Precise the Kconfig parsing
[kconfig-hardened-check.git] / kconfig_hardened_check / __init__.py
1 #!/usr/bin/python3
2
3 """
4 This tool is for checking the security hardening options of the Linux kernel.
5
6 Author: Alexander Popov <alex.popov@linux.com>
7
8 This module performs input/output.
9 """
10
11 # pylint: disable=missing-function-docstring,line-too-long,invalid-name,too-many-branches,too-many-statements
12
13 import gzip
14 import sys
15 from argparse import ArgumentParser
16 from collections import OrderedDict
17 import re
18 import json
19 from .__about__ import __version__
20 from .checks import add_kconfig_checks, add_cmdline_checks, normalize_cmdline_options, add_sysctl_checks
21 from .engine import populate_with_data, perform_checks, override_expected_value
22
23
24 def _open(file: str, *args, **kwargs):
25     open_method = open
26     if file.endswith(".gz"):
27         open_method = gzip.open
28
29     return open_method(file, *args, **kwargs)
30
31
32 def detect_arch(fname, archs):
33     with _open(fname, 'rt', encoding='utf-8') as f:
34         arch_pattern = re.compile("CONFIG_[a-zA-Z0-9_]+=y$")
35         arch = None
36         for line in f.readlines():
37             if arch_pattern.match(line):
38                 option, _ = line[7:].split('=', 1)
39                 if option in archs:
40                     if arch is None:
41                         arch = option
42                     else:
43                         return None, 'detected more than one microarchitecture'
44         if arch is None:
45             return None, 'failed to detect microarchitecture'
46         return arch, 'OK'
47
48
49 def detect_kernel_version(fname):
50     with _open(fname, 'rt', encoding='utf-8') as f:
51         ver_pattern = re.compile("# Linux/.+ Kernel Configuration$")
52         for line in f.readlines():
53             if ver_pattern.match(line):
54                 line = line.strip()
55                 parts = line.split()
56                 ver_str = parts[2]
57                 ver_numbers = ver_str.split('.')
58                 if len(ver_numbers) < 3 or not ver_numbers[0].isdigit() or not ver_numbers[1].isdigit():
59                     msg = f'failed to parse the version "{ver_str}"'
60                     return None, msg
61                 return (int(ver_numbers[0]), int(ver_numbers[1])), None
62         return None, 'no kernel version detected'
63
64
65 def detect_compiler(fname):
66     gcc_version = None
67     clang_version = None
68     with _open(fname, 'rt', encoding='utf-8') as f:
69         for line in f.readlines():
70             if line.startswith('CONFIG_GCC_VERSION='):
71                 gcc_version = line[19:-1]
72             if line.startswith('CONFIG_CLANG_VERSION='):
73                 clang_version = line[21:-1]
74     if gcc_version is None or clang_version is None:
75         return None, 'no CONFIG_GCC_VERSION or CONFIG_CLANG_VERSION'
76     if gcc_version == '0' and clang_version != '0':
77         return 'CLANG ' + clang_version, 'OK'
78     if gcc_version != '0' and clang_version == '0':
79         return 'GCC ' + gcc_version, 'OK'
80     sys.exit(f'[!] ERROR: invalid GCC_VERSION and CLANG_VERSION: {gcc_version} {clang_version}')
81
82
83 def print_unknown_options(checklist, parsed_options):
84     known_options = []
85
86     for o1 in checklist:
87         if o1.type != 'complex':
88             known_options.append(o1.name)
89             continue
90         for o2 in o1.opts:
91             if o2.type != 'complex':
92                 if hasattr(o2, 'name'):
93                     known_options.append(o2.name)
94                 continue
95             for o3 in o2.opts:
96                 assert(o3.type != 'complex'), \
97                        f'unexpected ComplexOptCheck inside {o2.name}'
98                 if hasattr(o3, 'name'):
99                     known_options.append(o3.name)
100
101     for option, value in parsed_options.items():
102         if option not in known_options:
103             print(f'[?] No check for option {option} ({value})')
104
105
106 def print_checklist(mode, checklist, with_results):
107     if mode == 'json':
108         output = []
109         for opt in checklist:
110             output.append(opt.json_dump(with_results))
111         print(json.dumps(output))
112         return
113
114     # table header
115     sep_line_len = 91
116     if with_results:
117         sep_line_len += 30
118     print('=' * sep_line_len)
119     print(f'{"option name":^40}|{"type":^7}|{"desired val":^12}|{"decision":^10}|{"reason":^18}', end='')
120     if with_results:
121         print('| check result', end='')
122     print()
123     print('=' * sep_line_len)
124
125     # table contents
126     for opt in checklist:
127         if with_results:
128             if mode == 'show_ok':
129                 if not opt.result.startswith('OK'):
130                     continue
131             if mode == 'show_fail':
132                 if not opt.result.startswith('FAIL'):
133                     continue
134         opt.table_print(mode, with_results)
135         print()
136         if mode == 'verbose':
137             print('-' * sep_line_len)
138     print()
139
140     # final score
141     if with_results:
142         fail_count = len(list(filter(lambda opt: opt.result.startswith('FAIL'), checklist)))
143         fail_suppressed = ''
144         ok_count = len(list(filter(lambda opt: opt.result.startswith('OK'), checklist)))
145         ok_suppressed = ''
146         if mode == 'show_ok':
147             fail_suppressed = ' (suppressed in output)'
148         if mode == 'show_fail':
149             ok_suppressed = ' (suppressed in output)'
150         print(f'[+] Config check is finished: \'OK\' - {ok_count}{ok_suppressed} / \'FAIL\' - {fail_count}{fail_suppressed}')
151
152
153 def parse_kconfig_file(parsed_options, fname):
154     with _open(fname, 'rt', encoding='utf-8') as f:
155         opt_is_on = re.compile("CONFIG_[a-zA-Z0-9_]+=.+$")
156         opt_is_off = re.compile("# CONFIG_[a-zA-Z0-9_]+ is not set$")
157
158         for line in f.readlines():
159             line = line.strip()
160             option = None
161             value = None
162
163             if opt_is_on.match(line):
164                 option, value = line.split('=', 1)
165                 if value == 'is not set':
166                     sys.exit(f'[!] ERROR: bad enabled Kconfig option "{line}"')
167             elif opt_is_off.match(line):
168                 option, value = line[2:].split(' ', 1)
169                 assert(value == 'is not set'), \
170                        f'unexpected value of disabled Kconfig option "{line}"'
171             elif line != '' and not line.startswith('#'):
172                 print(f'[!] WARNING: strange line in Kconfig file: "{line}"')
173
174             if option in parsed_options:
175                 sys.exit(f'[!] ERROR: Kconfig option "{line}" exists multiple times')
176
177             if option:
178                 parsed_options[option] = value
179
180
181 def parse_cmdline_file(parsed_options, fname):
182     with open(fname, 'r', encoding='utf-8') as f:
183         line = f.readline()
184         opts = line.split()
185
186         line = f.readline()
187         if line:
188             sys.exit(f'[!] ERROR: more than one line in "{fname}"')
189
190         for opt in opts:
191             if '=' in opt:
192                 name, value = opt.split('=', 1)
193             else:
194                 name = opt
195                 value = '' # '' is not None
196             if name in parsed_options:
197                 sys.exit(f'[!] ERROR: cmdline option "{name}" exists multiple times')
198             value = normalize_cmdline_options(name, value)
199             parsed_options[name] = value
200
201
202 def parse_sysctl_file(parsed_options, fname):
203     print('parse_sysctl_file: TODO')
204
205
206 def main():
207     # Report modes:
208     #   * verbose mode for
209     #     - reporting about unknown kernel options in the Kconfig
210     #     - verbose printing of ComplexOptCheck items
211     #   * json mode for printing the results in JSON format
212     report_modes = ['verbose', 'json', 'show_ok', 'show_fail']
213     supported_archs = ['X86_64', 'X86_32', 'ARM64', 'ARM']
214     parser = ArgumentParser(prog='kconfig-hardened-check',
215                             description='A tool for checking the security hardening options of the Linux kernel')
216     parser.add_argument('--version', action='version', version='%(prog)s ' + __version__)
217     parser.add_argument('-m', '--mode', choices=report_modes,
218                         help='choose the report mode')
219     parser.add_argument('-c', '--config',
220                         help='check the security hardening options in the kernel Kconfig file (also supports *.gz files)')
221     parser.add_argument('-l', '--cmdline',
222                         help='check the security hardening options in the kernel cmdline file (contents of /proc/cmdline)')
223 #   parser.add_argument('-s', '--sysctl',
224 #                       help='check the security hardening options in the sysctl output file (`sudo sysctl -a > file`)')
225     parser.add_argument('-p', '--print', choices=supported_archs,
226                         help='print the security hardening recommendations for the selected microarchitecture')
227     parser.add_argument('-g', '--generate', choices=supported_archs,
228                         help='generate a Kconfig fragment with the security hardening options for the selected microarchitecture')
229     args = parser.parse_args()
230     args.sysctl = None # FIXME
231
232     mode = None
233     if args.mode:
234         mode = args.mode
235         if mode != 'json':
236             print(f'[+] Special report mode: {mode}')
237
238     config_checklist = []
239
240     if args.config:
241         if args.print:
242             sys.exit('[!] ERROR: --config and --print can\'t be used together')
243
244         if args.generate:
245             sys.exit('[!] ERROR: --config and --generate can\'t be used together')
246
247         if mode != 'json':
248             print(f'[+] Kconfig file to check: {args.config}')
249             if args.cmdline:
250                 print(f'[+] Kernel cmdline file to check: {args.cmdline}')
251             if args.sysctl:
252                 print(f'[+] Kernel sysctl output file to check: {args.sysctl}')
253
254         arch, msg = detect_arch(args.config, supported_archs)
255         if arch is None:
256             sys.exit(f'[!] ERROR: {msg}')
257         if mode != 'json':
258             print(f'[+] Detected microarchitecture: {arch}')
259
260         kernel_version, msg = detect_kernel_version(args.config)
261         if kernel_version is None:
262             sys.exit(f'[!] ERROR: {msg}')
263         if mode != 'json':
264             print(f'[+] Detected kernel version: {kernel_version[0]}.{kernel_version[1]}')
265
266         compiler, msg = detect_compiler(args.config)
267         if mode != 'json':
268             if compiler:
269                 print(f'[+] Detected compiler: {compiler}')
270             else:
271                 print(f'[-] Can\'t detect the compiler: {msg}')
272
273         # add relevant Kconfig checks to the checklist
274         add_kconfig_checks(config_checklist, arch)
275
276         if args.cmdline:
277             # add relevant cmdline checks to the checklist
278             add_cmdline_checks(config_checklist, arch)
279
280         if args.sysctl:
281             # add relevant sysctl checks to the checklist
282             add_sysctl_checks(config_checklist, arch)
283
284         # populate the checklist with the parsed Kconfig data
285         parsed_kconfig_options = OrderedDict()
286         parse_kconfig_file(parsed_kconfig_options, args.config)
287         populate_with_data(config_checklist, parsed_kconfig_options, 'kconfig')
288
289         # populate the checklist with the kernel version data
290         populate_with_data(config_checklist, kernel_version, 'version')
291
292         if args.cmdline:
293             # populate the checklist with the parsed cmdline data
294             parsed_cmdline_options = OrderedDict()
295             parse_cmdline_file(parsed_cmdline_options, args.cmdline)
296             populate_with_data(config_checklist, parsed_cmdline_options, 'cmdline')
297
298         if args.sysctl:
299             # populate the checklist with the parsed sysctl data
300             parsed_sysctl_options = OrderedDict()
301             parse_sysctl_file(parsed_sysctl_options, args.sysctl)
302             populate_with_data(config_checklist, parsed_sysctl_options, 'sysctl')
303
304         # hackish refinement of the CONFIG_ARCH_MMAP_RND_BITS check
305         mmap_rnd_bits_max = parsed_kconfig_options.get('CONFIG_ARCH_MMAP_RND_BITS_MAX', None)
306         if mmap_rnd_bits_max:
307             override_expected_value(config_checklist, 'CONFIG_ARCH_MMAP_RND_BITS', mmap_rnd_bits_max)
308
309         # now everything is ready, perform the checks
310         perform_checks(config_checklist)
311
312         if mode == 'verbose':
313             # print the parsed options without the checks (for debugging)
314             all_parsed_options = parsed_kconfig_options # assignment does not copy
315             if args.cmdline:
316                 all_parsed_options.update(parsed_cmdline_options)
317             if args.sysctl:
318                 all_parsed_options.update(parsed_sysctl_options)
319             print_unknown_options(config_checklist, all_parsed_options)
320
321         # finally print the results
322         print_checklist(mode, config_checklist, True)
323
324         sys.exit(0)
325     elif args.cmdline:
326         sys.exit('[!] ERROR: checking cmdline depends on checking Kconfig')
327     elif args.sysctl:
328         # TODO: sysctl check should also work separately
329         sys.exit('[!] ERROR: checking sysctl depends on checking Kconfig')
330
331     if args.print:
332         assert(args.config is None and args.cmdline is None and args.sysctl is None), 'unexpected args'
333         if mode and mode not in ('verbose', 'json'):
334             sys.exit(f'[!] ERROR: wrong mode "{mode}" for --print')
335         arch = args.print
336         add_kconfig_checks(config_checklist, arch)
337         add_cmdline_checks(config_checklist, arch)
338         add_sysctl_checks(config_checklist, arch)
339         if mode != 'json':
340             print(f'[+] Printing kernel security hardening options for {arch}...')
341         print_checklist(mode, config_checklist, False)
342         sys.exit(0)
343
344     if args.generate:
345         assert(args.config is None and args.cmdline is None and args.sysctl is None), 'unexpected args'
346         if mode:
347             sys.exit(f'[!] ERROR: wrong mode "{mode}" for --generate')
348         arch = args.generate
349         add_kconfig_checks(config_checklist, arch)
350         print(f'CONFIG_{arch}=y') # the Kconfig fragment should describe the microarchitecture
351         for opt in config_checklist:
352             if opt.name == 'CONFIG_ARCH_MMAP_RND_BITS':
353                 continue # don't add CONFIG_ARCH_MMAP_RND_BITS because its value needs refinement
354             if opt.expected == 'is not set':
355                 print(f'# {opt.name} is not set')
356             else:
357                 print(f'{opt.name}={opt.expected}')
358         sys.exit(0)
359
360     parser.print_help()
361     sys.exit(0)