GNU Linux-libre 4.19.286-gnu1
[releases.git] / fs / notify / fanotify / fanotify.c
1 // SPDX-License-Identifier: GPL-2.0
2 #include <linux/fanotify.h>
3 #include <linux/fdtable.h>
4 #include <linux/fsnotify_backend.h>
5 #include <linux/init.h>
6 #include <linux/jiffies.h>
7 #include <linux/kernel.h> /* UINT_MAX */
8 #include <linux/mount.h>
9 #include <linux/sched.h>
10 #include <linux/sched/user.h>
11 #include <linux/sched/signal.h>
12 #include <linux/types.h>
13 #include <linux/wait.h>
14 #include <linux/audit.h>
15 #include <linux/sched/mm.h>
16
17 #include "fanotify.h"
18
19 static bool should_merge(struct fsnotify_event *old_fsn,
20                          struct fsnotify_event *new_fsn)
21 {
22         struct fanotify_event_info *old, *new;
23
24         pr_debug("%s: old=%p new=%p\n", __func__, old_fsn, new_fsn);
25         old = FANOTIFY_E(old_fsn);
26         new = FANOTIFY_E(new_fsn);
27
28         if (old_fsn->inode == new_fsn->inode && old->tgid == new->tgid &&
29             old->path.mnt == new->path.mnt &&
30             old->path.dentry == new->path.dentry)
31                 return true;
32         return false;
33 }
34
35 /* and the list better be locked by something too! */
36 static int fanotify_merge(struct list_head *list, struct fsnotify_event *event)
37 {
38         struct fsnotify_event *test_event;
39
40         pr_debug("%s: list=%p event=%p\n", __func__, list, event);
41
42         /*
43          * Don't merge a permission event with any other event so that we know
44          * the event structure we have created in fanotify_handle_event() is the
45          * one we should check for permission response.
46          */
47         if (fanotify_is_perm_event(event->mask))
48                 return 0;
49
50         list_for_each_entry_reverse(test_event, list, list) {
51                 if (should_merge(test_event, event)) {
52                         test_event->mask |= event->mask;
53                         return 1;
54                 }
55         }
56
57         return 0;
58 }
59
60 static int fanotify_get_response(struct fsnotify_group *group,
61                                  struct fanotify_perm_event_info *event,
62                                  struct fsnotify_iter_info *iter_info)
63 {
64         int ret;
65
66         pr_debug("%s: group=%p event=%p\n", __func__, group, event);
67
68         wait_event(group->fanotify_data.access_waitq, event->response);
69
70         /* userspace responded, convert to something usable */
71         switch (event->response & ~FAN_AUDIT) {
72         case FAN_ALLOW:
73                 ret = 0;
74                 break;
75         case FAN_DENY:
76         default:
77                 ret = -EPERM;
78         }
79
80         /* Check if the response should be audited */
81         if (event->response & FAN_AUDIT)
82                 audit_fanotify(event->response & ~FAN_AUDIT);
83
84         event->response = 0;
85
86         pr_debug("%s: group=%p event=%p about to return ret=%d\n", __func__,
87                  group, event, ret);
88         
89         return ret;
90 }
91
92 static bool fanotify_should_send_event(struct fsnotify_iter_info *iter_info,
93                                        u32 event_mask, const void *data,
94                                        int data_type)
95 {
96         __u32 marks_mask = 0, marks_ignored_mask = 0;
97         const struct path *path = data;
98         struct fsnotify_mark *mark;
99         int type;
100
101         pr_debug("%s: report_mask=%x mask=%x data=%p data_type=%d\n",
102                  __func__, iter_info->report_mask, event_mask, data, data_type);
103
104         /* if we don't have enough info to send an event to userspace say no */
105         if (data_type != FSNOTIFY_EVENT_PATH)
106                 return false;
107
108         /* sorry, fanotify only gives a damn about files and dirs */
109         if (!d_is_reg(path->dentry) &&
110             !d_can_lookup(path->dentry))
111                 return false;
112
113         fsnotify_foreach_obj_type(type) {
114                 if (!fsnotify_iter_should_report_type(iter_info, type))
115                         continue;
116                 mark = iter_info->marks[type];
117
118                 /* Apply ignore mask regardless of ISDIR and ON_CHILD flags */
119                 marks_ignored_mask |= mark->ignored_mask;
120
121                 /*
122                  * If the event is for a child and this mark doesn't care about
123                  * events on a child, don't send it!
124                  */
125                 if (event_mask & FS_EVENT_ON_CHILD &&
126                     (type != FSNOTIFY_OBJ_TYPE_INODE ||
127                      !(mark->mask & FS_EVENT_ON_CHILD)))
128                         continue;
129
130                 marks_mask |= mark->mask;
131         }
132
133         if (d_is_dir(path->dentry) &&
134             !(marks_mask & FS_ISDIR & ~marks_ignored_mask))
135                 return false;
136
137         if (event_mask & FAN_ALL_OUTGOING_EVENTS & marks_mask &
138                                  ~marks_ignored_mask)
139                 return true;
140
141         return false;
142 }
143
144 struct fanotify_event_info *fanotify_alloc_event(struct fsnotify_group *group,
145                                                  struct inode *inode, u32 mask,
146                                                  const struct path *path)
147 {
148         struct fanotify_event_info *event = NULL;
149         gfp_t gfp = GFP_KERNEL_ACCOUNT;
150
151         /*
152          * For queues with unlimited length lost events are not expected and
153          * can possibly have security implications. Avoid losing events when
154          * memory is short. For the limited size queues, avoid OOM killer in the
155          * target monitoring memcg as it may have security repercussion.
156          */
157         if (group->max_events == UINT_MAX)
158                 gfp |= __GFP_NOFAIL;
159         else
160                 gfp |= __GFP_RETRY_MAYFAIL;
161
162         /* Whoever is interested in the event, pays for the allocation. */
163         memalloc_use_memcg(group->memcg);
164
165         if (fanotify_is_perm_event(mask)) {
166                 struct fanotify_perm_event_info *pevent;
167
168                 pevent = kmem_cache_alloc(fanotify_perm_event_cachep, gfp);
169                 if (!pevent)
170                         goto out;
171                 event = &pevent->fae;
172                 pevent->response = 0;
173                 goto init;
174         }
175         event = kmem_cache_alloc(fanotify_event_cachep, gfp);
176         if (!event)
177                 goto out;
178 init: __maybe_unused
179         fsnotify_init_event(&event->fse, inode, mask);
180         event->tgid = get_pid(task_tgid(current));
181         if (path) {
182                 event->path = *path;
183                 path_get(&event->path);
184         } else {
185                 event->path.mnt = NULL;
186                 event->path.dentry = NULL;
187         }
188 out:
189         memalloc_unuse_memcg();
190         return event;
191 }
192
193 static int fanotify_handle_event(struct fsnotify_group *group,
194                                  struct inode *inode,
195                                  u32 mask, const void *data, int data_type,
196                                  const unsigned char *file_name, u32 cookie,
197                                  struct fsnotify_iter_info *iter_info)
198 {
199         int ret = 0;
200         struct fanotify_event_info *event;
201         struct fsnotify_event *fsn_event;
202
203         BUILD_BUG_ON(FAN_ACCESS != FS_ACCESS);
204         BUILD_BUG_ON(FAN_MODIFY != FS_MODIFY);
205         BUILD_BUG_ON(FAN_CLOSE_NOWRITE != FS_CLOSE_NOWRITE);
206         BUILD_BUG_ON(FAN_CLOSE_WRITE != FS_CLOSE_WRITE);
207         BUILD_BUG_ON(FAN_OPEN != FS_OPEN);
208         BUILD_BUG_ON(FAN_EVENT_ON_CHILD != FS_EVENT_ON_CHILD);
209         BUILD_BUG_ON(FAN_Q_OVERFLOW != FS_Q_OVERFLOW);
210         BUILD_BUG_ON(FAN_OPEN_PERM != FS_OPEN_PERM);
211         BUILD_BUG_ON(FAN_ACCESS_PERM != FS_ACCESS_PERM);
212         BUILD_BUG_ON(FAN_ONDIR != FS_ISDIR);
213
214         if (!fanotify_should_send_event(iter_info, mask, data, data_type))
215                 return 0;
216
217         pr_debug("%s: group=%p inode=%p mask=%x\n", __func__, group, inode,
218                  mask);
219
220         if (fanotify_is_perm_event(mask)) {
221                 /*
222                  * fsnotify_prepare_user_wait() fails if we race with mark
223                  * deletion.  Just let the operation pass in that case.
224                  */
225                 if (!fsnotify_prepare_user_wait(iter_info))
226                         return 0;
227         }
228
229         event = fanotify_alloc_event(group, inode, mask, data);
230         ret = -ENOMEM;
231         if (unlikely(!event)) {
232                 /*
233                  * We don't queue overflow events for permission events as
234                  * there the access is denied and so no event is in fact lost.
235                  */
236                 if (!fanotify_is_perm_event(mask))
237                         fsnotify_queue_overflow(group);
238                 goto finish;
239         }
240
241         fsn_event = &event->fse;
242         ret = fsnotify_add_event(group, fsn_event, fanotify_merge);
243         if (ret) {
244                 /* Permission events shouldn't be merged */
245                 BUG_ON(ret == 1 && mask & FAN_ALL_PERM_EVENTS);
246                 /* Our event wasn't used in the end. Free it. */
247                 fsnotify_destroy_event(group, fsn_event);
248
249                 ret = 0;
250         } else if (fanotify_is_perm_event(mask)) {
251                 ret = fanotify_get_response(group, FANOTIFY_PE(fsn_event),
252                                             iter_info);
253                 fsnotify_destroy_event(group, fsn_event);
254         }
255 finish:
256         if (fanotify_is_perm_event(mask))
257                 fsnotify_finish_user_wait(iter_info);
258
259         return ret;
260 }
261
262 static void fanotify_free_group_priv(struct fsnotify_group *group)
263 {
264         struct user_struct *user;
265
266         user = group->fanotify_data.user;
267         atomic_dec(&user->fanotify_listeners);
268         free_uid(user);
269 }
270
271 static void fanotify_free_event(struct fsnotify_event *fsn_event)
272 {
273         struct fanotify_event_info *event;
274
275         event = FANOTIFY_E(fsn_event);
276         path_put(&event->path);
277         put_pid(event->tgid);
278         if (fanotify_is_perm_event(fsn_event->mask)) {
279                 kmem_cache_free(fanotify_perm_event_cachep,
280                                 FANOTIFY_PE(fsn_event));
281                 return;
282         }
283         kmem_cache_free(fanotify_event_cachep, event);
284 }
285
286 static void fanotify_free_mark(struct fsnotify_mark *fsn_mark)
287 {
288         kmem_cache_free(fanotify_mark_cache, fsn_mark);
289 }
290
291 const struct fsnotify_ops fanotify_fsnotify_ops = {
292         .handle_event = fanotify_handle_event,
293         .free_group_priv = fanotify_free_group_priv,
294         .free_event = fanotify_free_event,
295         .free_mark = fanotify_free_mark,
296 };