]> git.baikalelectronics.ru Git - kernel.git/commit
mm: check that mm is still valid in madvise()
authorLinus Torvalds <torvalds@linux-foundation.org>
Fri, 24 Apr 2020 18:10:58 +0000 (11:10 -0700)
committerLinus Torvalds <torvalds@linux-foundation.org>
Fri, 24 Apr 2020 20:28:03 +0000 (13:28 -0700)
commit10424f5af7bae663f726944a471af2767ba1a569
tree56feb0f1b79069da8c18c20387405a5ae63c2337
parent8eac945efa15eeeb2004acab0b9e05b46e845066
mm: check that mm is still valid in madvise()

IORING_OP_MADVISE can end up basically doing mprotect() on the VM of
another process, which means that it can race with our crazy core dump
handling which accesses the VM state without holding the mmap_sem
(because it incorrectly thinks that it is the final user).

This is clearly a core dumping problem, but we've never fixed it the
right way, and instead have the notion of "check that the mm is still
ok" using mmget_still_valid() after getting the mmap_sem for writing in
any situation where we're not the original VM thread.

See commit ed8c070537a3 ("coredump: fix race condition between
mmget_not_zero()/get_task_mm() and core dumping") for more background on
this whole mmget_still_valid() thing.  You might want to have a barf bag
handy when you do.

We're discussing just fixing this properly in the only remaining core
dumping routines.  But even if we do that, let's make do_madvise() do
the right thing, and then when we fix core dumping, we can remove all
these mmget_still_valid() checks.

Reported-and-tested-by: Jann Horn <jannh@google.com>
Fixes: bad805556e8b ("io_uring: add IORING_OP_MADVISE")
Acked-by: Jens Axboe <axboe@kernel.dk>
Signed-off-by: Linus Torvalds <torvalds@linux-foundation.org>
mm/madvise.c