]> git.baikalelectronics.ru Git - kernel.git/commit
btrfs: Ensure replaced device doesn't have pending chunk allocation
authorNikolay Borisov <nborisov@suse.com>
Fri, 17 May 2019 07:44:25 +0000 (10:44 +0300)
committerDavid Sterba <dsterba@suse.com>
Tue, 28 May 2019 16:54:00 +0000 (18:54 +0200)
commit26e7b0c8e210d8bb4bd315939e143d9c9d1f27e3
tree518c72633612dc0002fe78b8f83366f54e8f9b60
parent417f944aff6e0db395255e93be6c2892291446a7
btrfs: Ensure replaced device doesn't have pending chunk allocation

Recent FITRIM work, namely 9e84154a5f4f ("btrfs: combine device update
operations during transaction commit") combined the way certain
operations are recoded in a transaction. As a result an ASSERT was added
in dev_replace_finish to ensure the new code works correctly.
Unfortunately I got reports that it's possible to trigger the assert,
meaning that during a device replace it's possible to have an unfinished
chunk allocation on the source device.

This is supposed to be prevented by the fact that a transaction is
committed before finishing the replace oepration and alter acquiring the
chunk mutex. This is not sufficient since by the time the transaction is
committed and the chunk mutex acquired it's possible to allocate a chunk
depending on the workload being executed on the replaced device. This
bug has been present ever since device replace was introduced but there
was never code which checks for it.

The correct way to fix is to ensure that there is no pending device
modification operation when the chunk mutex is acquire and if there is
repeat transaction commit. Unfortunately it's not possible to just
exclude the source device from btrfs_fs_devices::dev_alloc_list since
this causes ENOSPC to be hit in transaction commit.

Fixing that in another way would need to add special cases to handle the
last writes and forbid new ones. The looped transaction fix is more
obvious, and can be easily backported. The runtime of dev-replace is
long so there's no noticeable delay caused by that.

Reported-by: David Sterba <dsterba@suse.com>
Fixes: 916b449c2382 ("Btrfs: fix unprotected alloc list insertion during the finishing procedure of replace")
CC: stable@vger.kernel.org # 4.4+
Signed-off-by: Nikolay Borisov <nborisov@suse.com>
Reviewed-by: David Sterba <dsterba@suse.com>
Signed-off-by: David Sterba <dsterba@suse.com>
fs/btrfs/dev-replace.c