]> git.baikalelectronics.ru Git - kernel.git/commit
mwifiex: resolve reset vs. remove()/shutdown() deadlocks
authorBrian Norris <briannorris@chromium.org>
Fri, 12 Jan 2018 21:08:37 +0000 (13:08 -0800)
committerKalle Valo <kvalo@codeaurora.org>
Tue, 16 Jan 2018 16:00:17 +0000 (18:00 +0200)
commit520c5f2ce2f41258be71f74ab95dfc99507be233
tree6f6c11441924ae39d4b3c40d2ab2a331cdccd86b
parent62df219c9407ed71746786b9dd93a52af12a311a
mwifiex: resolve reset vs. remove()/shutdown() deadlocks

Commit 0d61c14cc414 ("PCI: Protect pci_error_handlers->reset_notify()
usage with device_lock()") resolves races between driver reset and
removal, but it introduces some new deadlock problems. If we see a
timeout while we've already started suspending, removing, or shutting
down the driver, we might see:

(a) a worker thread, running mwifiex_pcie_work() ->
    mwifiex_pcie_card_reset_work() -> pci_reset_function()
(b) a removal thread, running mwifiex_pcie_remove() ->
    mwifiex_free_adapter() -> mwifiex_unregister() ->
    mwifiex_cleanup_pcie() -> cancel_work_sync(&card->work)

Unfortunately, mwifiex_pcie_remove() already holds the device lock that
pci_reset_function() is now requesting, and so we see a deadlock.

It's necessary to cancel and synchronize our outstanding work before
tearing down the driver, so we can't have this work wait indefinitely
for the lock.

It's reasonable to only "try" to reset here, since this will mostly
happen for cases where it's already difficult to reset the firmware
anyway (e.g., while we're suspending or powering off the system). And if
reset *really* needs to happen, we can always try again later.

Fixes: 0d61c14cc414 ("PCI: Protect pci_error_handlers->reset_notify() usage with device_lock()")
Cc: <stable@vger.kernel.org>
Cc: Xinming Hu <huxm@marvell.com>
Signed-off-by: Brian Norris <briannorris@chromium.org>
Signed-off-by: Kalle Valo <kvalo@codeaurora.org>
drivers/net/wireless/marvell/mwifiex/pcie.c