]> git.baikalelectronics.ru Git - kernel.git/commit
nvme-rdma: Fix command completion race at error recovery
authorIsrael Rukshin <israelr@mellanox.com>
Tue, 19 Jun 2018 12:34:11 +0000 (15:34 +0300)
committerChristoph Hellwig <hch@lst.de>
Wed, 20 Jun 2018 12:20:51 +0000 (14:20 +0200)
commitb649d090fed0530d16c192dfaccefc45f8e8af9f
tree252bc9998774c6eb77d2e0dd31c850ec0d2db67d
parent827e25ca4e397700e3642f565fb34b235ed40b21
nvme-rdma: Fix command completion race at error recovery

The race is between completing the request at error recovery work and
rdma completions.  If we cancel the request before getting the good
rdma completion we get a NULL deref of the request MR at
nvme_rdma_process_nvme_rsp().

When Canceling the request we return its mr to the mr pool (set mr to
NULL) and also unmap its data.  Canceling the requests while the rdma
queues are active is not safe.  Because rdma queues are active and we
get good rdma completions that can use the mr pointer which may be NULL.
Completing the request too soon may lead also to performing DMA to/from
user buffers which might have been already unmapped.

The commit fixes the race by draining the QP before starting the abort
commands mechanism.

Signed-off-by: Israel Rukshin <israelr@mellanox.com>
Reviewed-by: Max Gurtovoy <maxg@mellanox.com>
Signed-off-by: Sagi Grimberg <sagi@grimberg.me>
Signed-off-by: Christoph Hellwig <hch@lst.de>
drivers/nvme/host/rdma.c