]> git.baikalelectronics.ru Git - kernel.git/commit
RDMA/nes: Fix hang issues for large cluster dynamic connections
authorFaisal Latif <faisal.latif@intel.com>
Mon, 27 Apr 2009 20:41:06 +0000 (13:41 -0700)
committerRoland Dreier <rolandd@cisco.com>
Mon, 27 Apr 2009 20:41:06 +0000 (13:41 -0700)
commit5947bc907dc56b33baa3a60484cfaa844b2a7df6
tree44b21f18ea6cb05ec6411b4ec00028152f4f1c5d
parent5f4a2ce469ea7140042b7a8427427f06df19be68
RDMA/nes: Fix hang issues for large cluster dynamic connections

Running large cluster setup, we are hanging after many hours of
testing.  Fixing this required going over the code and making sure the
rexmit entry was properly removed based on the cm_node's state and
packet received.  Also when receiving a FIN packet, check seq# and
make sure there were no errors before calling handle_fin().

Following are the changes done in nes_cm.c:

* handle_ack_pkt() needs to return error value, so in case of error,
  handle_fin() is not called. Some cleanup done while going over the code.

* handle_rst_pkt(), handling of cm_node's NES_CM_STATE_LAST_ACK is missing.

* process_packet(), in case of FIN only packet is received, call
  check_seq() before processing.

* in handle_fin_pkt(), we are calling cleanup_retrans_entry() for all
  conditions, even if the packets need to be dropped.

Signed-off-by: Faisal Latif <faisal.latif@intel.com>
Signed-off-by: Roland Dreier <rolandd@cisco.com>
drivers/infiniband/hw/nes/nes_cm.c