]> git.baikalelectronics.ru Git - kernel.git/commit
ocfs2/dlm: Clear joining_node on hearbeat node down
authorTao Ma <tao.ma@oracle.com>
Thu, 10 Jan 2008 07:20:55 +0000 (15:20 +0800)
committerMark Fasheh <mark.fasheh@oracle.com>
Fri, 25 Jan 2008 23:05:46 +0000 (15:05 -0800)
commitca79582e858b1c9717e2c94915818860be52020c
treedfd6da78d6c18b9261b3c1cb572986ac5c495f66
parentcb7a65b9a3b0b5af59ba75560b45c70aa1362d37
ocfs2/dlm: Clear joining_node on hearbeat node down

Currently the process of dlm join contains 2 steps: query join and assert join.
After query join, the joined node will set its joining_node. So if the joining
node happens to panic before the 2nd step, the joined node will fail to clear
its joining_node flag because that node isn't in the domain map. It at least
cause 2 problems.
1. All the new join request will fail. So no new node can mount the volume.
2. The joined node can't umount the volume since during the umount process it
   has to wait for the joining_node to be unknown. So the umount will be hanged.

The solution is to clear the joining_node before we check the domain map.

Signed-off-by: Tao Ma <tao.ma@oracle.com>
Signed-off-by: Mark Fasheh <mark.fasheh@oracle.com>
fs/ocfs2/dlm/dlmrecovery.c