]> git.baikalelectronics.ru Git - kernel.git/commit
x86/mce: Make timer handling more robust
authorThomas Gleixner <tglx@linutronix.de>
Tue, 31 Jan 2017 08:37:34 +0000 (09:37 +0100)
committerThomas Gleixner <tglx@linutronix.de>
Tue, 31 Jan 2017 20:47:58 +0000 (21:47 +0100)
commit2f407370be98cfff3fe8d18732af07af20e3a3ff
treebe6d0e1f37c38ed0a7dd5da2d4b1e93f0fb43101
parent9654a633447d1992b6f8c5fd9db0a5c65dfc7663
x86/mce: Make timer handling more robust

Erik reported that on a preproduction hardware a CMCI storm triggers the
BUG_ON in add_timer_on(). The reason is that the per CPU MCE timer is
started by the CMCI logic before the MCE CPU hotplug callback starts the
timer with add_timer_on(). So the timer is already queued which triggers
the BUG.

Using add_timer_on() is pretty pointless in this code because the timer is
strictlty per CPU, initialized as pinned and all operations which arm the
timer happen on the CPU to which the timer belongs.

Simplify the whole machinery by using mod_timer() instead of add_timer_on()
which avoids the problem because mod_timer() can handle already queued
timers. Use __start_timer() everywhere so the earliest armed expiry time is
preserved.

Reported-by: Erik Veijola <erik.veijola@intel.com>
Tested-by: Borislav Petkov <bp@alien8.de>
Signed-off-by: Thomas Gleixner <tglx@linutronix.de>
Reviewed-by: Borislav Petkov <bp@alien8.de>
Cc: Tony Luck <tony.luck@intel.com>
Link: http://lkml.kernel.org/r/alpine.DEB.2.20.1701310936080.3457@nanos
Signed-off-by: Thomas Gleixner <tglx@linutronix.de>
arch/x86/kernel/cpu/mcheck/mce.c