]> git.baikalelectronics.ru Git - kernel.git/commit
powerpc/64s: Fix unrecoverable MCE calling async handler from NMI
authorNicholas Piggin <npiggin@gmail.com>
Mon, 4 Oct 2021 14:56:42 +0000 (00:56 +1000)
committerMichael Ellerman <mpe@ellerman.id.au>
Thu, 7 Oct 2021 08:54:55 +0000 (19:54 +1100)
commitb99580117570d02b0f6e5d992dff7a86c0cef4d9
tree3770f39e25bf2a57936c4ea55609aaaf63870e4b
parent4f50495d736ed8b8eceda70224af3d146440efe0
powerpc/64s: Fix unrecoverable MCE calling async handler from NMI

The machine check handler is not considered NMI on 64s. The early
handler is the true NMI handler, and then it schedules the
machine_check_exception handler to run when interrupts are enabled.

This works fine except the case of an unrecoverable MCE, where the true
NMI is taken when MSR[RI] is clear, it can not recover, so it calls
machine_check_exception directly so something might be done about it.

Calling an async handler from NMI context can result in irq state and
other things getting corrupted. This can also trigger the BUG at
  arch/powerpc/include/asm/interrupt.h:168
  BUG_ON(!arch_irq_disabled_regs(regs) && !(regs->msr & MSR_EE));

Fix this by making an _async version of the handler which is called
in the normal case, and a NMI version that is called for unrecoverable
interrupts.

Fixes: 4e2500cd8f18 ("powerpc/64: enable MSR[EE] in irq replay pt_regs")
Signed-off-by: Nicholas Piggin <npiggin@gmail.com>
Tested-by: Cédric Le Goater <clg@kaod.org>
Signed-off-by: Michael Ellerman <mpe@ellerman.id.au>
Link: https://lore.kernel.org/r/20211004145642.1331214-6-npiggin@gmail.com
arch/powerpc/include/asm/interrupt.h
arch/powerpc/kernel/exceptions-64s.S
arch/powerpc/kernel/traps.c