]> git.baikalelectronics.ru Git - kernel.git/commit
x86/mce: Improve error message when kernel cannot recover
authorTony Luck <tony.luck@intel.com>
Fri, 25 May 2018 21:41:39 +0000 (14:41 -0700)
committerThomas Gleixner <tglx@linutronix.de>
Thu, 7 Jun 2018 20:22:12 +0000 (22:22 +0200)
commitb9c43d92b348c12d69387d112c552804de6dc438
tree866560cab0deca4e4f3df24e5df2d7813fbdd49b
parentca91955a981b6349a65d606058c12e516920e690
x86/mce: Improve error message when kernel cannot recover

Since we added support to add recovery from some errors inside the kernel in:

commit 39a6f32334f5 ("x86/mce: Check for faults tagged in EXTABLE_CLASS_FAULT exception table entries")

we have done a less than stellar job at reporting the cause of recoverable
machine checks that occur in other parts of the kernel. The user just gets
the unhelpful message:

mce: [Hardware Error]: Machine check: Action required: unknown MCACOD

doubly unhelpful when they check the manual for the reported IA32_MSR_STATUS.MCACOD
and see that it is listed as one of the standard recoverable values.

Add an extra rule to the MCE severity table to catch this case and report it
as:

mce: [Hardware Error]: Machine check: Data load in unrecoverable area of kernel

Fixes: 39a6f32334f5 ("x86/mce: Check for faults tagged in EXTABLE_CLASS_FAULT exception table entries")
Signed-off-by: Tony Luck <tony.luck@intel.com>
Signed-off-by: Thomas Gleixner <tglx@linutronix.de>
Cc: Qiuxu Zhuo <qiuxu.zhuo@intel.com>
Cc: Ashok Raj <ashok.raj@intel.com>
Cc: stable@vger.kernel.org # 4.6+
Cc: Dan Williams <dan.j.williams@intel.com>
Cc: Borislav Petkov <bp@suse.de>
Link: https://lkml.kernel.org/r/4cc7c465150a9a48b8b9f45d0b840278e77eb9b5.1527283897.git.tony.luck@intel.com
arch/x86/kernel/cpu/mcheck/mce-severity.c