- 主题:偶发死机问题好像解决了
[20200526]
关闭c6跑一周未复现。如果是e5v3都可以试试这个办法,应该是haswell c6/c7问题。
-----------------------------------
前阵子换了linux,整体使用体验还可以,但有一个问题是每隔几个小时会发生整个系统冻结,ping也不通(肯定是kernel挂了,bios不支持mce无法自动重启)。日志里没有任何冻结当时的异常信息。做一晚上memtest无问题。怀疑显卡驱动的问题(memtest时显卡工作在vesa模式,io问题概率低)。网上搜了一下,说nvidia显卡冻结问题的还不少,主要是电源管理引起的。在联想到我这寨板瘸腿的bios和各种acpi特性的不支持,觉得方向对了,按这个思路再查syslog果然发现了蛛丝马迹:
Uhhuh, NMI received for unknown reason 3d on CPU0.
Do you have a strange power saving mode enabled?
Dazed and confused, but trying to continue.
修改方法:
1 在nvidia-setting里把电源管理策略改成强制max-performance。
2 kernel command line增加 pcie_aspm=off。
用了20个小时左右暂时没有冻结。
※ 修改:·dareta 于 May 26 08:32:57 2022 修改本文·[FROM: 112.96.226.*]
※ 来源:·最水木 客户端·[FROM: 223.74.101.*]
修改:dareta FROM 112.96.226.*
FROM 223.74.101.*
太牛逼了
【 在 dareta 的大作中提到: 】
: 前阵子换了linux,整体使用体验还可以,但有一个问题是每隔几个小时会发生整个系统冻结,ping也不通(肯定是kernel挂了,bios不支持mce无法自动重启)。日志里没有任何冻结当时的异常信息。做一晚上memtest无问题。怀疑显卡驱动的问题(memtest时显卡工作在vesa模式,io问题概率
: ..................
发自「今日水木 on Android」
--
FROM 114.241.247.*
这是不是就不省电了?
【 在 dareta 的大作中提到: 】
: 1 在nvidia-setting里把电源管理策略改成强制max-performance。
: ...................
--
FROM 52.9.227.*
高了20w左右(4x -> 6x)
【 在 hongyan2022 的大作中提到: 】
:
: 这是不是就不省电了?
: --
:
--
FROM 223.73.210.*
那还好,一个月也就是15度
【 在 dareta 的大作中提到: 】
: 高了20w左右(4x -> 6x)
--
FROM 52.9.227.*
老显卡的电源管理行为比较诡异,没法用aspm,只能支持suspend/resume。也可能是驱动的问题,现在降级470->390观察
【 在 hongyan2022 的大作中提到: 】
:
: 那还好,一个月也就是15度
: --
:
--
FROM 112.96.242.*
niubility,我这有个老笔记本之前装Ubuntu老是关机卡死,只能电源键长按关机。后来换成centos好了。linux下疑难杂症多一些,特别是硬件相关的。win10的话相反,软件问题一大堆,硬件基本都支持。linux败在硬件驱动上,所以说kernel中加驱动我是支持的。win10这是极其失败,自己作死。
【 在 dareta 的大作中提到: 】
: 前阵子换了linux,整体使用体验还可以,但有一个问题是每隔几个小时会发生整个系统冻结,ping也不通(肯定是kernel挂了,bios不支持mce无法自动重启)。日志里没有任何冻结当时的异常信息。做一晚上memtest无问题。怀疑显卡驱动的问题(memtest时显卡工作在vesa模式,io问题概率低)。网上搜了一下,说nvidia显卡冻结问题的还不少,主要是电源管理引起的。在联想到我这寨板瘸腿的bios和各种acpi特性的不支持,觉得方向对了,按这个思路再查syslog果然发现了蛛丝马迹:
: Uhhuh, NMI received for unknown reason 3d on CPU0.
: Do you have a strange power saving mode enabled?
: ...................
--来自微微水木3.5.12
--
FROM 101.204.58.*
厉害了,高手
--
FROM 1.196.180.*
我一开始也是怀疑Linux内核的问题,后来发现不是(换到win10现象一样)。
现在是关了C6在测试,目前故障没有重现。
代价是功耗又高了10W,C6比C1E费电很多。归根结底还是寨板BIOS的锅。
【 在 gamecmd 的大作中提到: 】
: niubility,我这有个老笔记本之前装Ubuntu老是关机卡死,只能电源键长按关机。后来换成centos好了。linux下疑难杂症多一些,特别是硬件相关的。win10的话相反,软件问题一大堆,硬件基本都支持。linux败在硬件驱动上,所以说kernel中加驱动我是支持的。win10这是极其失败,自
: 己作死。
: 飧怕实停M纤蚜艘幌拢祅vidia显卡冻结问题的还不少,主要是电源管理引起的。在联想到我这寨板瘸腿的bios和各种acpi特性的不支持,觉得方向对了,按这个思路再查syslog果然发现了蛛丝马迹:
: ...................
--
FROM 223.74.151.*