- 主题:我另一台t495,debian12同样的smart错误信息
最后你还是不看具体log内容是什么。
【 在 x2303612 的大作中提到: 】
:
: 这个硬盘的错误数多的吓人,我记得是某一次更新12.3,也不知是12.4,系统出错。后来听说是12那次系统的问题。
: 系统重装过后,都能升级,都能正常工作,但是,每次开机,root会发来一封邮件!而且错误数在缓慢增加。
: 怎么才能解决这个问题?
:
#发自zSMTH@Redmi Note 11
--
FROM 113.119.11.*
sudo smartctl -l error /dev/XXXX
或者
sudo smartctl -l xerror /dev/XXXX
【 在 x2303612 的大作中提到: 】
:
: 不知怎么看。
:
: 【 在 Dazzy (大懒虫,脱焦省却磨皮) 的大作中提到: 】
: : 最后你还是不看具体log内容是什么。
#发自zSMTH@Redmi Note 11
--
FROM 113.119.11.*
原来是这个,可以装个nvme-cli
sudo nvme error-log /dev/nvmeXX
确认一下。
不过基本上没啥大事,linux主机会在启动时发送一些非nvme命令给磁盘,nvme执行不了,错误计数加一。重启后nvme会把log内容清了,但计数器还在。这种应为非紧急情况,但smartd依然报错。
解决方案,装bookworm-backports里面的smartmontools 7.4.2。
延伸阅读: #1222
Smartd should ignore non-error entries from NVMe Error Information log
【 在 x2303612 @ [LinuxApp] 的大作中提到: 】
:
: 请帮忙看一下
: - 来自 水木社区APP v3.5.7
: 【 在 Dazzy 的大作中提到: 】
: : sudo smartctl -l error /dev/XXXX
#发自zSMTH@Redmi Note 11
--
FROM 113.119.11.*
大概率是,因为目测你的log里没有什么要命的内容。
【 在 x2303612 的大作中提到: 】
: 非常感谢,也就是说,这的确是程序的问题?
--
FROM 119.129.50.*
nvme-cli有一类命令,clear-pcie-correctable-errors,你可以了解一下。但硬盘错误不一定全是这种,这类命令也不是所有nvme硬盘支持。不一定能如你所想。此外的,我不太了解。
【 在 x2303612 的大作中提到: 】
: 有什么办法让硬盘的errcount计数变成0呢?找遍全网,找半天都没找到方法。但是,一定是有方法的吧?对不对?
--
FROM 119.129.51.*
SMART是磁盘自带的自监测功能,数值变化,由磁盘控制器决定。smartmontools只是读取。它的问题是和nvme规范有点不搭,会把nvme积累的非紧急情况也通知用户。
杂牌盘,平时当心点。总是蹦数值,保不准里头有要命的。狼来了不好办。
【 在 x2303612 的大作中提到: 】
:
: 实与smartmontools程序无关。我把这个程序删除了,发现,错误数目依然在增加。
:
: 【 在 x2303612 的大作中提到: 】
: : 的确是的,有清零盘这种说法的。但我提到的这个问题,我在网上查了,有很多很多人碰到了。 据说是smartctl程序相关。不是致命的错误,应该算是某个程序的bug了。
#发自zSMTH@Redmi Note 11
--
FROM 113.115.57.*
error数增加,部分可能与系统有关,比如系统kernel发送nvme控制器无法识别执行的指令,error数就会加。但也可能是盘自己的问题,所以要具体问题具体分析。
【 在 x2303612 @ [LinuxApp] 的大作中提到: 】
:
: 这不是跟系统的程序有关?是盘自己的问题?
:
: 【 在 Dazzy (大懒虫,脱焦省却磨皮) 的大作中提到: 】
: : SMART是磁盘自带的自监测功能,数值变化,由磁盘控制器决定。smartmontools只是读取。它的问题是和nvme规范有点不搭,会把nvme积累的非紧急情况也通知用户。
#发自zSMTH@Redmi Note 11
--
FROM 14.16.87.*
linux kernel的事情。如果你有看我之前提供的延伸阅读,会知道,kernel启动时*可能*会发送一些nvme控制器不支持的指令,增加磁盘的error数量。windows用错驱动也可能会。这种错误,跟坏数据线是一样的,不是硬盘自己的错,但硬盘控制器会因发生了接口读写错误,增加错误计数。
然而,SMART错误就要具体问题具体分析。有些内容是要命的真故障。
【 在 x2303612 @ [LinuxApp] 的大作中提到: 】
:
: 我机子是双系统,在win下error数量,好像不增加,开机进入debian12 ,就会增加
:
: 【 在 Dazzy (大懒虫,脱焦省却磨皮) 的大作中提到: 】
: : error数增加,部分可能与系统有关,比如系统kernel发送nvme控制器无法识别执行的指令,error数就会加。但也可能是盘自己的问题,所以要具体问题具体分析。
#发自zSMTH@Redmi Note 11
--
FROM 14.16.87.*
时间忙,就先学习使用搜索引擎吧。
搜索引擎不会抱怨你扔给它们的各种问题,也不会介意你有没有做功课。
但在板上问没有怎么验证或者思考过的帖子,多了大家就觉得没啥意思了,回多少,你还是进展甚微。
【 在 x2303612 的大作中提到: 】
:
: 的确,也要上班的。
: 不过,即便有时间,也一时不知怎么学,只有有限的学习能力。
:
: 【 在 ayaka (ayaka) 的大作中提到: 】
#发自zSMTH@Redmi Note 11
--
FROM 14.16.87.*
用必应或者yandax之类的,英语关键词。linux社区文档中文本地化,才起步几年,社区论坛帖子就不用说了,中文的一直很少。各家项目的bug tracker,帖子全都是英文的。
用百度搜,结果很不理想。往往英文搜索才发现,自己的问题,几年前就有答案了。
这是目前的现实,需要适应。
【 在 x2303612 @ [LinuxApp] 的大作中提到: 】
:
: 其实我的第1时间就在使用百度的,没法了,才来的。
: 【 在 Dazzy 的大作中提到: 】
: : 时间忙,就先学习使用搜索引擎吧。
: : 搜索引擎不会抱怨你扔给它们的各种问题,也不会介意你有没有做功课。
#发自zSMTH@Redmi Note 11
--
FROM 14.27.48.*