- 主题:ZFS必须用带ECC的内存吗?
看来intel的ECC比较贵,想性价比高就AMD。
我记得之前板上有人推过ECC内存,好像就是AMD的某些主板可以用。
【 在 Dazzy 的大作中提到: 】
: 没有推荐。
: 比如用洋垃圾,上ecc内存完全不是事,轻松得很。问题在于洋垃圾的稳定性存疑,为了
: 支持ecc值不值。
: ...................
--
FROM 59.40.10.*
32g 内存,100T 硬盘,每年暑假关机一个月其余时候一直开机,每个月一次 scrub
【 在 ttaudi (ttaudi) 的大作中提到: 】
: 内存多大?是7x24小时开机吗?
:
: 我看说32G内存连续开机5天就会出现1bit错误,那篇新闻也说,如果不是连续开机,遇到1bit错误的概率很小。
:
--
FROM 1.202.10.*
先选你看中的CPU,Xeon 或者 EPYC,二手,
再选对应的芯片组,然后选机箱适合的主板型号,新的或者二手,
买二手 ECC RDIMM,把主板插满,
CPU 散热器买新的。
以上过程可靠,
唉,这么说来,不知不觉我已经是一个熟练的垃圾佬了。
【 在 ttaudi 的大作中提到: 】
: 这个得连主板一起换了吧。
: 应该不是全新的吧,这个有没有什么指导,可以可靠的建立起一套系统
--
FROM 58.48.27.*
这种统计数据没什么意义。
现代操作系统,本来就有层层机制,消减内存内容受损(因故障或者攻击者恶意)的影
响。
如果内存发生bit flip,那么,它会发生在操作系统整个寻址空间的随机位置,造成后
果五花八门。
比如:
发生在未分配的内存空间——啥事都不会发生,原来就是垃圾数据;
发生在往外发送网络数据缓存区——很可能没啥大事,坏包一个,被对方丢弃要求重发
;
发生在程序运行数据中——也可能啥事没有,被运行中的检查发现,这个exception被捕
捉处理了;
当然也有捕捉处理不到的,某进程segfault,或者kernel panic,甚至整个系统崩溃,
这里对文件系统的影响就是未写入到文件系统的缓冲区数据丢失。但对zfs,btrfs这类
COW文件系统上原有的数据应该不会有问题,因为它们只改写新的数据块,除非你在干文
件系统级别的重IO维护操作,尽管这样,后果可能比你的误挂载轻很多。
而用户最担心的,会永久应用到文件系统的,可能就是内存内容损坏刚好没引起任何浪
花,逃脱检查,静默的写入到磁盘中转为合法正式数据。前面种种可能分下来,这个不
会多的。
讨厌服务中断,数据有一丁点损坏可能的关键性业务,当然是必须上ECC了,但是,ECC
不免费。很多时候,休闲用户容忍一定频率的死机,定期scrub,也能覆盖大部分。
所以我让你注意一下,你不用ecc的时候,系统如何的不稳定。在文件系统倒霉前,系统
一定会不稳到一定程度,自己评估上ECC的必要性。
如果自己上ECC成本很低,不用纠结,上就是了。锦上添花好。
【 在 ttaudi 的大作中提到: 】
: 内存多大?是7x24小时开机吗?
: 我看说32G内存连续开机5天就会出现1bit错误,那篇新闻也说,如果不是连续开机,遇到1bit错误的概率很小。
--
修改:Dazzy FROM 119.130.152.*
FROM 119.130.152.*
上zfs主要成本是硬盘
内存能上就上,没必要省
【 在 Quanm 的大作中提到: 】
: 先选你看中的CPU,Xeon 或者 EPYC,二手,
: 再选对应的芯片组,然后选机箱适合的主板型号,新的或者二手,
: 买二手 ECC RDIMM,把主板插满,
: ...................
--
FROM 27.8.148.*
“每年暑假关机”,您是高校老师吧。
组那么大容量要raid几,有没有遇到硬盘同时坏的,我看以前有人遇到过2个硬盘坏的,是不是要raidz3才可靠。
【 在 cppbuilder 的大作中提到: 】
: 32g 内存,100T 硬盘,每年暑假关机一个月其余时候一直开机,每个月一次 scrub
--
FROM 120.231.213.*
前辈啊,看着洋垃圾cpu便宜,我一直想捡洋垃圾,但又怕翻车浪费时间。
然后现在又看到有说法说不建议捡垃圾了,说AMD的5500秒所有洋垃圾,还是一手货,可靠性更有保证。
【 在 Quanm 的大作中提到: 】
: 先选你看中的CPU,Xeon 或者 EPYC,二手,
: 再选对应的芯片组,然后选机箱适合的主板型号,新的或者二手,
: 买二手 ECC RDIMM,把主板插满,
: ...................
--
FROM 120.231.213.*
用raidz2就行了。可以坏2个。大不了加个热备。
还是做好邮件提醒吧。要不然raidzx都不够折腾。
【 在 ttaudi 的大作中提到: 】
: “每年暑假关机”,您是高校老师吧。
: 组那么大容量要raid几,有没有遇到硬盘同时坏的,我看以前有人遇到过2个硬盘坏的,是不是要raidz3才可靠。
--
FROM 27.8.148.*
非常感谢回复,您非常专业。结合您和大家的回复,我得出:ZFS能上ECC就上ECC,不能上ECC,在要求不高的环境也能使用,定期scrub也可以支撑下去。这样的话,我现在普通DDR4也能用下去,后续更新硬件或者有机会就换成带ECC的内存。
【 在 Dazzy 的大作中提到: 】
: 这种统计数据没什么意义。
: 现代操作系统,本来就有层层机制,消减内存内容受损(因故障或者攻击者恶意)的影
: 响。
: ...................
--
FROM 113.89.3.*
非常感谢。请问热备份你们一般怎么做呢?建立两个raidz2?
【 在 stany 的大作中提到: 】
: 用raidz2就行了。可以坏2个。大不了加个热备。
: 还是做好邮件提醒吧。要不然raidzx都不够折腾。
:
--
FROM 113.89.3.*