- 主题:请教ubuntu下workstation的故障检测
我有一台装了Ubuntu 18.04的workstation。内存有96G。
我跑自己的程序,用了40多个G,运行十多分钟,电脑就没有反应了。
但是用stress测试
stress --vm 15 --vm-bytes 5G --vm-hang 100 --timeout 500s
stress --vm 1 --vm-bytes 60G --vm-hang 100 --timeout 500s
一点问题都没有。
也测过内存
sudo memtester 200M 1
没有报错。
我怀疑主板可能有问题。请问在Ubuntu环境下如果测试?
--
FROM 150.182.222.*
看一下syslog
【 在 wcwyf (多尔衮) 的大作中提到: 】
: 我有一台装了Ubuntu 18.04的workstation。内存有96G。
: 我跑自己的程序,用了40多个G,运行十多分钟,电脑就没有反应了。
: 但是用stress测试
: ...................
--
FROM 116.232.49.*
没有响应,强行重启后。
vim /var/log/syslog
里面唯一能发现问题的是类似
BUG soft lockup - cpu#0 stuck for 20s
但是CPU肯定没有问题。因为我有程序用所有CPU core跑个几十天(这个程序内存用的很少),没有出任何问题。
【 在 RuralHunter 的大作中提到: 】
: 看一下syslog
:
--
FROM 150.182.222.*
可能是内核bug,升级一下操作系统试试。
【 在 wcwyf (多尔衮) 的大作中提到: 】
: 没有响应,强行重启后。
: vim /var/log/syslog
: 里面唯一能发现问题的是类似
: ...................
--
FROM 116.232.49.*
40G+的内存使用量是物理内存还是虚拟内存?我见过的这种现象都是虚拟内存(也就是总内存)用量太大,超过了机器的承受能力
【 在 wcwyf 的大作中提到: 】
: 我有一台装了Ubuntu 18.04的workstation。内存有96G。
: 我跑自己的程序,用了40多个G,运行十多分钟,电脑就没有反应了。
: 但是用stress测试
: ...................
--
FROM 123.112.70.*
这个有可能,物理内存不够的话,会不停的做page swap,导致速度很慢。
可以用perf运行应用程序,看内核events和pmu counter。
【 在 likely 的大作中提到: 】
: 40G+的内存使用量是物理内存还是虚拟内存?我见过的这种现象都是虚拟内存(也就是总内存)用量太大,超过了机器的承受能力
:
: 【 在 wcwyf 的大作中提到: 】
: ....................
--
FROM 101.84.36.*
是物理内存。这样的电脑我有两台。软硬件配置都一样。另一台完全没有问题。所以我怀疑这台硬件哪里有问题。
【 在 likely 的大作中提到: 】
: 40G+的内存使用量是物理内存还是虚拟内存?我见过的这种现象都是虚拟内存(也就是总内存)用量太大,超过了机器的承受能力
:
: 【 在 wcwyf 的大作中提到: 】
: ....................
- 来自「最水木 for iPhone 6s Plus」
--
FROM 162.238.157.*
一般是内核bug,可以设置 kernel.softlockup_panic=1
让他自动重启,
【 在 wcwyf (多尔衮) 的大作中提到: 】
: 是物理内存。这样的电脑我有两台。软硬件配置都一样。另一台完全没有问题。所以我
: 怀疑这台硬件哪里有问题。
: - 来自「最水木 for iPhone 6s Plus」
--
FROM 120.229.207.*