在centos7 环境里 使用 openmpi 发现机器数超过64
mpirun -np 65 --hostfile ./host65 hostname
就不行
mpirun -np 64 --hostfile ./host64 hostname
就可以
提示:ORTE was unable to reliably start one or more daemons
因为 openmpi 是用ssh连接的 会提示 ssh:22 connection refused ssh都是打通的 pssh 可以执行,换一些机器到64台以内也可以,但一超过64就不行
也google了挺久 用chatgpt问过 说是 MaxSessions 之类的配置改了也没用
我感觉是哪个linux的网络参数配置导致的,不知道查的方向了,请教一下版上
--
FROM 124.126.229.*