我也不熟,没管理过slurm集群。
稍微查了一下,有一个overcommit选项
https://slurm.schedmd.com/srun.html#OPT_overcommit
但是如果你要让任务自己抢,那不就是依赖操作系统的进程调度吗?不通过slurm,直接运行不就行了?
【 在 meizhi (meizhi) 的大作中提到: 】
: 哦,不是搞事情。。我们公司自己搭的集群,只有我这块在开发使用,只是为了同时多跑一些job,增加吞吐量。请问有啥好建议么?
: 发自「今日水木 on Redmi Note 7」
--
FROM 159.226.171.*