根据阿姆达定律,即使只有5%的通讯成本,加速比最多也只能达到20(现实一般只能到10左右),所以,超过10核以后,增加核心数所带来的提升就越来越小,到了20核之后,就没有提升了。所以,没必要盲目追求增加核心数。
【 在 cum 的大作中提到: 】
: 起因是要跑一个matlab代码(每个循环主要时间花在稀疏矩阵构建和eigs进行稀疏矩阵特征值计算,循环间无依赖,可并行)。
: 整个升级过程错综复杂,看不下去可直接转标题结论:)。
: 一开始是12700跑,后来12400也一起跑,发现前者竟不如后者(早前跑过tensorflow已经发现过了,不过那时候整个耗时都可接受范围)。后来发现应该是小核参与的原因(超线程好像也有点关系),关掉超线程,设置相关性到大核后,效果基本满意了。
: ...................
--
FROM 113.233.213.*