有没有推荐的书或课程/有没有推荐的开源项目可学习模仿下?
研究研究为啥高手的linpack能64核intel 4numa暴打32核amd 4numa,而我写的程序64核intel勉强打平32核amd
【 在 ziqin 的大作中提到: 】
: 用的什么编译器,intel cpu要用intel的编译器,用其他编译器的话avx512这些开了没有
ms的编译器,因为公司大部分机器禁用avx512所以没开512
: HT不要用,HT是假的,用了反而影响性能,numa上同一模块数据有没有限定cpu组
: 程序里用的什么数据结构,是否cache友好,访问的时候是否按内存遍历,有没有很多shared variable,哪怕是shared read
: ...................
--
FROM 123.150.181.*