超线程关掉试试
【 在 Akyrum 的大作中提到: 】
: 自己写的蒙特卡洛仿真程序,用了tbb和mkl,在8c16t的台式机cpu占用率只有35%左右(debug版本能开到95%+)。
: 指定tbb只用单线程,开8个进程同时跑,也是35%左右。
: 我确定代码里没用等待或锁,并且IO都放到了ramdisk里,运算速度上不去的原因会是什么呢?
: 我怀疑是源码里memcpy/memmove用得过多,但就现在这计算速度估算了一下,内存吞吐2500MB/s,离内存瓶颈还远着吧?有什么工具能分析瓶颈在哪吗?
来自 MI 6
--
FROM 171.10.80.*