传说中的 export MKL_DEBUG_CPU_TYPE=5 用了没?
【 在 Akyrum (人類に栄光あれ) 的大作中提到: 】
: 自己写的蒙特卡洛仿真程序,用了tbb和mkl,在8c16t的台式机cpu占用率只有35%左右(debug版本能开到95%+)。
: 指定tbb只用单线程,开8个进程同时跑,也是35%左右。
: 我确定代码里没用等待或锁,并且IO都放到了ramdisk里,运算速度上不去的原因会是什么呢?
: ...................
--
FROM 202.114.111.*