高算主要基础课是计算机体系结构,编码只是技巧应用
【 在 Akyrum 的大作中提到: 】
: 平时抠代码基本凭心情套用tbb::pineline和tbb::parallel,没用过L1 optimize也没用过cpu affinity。编译后的程序在单cpu机器上多核较单核加速比不错,但在2路ylj、4路金牌上明明cpu占用率80% 了,测下来吞吐率加速比不高,原因可能是什么?
: 我是不是该补些姿势,从哪里学起?
- 来自「最水木 for iPhone Xs」
--
FROM 124.160.213.*