没那么神奇,就是正常情况
我测试过ThreadPool,单个Task耗时在0.2ms时,并行就有收益了
到了0.5ms,收益就挺明显的,你的数据符合测试结果
【 在 Akyrum (为祖国健康吃饭100年) 的大作中提到: 】
: 当时我那数据量还没L3大,release版跑1步才0.几ms,试了tbb/ppl/openmp速度都没提升....
: 还发现ipp开自动多线程能把矩阵乘耗时从2ms加速到0.几ms,单线程单步耗时这么短的计算还能用多线程加速,不知intel怎么实现的
--
FROM 114.252.34.69