水木社区手机版
首页
|版面-C++程序设计语言(CPlusPlus)|
新版wap站已上线
返回
1/1
|
转到
主题:求指点高性能计算的技术栈学习路径
1楼
|
dedeLotus
|
2021-05-02 01:25:35
|
展开
可能需要了解一下NUMA这个概念
【 在 Akyrum (为祖国健康吃饭100年) 的大作中提到: 】
: 平时抠代码基本凭心情套用tbb::pineline和tbb::parallel,没用过L1 optimize也没用过cpu affinity。编译后的程序在单cpu机器上多核较单核加速比不错,但在2路ylj、4路金牌上明明cpu占用率80% 了,测下来吞吐率加速比不高,原因可能是什么?
: 我是不是该补些姿势,从哪里学起?
--
FROM 218.83.119.*
12楼
|
dedeLotus
|
2021-07-28 20:42:31
|
展开
先用CPU测试软件测个分再分析吧
不是代码问题的话,能慢几十倍,这是有缓存没缓存的区别,不知道你的bios是否有禁用二级三级缓存的设置
【 在 Akyrum (为了蔚蓝而清净的世界) 的大作中提到: 】
: bios里关掉HT,start /affinity强制只跑在1颗U上,在这台intel上入栈出栈耗时比amd慢太多,栈上临时对象没啥特别的,大多stl轮子。大神们,会是哪里出问题了?
--
FROM 101.85.238.*
1/1
|
转到
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版