水木社区手机版
首页
|版面-编程技术(Programming)|
新版wap站已上线
展开
|
楼主
|
同主题展开
|
返回
上一篇
|
下一篇
|
同主题下篇
主题:为什么在内存带宽只有几十G的情况下计算性能能到上百flops?
snnn
|
2020-08-17 02:03:37
|
举个例子
Intel(R) Xeon(R) Processor E3-1230 v5
8M Cache, 3.40 GHz
官网写Max Memory Bandwidth = 34.1 GB/s, 这应该是理论值,实际很难达到。
但是我实测做矩阵乘法运算,可达100Gflops以上,单精度。矩阵大小4096x4096,三个这样的矩阵。CPU cache肯定放不下全部。
怎么解释呢?
--
FROM 73.189.34.*
上一篇
|
下一篇
|
同主题下篇
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版