我是拿eigen做的测试
L1 cache size = 32 KB
L2/L3 cache size = 8192 KB
Register blocking = 8 x 4
Matrix sizes = 2048x2048 * 2048x2048
blocking size (mc x kc) = 2048 x 520 x 344
eigen 0.160898s 106.775 GFLOPS
【 在 Taker 的大作中提到: 】
: 这问题问得……
: E3-1230V5的理论计算峰值=
: 主频 3.4 * 核数4 * 每个时钟周期浮点计算次数 16 (AVX2)
: ...................
--
FROM 73.189.34.*