你的代码没有发挥simd的功能。
xmm一次可以装4个float,也就是同时可以进行4个float运算。
而double只能2个。
你把你都测试代码全部改成一次循环计算4个元素。
就能看出显著差异了。
【 在 confinement 的大作中提到: 】
: 每次计时开始之前,加了两行
: memset(result_double, 0, sizeof(result_double));
: memset(result_float, 0, sizeof(result_float));
: ...................
--来自微水木3.5.11
--
FROM 140.206.195.*