激活svml(avx2)后,只要0.006秒了。
从一开始C++的单线程0.14秒,到python numba(i5 8265u,4c8t,avx2)的0.006秒,
理论最高加速8*4=32倍,实际加速23倍。
numba太牛了,可以几乎不用做什么工作,就能同时发挥多现场和simd的威力
这样完全可以胜任cpu密集的工作了
【 在 finlab 的大作中提到: 】
: @njit(parallel=True,fastmath=True)
: def run2(ff):
: s=0.0
: ...................
--
修改:finlab FROM 123.112.71.*
FROM 123.112.71.*