硬件加速就和语言关系不大了。这个方向还可以试试
https://github.com/Sergio0694/ComputeSharp应该比cpu simd快
【 在 finlab 的大作中提到: 】
: 今天晚上重新实现了C#的simd, 在我的i5 8265U上只需要1.8秒了,比simd 的C++的2.96秒还快很多。
: 需要说明的是,昨天直接用AVX2指令实现simd, 因为不支持除法,先把int转成float然后做除法。
: 结果一直不对,发现是对于比较大的i,转成float后精度损失了,所以结果就不对了。
: ...................
--
FROM 123.116.198.*