那是肯定的
MS以前有个老帖子,论述比较清楚,而且有性能对比测试的现成代码,MS自家居然给删了
幸好有人mirror了
Windows Data Alignment on IPF, x86, and x86-64
https://blog.csdn.net/zade/article/details/549411
【 在 Akyrum 的大作中提到: 】
: 对齐运算速度是快些,而我以前拿gromacs里一些函数测了测,{copy至对齐+后续运算}耗时比{_mm256_loadu+后续运算}长百分之几~十。所以我习惯不对齐直接拿来算
: :
--
FROM 114.241.227.*