1. 如果你认为的最好指的是cycle级别,那么对齐最好。是否对齐也跟你使用的指令有关,但是也许为了对齐会产生overhead大于对齐带来的好处
2. memcpy在系统中的延迟也来自于跳转预测失败,所以很多地方我采取覆盖写的方法减少跳转指令的使用,同时这种方法也解决了memory false dependence
3. 如果能不用还是尽量不用,除了跳转预测失败带来的问题,数据迁移也会污染数据和指令
【 在 hgoldfish 的大作中提到: 】
: 假定要执行 memcpy(*dest, *src, n) 复制一段内存。正常在 amd64 计算机下,dest, src 两个指针最好是对齐的。
: 那么,不同的计算机架构会要求不同的对齐方式吗?还是说只要对齐到 4 个字节就行?
--
修改:MaLing FROM 116.30.17.*
FROM 140.210.153.*