这实现已经相当好了,版上绝大部分人应该是写不出来的,不知道上面说不好的仔细看过没。跟汇编比除了没法用SSE,该做的优化都做到了。
1. 4字节拷贝。没按8字节优化可能是追求代码简洁。
2. dest的4字节对齐。
3. 主循环内4条指令超标量同时拷贝32字节,一般处理器也够了。
4. 纯C,可移植性好,而且写的简洁美观。
ps,我面试时coding基本必问memset或memcpy,十几年目前没遇到过能考虑到超过三条的人。
【 在 octavo 的大作中提到: 】
: [upload=1][/upload]
--
FROM 106.39.149.*