可以参考一下DPDK的
x86
https://github.com/cranechu/dpdk/blob/master/lib/librte_eal/common/include/arch/x86/rte_memcpy.h
https://www.intel.com/content/www/us/en/developer/articles/technical/performance-optimization-of-memcpy-in-dpdk.html?wapkw=memcpy
【 在 adoal 的大作中提到: 】
: 如果source和dest对的偏移不一样,比如一个余1一个余0,
: 那是不是就很难优化了^o^
:
--
FROM 123.118.191.*