不要怀疑你的测试结果。
对于单线程而言,内存效率取决于从cpu的L1D转移数据的延迟。由于应用场景的不同,intel的桌面端cpu的延迟要优于服务端cpu,内存效率自然更高。
这个资源库有更为详细的测试,有各种memcpy方法,在xeon以及其他cpu上的测试结果,可供参考。
https://github.com/marcmicalizzi/memcpy_test
另外按照intel的建议,服务端cpu内存操作应尽可能的使用nt stream store。大内存拷贝使用ermsb。
【 在 grainbuds 的大作中提到: 】
: 一台配置较高的服务器上memcpy的性能居然不如一台老旧的笔记本电脑,测试了拷贝不同大小字节的数据,最差的情况(4MB数据拷贝)居然差了4倍,400ms vs 100ms(循环500次总时间)。
: 服务器配置:2 * Intel Xeon 6242R + 4 * 8G DDR4 3200 ECC
: 笔记本配置:Intel i7-6820HQ + 2 * 8G DDR4 2133
: ...................
--来自微微水木3.5.12
--
FROM 223.167.168.*