这有个关于linux的同样问题,
它这个除了memcpy的指令实现不同(在你的windows上可能没这个问题,因为应该是同一个exe拿去跑server和workstation的),还提到了:
streaming store(non-temporal store)
memory latency
memory align等方面的影响
https://stackoverflow.com/questions/22793669/poor-memcpy-performance-on-linux
ECC的影响较小,这有个老数据:
https://www.pugetsystems.com/labs/articles/ECC-and-REG-ECC-Memory-Performance-560/
【 在 grainbuds 的大作中提到: 】
: 现在使用的是Windows系统,我查了一下,尝试使用VirtualAllocExNuma从同一个node分配内存,测试下来没有变化,不知道是否正确。
--
修改:z16166 FROM 125.35.123.*
FROM 125.35.123.*