水木社区手机版
首页
|版面-C++程序设计语言(CPlusPlus)|
新版wap站已上线
返回
1/1
|
转到
主题:最佳memcpy实现
1楼
|
hgoldfish
|
2020-07-29 10:25:05
|
展开
这个不可能是最佳实现。。在现代处理器上面,单字节访问非常慢。
你发的这种实现无非是朴素实现的简单推广:
1. 没考虑内存地址对齐
2. 至少用个戴夫设备吧。
3. 用 simd 指令集一次复制 32 字节才是王道啊。
edit: 有内存地址对齐。
【 在 octavo (octavo) 的大作中提到: 】
: [upload=1][/upload]
--
修改:hgoldfish FROM 112.47.122.*
FROM 112.47.122.*
29楼
|
hgoldfish
|
2020-07-31 13:34:55
|
展开
linus 说 avx512 会降频。。真的有人用 avx512 搞 memcpy?
【 在 ilovecpp (cpp) 的大作中提到: 】
: 中间隔着cache呢,哪能这么比。
: 这种通用实现也不追求最优。具体平台上用movsq乃至avx512的实现都有。
--
FROM 112.47.122.*
1/1
|
转到
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版