- 主题:amd现在这么猛,为啥在服务器没什么建树?
网卡通过 pcie 连接到 cpu,这个事情跟 cpu 有什么关系吗?
【 在 TDK1 (soho) 的大作中提到: 】
: 按摩店的U 网卡支持的不行,主流网卡厂都不去做AMD U性能调试。
: 速率上不去。
--
FROM 110.81.12.*
我大概知道一点点,因为我有个朋友做过这种项目,有跟我说过里面的一些原理。只是不太明白这事跟 CPU 有什么关系。
网卡把数据包发送到内存再通知 CPU,农企和牙膏厂有区别?接下来都是用户代码的优化,无非是减少内存复制,或者使用内核态用户态的区别,这个效率完全是软件的不考虑。
【 在 TDK1 (soho) 的大作中提到: 】
: 当然有,pcie来的数据还不得CPU去接收处理?
: 做过相关项目你就懂了。
: 各大互联网厂商服务器拼的就是收报文的效率。
: ...................
--
FROM 110.81.12.*
然而 amd 和 intel 的指令集是完全一样的。
zen1 的指令集是完全兼容 Haswell (很肯定地说),貌似也完全兼容 skylake,也就是现在服务器主流的指令集。好像只缺少 avx512 这个降频货。
不止兼容,性能还更高。现在应该是农企的产能不足,不然牙膏厂根本没法挡 zen1 胶水多核的威力。
【 在 TDK1 (soho) 的大作中提到: 】
: 错,互联网大厂的系统,CPU收包处理全是针对指令集的类似汇编函数,不用纯C,效率太慢。
: 具体的说就是这些函数全是绑死指令集的。
: 连网易这类中型互联网公司都做这个优化,再小的厂我就不知道了。腾讯阿里蚂蚁这些不用说。
: ...................
--
FROM 110.81.12.*
最近 amd 加了好几个关于 cache 的指令,不知道是不是用于做这些事情的。
如果真的能做到,那提升一定很大,现在 L3 cache 这么大,可以利用起来。
【 在 ArchLinux (a lightweight and flexible distribution) 的大作中提到: 】
: 听说现在一些网卡DMA可以直接把数据搬运到CPU的cache,但是不知道这和CPU实现有多大关系。相关benchmark我也没见过。
--
FROM 110.81.12.*
zen2 就支持 avx256 啊。这两家是指令集兼容的。你看现在我们日常使用的 64 位 x86 指令集都是 amd 发明的。
avx512 啊,呵呵。。台式机的 i7 能从 4.5g 降到 0.8g,简直是搞笑。
【 在 TDK1 (soho) 的大作中提到: 】
: 大厂现在都是AVX2,下一步到avx512.
: axv512位宽是AVX2的俩倍!
--
FROM 110.81.12.*