确认用上avx2 了么 米兰可以两个fma和两个fadd
【 在 johnstrauss (TO0ooo0Old) 的大作中提到: 】
: 最近实验室搞了个EPYC 7773X 的服务器,用fortran 编了个的矩阵乘法,4000*4000的real(8)两个矩阵相乘, gfortran编译,居然还不如俺笔记本算的快,笔记本CPU 是Ryzen 7 5800H. 太令人失望了。跟intel 的 Xeon 更是没法比了。
: 是不是有啥窍门让它算的比较快点?
: --
:
--
FROM 122.96.6.*