- 主题:EPYC 三代 浮点运算貌似很慢啊
最近实验室搞了个EPYC 7773X 的服务器,用fortran 编了个的矩阵乘法,4000*4000的real(8)两个矩阵相乘, gfortran编译,居然还不如俺笔记本算的快,笔记本CPU 是Ryzen 7 5800H. 太令人失望了。跟intel 的 Xeon 更是没法比了。
是不是有啥窍门让它算的比较快点?
--
FROM 202.115.49.*
你先试试其他的库看看,mkl/eigen
【 在 johnstrauss 的大作中提到: 】
: 最近实验室搞了个EPYC 7773X 的服务器,用fortran 编了个的矩阵乘法,4000*4000的real(8)两个矩阵相乘, gfortran编译,居然还不如俺笔记本算的快,笔记本CPU 是Ryzen 7 5800H. 太令人失望了。跟intel 的 Xeon 更是没法比了。
: 是不是
: ..................
发自「今日水木 on iPhone 13 Pro」
--
FROM 121.225.68.*
确认用上avx2 了么 米兰可以两个fma和两个fadd
【 在 johnstrauss (TO0ooo0Old) 的大作中提到: 】
: 最近实验室搞了个EPYC 7773X 的服务器,用fortran 编了个的矩阵乘法,4000*4000的real(8)两个矩阵相乘, gfortran编译,居然还不如俺笔记本算的快,笔记本CPU 是Ryzen 7 5800H. 太令人失望了。跟intel 的 Xeon 更是没法比了。
: 是不是有啥窍门让它算的比较快点?
: --
:
--
FROM 122.96.6.*
是不是代码问题导致拼单线程了
不然解释不了 PK 5800H 的结论
跑专业测试软件吧,先排除自己代码问题
如果结论不一样,再考虑怎么提升自己能力
【 在 johnstrauss 的大作中提到: 】
: 最近实验室搞了个EPYC 7773X 的服务器,用fortran 编了个的矩阵乘法,4000*4000的real(8)两个矩阵相乘, gfortran编译,居然还不如俺笔记本算的快,笔记本CPU 是Ryzen 7 5800H. 太令人失望了。跟intel 的 Xeon 更是没法比了。
: 是不是有啥窍门让它算的比较快点?
--
FROM 182.150.27.*
@gokiller 你全家都是土鳖蛋孵的土鳖崽,王八下的王八犊子,狗逼养的的货 @lichtenlade,骂土鳖可以对吧,水木监管还确实别具风格,不好拿捏,估计也是狗逼养的的货 ,哈哈
【 在 gokiller 的大作中提到: 】
: 怎么总有土鳖把国外看成白莲花?有人的地方就有江湖,就有争斗。最多就是方式不同,程度不同罢了
【 在 johnstrauss 的大作中提到: 】
: 最近实验室搞了个EPYC 7773X 的服务器,用fortran 编了个的矩阵乘法,4000*4000的real(8)两个矩阵相乘, gfortran编译,居然还不如俺笔记本算的快,笔记本CPU 是Ryzen 7 5800H. 太令人失望了。跟intel 的 Xeon 更是没法比了。
: 是不是有啥窍门让它算的比较快点?
--
FROM 106.121.188.*