- 主题:对于并行计算,洋垃圾+linux server还是很香的
那还不是os的锅吗?
【 在 cum 的大作中提到: 】
:
: 要好的调度吧。频率决定性能,但没调度好,就是小核忙死大核围观。
: 我这里同样的cpu版tensorflow,i7跑不过i5。
: --
: 发自xsmth (iOS版)
: --
:
发自「今日水木 on iPhoneProPlusMax」
--
FROM 223.74.151.*
对对,准备加个硬盘双系统。
以前项目是分钟级别,将就了。现在一套下来可能天级别,将就不了了。
【 在 dareta (dd) 的大作中提到: 】
: 那还不是os的锅吗?
: 【 在 cum 的大作中提到: 】
: :
: : 要好的调度吧。频率决定性能,但没调度好,就是小核忙死大核围观。
--
FROM 124.90.178.*
了不起
【 在 cum 的大作中提到: 】
: 起因是要跑一个matlab代码(每个循环主要时间花在稀疏矩阵构建和eigs进行稀疏矩阵特征值计算,循环间无依赖,可并行) ...
--
FROM 183.217.75.*
对于大小核,“CPU相关性”绑定后要比不绑定好,这可能是如果调度小核,会导致大核等待小核结果。
然后,昨天突发奇想,win11下用vmware安装了虚拟机ubuntu server,跑出来的结果也是非常惊人。以下记录了“CPU相关性”绑定的结果。
代码很简单,一段512次的随机累加,一段是2^18x2^18稀疏矩阵构建,一段调用eig,没别的了。
win11下,8核的加速比是3.88;
win11下的vm中,8核的加速比是5.48;
双路2680中,8核时加速比是6.90。
【 在 dareta 的大作中提到: 】
: 那还不是os的锅吗?
: 发自「今日水木 on iPhoneProPlusMax」
--
FROM 124.160.88.*
大小核快坑死我了。
洋垃圾非常划算,现在100多个核心的cpu才几千块。
【 在 cum 的大作中提到: 】
: 对于大小核,“CPU相关性”绑定后要比不绑定好,这可能是如果调度小核,会导致大核等待小核结果。
:
: 然后,昨天突发奇想,win11下用vmware安装了虚拟机ubuntu server,跑出来的结果也是非常惊人。以下记录了“CPU相关性”绑定的结果。
: 代码很简单,一段512次的随
: ..................
发自「今日水木 on V」
--
FROM 58.246.155.*
这种洋垃圾一般是淘宝还是咸鱼买,什么关键字?我也去看看
- 来自 水木社区APP v3.5.7
【 在 isxb2 的大作中提到: 】
: 大小核快坑死我了。
: 洋垃圾非常划算,现在100多个核心的cpu才几千块。
--
FROM 39.144.137.*
amd epyc 2代3代
intel 志强 xxxx x代
【 在 sgdf 的大作中提到: 】
:
: 这种洋垃圾一般是淘宝还是咸鱼买,什么关键字?我也去看看
: - 来自 水木社区APP v3.5.7
: --
:
发自「今日水木 on V」
--
FROM 220.196.194.*
貌似不行
https://ww2.mathworks.cn/matlabcentral/answers/572377-accelerate-eigs-with-gpu?#answer_472900
【 在 cum 的大作中提到: 】
: 昨天特地去找了一下,好像都200多了啊
: eigs也能显卡吗?
--
FROM 113.208.113.*
桌面cpu的方向不一样,适合于桌面级的简单应用。所以不能简单的看数字。
【 在 cum 的大作中提到: 】
: 起因是要跑一个matlab代码(每个循环主要时间花在稀疏矩阵构建和eigs进行稀疏矩阵特征值计算,循环间无依赖,可并行)。
: 整个升级过程错综复杂,看不下去可直接转标题结论:)。
: 一开始是12700跑,后来12400也一起跑,发现前者竟不如后者(早前跑过tensorflow已经发现过了,不过那时候整个耗时都可接受范围)。后来发现应该是小核参与的原因(超线程好像也有点关系),关掉超线程,设置相关性到大核后,效果基本满意了。
: ...................
--
FROM 123.112.70.*