对于并行计算，洋垃圾+linux server还是很香的

水木社区手机版

主题:对于并行计算，洋垃圾+linux server还是很香的
20楼|dareta|2023-12-02 16:55:34|只看此ID
那还不是os的锅吗？
【在 cum 的大作中提到: 】
:
: 要好的调度吧。频率决定性能，但没调度好，就是小核忙死大核围观。
: 我这里同样的cpu版tensorflow，i7跑不过i5。
: --
: 发自xsmth (iOS版)
: --
:

发自「今日水木 on iPhoneProPlusMax」
--
FROM 223.74.151.*
21楼|cum|2023-12-02 17:47:52|只看此ID
对对，准备加个硬盘双系统。
以前项目是分钟级别，将就了。现在一套下来可能天级别，将就不了了。

【在 dareta (dd) 的大作中提到: 】
:  那还不是os的锅吗？
:  【在 cum 的大作中提到: 】
:  :
:  : 要好的调度吧。频率决定性能，但没调度好，就是小核忙死大核围观。
--
FROM 124.90.178.*
22楼|cperson|2023-12-02 22:20:06|只看此ID
了不起
【在 cum 的大作中提到: 】
: 起因是要跑一个matlab代码（每个循环主要时间花在稀疏矩阵构建和eigs进行稀疏矩阵特征值计算，循环间无依赖，可并行） ...
--
FROM 183.217.75.*
23楼|cum|2023-12-04 10:50:05|只看此ID
对于大小核，“CPU相关性”绑定后要比不绑定好，这可能是如果调度小核，会导致大核等待小核结果。

然后，昨天突发奇想，win11下用vmware安装了虚拟机ubuntu server，跑出来的结果也是非常惊人。以下记录了“CPU相关性”绑定的结果。
代码很简单，一段512次的随机累加，一段是2^18x2^18稀疏矩阵构建，一段调用eig，没别的了。
win11下，8核的加速比是3.88；
win11下的vm中，8核的加速比是5.48；
双路2680中，8核时加速比是6.90。

【在 dareta 的大作中提到: 】
: 那还不是os的锅吗？
: 发自「今日水木 on iPhoneProPlusMax」
--
FROM 124.160.88.*
24楼|isxb2|2023-12-06 20:09:58|只看此ID
大小核快坑死我了。
洋垃圾非常划算，现在100多个核心的cpu才几千块。
【在 cum 的大作中提到: 】
: 对于大小核，“CPU相关性”绑定后要比不绑定好，这可能是如果调度小核，会导致大核等待小核结果。
:
: 然后，昨天突发奇想，win11下用vmware安装了虚拟机ubuntu server，跑出来的结果也是非常惊人。以下记录了“CPU相关性”绑定的结果。
: 代码很简单，一段512次的随
: ..................

发自「今日水木 on V」
--
FROM 58.246.155.*
25楼|sgdf|2023-12-15 09:41:26|只看此ID
这种洋垃圾一般是淘宝还是咸鱼买，什么关键字？我也去看看
- 来自水木社区APP v3.5.7
【在 isxb2 的大作中提到: 】
: 大小核快坑死我了。
: 洋垃圾非常划算，现在100多个核心的cpu才几千块。
--
FROM 39.144.137.*
26楼|isxb2|2023-12-15 11:31:57|只看此ID
amd epyc 2代3代
intel 志强 xxxx x代

【在 sgdf 的大作中提到: 】
:
: 这种洋垃圾一般是淘宝还是咸鱼买，什么关键字？我也去看看
: - 来自水木社区APP v3.5.7
: --
:

发自「今日水木 on V」
--
FROM 220.196.194.*
27楼|xiaoda|2023-12-15 14:32:48|只看此ID
貌似不行

https://ww2.mathworks.cn/matlabcentral/answers/572377-accelerate-eigs-with-gpu?#answer_472900

【在 cum 的大作中提到: 】
: 昨天特地去找了一下，好像都200多了啊
: eigs也能显卡吗？
--
FROM 113.208.113.*
28楼|gordonsun|2023-12-15 14:45:49|只看此ID
桌面cpu的方向不一样，适合于桌面级的简单应用。所以不能简单的看数字。
【在 cum 的大作中提到: 】
: 起因是要跑一个matlab代码（每个循环主要时间花在稀疏矩阵构建和eigs进行稀疏矩阵特征值计算，循环间无依赖，可并行）。
: 整个升级过程错综复杂，看不下去可直接转标题结论：）。
: 一开始是12700跑，后来12400也一起跑，发现前者竟不如后者（早前跑过tensorflow已经发现过了，不过那时候整个耗时都可接受范围）。后来发现应该是小核参与的原因（超线程好像也有点关系），关掉超线程，设置相关性到大核后，效果基本满意了。
: ...................
--
FROM 123.112.70.*
29楼|cum|2023-12-15 17:41:56|只看此ID
?赞

【在 xiaoda (Leon) 的大作中提到: 】
:  貌似不行
:
:  https://ww2.mathworks.cn/matlabcentral/answers/572377-accelerate-eigs-with-gpu?#answer_472900
:
--
FROM 124.90.177.*