- 主题:对于并行计算,洋垃圾+linux server还是很香的
看不明白,1,4,...,20的运行时间不是应该越来越少吗?
【 在 cum 的大作中提到: 】
: 所以针对我目前的程序特地写过一个挑最佳核数的测试程序。
: matlab中eigs本身也是多线程应用的,指定规模后,不开parpool一个迭代需要跑31秒(相当于有多线程)。parpool(1)是47秒,parpool(4)是48~51秒,parpool(20)大概衰减到60-70秒之间。因为每个迭代内存峰值在4G左右,整机目前才配64G,所以parpool(20)的时候一个worker掉线,相当于parpool(19)。
: 虽然折腾,整体非常满意。整套下来才花了1900不到(显卡硬盘用旧的且闲置的),还不到去年一个12700的价格。后面再200块钱加个矿卡去。
--
FROM 113.233.213.*
matlab是每个迭代间并行,统计的是parfor的时候单核上跑一个迭代的时间,等效时间相当于除以核数。
【 在 heideggerr (heideggerr) 的大作中提到: 】
: 看不明白,1,4,...,20的运行时间不是应该越来越少吗?
:
:
: 【 在 cum 的大作中提到: 】
--
FROM 124.90.178.*
就是说,1核是 47秒/1 ,4是(48~51秒)/4,19核是 (60-70秒)/19,那你这个加速比还真是令人惊叹!我写过很多多核程序,加速比就没有超过4的,高纳德也说他这辈子没见过几个加速比大于6的算法。所以,我的直觉是,要么你的算法根本就是各个核心之间几乎没有任何关系的(类似于n个工人往30层楼上搬砖之类的)--所以这种问题往往几乎没有任何意义,要么就是程序中有bug。
【 在 cum 的大作中提到: 】
: matlab是每个迭代间并行,统计的是parfor的时候单核上跑一个迭代的时间,等效时间相当于除以核数。
--
FROM 113.233.213.*
【 在 cum 的大作中提到: 】
: 我们平时都写的小代码。当然偶尔还是会规模大一点。windows是因为用习惯了,属于历史遗留。
: 昨日linuxserver连gui都没敢安装,折腾了数日,总不能如愿,都有点窝火了。也有付费集群,0.15元1核时,但因为都是调试阶段的代码,花起来也心疼。
linux server装gui?
为什么要和自己过不去?
--
FROM 120.244.234.*
随机扰动,确实并行度高,无依赖。
【 在 heideggerr (heideggerr) 的大作中提到: 】
: 就是说,1核是 47秒/1 ,4是(48~51秒)/4,19核是 (60-70秒)/19,那你这个加速比还真是令人惊叹!我写过很多多核程序,加速比就没有超过4的,高纳德也说他这辈子没见过几个加速比大于6的算法。所以,我的直觉是,要么你的算法根本就是各个核心之间几乎没有任何关系的(类似于n个工人往30层楼上搬砖之类的)--所以这种问题往往几乎没有任何意义,要么就是程序中有bug。
:
:
: 【 在 cum 的大作中提到: 】
--
FROM 36.19.165.*
难道intel在吹牛逼吗?Stephen Robinson亲口说gracemont性能超过skylake
【 在 cum 的大作中提到: 】
:
: 是windows11。
: 这个12700因为平常家用的,多用途,装linux可能有点不合适。
: --
:
发自「今日水木 on iPhoneProPlusMax」
--
FROM 223.74.151.*
要好的调度吧。频率决定性能,但没调度好,就是小核忙死大核围观。
我这里同样的cpu版tensorflow,i7跑不过i5。
【 在 dareta (dd) 的大作中提到: 】
: 难道intel在吹牛逼吗?Stephen Robinson亲口说gracemont性能超过skylake
: 【 在 cum 的大作中提到: 】
: :
: : 是windows11。
--
FROM 36.19.165.*
所以加速的不是算法,是找更多的工人做同样的事。
【 在 cum (天天早上看到你睡意朦胧的样子) 的大作中提到: 】
: 随机扰动,确实并行度高,无依赖。
:
: 【 在 heideggerr (heideggerr) 的大作中提到: 】
: : 就是说,1核是 47秒/1 ,4是(48~51秒)/4,19核是 (60-70秒)/19,那你这个加速比还真是令人惊叹!我写过很多多核程序,加速比就没有超过4的,高纳德也说他这辈子没见过几个加速比大于6的算法。所以,我的直觉是,要么你的算法根本就是各个核心之间几乎没有任何关系的(类似于n个工人往30层楼上搬砖之类的)--所以这种问题往往几乎没有任何意义,要么就是程序中有bug。
--
FROM 36.19.165.*
其实我想说的是,你这样的并行问题是非常非常有限的,大部分并行问题都不是这样的,所以低频多核的(旧的)服务器在觉大多数情况下完全不如(新的)8核的高频机器来得有效。
【 在 cum 的大作中提到: 】
: 随机扰动,确实并行度高,无依赖。
--
FROM 113.233.213.*
这个确实。这个更像分布式。
【 在 heideggerr (heideggerr) 的大作中提到: 】
: 其实我想说的是,你这样的并行问题是非常非常有限的,大部分并行问题都不是这样的,所以低频多核的(旧的)服务器在觉大多数情况下完全不如(新的)8核的高频机器来得有效。
:
: 【 在 cum 的大作中提到: 】
: : 随机扰动,确实并行度高,无依赖。
--
FROM 124.90.178.*