- 主题:自己想攒个四卡的深度学习工作站,硬件来源?
双精度对ai没啥用。
现在ai都在搞4bit计算了,还双精度...
【 在 sweanson 的大作中提到: 】
: 建议资金不富裕就买Quadro K6000*4,资金中等买M6000,资金充裕买 P6000,都有 12G和24G版,价格差1000,单价tb很多。
: 钱都花那么多了,还不支持双精度计算,投资完全浪费。
: 可以配个超微 单路 支持 4路双宽的板子3-4000,加个多核cpu+内存。资金有限也可以整3路,性能高的。都有相应的解决方案。
: ...................
--
FROM 117.136.46.*
pcie x1的垃圾而已
【 在 LYMing1986 的大作中提到: 】
: 看到个东西,仅供参考
: [upload=1][/upload]
--
修改:lvsoft FROM 117.136.46.*
FROM 117.136.46.*
最低pcie3.0 x8,等价pcie4.0 x4
再低就有显著影响了。
你的问题可能是接触不良跑在降级的profile上了。
【 在 haiyy 的大作中提到: 】
: 请教一下,我的主板是x79的,用cpu-z查看应该是pcie3.0的,可用gpu-z查看显卡却是工作在pcie2.0下,问题出在哪里?像3090这种pcie4.0的显卡如果工作在pcie3.0或2.0下,对深度学习的训练有多大影响?
--
FROM 117.136.46.*
ups意义不大。个人用遇到掉电了也无所谓,反正训练过程中会有checkpoint,顶天浪费1-2小时而已。
内存问题看会不会用到off load,不然也一样意义不大,不管是容量还是带宽。
【 在 VincentGe 的大作中提到: 】
: 消费卡不建议多卡,并行效果不好,单卡4090,3090不错。有钱上计算卡,V100 32G性价比不错,三楼的P40也可以考虑。根据你的方向来,如果做NLP一定大显存。
: 内存4通道打底,200G保底,这个也很重要,看你数据集小。
: 主板一定要好,二手服务器也可以,他们的机子要定期退的。注意电源,UPS非常重要,IPS是可选的,电源要好,主要空调。
: ...................
--
修改:lvsoft FROM 117.136.46.*
FROM 117.136.46.*
这种概率可能还没4090供电线烧了的概率大。
小概率事件无视就行了。
另外,gpu算错很常见的事情,不然你以为为啥ecc会是tesla级的配置?
【 在 VincentGe 的大作中提到: 】
: 内存问题好说,但UPS绝对非常重要。
: 有一次我一客户出错了,算出了一个意外值,排查了好久,最后判断是显卡意外断电核心烧了,UPS不是为了保模型,是为了保硬件。
:
--
FROM 180.111.26.*