怎么感觉24G显存不太够用？

水木社区手机版

主题:怎么感觉24G显存不太够用？
楼主|op1qtz|2022-11-08 18:57:02|只看此ID
随便一个embedding+transformer+batch，显存就超了
--
FROM 223.104.41.*
1楼|loooong|2022-11-08 22:16:45|只看此ID
对，遇到同样问题。

【在 op1qtz 的大作中提到: 】
: 随便一个embedding+transformer+batch，显存就超了
--
FROM 221.212.116.*
2楼|Blue|2022-11-21 10:47:26|只看此ID
是的，几个个五位数维度的矩阵就把显存吃光了
--
修改:Blue FROM 219.237.112.*
FROM 219.237.112.*
3楼|hongyan2022|2022-11-29 01:35:43|只看此ID
embedding+transformer
干吗？

你不用现成的结果而是自己训transformer ？

【在 op1qtz 的大作中提到: 】
: 随便一个embedding+transformer+batch，显存就超了
--
FROM 47.152.116.*
4楼|donkeymeat|2022-11-29 02:16:33|只看此ID
transformer的patch大小多少，太小肯定超啊。再加上multi-head。大公司都至少16块A100训练的。算力推得满满的。个人玩玩就行。
--
FROM 114.249.223.*
5楼|heyuanlie|2022-11-29 09:09:59|只看此ID
搭车问一下，现在的计算框架能支持amd(ati)的显卡吗？

【在 op1qtz 的大作中提到: 】
: 随便一个embedding+transformer+batch，显存就超了
--
FROM 120.230.113.*
6楼|hongyan2022|2022-11-30 02:50:48|只看此ID
好多库对不同的OS 或是CPU 都专门优化过的
A卡上也有

一二十年前 N开始搞自己的 CUDA 当时MS 正在推DirectX 非常不高兴N 搞自己的计算库
但是 N顶住了而且靠着 CUDA 赶上了机器学习

个人当时选卡的时候觉得还是不趟混水的好
python tensorflow pytorch docker 甚至操作系统 .... 没一个是铁板一块的可靠的动不动会有点小问题
运气不好碰上点问题时间就全搭进去了

【在 heyuanlie 的大作中提到: 】
: 搭车问一下，现在的计算框架能支持amd(ati)的显卡吗？
:
--
FROM 47.152.116.*
7楼|heyuanlie|2022-11-30 12:46:09|只看此ID
谢谢大牛！
看来现阶段还是用N卡比较保险了。

【在 hongyan2022 的大作中提到: 】
: 好多库对不同的OS 或是CPU 都专门优化过的
: A卡上也有
: 一二十年前 N开始搞自己的 CUDA 当时MS 正在推DirectX 非常不高兴N 搞自己的计算库
: ...................
--
FROM 120.230.113.*
8楼|hongyan2022|2022-12-01 01:03:49|只看此ID
我不是大牛在AI上是爬行的蜗牛呢

【在 heyuanlie 的大作中提到: 】
: 谢谢大牛！
: 看来现阶段还是用N卡比较保险了。
:
--
FROM 47.152.116.*
9楼|sataMXH|2023-01-11 21:09:28|只看此ID
16块A100算什么模型？
【在 donkeymeat 的大作中提到: 】
: transformer的patch大小多少，太小肯定超啊。再加上multi-head。大公司都至少16块A100训练的。算力推得满满的。个人玩玩就行。
--
FROM 115.221.249.*