今年又是挤牙膏的一年

水木社区手机版

主题:今年又是挤牙膏的一年
30楼|beaver|2023-09-08 12:26:38|只看此ID
您的意思是不是nvidia现在能做1.5T显存用于计算，是在显示卡芯片链接量级上实现的？

【在 haili 的大作中提到: 】
:
: 这不太可能啊，现在m1 ultra /m2 ultra 就是靠内存做在芯片里面实现大带宽的，单扩内存肯定做不到，而且也没大带宽的效果了，最多变成高性能外存。
: 如果多插芯片，不说价格，还有个互连带宽问题。
--
FROM 116.7.169.*
31楼|haili|2023-09-08 15:28:18|只看此ID
nvlink，现在的dgx-h100单台640G总显存，就是8个H100卡加内部高速互联做到，而且还有专门的网络供多机互联。
https://www.nvidia.com/en-us/data-center/dgx-h100/

不是说苹果一定做不了，但是肯定不是你设想的简单模式，基本上也不会是Mac Pro系列了。

【在 beaver 的大作中提到: 】
: 您的意思是不是nvidia现在能做1.5T显存用于计算，是在显示卡芯片链接量级上实现的？
:
--
FROM 116.213.168.*
32楼|beaver|2023-09-08 17:53:16|只看此ID
我看了一下，我不专业啊，可能看的不对……不过看起来这也是板卡级别的电气连接呀，并不是芯片到芯片的的连接，才能实现高带宽。

我就是想啊，不知道这个大模型是需要怎么操作的，如果每个 m2ultra有192G内存，是处理器到内存的相对紧密的封装方式，直连大带宽。一个计算任务是否能分为8个子模块，分给8个m2ultra+192G来并行执行。然后彼此之前的互通是不是信息传递压力会小一些？如果是这样，级联就能做到了呀。为啥说就不行呢。

如果实在是刀片插卡这个扩张是做不到的话，那么是不是干脆分装四块或者八块m2ultra在一个板子上。没有拓展性了，但是功能足够强大？

如果实在实在不行……那么刀片插入的这个动作，看来是不能用于AI计算所需要的大带宽了。那就退而求其次，至少能媲美甚至超过 1.5T的DDR吧。现在192G连好几年前的 mac pro的内存扩展性都比不上，这个确实有点渣

【在 haili 的大作中提到: 】
: nvlink，现在的dgx-h100单台640G总显存，就是8个H100卡加内部高速互联做到，而且还有专门的网络供多机互联。
: https://www.nvidia.com/en-us/data-center/dgx-h100/
: 不是说苹果一定做不了，但是肯定不是你设想的简单模式，基本上也不会是Mac Pro系列了。
: ...................
--
FROM 116.7.169.*
33楼|strange|2023-09-14 20:22:36|只看此ID
所以现在发布会没人看了
哪像以前，有人熬夜观看
【在 chongmingle 的大作中提到: 】
: 改C口，钛合金，潜望镜头，没了，真是无聊啊
:
: - 来自水木社区APP v3.5.7
: ...................
--来自微微水木3.5.14
--
FROM 39.128.45.*
34楼|laputa2013|2023-09-14 21:50:40|只看此ID
提价了？

【在 ReverseSMTH (逆水) 的大作中提到: 】
:  灵动岛下放+C口，就能让普通版比年卖得多了，更何况还有内部硬件升级，  去年芯片基本没升
:
:  窄边+C口+相机，稳住pro版和去年卖的一样多问题不大，唯一的变数是提价，看市场接不接得住。
:
--
FROM 114.254.22.*