- 主题:为啥要分内存和显存?
【 在 hgoldfish 的大作中提到: 】
: 标 题: Re: 为啥要分内存和显存?
: 发信站: 水木社区 (Sat Feb 8 00:22:54 2025), 站内
:
: 其实吧。果子的统一内存才是王道。虽然现在价格贵。但是慢慢地都可以降下来啊。
这个“慢慢”恐怕要很长时间
这种超高频率超高带宽,本来单体成本就高
容量密度暂时没有黑科技,实现大容量内存就只能使用多个核心胶水粘贴封装
这样物理成本没办法降下来
:
: 不说服务器。我觉得以后的手机芯片应该是级层架构,从上到下依次是:
:
: 1. GPU
: 2. CPU
: 3. 超级 L3 cache, 容量至少 8GB
: 4. 3D Point
:
: 然后呢。把 L3 cache + 3D Point 融合起来搞 1TB 的内存。
:
: 这四层依次叠起来。都放到金刚石里面。
:
: 以后不再需要单独的内存了。这样的架构虽然不适合服务器,但是放到手机上可以搞出 1TB 的内存省电集成度又高。
:
: 【 在 cha 的大作中提到: 】
: : 技术上是可以2合1的
: : 但两者的性能相差太多了
: : 如果合并之后都向显存方向靠(apple的统一内存模式),那价格贵死人
: : ...................
:
: --
: 灭绝人性啊
:
:
: ※ 来源:·水木社区 mysmth.net·[FROM: 120.37.20.*]
--
FROM 114.242.33.*
就我说的,别用 DRAM 了。用 1GB-8GB 的 L3 超大缓存,融合 NAND/3DPOINT 代替传统的大功耗 DRAM 内存。
这种融合内存如果热点数据超过 8GB 肯定很慢。但胜在大容量啊。NAND 和 3DPOINT 做到 1TB 都很容易。
【 在 cha 的大作中提到: 】
: 这个“慢慢”恐怕要很长时间
: 这种超高频率超高带宽,本来单体成本就高
: 容量密度暂时没有黑科技,实现大容量内存就只能使用多个核心胶水粘贴封装
: ...................
--
FROM 110.84.122.*
核显不就是这么干的么,主要是内存速度慢,其实核显一般也是带专用显存的,只是普遍比较小
另外,即使独显,在显存用完的时候,也会开始用内存
【 在 chylli 的大作中提到: 】
: 直接内存里跑deepseek不行吗?
: --
:
发自「今日水木 on iPhone 15 Plus」
--
修改:kettle FROM 223.104.79.*
FROM 223.104.79.*
集成度太高必然会贵,因为需求多样性,都集成在一个SOC上很多module就会用不上,要么就是某些module不够用然后用户还扩展不了,就像现在笔记本焊死内存都被很多人喷,果子的优势是通过硬件定义软件从而统一需求,其他家没这个能力吧
【 在 hgoldfish 的大作中提到: 】
: 其实吧。果子的统一内存才是王道。虽然现在价格贵。但是慢慢地都可以降下来啊。
:
: 不说服务器。我觉得以后的手机芯片应该是级层架构,从上到下依次是:
:
: 1\. GPU
: 2\. CPU
: 3\. 超级 L3 cache, 容量至少 8GB
: 4\. 3D Po
: ..................
发自「今日水木 on iPhone 15 Plus」
--
修改:kettle FROM 223.104.79.*
FROM 223.104.79.*
【 在 chylli 的大作中提到: 】
: 直接内存里跑deepseek不行吗?
显存距离显卡核心物理上要近, 距离内存太远,
这个是物理延迟, 电磁波的物理延迟, 另外, 显存使用的一般领先内存一个代词,
比如, 现在内存ddr5 还没完全普及, 显卡却大量使用的ddr6显存。 内存是ddr4的时候, 显存就用的ddr5.
如果和cpu共用内存, 还会有争用和等待的问题,而显卡游戏输出有时是需要实时的,
如果出现等待, 很可能会导致顿挫,掉帧, 影响实际应用。
其实, 核显一般都是使用内存做显存, 导致, 核显的性能普遍无法和独立显卡匹敌。
--
FROM 124.126.2.*
【 在 hgoldfish 的大作中提到: 】
: 就我说的,别用 DRAM 了。用 1GB-8GB 的 L3 超大缓存,融合 NAND/3DPOINT 代替传统的大功耗 DRAM 内存。
: 这种融合内存如果热点数据超过 8GB 肯定很慢。但胜在大容量啊。NAND 和 3DPOINT 做到 1TB 都很容易。
:
8GB sram要多大面积要多少钱, 工艺专家来讲讲
--
FROM 117.35.158.*
农企的 L3 最高到了 1GB,但那是 eypc,不好分析贵在哪里。
消费级的 3D cache 倒是不贵,容量不大 96M,只比普通版本贵 300 块钱,换算成 1GB 大约是三千元。
等个三五年以后 1GB 估计可以降到千元以内。这个容量的 sram 可以拿来融合 3D Point 了。到时手机内存搞 256GB 还是持久内存。
【 在 giant85 的大作中提到: 】
: 8GB sram要多大面积要多少钱, 工艺专家来讲讲
--
修改:hgoldfish FROM 110.84.122.*
FROM 110.84.122.*
【 在 Jacqueline 的大作中提到: 】
: 模型运行的时候要整个刷一遍,大点的模型ddr4/ddr5带宽都跟不上,慢,内存里跑70b一秒吐一个字
如果都在显卡上用gpu指令调度延迟少会有几倍加速。
如果经过cpu和总线调度,读取复制,延迟就太大了。
--
FROM 180.139.99.*
jetson orion就是内存显存共用,但是共用的存储速度比显卡的显存慢很多。
【 在 hgoldfish 的大作中提到: 】
: cpu 和 gpu 设计在一起的时候就是这样的。
: 但问题是现在 cpu 厂商是农企和牙膏厂,gpu 厂商是核弹厂。没有整合在一起。所以各自有自己的内存。
: 农企的 apu 和水果公司的 m4 芯片,把 cpu/gpu 设计在一起,这时候,内存也同时是显存。
: ...................
--
FROM 218.108.210.*
咱搞计算机的,其实很容易遇到不得不考虑的平衡,成本和性能永远是一对必然存在的矛盾。ddr和gddr之所以分家就是为了各自解决各自独立场景的平衡
【 在 hgoldfish 的大作中提到: 】
: 其实吧。果子的统一内存才是王道。虽然现在价格贵。但是慢慢地都可以降下来啊。
: 不说服务器。我觉得以后的手机芯片应
:......
论坛助手,iPhone
--
FROM 180.173.63.*