水木社区手机版
首页
|版面-苹果(Apple)|
新版wap站已上线
展开
|
楼主
|
同主题展开
|
返回
上一篇
|
下一篇
|
同主题下篇
主题:苹果跑大模型也不想传说中那么给力啊
iwannabe
|
2025-05-18 19:41:27
|
也就是个玩具的水平
mac studio m3 ultra, 512g内存/显存, 671b q4_k_m, gpu和内存都跑满了,10几个
tokens/s
32b,内存不算多,8%,但是gpu总是跑满,20多个tokens/s
如果在一台里加上嵌入和rerank模型(知识库标配),基本上都很卡
--
修改:iwannabe FROM 27.38.223.*
FROM 27.38.223.*
上一篇
|
下一篇
|
同主题下篇
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版