水木社区手机版
首页
|版面-电脑市场(CompMarket)|
新版wap站已上线
返回
1/1
|
转到
主题:玄武实验室:不到4万元的DeepSeek-R1-671B-Q8部署方案 (转载)
楼主
|
chaobill
|
2025-03-20 21:16:39
|
只看此ID
【 以下文字转载自 AI 讨论区 】
发信人: oneyuan (順天府首席仁波切), 信区: AI
标 题: 玄武实验室:不到4万元的DeepSeek-R1-671B-Q8部署方案
发信站: 水木社区 (Mon Mar 17 22:17:58 2025), 站内
--
FROM 123.117.79.*
1楼
|
zerg136
|
2025-03-21 09:59:25
|
只看此ID
这是又回归CPU+内存来计算推理了么?完全不需要显卡
--
FROM 14.145.214.*
2楼
|
adamhj
|
2025-03-21 10:17:07
|
只看此ID
是,LLM推理瓶颈在显存/内存带宽,对gpu/cpu处理能力要求不是很高
【 在 zerg136 的大作中提到: 】
: 这是又回归CPU+内存来计算推理了么?完全不需要显卡
--
FROM 202.109.128.*
3楼
|
johnbird
|
2025-03-21 10:18:04
|
只看此ID
64G显存的显卡就远不止4万块了,成本太高了,论性价比肯定是CPU推理更高
【 在 zerg136 的大作中提到: 】
: 这是又回归CPU+内存来计算推理了么?完全不需要显卡
--
FROM 101.226.154.*
4楼
|
Akyrum
|
2025-03-21 18:45:24
|
只看此ID
这两代EYPC的32核以下sku,ccd和iod之间带宽很高,跑deepseek有奇效,比48核以上还快
【 在 adamhj 的大作中提到: 】
: 是,LLM推理瓶颈在显存/内存带宽,对gpu/cpu处理能力要求不是很高
:
--
FROM 218.204.255.*
5楼
|
Fgps
|
2025-03-22 00:47:26
|
只看此ID
intel应该把握住这次机会,不然就不好翻身了
【 在 chaobill 的大作中提到: 】
【 以下文字转载自 AI 讨论区 】
发信人: oneyuan (順天府首席仁波切), 信区: AI
标 题: 玄武实验室:不到4万元的DeepSeek-R1-671B-Q8部署方案
发信站: 水木社区 (Mon Mar 17 22:17:58 2025), 站内
[upload=1][/upload][upload=2][/upload]
--
FROM 123.115.133.*
6楼
|
aosp
|
2025-03-24 10:35:26
|
只看此ID
帮帮Intel!
【 在 Fgps 的大作中提到: 】
: intel应该把握住这次机会,不然就不好翻身了 ...
--
FROM 144.202.123.*
7楼
|
mafama
|
2025-03-28 14:04:00
|
只看此ID
这个深度思考要花多长时间,机器联网的话,本地大模型可以上网搜索吗
【 在 chaobill 的大作中提到: 】
: 发信人: oneyuan (順天府首席仁波切), 信区: AI
: 标 题: 玄武实验室:不到4万元的DeepSeek-R1-671B-Q8部署方案
: 发信站: 水木社区 (Mon Mar 17 22:17:58 2025), 站内
: ...................
--
FROM 36.159.161.*
8楼
|
isxb2
|
2025-03-28 20:58:46
|
只看此ID
这篇文章好像没有专门提这个事情,但他们选的CPU确实奇怪,更多核心的并没有贵太多,然而还是选了核心少的
再就是线程撕裂者的推理性能会不会好一些,
因为还有其他应用需要高主频
【 在 Akyrum 的大作中提到: 】
: 这两代EYPC的32核以下sku,ccd和iod之间带宽很高,跑deepseek有奇效,比48核以上还快
: :
--
FROM 39.82.60.*
9楼
|
Akyrum
|
2025-04-02 18:07:21
|
只看此ID
农企的手册里提到,32核以下有加宽
【 在 isxb2 的大作中提到: 】
: 这篇文章好像没有专门提这个事情,但他们选的CPU确实奇怪,更多核心的并没有贵太多,然而还是选了核心少的
: 再就是线程撕裂者的推理性能会不会好一些,
: 因为还有其他应用需要高主频
: ...................
--
FROM 111.63.136.*
1/1
|
转到
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版