有人试过了,不用显卡,把内存弄到768G,可以跑完整版的DeepSeek-r1。成本只要6000美元,不到显卡版本的1/10。当然速度要慢很多,每秒6-8tokens,但个人用应该是足够了。
类似的思路,弄个64G内存跑70B的肯定也可以,不用昂贵的显卡了。
【 在 sthgot2give 的大作中提到: 】
: 那个Deepseek r1:70B需要40多G显存,正好能跑。
: 然后就可以用现成工具基于这个模型做一个Agent,做成网页形式的应用,在本地发布。
: 比如对话式的剧本/小说/邮件/公文撰写工具,自动化翻译工具,房价股价跟踪分析工具、旅游计划制订工具、跨平台商品比价推荐工具等等。基本上还是语言类的应用。我也还没试,这两天准备试试看。
: ...................
--
FROM 223.77.79.*