deepseek 671b r1一出，洋垃圾又要暴涨了

水木社区手机版

主题:deepseek 671b r1一出，洋垃圾又要暴涨了
39楼|Jacqueline|2025-02-01 09:44:16|展开
7b/8b可以在3060 6G上跑得很流畅
【在 Fgps 的大作中提到: 】
: 7b需要多少内存？
: 的确，我也没想到能跑起来，分别跑了1.5b，7b和14b三个规格的模型，1.5b像一个弱智一样，7b的就好了很多，性能也不错， 14b看起来思考得更多，但也更慢，所以综合来说，可以拿7b来进行下测试。
: 我的机器普通得不能再普通了，绝对不是什么高端机器，而是一台3年前的中低端机器而已，存储就是最普通不过的nvme 512G罢了。
: ...................
--
修改:Jacqueline FROM 116.235.194.*
FROM 116.235.194.*
52楼|Jacqueline|2025-02-02 13:21:20|展开
二三十。不过8b模型太弱，基本没啥用。70b的64G内存可以装下，内存占用48G，
显存占用4-5G，很慢，每秒一个token，然后代码能力不如刚发布的27b的mistral-small。
70b已经不能用一张5090搞定了，27b的勉强可以。

中文能力deepseek超强，西方语言最强的似乎是mistral。

做高考理科导数题，这几个模型都在胡说八道，第一问很多模型都会，第二问起只有deepseek
在线版好一些，做出一问，第二问整出一个不寻常的简单证明，后面就不会了。

在线版的deepseek代码能力还不错，我就不折腾本地的了。对了，数学和编程一定要用英语
跟他对话，英语的代码能力和数学能力似乎比中文的强很多。

【在 hgoldfish 的大作中提到: 】
: 每秒可以出几个 token?
--
FROM 116.235.194.*