- 主题:Re: 阿里Qwen臆想症,要命后还要钱
推荐kimi k1.5 长思考模型,能联网搜索,能有类似的深度思考过程。
效果不错,比想象中好,1月20日上线
【 在 do 的大作中提到: 】
: 月初开始用deepseek编程也还行,虽然也不是能轻松搞定,但反复debug还能慢慢走。
: 结果近些天来太火了,实在连不上了,要赶进度,我只好搜下,到底哪个能替代。阿里Qwen的max, 1月25日版说coding评测分数更高,于是获得API Key,vscode+cline试一下。
: 一个很简单的任务,一段log记录,日期时间开头,然后是大括号,各个Key,与value,各自都有单引号括起来。让他按新的顺序整理,写入新文本文件(本想写入数据库的,但后来想还是一步步来)。
: ...................
--
FROM 111.197.86.*
自己搭deepseek私服
【 在 do 的大作中提到: 】
: 月初开始用deepseek编程也还行,虽然也不是能轻松搞定,但反复debug还能慢慢走。
: 结果近些天来太火了,实在连不上了,要赶进度,我只好搜下,到底哪个能替代。阿里Qwen的max, 1月25日版说coding评测分数更高,于是获得API Key,vscode+cline试一下。
: 一个很简单的任务,一段log记录,日期时间开头,然后是大括号,各个Key,与value,各自都有单引号括起来。让他按新的顺序整理,写入新文本文件(本想写入数据库的,但后来想还是一步步来)。
: ...................
--
FROM 112.66.25.*
本地个人一般只能用量化丐版,不大行
【 在 chaobill 的大作中提到: 】
: 自己搭deepseek私服
--
FROM 119.125.216.*
6000美元的CPU完整版ds私服,一秒也就4个词元的生成速度,50多万个词元得等到天荒地老。
至于70b的版本,那就是个弱智,还不如用qwen2.5.
【 在 chaobill 的大作中提到: 】
: 自己搭deepseek私服
--
FROM 171.221.52.*
没那么夸张,1小时就1万多词元了,50多万个只要30多个小时就能生成完。而且6000美元的速度没这么低,说是每秒6-8tokens。50多万个不管阅读还是运行我感觉我两天肯定弄不完,够快了。
【 在 poocp 的大作中提到: 】
: 6000美元的CPU完整版ds私服,一秒也就4个词元的生成速度,50多万个词元得等到天荒地老。
: 至于70b的版本,那就是个弱智,还不如用qwen2.5.
--
FROM 223.77.78.*