deepseek 671b r1一出，洋垃圾又要暴涨了

水木社区手机版

主题:deepseek 671b r1一出，洋垃圾又要暴涨了
80楼|Akyrum|2025-02-07 10:10:44|只看此ID
404G是降bit量化的，它上面还有713G 8bit版和1.3T 16bit
【在 Auguster 的大作中提到: 】
: 不是404G吗？
:
--
修改:Akyrum FROM 111.63.136.*
FROM 111.63.136.*
81楼|ziwai73|2025-02-07 14:08:01|只看此ID
ds这破玩意儿有啥用？
今天随意问了几个问题，从第二问（反问）开始就转啊转，然后就服务器繁忙了，然后就一路繁忙。最后问了个谁都会的弱智问题，才帮助它“醒过来”。
然后我把相同问题以相同次序喂给我一向看不上的某一言，居然个个问题都能答，就是水平不能说多高。
--
FROM 58.243.250.*
82楼|Auguster|2025-02-07 14:09:38|只看此ID
谢谢指正

我一直以为ollama上的是全量的

【在 Akyrum 的大作中提到: 】
: 404G是降bit量化的，它上面还有713G 8bit版和1.3T 16bit
--
FROM 1.119.200.*
83楼|bom|2025-02-07 14:10:25|只看此ID
是啊，问点难的问题就繁忙。。。

【在 ziwai73 的大作中提到: 】
: 标题: Re: deepseek 671b r1一出，洋垃圾又要暴涨了
: 发信站: 水木社区 (Fri Feb 7 14:08:01 2025), 站内
:
: ds这破玩意儿有啥用？
: 今天随意问了几个问题，从第二问（反问）开始就转啊转，然后就服务器繁忙了，然后就一路繁忙。最后问了个谁都会的弱智问题，才帮助它“醒过来”。
: 然后我把相同问题以相同次序喂给我一向看不上的某一言，居然个个问题都能答，就是水平不能说多高。
: --
:
: ※ 来源:·水木社区 http://www.mysmth.net·[FROM: 58.243.250.*]
--
FROM 114.225.119.*
84楼|Auguster|2025-02-07 14:11:29|只看此ID
餐厅排队时间长，服务差

但不也用去厕所呀

xx一下，你就上当的那个公司算是死了，只是还没有僵硬

【在 ziwai73 的大作中提到: 】
: ds这破玩意儿有啥用？
: 今天随意问了几个问题，从第二问（反问）开始就转啊转，然后就服务器繁忙了，然后就一路繁忙。最后问了个谁都会的弱智问题，才帮助它“醒过来”。
: 然后我把相同问题以相同次序喂给我一向看不上的某一言，居然个个问题都能答，就是水平不能说多高。
--
FROM 1.119.200.*
85楼|brucewww|2025-02-07 14:24:29|只看此ID
显卡也是二手的呗
【在 stany 的大作中提到: 】
: 最贵的是显卡，显卡都买了，还省钱买洋垃圾凑数？
--
FROM 202.85.208.*
86楼|haili|2025-02-07 15:36:11|只看此ID
这只是恰好4o训练到了你对应的API网页呗，或者它见的代码库里面调用这个版本API比较多，恰好学到了。

拿单个例子测试没啥意义，多用就知道了。单纯编码问题，不要求推理，还是 sonnet 3.5 > v3 > 4o >=gemini-pro exp/flash = qwen-coder-32B

【在 smthhz 的大作中提到: 】
: 那为啥chatgpt的4o直接就回答的没问题，也没联网，cline这些都是到具体写代码阶段了吧，我只是要个示例而以，不需要任何上下文。
--
FROM 119.57.72.*
87楼|ylgao1987|2025-02-07 15:56:55|只看此ID
你这个题吧，我媳妇的deepseek是43秒，我的是4分钟
这题我不会，但我知道deepseek也扯淡
【在 MrRight 的大作中提到: 】
: 就是这道题，只有DeepSeek深度思考做对了；ChatGPT 4o都看不懂题：
: 两地A、B之间相距4000m；甲从A地以匀速60m/min向B出发，同时乙从B地出发以匀速260m/min向A出发。乙到达A地之后立即以同一匀速折返向B地，追上甲之后，甲和乙以相同的匀速175m/min到达B地。如果甲和乙分别从A、B两地相向出发的时刻是上午7:20, 则甲和乙携手到达B地时，距离上午8:00还差几分钟？
:
: ...................
--
FROM 27.189.242.*
88楼|Auguster|2025-02-07 16:10:54|只看此ID
Cline自己说的是：
Want to pick the right LLM for Cline? Here's what our users actually use (Feb 2025):

1. 3.5 Sonnet (200k) - Best coder, $3/15/M in/out
2. DeepSeek R1 (128k) - Planning champion at $0.55/2.19/M
3. o3-mini (200k) - Great middle ground, $1.10/4.40/M (*requires T-3 OpenAI account)
4. DeepSeek V3 (128k) - Near-Sonnet code, $0.14/0.28/M
5. Gemini Flash 2.0 (1M) - Strong generalist, $0/M
6. Gemini 1.5 Pro (2M) - Large ctx, $0/M

【在 haili 的大作中提到: 】
: 这只是恰好4o训练到了你对应的API网页呗，或者它见的代码库里面调用这个版本API比较多，恰好学到了。
: 拿单个例子测试没啥意义，多用就知道了。单纯编码问题，不要求推理，还是 sonnet 3.5 > v3 > 4o >=gemini-pro exp/flash = qwen-coder-32B
:
--
FROM 1.119.200.*
89楼|smthhz|2025-02-07 17:01:53|只看此ID
哦，我知道4o本来编码和逻辑方面也不咋样， v3肯定也学了相关页面，编码问题不是太大主要是乱解释，比如拿同服务另一个api参数给这api，编造参数，输出前后不一致，我觉得根本不是没在知识库的问题，所以很怀疑它的能力。你这排名是都自己试过？
【在 haili (人尔有窍风吹为籁) 的大作中提到: 】
:  这只是恰好4o训练到了你对应的API网页呗，或者它见的代码库里面调用这个版本API比较多，恰好学到了。
:
:  拿单个例子测试没啥意义，多用就知道了。单纯编码问题，不要求推理，还是 sonnet 3.5 > v3 > 4o >=gemini-pro exp/flash = qwen-coder-32B
:
--
FROM 106.9.106.*