deepseek 671b r1一出，洋垃圾又要暴涨了

水木社区手机版

主题:deepseek 671b r1一出，洋垃圾又要暴涨了
2楼|smthhz|2025-01-29 11:18:11|展开
随便问了个一个公开api的问题，错的离谱，同样问题gpt4就很正常，在我看来根本不能用啊

【在 coollpe (coollpe) 的大作中提到: 】
:  作为最强大的模型，它本地运行只需要768G内存，势必大幅增加洋垃圾服务器需求
:
:  --
:
--
FROM 119.166.113.*
4楼|smthhz|2025-01-29 13:46:04|展开
我就是用的官网，没自己搞，官网都这样，还自己搞啥……

【在 Fgps (good luck ! my father) 的大作中提到: 】
:  得自己训练吗？
:  【在 smthhz 的大作中提到: 】
:  随便问了个一个公开api的问题，错的离谱，同样问题gpt4就很正常，在我看来根本不能用啊
:
--
FROM 123.235.226.*
7楼|smthhz|2025-01-29 14:34:03|展开
r1思考时间就够长了……  我只是懒得查文档了，对于那么简单的问题再问几次不如我自己看文档去了

【在 niumiu (海贼王) 的大作中提到: 】
:  多问几次
:  【在 smthhz 的大作中提到: 】
:  : 随便问了个一个公开api的问题，错的离谱，同样问题gpt4就很正常，在我看来根本不能用啊
:
--
FROM 123.235.226.*
24楼|smthhz|2025-01-31 00:04:14|展开
关于aws一个服务的api使用问题并给出示例，很普通的一个问题，看到它的回答直接不想再用了
【在 bluemind (bluemind) 的大作中提到: 】
:  能否把你的问题贴一下？   我看老外用的很满意
:
:
:
--
FROM 119.166.113.*
51楼|smthhz|2025-02-02 11:58:25|展开
  厉害，看来是我工作内容太简单不配用

【在 MrRight (谁找我) 的大作中提到: 】
:  就是这道题，只有DeepSeek深度思考做对了；ChatGPT 4o都看不懂题：
:
:  两地A、B之间相距4000m；甲从A地以匀速60m/min向B出发，同时乙从B地出发以匀速260m/min向A出发。乙到达A地之后立即以同一匀速折返向B地，追上甲之后，甲和乙以相同的匀速175m/min到达B地。如果甲和乙分别从A、B两地相向出发的时刻是上午7:20, 则甲和乙携手到达B地时，距离上午8:00还差几分钟？
:
--
FROM 119.166.113.*
58楼|smthhz|2025-02-05 21:58:30|展开
没联网，深度也用了也不行，不需要联网，从回答的内容看它的知识库有相关数据，而且是个多年前就有的一个api。可能它对这种问题不擅长吧。它可能强在数学题？感觉大部分实际应用场景都不如别的啊，还经常服务器繁忙。

【在 xxys001 (思) 的大作中提到: 】
:  点深度思考和联网搜索了嘛？
:  【在 smthhz 的大作中提到: 】
:  : 随便问了个一个公开api的问题，错的离谱，同样问题gpt4就很正常，在我看来根本不能用啊
:  : --
--
FROM 119.166.113.*
69楼|smthhz|2025-02-06 16:38:06|展开
那为啥chatgpt的4o直接就回答的没问题，也没联网，cline这些都是到具体写代码阶段了吧，我只是要个示例而以，不需要任何上下文。

【在 haili (人尔有窍风吹为籁) 的大作中提到: 】
:  既然有官方url，其实应该把url加进去，但是ds界面不见得支持url内容直接加载（不确定）。
:
:  这类问题我估计会用cline或者roo cline这类工具配api去用，这类工具会把url内容抓出来，配合你的问题作为上下文去问。
:
--
FROM 223.104.194.*
89楼|smthhz|2025-02-07 17:01:53|展开
哦，我知道4o本来编码和逻辑方面也不咋样， v3肯定也学了相关页面，编码问题不是太大主要是乱解释，比如拿同服务另一个api参数给这api，编造参数，输出前后不一致，我觉得根本不是没在知识库的问题，所以很怀疑它的能力。你这排名是都自己试过？
【在 haili (人尔有窍风吹为籁) 的大作中提到: 】
:  这只是恰好4o训练到了你对应的API网页呗，或者它见的代码库里面调用这个版本API比较多，恰好学到了。
:
:  拿单个例子测试没啥意义，多用就知道了。单纯编码问题，不要求推理，还是 sonnet 3.5 > v3 > 4o >=gemini-pro exp/flash = qwen-coder-32B
:
--
FROM 106.9.106.*
97楼|smthhz|2025-02-10 23:18:45|展开
嗯，想来也应该是各个模型侧重点不同，但如果公开很久的常用文档都要复制过去，那效率就太低了。
【在 haili (人尔有窍风吹为籁) 的大作中提到: 】
:  个人经常混用下来的体感。（flash靠ai studio免费，4o/sonnet 3.5 o1/3 mini靠you的混合账号）
:
:  只要你把页面拿过去，或者直接ctrl+a作为context给LLM，这之后的编码才是考验llm的逻辑的。
:
--
FROM 223.104.41.*