- 主题:deepseek 671b r1一出,洋垃圾又要暴涨了
随便问了个一个公开api的问题,错的离谱,同样问题gpt4就很正常,在我看来根本不能用啊
【 在 coollpe (coollpe) 的大作中提到: 】
: 作为最强大的模型,它本地运行只需要768G内存,势必大幅增加洋垃圾服务器需求
:
: --
:
--
FROM 119.166.113.*
我就是用的官网,没自己搞,官网都这样,还自己搞啥……
【 在 Fgps (good luck ! my father) 的大作中提到: 】
: 得自己训练吗?
: 【 在 smthhz 的大作中提到: 】
: 随便问了个一个公开api的问题,错的离谱,同样问题gpt4就很正常,在我看来根本不能用啊
:
--
FROM 123.235.226.*
r1思考时间就够长了…… 我只是懒得查文档了,对于那么简单的问题再问几次不如我自己看文档去了
【 在 niumiu (海贼王) 的大作中提到: 】
: 多问几次
: 【 在 smthhz 的大作中提到: 】
: : 随便问了个一个公开api的问题,错的离谱,同样问题gpt4就很正常,在我看来根本不能用啊
:
--
FROM 123.235.226.*
关于aws一个服务的api使用问题并给出示例,很普通的一个问题,看到它的回答直接不想再用了
【 在 bluemind (bluemind) 的大作中提到: 】
: 能否把你的问题贴一下 ? 我看老外用的很满意
:
:
:
--
FROM 119.166.113.*
厉害,看来是我工作内容太简单不配用
【 在 MrRight (谁找我) 的大作中提到: 】
: 就是这道题,只有DeepSeek深度思考做对了;ChatGPT 4o都看不懂题:
:
: 两地A、B之间相距4000m;甲从A地以匀速60m/min向B出发,同时乙从B地出发以匀速260m/min向A出发。乙到达A地之后立即以同一匀速折返向B地,追上甲之后,甲和乙以相同的匀速175m/min到达B地。如果甲和乙分别从A、B两地相向出发的时刻是上午7:20, 则甲和乙携手到达B地时,距离上午8:00还差几分钟?
:
--
FROM 119.166.113.*
没联网,深度也用了也不行,不需要联网,从回答的内容看它的知识库有相关数据,而且是个多年前就有的一个api。可能它对这种问题不擅长吧。它可能强在数学题?感觉大部分实际应用场景都不如别的啊,还经常服务器繁忙。
【 在 xxys001 (思) 的大作中提到: 】
: 点深度思考和联网搜索了嘛?
: 【 在 smthhz 的大作中提到: 】
: : 随便问了个一个公开api的问题,错的离谱,同样问题gpt4就很正常,在我看来根本不能用啊
: : --
--
FROM 119.166.113.*
那为啥chatgpt的4o直接就回答的没问题,也没联网,cline这些都是到具体写代码阶段了吧,我只是要个示例而以,不需要任何上下文。
【 在 haili (人尔有窍 风吹为籁) 的大作中提到: 】
: 既然有官方url,其实应该把url加进去,但是ds界面不见得支持url内容直接加载(不确定)。
:
: 这类问题我估计会用cline或者roo cline这类工具配api去用,这类工具会把url内容抓出来,配合你的问题作为上下文去问。
:
--
FROM 223.104.194.*
哦,我知道4o本来编码和逻辑方面也不咋样, v3肯定也学了相关页面,编码问题不是太大主要是乱解释,比如拿同服务另一个api参数给这api,编造参数,输出前后不一致,我觉得根本不是没在知识库的问题,所以很怀疑它的能力。你这排名是都自己试过?
【 在 haili (人尔有窍 风吹为籁) 的大作中提到: 】
: 这只是恰好4o训练到了你对应的API网页呗,或者它见的代码库里面调用这个版本API比较多,恰好学到了。
:
: 拿单个例子测试没啥意义,多用就知道了。单纯编码问题,不要求推理,还是 sonnet 3.5 > v3 > 4o >=gemini-pro exp/flash = qwen-coder-32B
:
--
FROM 106.9.106.*
嗯,想来也应该是各个模型侧重点不同,但如果公开很久的常用文档都要复制过去,那效率就太低了。
【 在 haili (人尔有窍 风吹为籁) 的大作中提到: 】
: 个人经常混用下来的体感。(flash靠ai studio免费,4o/sonnet 3.5 o1/3 mini靠you的混合账号)
:
: 只要你把页面拿过去,或者直接ctrl+a作为context给LLM,这之后的编码才是考验llm的逻辑的。
:
--
FROM 223.104.41.*