- 主题:Anthropic的Claude,OpenAI的GPT,Google的Gemini三足鼎立
在知识库的实时性更新方面,copilot相对较差,Grok相对较强。知识的实时更新,可以代表AI的随时训练更新的能力,xAI Grok有钱阔气在算力上投入舍得,此外Grok直接接入/关联X媒体等平台,数据知识实时性自然相对会好一些。
逻辑推导协助分析问题方面,ChatGPT、Grok、Gemini相对较强。copilot claude相对较弱,更多地需要提问者引导正确的思路,而让他们帮忙辅助细化,所以,辅助助理特征更明显
但是Gemini的边际censorship(医疗、技术前沿、political right等触发安全风险)很严,甚至有些过头了,导致经常出现拒绝回答的情况。
编程上,Claude被捧成“地表编程之王”,但是我感觉前提是在常规通用编程领域可能如此。复杂或带有跟多定制化或者最新SDK等领域的编程,经常错得一塌糊涂。所以,建议修正称为“通用编程地表之王”
所有的AI,在前沿一点、特征化一些、定制化的问题分析方面,很容易出现幻觉性错误。
不要忽视AI的幻觉问题,它对用户是一个很大的问题:对于幻觉性的回答,AI它是不知道自己错误的,给你的感觉这就是正确的答案的,所以需要用户很小心能发现AI出现幻觉性错误了,需要自己去验证或逻辑完整性或符合性分析。否则,可能就会误导或出错。想一想,假设你依赖的导师或助理,以他们以为正确的方式,直接给你一个错误的答案或错误的信息的后果
不知是否因为使用ladder或者因为经常需要深入讨论一些技术问题,我个人使用发现各大AI(除了Grok)的确似乎有相对他们自己过去主动不断降智的嫌疑。
个人认为,AI做一些助理型的工作,还是不错的。但是作为“人”的使用者,还是需要要具备对AI的把关以及引导思路的能力。
【 在 WorldRoamer 的大作中提到: 】
: 标 题: Re: Anthropic的Claude,OpenAI的GPT,Google的Gemini三足鼎立
: 发信站: 水木社区 (Thu Feb 26 11:44:16 2026), 站内
:
: copilot呢
: app store五星数量
: chatgpt 584万
: gemini 132万
: grok 98万
: claude 5.3万
: copilot 36万
:
: 【 在 FrederickLin 的大作中提到: 】
: : xAI的Grok,Meta的Llama感觉差一些
:
: --
:
: ※ 修改:·WorldRoamer 于 Feb 26 11:45:59 2026 修改本文·[FROM: 123.234.130.*]
: ※ 来源:·水木社区 mysmth.net·[FROM: 123.234.130.*]
--
修改:WorldRoamer FROM 123.234.130.*
FROM 223.104.3.*
顶一下,赞分享。
【 在 anylinkin 的大作中提到: 】
: 在知识库的实时性更新方面,copilot相对较差,Grok相对较强。知识的实时更新,可以代表AI的随时训练更新的能力,xAI Grok有钱阔气在算力上投入舍得,此外Grok直接接入/关联X媒体等平台,数据知识实时性自然相对会好一些。
: 逻辑推导协助分析问题方面,ChatGPT、Grok、Gemini相对较强。copilot claude相对较弱,更多地需要提问者引导正确的思路,而让他们帮忙辅助细化,所以,辅助助理特征更明显
: 但是Gemini的边际censorship(医疗、技术前沿、political righteness等触发安全风险)很严,甚至有些过头了,导致经常出现拒绝回答的情况。
: ...................
--
FROM 112.47.225.*
gemini的实时更新的确不快
我曾经遇到一个问题
就是Charlie" Kirk刚遇刺大概一周左右的时候
我曾经问了下gemini相关的影响有多大
但是gemini非说kirk遇刺是假消息
哪怕我给它发了很多相关新闻
但是gemini就是死不承认
一直持续了差不多10天左右
gemini才某天突然承认kirk的确是死了....
【 在 anylinkin 的大作中提到: 】
: 在知识库的实时性更新方面,copilot相对较差,Grok相对较强。知识的实时更新,可以代表AI的随时训练更新的能力,xAI Grok有钱阔气在算力上投入舍得,此外Grok直接接入/关联X媒体等平台,数据知识实时性自然相对会好一些。
: 逻辑推导协助分析问题方面,ChatGPT、Grok、Gemini相对较强。copilot claude相对较弱,更多地需要提问者引导正确的思路,而让他们帮忙辅助细化,所以,辅助助理特征更明显
: 但是Gemini的边际censorship(医疗、技术前沿、political right等触发安全风险)很严,甚至有些过头了,导致经常出现拒绝回答的情况。
: ...................
--
修改:Aladdin FROM 119.97.45.*
FROM 119.97.45.*
Claude处理具体业务相关的时候,有复杂条件的时候,表现的很一般,考虑条件不全处理遗漏
--
FROM 223.104.86.*