Anthropic的Claude，OpenAI的GPT，Google的Gemini三足鼎立

水木社区手机版

主题:Anthropic的Claude，OpenAI的GPT，Google的Gemini三足鼎立
楼主|anylinkin|2026-02-26 13:27:26|只看此ID
在知识库的实时性更新方面，copilot相对较差，Grok相对较强。知识的实时更新，可以代表AI的随时训练更新的能力，xAI Grok有钱阔气在算力上投入舍得，此外Grok直接接入/关联X媒体等平台，数据知识实时性自然相对会好一些。

逻辑推导协助分析问题方面，ChatGPT、Grok、Gemini相对较强。copilot claude相对较弱，更多地需要提问者引导正确的思路，而让他们帮忙辅助细化，所以，辅助助理特征更明显

但是Gemini的边际censorship(医疗、技术前沿、political right等触发安全风险)很严，甚至有些过头了，导致经常出现拒绝回答的情况。

编程上，Claude被捧成“地表编程之王”，但是我感觉前提是在常规通用编程领域可能如此。复杂或带有跟多定制化或者最新SDK等领域的编程，经常错得一塌糊涂。所以，建议修正称为“通用编程地表之王”

所有的AI，在前沿一点、特征化一些、定制化的问题分析方面，很容易出现幻觉性错误。

不要忽视AI的幻觉问题，它对用户是一个很大的问题：对于幻觉性的回答，AI它是不知道自己错误的，给你的感觉这就是正确的答案的，所以需要用户很小心能发现AI出现幻觉性错误了，需要自己去验证或逻辑完整性或符合性分析。否则，可能就会误导或出错。想一想，假设你依赖的导师或助理，以他们以为正确的方式，直接给你一个错误的答案或错误的信息的后果

不知是否因为使用ladder或者因为经常需要深入讨论一些技术问题，我个人使用发现各大AI（除了Grok）的确似乎有相对他们自己过去主动不断降智的嫌疑。

个人认为，AI做一些助理型的工作，还是不错的。但是作为“人”的使用者，还是需要要具备对AI的把关以及引导思路的能力。

【在 WorldRoamer 的大作中提到: 】
: 标题: Re: Anthropic的Claude，OpenAI的GPT，Google的Gemini三足鼎立
: 发信站: 水木社区 (Thu Feb 26 11:44:16 2026), 站内
:
: copilot呢
: app store五星数量
: chatgpt 584万
: gemini 132万
: grok 98万
: claude 5.3万
: copilot 36万
:
: 【在 FrederickLin 的大作中提到: 】
: : xAI的Grok，Meta的Llama感觉差一些
:
: --
:
: ※ 修改:·WorldRoamer 于 Feb 26 11:45:59 2026 修改本文·[FROM: 123.234.130.*]
: ※ 来源:·水木社区 mysmth.net·[FROM: 123.234.130.*]
--
修改:WorldRoamer FROM 123.234.130.*
FROM 223.104.3.*
1楼|zszqzzzf|2026-02-26 14:46:21|只看此ID
顶一下，赞分享。
【在 anylinkin 的大作中提到: 】
: 在知识库的实时性更新方面，copilot相对较差，Grok相对较强。知识的实时更新，可以代表AI的随时训练更新的能力，xAI Grok有钱阔气在算力上投入舍得，此外Grok直接接入/关联X媒体等平台，数据知识实时性自然相对会好一些。
: 逻辑推导协助分析问题方面，ChatGPT、Grok、Gemini相对较强。copilot claude相对较弱，更多地需要提问者引导正确的思路，而让他们帮忙辅助细化，所以，辅助助理特征更明显
: 但是Gemini的边际censorship(医疗、技术前沿、political righteness等触发安全风险)很严，甚至有些过头了，导致经常出现拒绝回答的情况。
: ...................
--
FROM 112.47.225.*
2楼|Aladdin|2026-02-26 15:26:58|只看此ID
gemini的实时更新的确不快

我曾经遇到一个问题

就是Charlie" Kirk刚遇刺大概一周左右的时候

我曾经问了下gemini相关的影响有多大

但是gemini非说kirk遇刺是假消息

哪怕我给它发了很多相关新闻

但是gemini就是死不承认

一直持续了差不多10天左右

gemini才某天突然承认kirk的确是死了....

【在 anylinkin 的大作中提到: 】
: 在知识库的实时性更新方面，copilot相对较差，Grok相对较强。知识的实时更新，可以代表AI的随时训练更新的能力，xAI Grok有钱阔气在算力上投入舍得，此外Grok直接接入/关联X媒体等平台，数据知识实时性自然相对会好一些。
: 逻辑推导协助分析问题方面，ChatGPT、Grok、Gemini相对较强。copilot claude相对较弱，更多地需要提问者引导正确的思路，而让他们帮忙辅助细化，所以，辅助助理特征更明显
: 但是Gemini的边际censorship(医疗、技术前沿、political right等触发安全风险)很严，甚至有些过头了，导致经常出现拒绝回答的情况。
: ...................
--
修改:Aladdin FROM 119.97.45.*
FROM 119.97.45.*
3楼|cavalryq|2026-03-01 18:29:00|只看此ID
Claude处理具体业务相关的时候，有复杂条件的时候，表现的很一般，考虑条件不全处理遗漏
--
FROM 223.104.86.*