- 主题:LMARENA全球前100模型来自于23家机构:美14家中7家
数据更新到2025年2月23日,每个公司取排名最高的模型作为公司的代表。全球前100的模型,产自23家机构,其中有美国公司14家,中国公司7家,法国1家(排13),以色列1家(排17)。
注意到
a.第23只有2个人,用开源平台上的各种资源自己捣,低于23的机构完全不能参与排名,只能算玩票,没有啥价值(也就是说美中法英以之外的国家,比如日韩德国的最好的ai赶不上顶尖的个人玩票选手,嗯,三星手机,索尼电视,bba保时捷车机adas...)
b.第21是一个事业单位(它前面必然有好几家大学和科研院所没参与网站排名)所以20以后的排名意义也不大了
c.第20的腾讯混元大家都用过,明显进不了国内前5,豆包,kimi不说了,甚至文小言,讯飞应该都在这之前
d.18是大学,但普林斯顿的ai在全球高校里面排不进前十,说明第18的水分仍然大
E.第11的英伟达不是大模型赛道的,做了一个70B的demo居然是最好的LLama,比meta 405B的强?
F.豆包,kimi的真实实力应该排哪儿?个人认为不低于智谱,大概率在阿里与deepseek之间。
加上豆包,kimi,个人认为真实的全球前10家ai大模型公司,可能是美国3家,中国7家。10名以后的anthropic和meta连零一万物都不如,没资格上桌说话。(斯坦福,mit这些高校可能能很轻易地吊打智谱以后的公司,毕竟智谱其实就是清华计算机系)。欧日韩的ai科研能力可以完全忽略不计了。
第1名:Xai
第2名:谷歌
第3名:OpenAI
第4名:Deepseek
第5名:阿里
第6名:智谱
第7名:阶跃星辰
第8名:零一万物
第9名:Anthropic
第10名:Nexusflow
第11名: 英伟达
第12名:Meta
第13名:Mistral
第14名:Amazon
第15名:Reka
第16名: Ai 2
第17名:AI 21LABS
第18名: 普林斯顿
第19名:Cohere
第20名:腾讯
第21名:上海人工智能实验室
第22名:IBM
第23名:Hugging face
--
FROM 117.176.186.*
这个可能没更新进去吧
【 在 Alohaaaa 的大作中提到: 】
: 混元 t1 这两天铺天盖地撒广告,用起来感觉还行啊,前十都进不了吗?
: 发自「快看水母 于 BVL-AN00」
--
FROM 117.176.186.*
用户习惯的惯性,不代表现在的模型能力
【 在 lvsoft 的大作中提到: 】
: anthropic和meta连零一万物都不如,没资格上桌说话?
: 你这一看就不是个经常用ai解决问题的人能说的出来的话。
: 贴个openrouter的ranking,用openrouter的人有3个特征:
: ...................
--
FROM 117.176.186.*
LMARENA是大家盲选比出来的吧
就参与评分的人而言,他们没觉得claude和meta的llama有多好用
【 在 lvsoft 的大作中提到: 】
: 呵呵,换个说法吧。
: anthropic的claude 3.5 sonnet,现在的费用是每百万字输入3$,输出15$。
: 比gpt4o要贵50%
: ...................
--
FROM 117.176.186.*
第13 mistral
【 在 chaobill 的大作中提到: 】
: 法国大神的那个ai,叫什么名,有没有在里面
: 我去他官网看过一次,这些都忘记了。
: 法国大神,也就是 QuickJs 的那个作者
--
FROM 117.176.186.*
这个不是大模型吧,是个平台
【 在 chaobill 的大作中提到: 】
: textsynth ,用的 Mistral 7B,47B 模型
--
FROM 117.176.186.*
Utf-8本来就是都处理成向量的吧,计算机使用的中间语言是向量吧,这个向量与哪个语言的结构更贴近,是自适应的
【 在 chaobill 的大作中提到: 】
: 我看到谷歌在中文问题用阿拉伯文表达更精确概念的那个截图
: 由此看出谷歌是最厉害的
: 说明他的思考不局限于某种语言
--
FROM 111.55.145.*