LMARENA全球前100模型来自于23家机构:美14家中7家

水木社区手机版

主题:LMARENA全球前100模型来自于23家机构:美14家中7家
楼主|Engelberger|2025-02-23 21:43:31|展开
数据更新到2025年2月23日，每个公司取排名最高的模型作为公司的代表。全球前100的模型，产自23家机构，其中有美国公司14家，中国公司7家，法国1家（排13），以色列1家（排17）。
注意到
a.第23只有2个人，用开源平台上的各种资源自己捣，低于23的机构完全不能参与排名，只能算玩票，没有啥价值（也就是说美中法英以之外的国家，比如日韩德国的最好的ai赶不上顶尖的个人玩票选手，嗯，三星手机，索尼电视，bba保时捷车机adas...）
b.第21是一个事业单位（它前面必然有好几家大学和科研院所没参与网站排名）所以20以后的排名意义也不大了
c.第20的腾讯混元大家都用过，明显进不了国内前5，豆包，kimi不说了，甚至文小言，讯飞应该都在这之前
d.18是大学，但普林斯顿的ai在全球高校里面排不进前十，说明第18的水分仍然大
E.第11的英伟达不是大模型赛道的，做了一个70B的demo居然是最好的LLama，比meta 405B的强？
F.豆包，kimi的真实实力应该排哪儿？个人认为不低于智谱，大概率在阿里与deepseek之间。
加上豆包，kimi，个人认为真实的全球前10家ai大模型公司，可能是美国3家，中国7家。10名以后的anthropic和meta连零一万物都不如，没资格上桌说话。（斯坦福，mit这些高校可能能很轻易地吊打智谱以后的公司，毕竟智谱其实就是清华计算机系）。欧日韩的ai科研能力可以完全忽略不计了。

第1名：Xai
第2名：谷歌
第3名：OpenAI
第4名：Deepseek
第5名：阿里
第6名：智谱
第7名：阶跃星辰
第8名：零一万物
第9名：Anthropic
第10名：Nexusflow
第11名: 英伟达
第12名：Meta
第13名：Mistral
第14名：Amazon
第15名：Reka
第16名: Ai 2
第17名：AI 21LABS
第18名: 普林斯顿
第19名：Cohere
第20名：腾讯
第21名：上海人工智能实验室
第22名：IBM
第23名：Hugging face
--
FROM 117.176.186.*
2楼|Engelberger|2025-02-23 22:06:53|展开
这个可能没更新进去吧
【在 Alohaaaa 的大作中提到: 】
: 混元 t1 这两天铺天盖地撒广告，用起来感觉还行啊，前十都进不了吗？
: 发自「快看水母于 BVL-AN00」
--
FROM 117.176.186.*
4楼|Engelberger|2025-02-23 22:36:03|展开
用户习惯的惯性，不代表现在的模型能力
【在 lvsoft 的大作中提到: 】
: anthropic和meta连零一万物都不如，没资格上桌说话?
: 你这一看就不是个经常用ai解决问题的人能说的出来的话。
: 贴个openrouter的ranking，用openrouter的人有3个特征：
: ...................
--
FROM 117.176.186.*
6楼|Engelberger|2025-02-23 22:58:27|展开
LMARENA是大家盲选比出来的吧
就参与评分的人而言，他们没觉得claude和meta的llama有多好用
【在 lvsoft 的大作中提到: 】
: 呵呵，换个说法吧。
: anthropic的claude 3.5 sonnet，现在的费用是每百万字输入3$，输出15$。
: 比gpt4o要贵50%
: ...................
--
FROM 117.176.186.*
9楼|Engelberger|2025-02-24 08:59:44|展开
第13 mistral
【在 chaobill 的大作中提到: 】
: 法国大神的那个ai，叫什么名，有没有在里面
: 我去他官网看过一次，这些都忘记了。
: 法国大神，也就是 QuickJs 的那个作者
--
FROM 117.176.186.*
12楼|Engelberger|2025-02-24 09:28:10|展开
这个不是大模型吧，是个平台
【在 chaobill 的大作中提到: 】
: textsynth ，用的 Mistral 7B,47B 模型
--
FROM 117.176.186.*
16楼|Engelberger|2025-02-24 20:29:14|展开
Utf-8本来就是都处理成向量的吧，计算机使用的中间语言是向量吧，这个向量与哪个语言的结构更贴近，是自适应的
【在 chaobill 的大作中提到: 】
: 我看到谷歌在中文问题用阿拉伯文表达更精确概念的那个截图
: 由此看出谷歌是最厉害的
: 说明他的思考不局限于某种语言
--
FROM 111.55.145.*