美团刚刚发布了名为“长猫(LongCat-Flash)”的开源大模型,拥有高达5600亿参数,采用了动态计算机制与MoE(专家混合)架构。模型会根据上下文需求动态激活186亿到313亿参数,平均约270亿,提升了效率和资源利用率。通过PID控制和ScMoE(Shortcut-connected MoE)架构,有效解决了大规模模型的通信瓶颈,并在成千上万加速器上实现了高速推理。
训练方面,美团团队采用了超参数迁移策略、模型增长机制以及多种稳定性和可复现性措施,保证训练过程稳定无突发异常。官方基准测试显示,LongCat-Flash在多个通用领域和智能体任务中表现优异,部分测试结果优于GPT-4.1、Claude4等国际主流模型。
这不就有了。。。。
【 在 gogo4528 的大作中提到: 】
:
: 感觉美团是最垃圾的互联网大厂,不但没有技术创新,国内互联网公司吹的产品创新也没有,人家做啥他就做,酒店、外卖、共享单车、社区团购、甚至享充电宝都做,打车有一阵要做,估计一直没拿到牌照没做起来
:
: 【 在 wuspd 的大作中提到: 】
: : 蒋凡放话
#发自zSMTH@NTH-AN00
--
※ 来源:水木社区 [221.218.159.*(北京–朝阳区-联通)]
#修改自zSMTH@NTH-AN00
※ 修改:·happy1985 于 Aug 31 07:35:20 2025 修改本文·[FROM: 221.218.159.*]
※ 来源:·水木社区
http://www.mysmth.net·[FROM: 221.218.159.*]
修改:happy1985 FROM 221.218.159.*
FROM 221.218.159.*