deepseek快是因为使用了“混合专家”模型

水木社区手机版

主题:deepseek快是因为使用了“混合专家”模型
4楼|hgoldfish|2025-01-25 14:22:57|展开
不知道 LLM 能不能最终搭配深度学习与规则派的技术。

比如识别出一些数学题，丢给 scipy 去处理。

又或者给 LLM 图片，叫它写作文的时候，它调用深度学习的模块，根据图片生成一大堆词——比如猫在荷叶上抓青蛙吃。这些都是比较容易识别出来的。再把这些 token 加入到 LLM 的思考过程里面。

【在 bxdx 的大作中提到: 】
: 因为分成一个个小的之后就出不来好的效果了，比如把化学相关的分离出来，效果会急剧下降
--
FROM 59.61.198.*

BYR-Team©2010. KBS Dev-Team©2011 登录完整版