水木社区手机版
首页
|版面-C++程序设计语言(CPlusPlus)|
新版wap站已上线
返回
1/1
|
转到
主题:deepseek快是因为使用了“混合专家”模型
4楼
|
hgoldfish
|
2025-01-25 14:22:57
|
展开
不知道 LLM 能不能最终搭配深度学习与规则派的技术。
比如识别出一些数学题,丢给 scipy 去处理。
又或者给 LLM 图片,叫它写作文的时候,它调用深度学习的模块,根据图片生成一大堆词——比如猫在荷叶上抓青蛙吃。这些都是比较容易识别出来的。再把这些 token 加入到 LLM 的思考过程里面。
【 在 bxdx 的大作中提到: 】
: 因为分成一个个小的之后就出不来好的效果了,比如把化学相关的分离出来,效果会急剧下降
--
FROM 59.61.198.*
1/1
|
转到
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版