求chatgpt、deepseek原理的好文章（从文字编码开始讲）

水木社区手机版

主题:求chatgpt、deepseek原理的好文章（从文字编码开始讲）
楼主|feng321|2025-02-05 20:22:34|展开
有大佬总结一下吗？太需要这个了。
1、文章（提示词）是如果被编码的？
如何一个一个的冒出回答的？
deepseek又是如何改进的？

盼版上大佬，给出详细、精简的解释。谢谢
--
FROM 114.104.109.*
2楼|feng321|2025-02-09 18:54:35|展开
问了，还是不太懂，更不懂“自注意力机制”是如何起作用的。以前看过一篇解释“自注意力机制”的文章，没看懂，就放弃了。你有好的解释“自注意力机制”的文章吗？谢谢
“自注意力机制：模型会计算输入序列中每个token之间的关系，决定哪些token对当前token的生成最为重要。这一机制使得模型能够关注上下文信息。”————如何决定哪些token对当前token的生成最为重要？
【在 Alohaaaa 的大作中提到: 】
: 我前两天问过 deepseek ，感觉回答的还不错
: 你可以问问
: 发自「快看水母于 BVL-AN00」
--
FROM 114.104.109.*

BYR-Team©2010. KBS Dev-Team©2011 登录完整版