求好的大模型指导文章，谢谢！！

水木社区手机版

主题:求好的大模型指导文章，谢谢！！
楼主|feng321|2025-07-24 20:11:03|只看此ID
有数学基础。以前也泛泛地看了一些（什么“注意力机制”），但是没看懂，也忘记链接了。求大佬指导一下。贵版置顶的文章“开放课程及开源资料汇总”竟然看不了了，奇怪。
--
FROM 120.242.240.*
1楼|snxly|2025-07-25 11:28:46|只看此ID
同小白，转行准备中。

我是从吴恩达开始看，比较适合没基础的同学，基本能看懂
coursera上面搜 machine learning specialization和 Deep learning specialization

然后推荐看看github上 Andrej Karpathy的两个库 convnetjs 和 recurrentjs
我是看了这两个代码才真正理解了 backpropagation 和 RNN/LSTM

吴恩达的DL课程里，nlp/Transformer的部分听的不是很明白，所以又看了斯坦福的 CS224N

我比较笨，看的也比较慢，这些资料大概用了4个月的时间。

楼主专门提到了数学。我看到这里，对数学部分的感受是，
1.如果还记得些向量/矩阵乘法基本就够用了。
2.另外就是有些求导数的公式，太久没用确实忘光了，这个用到的时候专门查一下就好。

下一步的重点就打算放在LLM了：
准备看看Andrej Karpathy 的《Zero 2 Hero》大概意思是从零撸一个 GPT-2

另外工程上，DL相关的工具链可能也得花些时间
python，numpy，scikit，pytorch，tensorflow之类的

以上是我目前看过的全部资料，也请大佬看看，还有没有其他资料值得推荐，感谢。
--
FROM 123.118.226.*
2楼|juda|2025-07-25 11:55:38|只看此ID
都是胡写的，不要看了，直接干代码。
【在 feng321 的大作中提到: 】
: 有数学基础。以前也泛泛地看了一些（什么“注意力机制”），但是没看懂，也忘记链接了。求大佬指导一下。贵版置顶的文章“开放课程及开源资料汇总”竟然看不了了，奇怪。
:
--
FROM 223.72.208.*
3楼|Joseph2012|2025-08-04 17:35:15|只看此ID
大模型时代干法不一样了，直接干代码开发应用。如果底子不够好，也没机会去头部公司，没数据没算力，大模型已经脱离一般玩家了
--
FROM 36.110.43.*