- 主题:想学习chatgpt是如何训练的?求大佬推荐好文章
最好是能从 问题编码开始讲起的,步骤大致是这样:
问题输入——编码——训练好的模型推理 ——给出一个结果(一个字或一个词)——再接着推理。。。。。
那这个模型是如何训练出来的呢?谢谢
--
FROM 120.242.238.*
这难道是在说我?我虽不具备这些条件,但是想学习、肯学习啊。98年google,2022年chatgpt。
google把互联网上所有的文章都看一遍,并按照关键词分类,推荐给你相关度高的。
chatgpt,能理解你的意思,并准确回答你的问题。
下一个伟大的产品可能在24年以后出现,她会解决个什么问题呢?
【 在 menglongwang 的大作中提到: 】
: 你只需知道一无数据、二无算力、三不懂算法、四无话语权就行了
--
FROM 120.242.238.*
哪里有这篇文章的中文版本吗?看英文的,实在太累了。谢谢
【 在 johnfader 的大作中提到: 】
: attention is all you need.
--
FROM 120.242.238.*
还是没找到学习方式。要跑这个代码(比如《Attention Is All You Need》里面给出的github项目代码),太麻烦了。要显卡、估计还至少要1t的硬盘,可是我都没有。
不知道学这个用在哪里?重点是学什么?
【 在 MirsWings 的大作中提到: 】
: 都开始研究AI了,难道不能用AI翻译么
:
--
FROM 120.242.238.*
本科就是数学专业的,自认为数学基础没有问题。
【 在 johnfader 的大作中提到: 】
: 先说你本身的基础,比如说本科是什么专业的?高数怎么样?线性代数学了吗?统计学基本概念学过吗?
:
--
FROM 120.242.238.*
谢谢,能告诉一下详细的书名吗?我买来看看。学这个,至少要个什么配置的机器啊?我的硬盘就512G,显卡就2g。
【 在 johnfader 的大作中提到: 】
: 那直接周志华的西瓜书,能看懂吗?这个是中文的基础书。
--
FROM 120.242.238.*
谢谢。我问了一下,这本书是2016年由清华大学出版社出版了。内容太老了啊。要学chatgpt的。
2016年以后,深度学习、神经网络发展,简直是一泻千里。2016年太老了。听名字也太老了。
机器学习,后面是《深度学习》
【 在 johnfader 的大作中提到: 】
: 周志华 《机器学习》
--
FROM 120.242.238.*
有《深度学习》电子版吗?麻烦发我一下?或者发我邮箱:1789270840@qq.com
我看过一本《TensorFlow 深度学习 实战大全》,李明军写的。这本书算是我买的好几本深度学习书里面最好的了(他第一章的例子非常好,基本上把要解决的问题,讲清楚了)。可是我和作者交流了,发现他基本上不懂数学里面的矩阵求导。。。。
我现在是想,低成本学习chatgpt(几乎没有显卡、硬盘也小、还得找几T的数据)
【 在 johnfader 的大作中提到: 】
: 老是老,但基础是基础,你现在要学习,高度数学,不要学习微积分的基础吗?
: 全部读懂了《机器学习》再来问吧。
: 如果你可以的话,直接读《深度学习》也可以。
--
FROM 120.242.238.*
是的,现在就是chatgpt的天下。能搞懂chatgpt,应该就算是有进步。其他的,都不适合。你学chatgpt,是怎么学的?
【 在 cppbuilder 的大作中提到: 】
: 说起来我让新生入门读的deep learning也是2016年出版的...
: 这东西就好像,如果你需要理解怎么求函数极值,函数导数,那看个一百年前的微积分教材是很适合的,真非要读去年刚出版的差一些的书反而浪费时间了
: 周志华这本我个人是不太建议读,不过不是因为老是现在看来稍微有点杂了,学生可能会没兴趣看完看懂
: ...................
--
FROM 120.242.238.*
对了,版主,我记得我们这个《人工智能》版,以前有作者写过长篇文章(里面详细描写了“注意力机制”),有目录的,里面分很多篇文章。可是那个入口,我现在找不到了。你知道在哪里吗?谢谢
【 在 cppbuilder 的大作中提到: 】
: 说起来我让新生入门读的deep learning也是2016年出版的...
: 这东西就好像,如果你需要理解怎么求函数极值,函数导数,那看个一百年前的微积分教材是很适合的,真非要读去年刚出版的差一些的书反而浪费时间了
: 周志华这本我个人是不太建议读,不过不是因为老是现在看来稍微有点杂了,学生可能会没兴趣看完看懂
: ...................
--
FROM 120.242.238.*