- 主题:Re: 想研究一下大模型的开源代码,以后给别人讲,请问选哪个合
这两天也在看transformer的源码。
大模型和transformer的源码有什么区别吗,感觉就是训练语料不同
【 在 brysj 的大作中提到: 】
: 现在已经用pytorch和tensorflow都写了一遍transformer架构,基础应该没啥问题了。
: 下一步打算研究一下大模型的开源代码,目前看到有3个开源的比较热门,分别是chatglm, 通义千问,llama,想找个代码邵的好研究,以后好给别人讲,大家帮忙指导一下选哪个合适?
--
FROM 119.4.146.*
【 在 brysj 的大作中提到: 】
: 现在已经用pytorch和tensorflow都写了一遍transformer架构,基础应该没啥问题了。
: 下一步打算研究一下大模型的开源代码,目前看到有3个开源的比较热门,分别是chatglm, 通义千问,llama,想找个代码邵的好研究,以后好给别人讲,大家帮忙指导一下选哪个合适?
不妨建立一个群, 一个人吭哧, 不如一起吭哧。
--
FROM 115.171.244.*
我推荐chatglm,大模型在我看来是个工程问题
【 在 brysj 的大作中提到: 】
:
: 现在已经用pytorch和tensorflow都写了一遍transformer架构,基础应该没啥问题了。
:
: 下一步打算研究一下大模型的开源代码,目前看到有3个开源的比较热门,分别是chatglm, 通义千问,llama,想找个代码邵的好研究,以后好给别人讲,大家帮忙指导一下选哪个合适?
#发自zSMTH@PCT-AL10
--
FROM 113.143.105.*