- 主题:怎么训练专用的智能体
大模型训练或微调,是不是一定要租算力?有专门的工具搞训练吗?
【 在 Dong12138 的大作中提到: 】
: 你的标题取得有问题,如果是训练的话,那就得进行微调,把你的教材全部变成高质量的文字,然后在计算集群上对开源的大模型进行微调。
: 如果是做RAG的话,本地智能体可以用dify,你得先找到这些资料的电子版本(最好是pdf,而不是图片),然后上传到你的dify知识库里,他会自动进行分块转embedding,这个就可以作为你的专用知识库了。然后你想创建什么样的功能就在dify里面拖动定义你自己的智能体。
--
FROM 116.234.23.*
【 在 ksxfhs 的大作中提到: 】
: 大模型训练或微调,是不是一定要租算力?有专门的工具搞训练吗?
:
微调也是训练的一种。如果你要重新训练(from scratch)就别想了,这是大公司干的活。
如果是微调(finetuning)可以在线微调,调用api;如果是离线微调,除非你自己有A100以上的显卡,否则是要租算力的。专门的工具github上一搜一大把,不过得自己花费心思准备高质量数据,再写一点代码,不然没效果。
--
FROM 106.11.41.*
教材的知识大模型都知道吧 何必再训练
【 在 letitbe321 的大作中提到: 】
: 我这里有好多教材,我想喂到一个模型里,让他成为土木专业的智能体。有没有好的思路。我知道最之前是选好神经网络然后训练,现在有大模型了,是不是有更好的思路。
:
: --
发自「今日水木 on iPhone 14」
--
FROM 61.171.198.*
微调也不容易,不过毕竟是程式化的套路,最后就是堆资料
搞个几百G资料,pdf+word+txt,搞出一个行业专家,总应该大差不差
【 在 Dong12138 的大作中提到: 】
: 微调也是训练的一种。如果你要重新训练(from scratch)就别想了,这是大公司干的活。
: 如果是微调(finetuning)可以在线微调,调用api;如果是离线微调,除非你自己有A100以上的显卡,否则是要租算力的。专门的工具github上一搜一大把,不过得自己花费心思准备高质量数据,再写一点代码,不然没效果。
--
FROM 116.234.23.*
微调需要的数据,需要大量,而且要格式化,感觉这个最不好准备
【 在 ksxfhs 的大作中提到: 】
: 微调也不容易,不过毕竟是程式化的套路,最后就是堆资料
: 搞个几百G资料,pdf+word+txt,搞出一个行业专家,总应该大差不差
:
--
FROM 39.155.178.*