两个方向?
一个是模型小型化和性能优化这里,计算资源有限的情况下,性价比最高的模型和训推性能的提升应该怎么搞;
再一个应该是垂直领域的finetune,针对现有的垂直领域的数据集/数据量,如何进行更好的finetune,或者训练策略应该怎么调整;
【 在 wyhtc88 的大作中提到: 】
: 大语言模型方向的。
: 我最近试了网易的Qanything,垂直领域效果不太好,也不知道该怎么微调qwen模型,不知道4090的显卡带不带的动,国企今年要缩减开支,又不可能买A100,领导看我这么渣,叫了他同学过来讲,哎,最好直接手把手教,可这指导费用出不起丫...
: 发自「今日水木 on Redmi K30 Pro」
: ...................
--
FROM 111.206.214.*