- 主题:折腾了小半年,发现垂直领域模型是个坑
目前大模型搞精准领域的确实还差点意思,还是要往处理基础数据、或者水基础内容等提升效率思路走
【 在 scramjet 的大作中提到: 】
: 分别和某头部大学,以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
: ...................
--
FROM 120.229.24.*
怎么才能不吹水
【 在 Aladdin 的大作中提到: 】
: 其中99%估计都是吹水
:
--
FROM 117.129.52.*
但是有的吹啊,训练出出某领域大模型,这个能有成果的。虽然效果一样
--
FROM 112.10.140.*
你们这个垂直模型要达到啥效果? 一竿子打死垂直领域模型,显然是不合适的
【 在 scramjet 的大作中提到: 】
: 分别和某头部大学,以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
: ...................
--
FROM 60.2.184.*
说实话 我只知道大模型等同于大语言模型
你说的大模型是啥
【 在 Zshadow 的大作中提到: 】
: 好多人大模型和大语言模型都混在一起。现在的所谓垂直大模型,其实都是垂直领域的语言大模型,不是 alpgago, alphafoler,气象这种专门模式. 效果大部分靠吹. 教育部今年要发布10个领域大模型,且看他一地鸡毛吧。
--
FROM 112.224.75.*
就不能承认项目失败了吗?失败了不是很正常吗?做研究哪有做一个成一个的?如果是做一个成一个,那肯定是造假了。
【 在 scramjet 的大作中提到: 】
: 一方面现在查的严,专家都不敢随便签字,所以指标不能差太多
: 另外肯定是不会真的应用到工程,这个大家心知肚明
发自「快看水母 于 BVL-AN16」
--
FROM 223.104.78.*
这种考虑通用大模型+行业数据迁移学习,效果应该不错,还能节约成本
【 在 scramjet 的大作中提到: 】
: 分别和某头部大学,以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
: ...................
--
FROM 124.17.28.*
科研探索不能保证一定有预期结果
ChatGPT,DeepSeek也是探索出来的。成功之前那都是乱花钱
【 在 scramjet 的大作中提到: 】
:
: 分别和某头部大学,以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
: 其效果和RAG+基座模型相比并没有实质性改善
#发自zSMTH@ANP-AN00
--
FROM 27.154.203.*
先看通用模型,在特定场景case上能不能部分解决。
有影儿的话,补充垂类数据,sft+rl
这条路确实玄学成分比较大,也在趟坑中…
【 在 scramjet 的大作中提到: 】
: 分别和某头部大学,以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
: 其效果和RAG+基座模型相比并没有实质性改善
: --
:
发自「今日水木 on iPhone 12」
--
FROM 120.244.222.*
感觉很难。
训练需要的资源很多,垂类自有数据其实很有限,容易过拟合自high.
【 在 bigbigbigben 的大作中提到: 】
: 先看通用模型,在特定场景case上能不能部分解决。
: 有影儿的话,补充垂类数据,sft+rl
: 这条路确实玄学成分比较大,也在趟坑中…
: ...................
--
FROM 36.40.165.*