折腾了小半年，发现垂直领域模型是个坑

水木社区手机版

主题:折腾了小半年，发现垂直领域模型是个坑
40楼|rumengruhuan|2025-07-06 10:05:28|只看此ID
所以现在各位大佬在公司里面落地的方式是训练私有大模型的多，还是用RAG+基座模型的多？
--
FROM 223.74.153.*
41楼|daidai|2025-07-06 10:22:39|只看此ID
你是预训练还是后训练？

垂类领域模型的关键是，数据都是私有的，大模型不可能见过、学过

【在 scramjet 的大作中提到: 】
: 分别和某头部大学，以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型，以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛，花费大量的精力训出来的模型
: ...................
--
FROM 222.129.2.*
42楼|liaotianxia|2025-07-06 10:23:27|只看此ID
有没有可能是你们水平不行
【在 scramjet 的大作中提到: 】
: 分别和某头部大学，以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型，以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛，花费大量的精力训出来的模型
: 其效果和RAG+基座模型相比并没有实质性改善
: --
:

发自「今日水木 on IN2020」
--
FROM 120.245.98.*
43楼|syy2018|2025-07-06 10:28:31|只看此ID
【在 reaphone 的大作中提到: 】
: 你们的领域知识是确定的（初始态、约束、目标都可以用数学建模），还是概率的？
: 概率的话，是用自然语言可以描述的么？
: 如果是概率性的（比如中医辩证），而且是用自然语言描述的（病历、医书），那我感觉垂直领域模型应该有搞头。
: ...................
现在的病历，绝大部分结构化了...
--
FROM 106.7.251.*
44楼|ztysys|2025-07-06 10:50:35|只看此ID
可能有几个方面的问题：
一、数据量和算力不足，导致训练效果不够
二、或许需要针对性地改进大模型算法，以提升效果和效率
三、训练方法不对
排除了这些之后，才能给出断言
不过每一点验证，都需要大量的投入，不容易

【在 scramjet 的大作中提到: 】
: 分别和某头部大学，以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型，以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛，花费大量的精力训出来的模型
: ...................
--
FROM 124.77.122.*
45楼|euro1|2025-07-06 10:54:32|只看此ID
是不是人群不行？这东西得顶尖智慧人群去做。
--
FROM 111.197.232.*
46楼|Zshadow|2025-07-06 10:55:38|只看此ID
好多人大模型和大语言模型都混在一起。现在的所谓垂直大模型，其实都是垂直领域的语言大模型，不是 alpgago, alphafoler，气象这种专门模式. 效果大部分靠吹. 教育部今年要发布10个领域大模型，且看他一地鸡毛吧。
--
修改:Zshadow FROM 110.87.65.*
FROM 110.87.65.*
47楼|Aladdin|2025-07-06 11:12:59|只看此ID
人家按指标一个个查啊为啥要懂...

【在 juda 的大作中提到: 】
: 这种没事得，审计得人也不懂。。。。
--
FROM 59.175.49.*
48楼|groundzero|2025-07-06 11:50:05|只看此ID
炼丹炼丹，原料火候风水丹炉都看一看。

【在 scramjet 的大作中提到: 】
: 分别和某头部大学，以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型，以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛，花费大量的精力训出来的模型
: ...................
--
FROM 111.192.246.*
49楼|tai123456|2025-07-06 11:51:29|只看此ID
都是造概念圈钱~~~~
--
FROM 114.248.122.*