折腾了小半年，发现垂直领域模型是个坑

水木社区手机版

主题:折腾了小半年，发现垂直领域模型是个坑
20楼|scramjet|2025-07-01 14:16:03|只看此ID
前面部分我认同，海洋测绘那个数据量其实很大(接近TB级)，但是问题是覆盖率依然不够，因为海洋测绘这个领域虽然数据量大，但是并不能覆盖所有的典型海况，这方面就很麻烦
然后化工那个主要问题是现有的Traformer构架对于时序数据本来就处理不好
但是我不同意的是：大模型，基础还是语言模型
现在的大模型底层的Transformer构架其实可以做很多其他事情的

【在 jansea 的大作中提到: 】
: 感觉海洋测绘这个领域是数据太少，不确定性太大
: 化工那个，字面看，不适合往大模型方向搞
: 大模型，基础还是语言模型，基于此，才有机会往某个专业领域去微调
--
修改:scramjet FROM 183.128.95.*
FROM 183.128.95.*
21楼|scramjet|2025-07-01 14:17:59|只看此ID
知识并不完全确定，你可以类比天气模型，有基于假设的理论模型但是对于长周期的预测准确度很低
确实有概率成分，但是并不是用自然语言去描述的，我们是直接自己构建模型做训练

【在 reaphone 的大作中提到: 】
: 你们的领域知识是确定的（初始态、约束、目标都可以用数学建模），还是概率的？
: 概率的话，是用自然语言可以描述的么？
: 如果是概率性的（比如中医辩证），而且是用自然语言描述的（病历、医书），那我感觉垂直领域模型应该有搞头。
: ...................
--
FROM 183.128.95.*
22楼|Multimeter|2025-07-01 15:47:24|只看此ID
微调通过验收也有问题？

【在 scramjet (用扯淡的态度,面对操蛋的人生...) 的大作中提到: 】
:  科研项目嘛，懂得都懂
:  其实我一开始也不是很看好，我们是参与单位不是牵头单位
:  然后现在快要专家评审了，在做验证测试时候指标不好看，和前面吹的差挺多
:  反正先让牵头单位头疼去吧
--
FROM 115.171.36.*
23楼|yzjba|2025-07-01 17:11:42|只看此ID
那发布了那么多领域大模型都是吹水吗
【在 scramjet 的大作中提到: 】
: 分别和某头部大学，以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型，以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛，花费大量的精力训出来的模型
: ...................
--
FROM 159.226.52.*
24楼|sanqigong|2025-07-01 17:45:10|只看此ID
垂域模型很多啊，金融，医疗，法律，。。。训练模型有探索成分，不是标准可复制产品，要耐住性质，每步都搞对才行

追短平快一把搞不定就撤，肯定失败

【在 scramjet 的大作中提到: 】
: 分别和某头部大学，以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型，以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛，花费大量的精力训出来的模型
: ...................
--
FROM 43.138.122.*
25楼|gfkid|2025-07-01 17:56:39|只看此ID
我觉得虽然你们没搞出来但是不代表这个是不行的
【在 sanqigong 的大作中提到: 】
: 垂域模型很多啊，金融，医疗，法律，。。。训练模型有探索成分，不是标准可复制产品，要耐住性质，每步都搞对才行
: 追短平快一把搞不定就撤，肯定失败
:
--
FROM 112.224.69.*
26楼|watchdogs|2025-07-01 21:44:39|只看此ID
这个人工智能目前就是百科全书模式。
特定领域，你用非线性处理就是高校。
AI目前的基础就是非线性

【在 scramjet 的大作中提到: 】
: 分别和某头部大学，以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型，以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛，花费大量的精力训出来的模型
: ...................
--
FROM 36.112.184.*
27楼|Hamsik|2025-07-01 23:21:59|只看此ID
数据不行吧，垂直领域搞rag就可以
【在 scramjet 的大作中提到: 】
: 分别和某头部大学，以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型，以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛，花费大量的精力训出来的模型
: ...................
--
FROM 124.79.213.*
28楼|Xjt|2025-07-04 17:59:17|只看此ID
这玩意我在2023年就想通了。。。你们是完全没战略思维啊

2023年我还在研究fine-tune、lora、RHLF等等。后来想通了，这东西普通人根本没必要搞，你搞的再好，也没顶级大模型进化的快

对普通人，或者普通团队，研究怎么更好的使用顶级大模型，比做模型训练有意义的多

比如现在RAG的方案至少有过百种，什么场景什么数据什么行业适合什么算法，这就很值得研究。AI Agent同理。
【在 scramjet 的大作中提到: 】
: 分别和某头部大学，以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型，以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛，花费大量的精力训出来的模型
: ...................
--
修改:Xjt FROM 202.47.106.*
FROM 202.47.106.*
29楼|plsfnd|2025-07-06 00:09:07|只看此ID
现在医疗大模型吹的很火的，至少医疗影像垂直领域的已经开始实用了
【在 scramjet 的大作中提到: 】
: 嗯，我发个帖子其实是想看一下，其他同行在垂直领域模型有没有什么好的进展
: 到底是我们的方法/思路不对，还是这条路子本来就不合适
:
--
FROM 114.249.61.*