- 主题:折腾了小半年,发现垂直领域模型是个坑
看了大家的回复,我心里拔凉拔凉的
【 在 tai123456 的大作中提到: 】
: 都是造概念圈钱~~~~
--
FROM 114.252.221.*
训练效果是不是没办法预测,只能训练完了看是吧?
【 在 scramjet 的大作中提到: 】
: 分别和某头部大学,以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
: ...................
--
FROM 114.221.72.*
有没有哪些垂直领域训练出来的模型明显有革命性提升的呀。我们想在畜牧行业的某一个更细分的行业来搞一套呢。要是哪个行业都没有成功的,那我们就重新考虑下要不要搞大模型了,不行就直接传统AI算了,选一个能用的模型算法凑合用,不这么硬凑高级货了。
--
FROM 114.221.72.*
先看下你的有效数据量有多大?
【 在 kanshangren 的大作中提到: 】
: 有没有哪些垂直领域训练出来的模型明显有革命性提升的呀。我们想在畜牧行业的某一个更细分的行业来搞一套呢。要是哪个行业都没有成功的,那我们就重新考虑下要不要搞大模型了,不行就直接传统AI算了,选一个能用的模型算法凑合用,不这么硬凑高级货了。
--
FROM 221.216.146.*
这个应该是没找到临界点吧,大模型可解释性太差,路没走对会让人很绝望的。
【 在 scramjet 的大作中提到: 】
:科研项目嘛,懂得都懂:其实我一开始也不是很看好,我们是参与单位不是牵头单位:然后现在快要专家评审了,在做验证测试时候指标
- 来自 水木社区APP v3.5.7
--
FROM 149.112.116.*
对,所以我们都说模型微调是炼丹,因为你根本不知道练出来的啥效果
【 在 kanshangren 的大作中提到: 】
: 训练效果是不是没办法预测,只能训练完了看是吧?
--
FROM 122.233.16.*
据我所知90%以上都是RAG+基座模型
【 在 rumengruhuan 的大作中提到: 】
: 所以现在各位大佬在公司里面落地的方式是训练私有大模型的多,还是用RAG+基座模型的多?
--
FROM 122.233.16.*
很有可能啊,这里面可能性太多了
包括特定领域也许就不适合垂直领域模型,所以我在发帖看看其他哪些领域有做的比较好的
【 在 liaotianxia 的大作中提到: 】
: 有没有可能是你们水平不行
: 发自「今日水木 on IN2020」
--
FROM 122.233.16.*
垂直领域的模型,就不应该采用,或是只能部分采用。因为大模型没有可解释性。没有真正的逻辑。
而垂直领域的逻辑经验,也不应该纯靠数值的相似性。
【 在 scramjet 的大作中提到: 】
: 分别和某头部大学,以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
: ...................
--
FROM 124.79.229.*
其中99%估计都是吹水
【 在 yzjba 的大作中提到: 】
: 那发布了那么多领域大模型都是吹水吗
--
FROM 59.175.49.*