- 主题:折腾了小半年,发现垂直领域模型是个坑
分别和某头部大学,以及北京某研究所合作
搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
最后的结果都是一地鸡毛,花费大量的精力训出来的模型
其效果和RAG+基座模型相比并没有实质性改善
--
FROM 122.234.18.*
这玩意儿技术方向就有问题,纯纯骗钱的玩意儿你们真上啊
【 在 scramjet 的大作中提到: 】
: 分别和某头部大学,以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
: 其效果和RAG+基座模型相比并没有实质性改善
: --
:
发自「今日水木 on V2178A」
--
FROM 124.64.18.*
要是有复杂推理的话,自己写一个MCP服务让大模型调用,是不是效果更好?
【 在 scramjet 的大作中提到: 】
: 分别和某头部大学,以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
: ...................
--
FROM 111.197.234.*
科研项目嘛,懂得都懂
其实我一开始也不是很看好,我们是参与单位不是牵头单位
然后现在快要专家评审了,在做验证测试时候指标不好看,和前面吹的差挺多
反正先让牵头单位头疼去吧
【 在 juda 的大作中提到: 】
: 这玩意儿技术方向就有问题,纯纯骗钱的玩意儿你们真上啊
: 发自「今日水木 on V2178A」
--
FROM 122.234.18.*
指标都能做得,不会真得应用工程上吧,钱到手了各方开心就行了
【 在 scramjet 的大作中提到: 】
: 科研项目嘛,懂得都懂
: 其实我一开始也不是很看好,我们是参与单位不是牵头单位
: 然后现在快要专家评审了,在做验证测试时候指标不好看,和前面吹的差挺多
: ...................
--
FROM 124.64.18.*
你就这么想,
王八拳抡死一个是一个,
买彩票还有中奖的时候,
哪怕是个小奖。
一个都抡不死,
也就是处出洋相。
王八拳本身就是王八拳。
【 在 scramjet 的大作中提到: 】
: 分别和某头部大学,以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
: ...................
--
FROM 115.53.39.*
一方面现在查的严,专家都不敢随便签字,所以指标不能差太多
另外肯定是不会真的应用到工程,这个大家心知肚明
【 在 juda 的大作中提到: 】
: 指标都能做得,不会真得应用工程上吧,钱到手了各方开心就行了
--
FROM 122.234.18.*
这种没事得,审计得人也不懂。。。。
【 在 scramjet 的大作中提到: 】
: 一方面现在查的严,专家都不敢随便签字,所以指标不能差太多
: 另外肯定是不会真的应用到工程,这个大家心知肚明
:
--
FROM 124.64.18.*
和AI大模型最好结合的是有一套script的系统,越全面越好,比如excel, blender之类的,可以用大模型生成script到里面执行。所以你们最好能先实现个python script能调用垂直模型的。然后微调大模型,让能生成代码。
【 在 scramjet 的大作中提到: 】
: 分别和某头部大学,以及北京某研究所合作
: 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
: 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
: ...................
--
FROM 111.197.234.*
我觉得你根本不了解我们的项目搞什么方向...
你这套思路还是通用应用的,我们是搞很专的方向
【 在 superisaac 的大作中提到: 】
: 和AI大模型最好结合的是有一套script的系统,越全面越好,比如excel, blender之类的,可以用大模型生成script到里面执行。所以你们最好能先实现个python script能调用垂直模型的。然后微调大模型,让能生成代码。
:
--
FROM 122.234.18.*