- 主题:[讨论]智能化方向是算法重要还是数据质量重要?
看你的角度...
如果你是甲方 就是在给定输入的情况下 哪个效果好 就是哪个产品好...
正经人 谁管算法...
【 在 netskysm 的大作中提到: 】
: 有个智能化项目,测试了开源和厂商的产品,poc发现差距还是很大,表现差的说是数据质量问题(数据量并不小),要做清洗和治理,如果数据都治理好了,结构都清晰了,算法不就是规则模型么?还要ai去跑么?售前宣传都是各种支持,高大上,真拉出来遛遛就对提出了各种环境要求。和大神们一起探讨一下,谢谢!
--
FROM 142.59.143.*
都重要,水多了加面面多了加水,主要看瓶颈在哪
机器学习目前仍然是统计学派占上风,算法策略都还是要对数据做很多限制和假设,大部分项目里数据处理分析起码占到60%以上时间,工程20%,纯算法能有20%就不错了
端到端的少样本学习、无监督学习是圣杯,还要符合可解释性的话,目前来看道路还比较漫长
--
FROM 111.206.214.*
开个脑洞,我觉得是算法重要。人从小长大的学习过程中,对数据并没有太多要求,会接触各种数据。只要和人有关(增加这句是为了避免狼孩的情况,但这句对数据的限制依然很弱),最终都能形成智能。
【 在 netskysm 的大作中提到: 】
: 有个智能化项目,测试了开源和厂商的产品,poc发现差距还是很大,表现差的说是数据质量问题(数据量并不小),要做清洗和治理,如果数据都治理好了,结构都清晰了,算法不就是规则模型么?还要ai去跑么?售前宣传都是各种支持,高大上,真拉出来遛遛就对提出了各种环境要求。和大神们一起探讨一下,谢谢!
--
FROM 106.122.180.*
传统规则模型容量很小,规则多了之后互相冲突,优先级难定,你愿意加再多人工,也无法提高了。
你愿意把新算法理解成容量很大的规则模型也没问题。真能“有多少人工就有多少智能”已经不错了,之前是“加再多人工也没多少智能”。
【 在 netskysm 的大作中提到: 】
: 机器学习是针对大量数据的,如果对数据做很多前期的治理,人工加上诸多标签,感觉有些脱离智能化了。现在宣传很好,但落地的时候真的是问题很多,不管是图像的分类还是语音的识别,需要大量人工干预进行标签化。效果好的算法,其实是掺杂了很多类似规则模型。
--
修改:ilovecpp FROM 124.78.174.*
FROM 124.78.174.*
瞎扯蛋吧你
你这个眼睛,耳朵,触觉收集的数据,比什么激光雷达强多了吧。
更重要的是反馈,社会给你的反馈数据不是数据了?
你找个感官不好的,看下智能到什么程度
找个没社会 反馈的,比如狼孩,看下智能到什么程度
【 在 gluon521 的大作中提到: 】
: 开个脑洞,我觉得是算法重要。人从小长大的学习过程中,对数据并没有太多要求,会接触各种数据。只要和人有关(增加这句是为了避免狼孩的情况,但这句对数据的限制依然很弱),最终都能形成智能。
:
--
FROM 27.38.250.*
那是因为人类生出来还没发育全。
那干脆看牛羊这样的好了,生下来就会走跑跳,就有各种条件反射和完备的系统。
即使没有数据输入,也知道看见老虎要跑,吃奶,吃草,也不会吃错东西被毒死。
然后你要说这是千万年大量数据的堆积,同样是数据。
如果这样说,那算法本身也是需要数据承载的,这就像先有鸡还是先有蛋,就没继续讨论的意义了。
大量数据本身是没有意义的,只有总结出规律的数据才有意义。而总结的过程以及规律本身就是算法。
原问题的所谓数据质量,那人和动物接触的数据有何“质量”可言呢?不照样能总结出规律。
如果数据质量已经很好了,那还要总结啥呢?
本质上已经是具有某种规律的结构了,算法就变成了简单的体力活。
【 在 bluecase 的大作中提到: 】
: 瞎扯蛋吧你
: 你这个眼睛,耳朵,触觉收集的数据,比什么激光雷达强多了吧。
: 更重要的是反馈,社会给你的反馈数据不是数据了?
: ...................
--
FROM 110.87.28.*
【 在 Sinopeus 的大作中提到: 】
:
: 问这个问题的,显然都是没学好高中物理啊
: 行星的观测数据都在那里, 托勒密搞了100多个本圆, 哥白尼搞了7个, 第谷算了一辈子没明白, 开普勒说一个椭圆搞定, 然后牛顿说,一个万有引力定律,我不但能用来解释为什么是一个椭圆,还能解释所有的行星进动
: ...................
有道理,现在ai的飞快发展也与deepmind核心算法突破有关。
--
FROM 223.70.209.*
当然是算法,数据不稀有,算法搞出一个管用的,可了不得。
【 在 netskysm 的大作中提到: 】
: 有个智能化项目,测试了开源和厂商的产品,poc发现差距还是很大,表现差的说是数据质量问题(数据量并不小),要做清洗和治理,如果数据都治理好了,结构都清晰了,算法不就是规则模型么?还要ai去跑么?售前宣传都是各种支持,高大上,真拉出来遛遛就对提出了各种环境要求。和大神们一起探讨一下,谢谢!
--
FROM 114.246.103.*