我老人家一针见血指出,你们争论的根源在于中英文翻译的差别,你几个光顾着唇枪舌剑,却没发现,嘿嘿
Vision掌握着通往真正人工智能的key,把vision做明白了,人工智能就明白了一半。CNN一定程度已经很接近真相了,不然不可能这么effective。多个layer把一张图片从裸像素一层层抽象到高级概念,这个很接近人脑了。人脑算力已在10年前被电脑超过。当然cpu,gpu的结构不适合当神经网络就是了。和人脑比起来还很粗陋,但本身视觉图像处理已经成熟。performance差,主要来源于后面、类似于人逻辑处理的层(比如判断什么物体,手势,结构等),一般简单用fc layer来模拟,也许完全是错的。可能cnn只对应了人脑部分具象思维,离先验概念上的抽象思维还很远。但既然cnn可以暴力数据驱动来实现低阶功能,焉知不会发现对应抽象逻辑思维的网络?
真正的自然语言处理跟通用智能一样困难。你只要有逻辑,不需要懂任何知识。你想想,机器会吹NB扯JB蛋。这玩意那么容易搞?别说不用码工,领导和老板也没用了。吹NB扯JB蛋搞不过机器,就是人类历史的终结。这玩意,全世界只要一台就够了。NLP的终极目标,就是取代。直接把自然语言转化为确定图灵机DTM。只需一台机器,和全世界聊聊天,就搞定了。就是general AI。这个世界只需要一台,就可以彻底消停了。
【 在 h2929 的大作中提到: 】
: 你说的都对,我比较关注这段, 一步一步来吧。
: “但有了0到1,就会有1到100、1万。现在用大规模神经网络已经可以摸仿几亿年进化出的视觉(智能一部分)。下一步仿的是几百万年的人类智能。”
: 现在视觉任务总体做的不错,但是还有以下笑话需要解决。
: ...................
--
FROM 164.92.116.*