CNN就是多层带模糊和扰动的模版匹配. 神经网络只是受到人脑的启发,实际上和人脑的工作原理是不是一样根本没有人说得清,因为人脑是怎么工作的现在还没弄明白。视力是代价非常大的进化,大脑很大一部分用来处理视力有关。眼睛很费能量的,每多一只眼,大脑需要处理的信息成几何倍数上涨。所以足够就好。两个正好。
CNN本质在于convolution, 这个约束极大减少了参数数量。二是multi-layer,把一张图片从裸像素一层层抽象到高级概念,这个很接近人脑了。就是你看图像3秒内的第一感,这个层面上CNN速度和精度上都秒杀人类。但人类是有高级技能的,可以通过高层级智能来帮助识别,人类看一个图像很长时间,可以推理出更多东西。这个层面,机器还不是人类的对手。
performance差,主要来源于后面类似于人的逻辑处理的层,一般就简单用fully connected layer来模拟,或者增加CNN的层数+FC layer来做,也许完全是错的。cnn只是对应了人脑部分低级具象思维,离建立在先验概念上的抽象思维还有很远。
如果谁真觉得智能是靠卷积,那也太鸡巴搞笑了。
卷积后面的东西是难点。
【 在 feng321 的大作中提到: 】
: 这只是途径的一种,我还是想知道人眼和人脑是如何配合,识别出干扰线的?
--
FROM 79.142.79.*