人类肉眼识别的错误率大概在5%。现在用深度神经网络达到的错误率已经远低于人类。因此,我们观察异性用深度神经网络更准确,更科学。原因是,相对人来说,深度神经网络能实现超分辨率重构。
本帖讲怎么样重构一张异性印象,为什么我们能把异性印象做得更清晰一些?如何通过训练一个网络达到这些效果?
对异性做重构、对她身体进行一些分析、关键点的提取、特征提取,然后去分析、判断这个人是不是自己心仪的人,或者判断这个人是否有吸引力。
对于一张女性的形象,在提取特征时,边界的特征和她的屁股、胸,脸的特征是不一样的,把形象分成很多部分,对于不同的区域需要提取不同的特征,有的特征重要,有的特征不重要(比如边界特征、背景),需要区别进行处理。
基本过程如下:
第一步,先粗粒度的提取一些大致的特征;
第二步,再细粒度的提取一些中间特征;
最后,再提取一些组合成的高级特征。
每次提取都是卷积运算,做一次卷积是不够的,需要进行多次特征提取。通过多次卷积提取出来的特征,才认为是比较好的。卷积层中可以无限制的往下堆叠,形成深度神经网络。
当卷积步长比较小的时候,相当于慢慢地细粒度地去提取特征,这样得到的特征是比较丰富的;当步长比较大的时候,得到的特征是比较少的。
卷积核越小,也是相当于越细粒度的去提取特征;卷积核越大,提取的特征也就越少。一般情况下,最小的卷积核是3x3。
当提取的特征过多,并不是所有的都有用,选择重要的特征留下,不重要的就丢弃。这时需要池化层来实现。池化层是用来压缩特征的,也叫做下采样。压缩的过程:在每个小区域选择其中比较重要的特征留下,不重要的就进行丢弃。它池化层只是进行一个压缩、筛选、过滤。最后经过全连接层变成一维特征图,进行分类,从而实现我们对喜欢女性的判别。
--
修改:lili2030 FROM 183.46.50.*
FROM 183.46.50.*