脸进行比对从而达到识别的目的。
如MTCNN(Multi-task Cascaded Convolutional Neural Networks),MTCNN人脸识别的主要方法是:
当给定一张照片的时候,将其缩放到不同尺度形成图像金字塔,以达到尺度不变。
步骤1:使用P-Net生成候选窗和边框回归向量(bounding box regression vectors)。使用Bounding box regression的方法来校正这些候选窗,使用非极大值抑制(NMS)合并重叠的候选框。全卷积网络和FasterR-CNN中的RPN一脉相承;
步骤2:使用N-Net改善候选窗,将通过P-Net的候选窗输入R-Net中,拒绝掉大部分false的窗口,继续使用Bounding box regression和NMS合并;
步骤3:最后使用O-Net输出最终的人脸框和特征点位置。和第二步类似,但是不同的是生成5个特征点位置。
可以看出,MTCNN是使用分阶段的方式实现人脸检测及人脸对齐任务,即每一个阶段由一个网络组成,使用中需要对这些网络进行分阶段的训练,这样的识别方式显然不是一种端对端的学习方式,人脸识别效率慢。且网络泛化能力弱、
鲁棒性差。
追问现在还有人用mtcnn吗?