YOLO模型和mtcnn模型对比，在做人脸识别时，有何不同？

如题所述

推荐答案 2019-03-05

脸进行比对从而达到识别的目的。

如MTCNN(Multi-task Cascaded Convolutional Neural Networks)，MTCNN人脸识别的主要方法是：

当给定一张照片的时候，将其缩放到不同尺度形成图像金字塔，以达到尺度不变。

步骤1：使用P-Net生成候选窗和边框回归向量(bounding box regression vectors)。使用Bounding box regression的方法来校正这些候选窗，使用非极大值抑制(NMS)合并重叠的候选框。全卷积网络和FasterR-CNN中的RPN一脉相承；

步骤2：使用N-Net改善候选窗，将通过P-Net的候选窗输入R-Net中，拒绝掉大部分false的窗口，继续使用Bounding box regression和NMS合并；

步骤3：最后使用O-Net输出最终的人脸框和特征点位置。和第二步类似，但是不同的是生成5个特征点位置。

可以看出，MTCNN是使用分阶段的方式实现人脸检测及人脸对齐任务，即每一个阶段由一个网络组成，使用中需要对这些网络进行分阶段的训练，这样的识别方式显然不是一种端对端的学习方式，人脸识别效率慢。且网络泛化能力弱、鲁棒性差。追问

现在还有人用mtcnn吗？

温馨提示：答案为网友推荐，仅供参考

当前网址：http://www.wendadaohang.com/zd/nK443W34nd11K1GG3n.html

其他回答

第1个回答 2019-03-06

识别技术是基于人的脸部特征，对输入的人脸图像或者视频流进行判断。首先判断是否存在人脸，如果存在，则进一步给出人脸所在的位置、大小。并根据这些信息进一步提取出人脸的特征信息，最后将其与已知的人脸对比，从而识别每个人脸的身份，总体来说，人脸的识别分为两大步骤，一是人脸的检测，二是人脸的对齐，人脸检测方面，目前人脸检测采用边框检测的方式，即利用网络学习将图像划分为若干边框，从若干边框中捕捉人脸，并提取出人脸的关键点信心，人脸的对齐则是将图像中的人脸与已知的人脸进行比对从而达到识别的目的。
如MTCNN(Multi-task Cascaded Convolutional Neural Networks)，MTCNN人脸识别的主要方法是：
当给定一张照片的时候，将其缩放到不同尺度形成图像金字塔，以达到尺度不变。
步骤1：使用P-Net生成候选窗和边框回归向量(bounding box regression vectors)。使用Bounding box regression的方法来校正这些候选窗，使用非极大值抑制(NMS)合并重叠的候选框。全卷积网络和FasterR-CNN中的RPN一脉相承；
步骤2：使用N-Net改善候选窗，将通过P-Net的候选窗输入R-Net中，拒绝掉本回答被网友采纳

第2个回答 2019-03-05

步骤1：使用P-Net生成候选窗和边框回归向量(bounding box regression vectors)。使用Bounding box regression的方法来校正这些候选窗，使用非极大值抑制(NMS)合并重叠的候选框。全卷积网络和FasterR-CNN中的RPN一脉相承；

第3个回答 2019-03-05

各有各的优点也各有各的缺点

第4个回答 2019-03-05

2010年荣获

相似回答

大家正在搜