- 拿到一张图片之后,把它重新调整成不同的大小,形成一个“图片金字塔”,以此作为后面网络的输入 - Stage 1 :PRoposal network,获得脸部的窗口以及一个叫bounding-box regression vector的东西(就叫它bounding-box 回归器向量吧,查了一下资料似乎是R-CNN论文里用到的东西),然后基于这个bounding-box来对人脸进行校准。之后使用non-maximum suppression (NMS,非极大值抑制算法,即搜索局部极大值,抑制非极大值) ,这个算法的作用主要是消除多余、交叉重复的窗口,找到最佳人脸检测位置,找出最佳定位人脸的窗口。 - Stage 2 :refine network,进一步使用bounding-box regression和NMS进行修正和校准 - Stage 3 :和Stage 2相似,但主要是识别人脸区域,输出脸部的五个位置坐标
新闻热点
疑难解答