《基于并行卷积神经网络的人脸关键点定位方法.docx》由会员分享,可在线阅读,更多相关《基于并行卷积神经网络的人脸关键点定位方法.docx(5页珍藏版)》请在第一文库网上搜索。
1、基于并行卷积神经网络的人脸关键点定位方法摘要:论文基于卷积神经网络以及人脸检测算法,提出了训练样本扩充策略,以及对人脸特征、遮挡以及光照检测的并行卷积网络人脸检测算法,结合ReIu激活函数和Dropout随机正则化策略进行网络训练,不仅加快了网络的收敛速度,而且提高了泛化能力。在此基础上,在基于人脸检测以及特征点定位的软件中,实现了对图片的自动载入以及人脸识别功能,实现对面对特征点的准确定位,在1WF人脸库上定位实验结果表明,该方法在准确性以及可靠性方面都得到很大程度提升,能实现对人脸关键点的鲁棒准确估计。关键词:并行卷积神经网络;人脸关键点定位;深度学习;人脸检测1引言人脸检测是人脸识别前不
2、可或缺的重要环节,人脸检测效果的好坏直接影响识别效果。人脸检测是指在视频或者静态图像中确定所有人脸(如果存在)的位置,姿态、大小的过程。经过几十年的研究,人脸检测已经成为一门独立的研究课题,受到国内外学者的广泛重视。在科技高速发展的今天,人脸检测的应用也越来越广泛。比如阿里巴巴总裁马云就提出了刷脸购物的思想,想必不久的将来这一构想将成为现实1。而人脸检测的关键技术也将进一步融入安检、身份认证、自动对焦、人机相互及图像搜索等领域,为智能生活造福。人脸特征点检测技术在人脸特征提取中起到承上启下,极为关键的作用【2,虽然人脸检测技术的研究近些年发展迅速,但即使精确的人脸定位结果,也受到姿态、角度、光
3、照等因素影响从而影响后续的识别效果。精确的面部关键点定位结果可用于姿态矫正和位置校准,从而提升识别效果。与此同时,人脸特征点标定技术还可以应用于脸部动画合成、表情分析、姿态分析、疲劳判断、2D/3D建模、视频人脸跟踪和人脸局部信息抽取等各个领域。人脸关键点定位是人脸识别等应用中必不可少的一个预处理环节,即使是简单地根据检测到的双眼坐标来旋转图像将双眼置水平面,也可以有效提升人脸识别的准确率,复杂的预处理手段也更加离不开精确的人脸关键点定位算法。卷积神经网络(CNN)最初是应用在手写字符识别3中,近年来获得极大发展并逐步应用到各个领域。卷积神经网络能够从输入图像中提取细节结构信息,同时又能使得这
4、些结构信息具有特征旋转等空间不变性,非常适合用于图像中的检测识别问题。基于此,文中提出一种新的基于并行卷积神经网络的人脸特征点定位方法。在卷积神经网络的研究中,网络结构的设计是最主要问题之一,不同的网络结构对识别结果影响非常大。在传统卷积与下采样不断重复的网络结构中,网络层数过多,结构复杂,因此本文设计并实现了一种并行卷积神经网络拓扑结构。2卷积神经网络卷积神经网络是传统人工神经网络与深度学习相结合而提出的新型人工神经网络,通过引入权值共享、局部感知以及池化层对传统的神经网络结构进行优化。卷积神经网络中卷积层神经元只与上一层的小范围内的神经元相连接,而不是与上一层所有的神经元进行相连,且处于同
5、一特征映射面上的神经元权值是共享的。权值共享和局部感知策略的应用,大幅度减少了需要学习的参数,使得卷积神经网络的训练更为高效。池化层输出的特征具有平移、旋转空间等不变性,使得卷积神经网络对平移、旋转等影响具有良好的鲁棒性。通过卷积层和池化层的交替使用,卷积神经网络完成了对图像特征从局部到全局的学习过程。卷积层的运算过程可以表示如下。X)+(1)p=,式中A表示第/层输出的第k组特征映射图,B%表示第/C层特征映射图的层数,DW(M表示第/E层中第P组特征映射图向第/F层中第k组特征映射图映射时所用的滤波器。第/H层的每一组特征映射图的生成都需要厂/1个滤波器和一个偏置,假设滤波器的大小为JXw
6、,那么第/K层卷积层的参数数量为MX/XOx卬+%O图1卷积神经网络原理图常见的池化操作有最大值池化、均值池化等,本文的卷积神经网络仅使用了最大值池化。池化操作后,特征映射图的大小会根据步长step,缩小至原先的1/siep。最大值池化的一般形式可以表现如下。(M)=maxIXmtep+a,ntep+Z)(2)式中:X(以)A为第/+/B层输出的第k组特征映射图坐标C(5)处的值;S为池化窗口的大小,SI叩为池化窗口移动时的步长,本文中S和SteP均设置为2。卷积神经网络在反向传播以最小化误差函数为目的,来更新神经元之间的所有连接权值和偏置。考虑到人脸关键点定位任务,采用平方和损失函数,它可以
7、表示如下。y凯-优式中:N为神经网络输出层节点数,y为神经网络的预测值,d为人工标注值。木文使用随机梯度下降4算法对神经元之间的所有连接权值和偏置进行更新,则最终的损失函数的表现形式为:TW击郭皿丹M式中:m为每次反向传播时所用训练样本的数量,W为网络中每一层的权重矩阵。卷积神经网络中的权重矩阵W在反向传播时进行更新,在网络训练开始前,以随机值矩阵AM对网络进行初始化,t+1次迭代后更新的权重矩阵叱+/B可以表示如下。3人脸特征点标定算法研究人脸面部特征包括眼睛、鼻子、嘴巴、眉毛和边界等,这些特征不仅可以用来分析面部表情、年龄、美丽指数,还可以用作识别人脸所属身份的重要判据,因此准确的特征点定
8、位结果成为提取面部特征的前提。主流的特征点定位算法包括:5点式、25点式、83点式等。特征点标定算法的基本流程包括:首先对输入图像进行人脸检测,从而获取准确的人脸位置;其次,根据人脸框内的细节纹理信息进行特征点检测;最后,将指定数量的特征点标定在人脸区域内。目前优图、Face+均提供了云端技术体验平台,供爱好者学习体验。本文采用5点式方法。其中,五点分别包括:左眼瞳孔中心点(1E)、右眼瞳孔中心点(RE)、鼻尖点闪、左嘴角点(1M)和右嘴角点(RM)。准确的特征点定位结果可用于人脸角度、姿态的矫正,从而提升人脸识别的准确率。而优秀的特征点标定算法不仅可以高效、准确的获得特征点位置,而且对人脸受
9、到表情、姿态、旋转、遮挡和光照等影响均具有一定鲁棒性。木文选择利用卷积神经网络用于特征点标定算法的研究。3.1 卷积神经网络拓扑结构卷积层和下采样层交替布局的结构,不仅可以将前层局部、具体的特征融合成更加全局、抽象的结构特征表达,有利于分类,而且在特征降维的过程中也简化了网络结构,消除冗余信息的干扰。卷积网络的末尾通常是全连接层和输出层。其中,全连接层将二维的特征映射图按照一定的方式重新排列成一维特征向量,输出层则实现分类和函数逼近。在特征点标定问题中,由于我们要获取5个特征点的坐标,因此网络输出层节点数目为10,分别代表5个输出点的横纵坐标值。具体网络结构如图2所示.n:Convo1utio
10、nFu11yconnected1O(Input)512x512256x256128x128646432x32(Output)图2用于特征点标定结构图图2中,假设经人脸检测算法检测到的人脸框的左上角和右下角坐标分别为(为,M)A和(X2,%)B且左眼瞳孔中心点的实际坐标为(x,y)c,则输出层节点归一化后的输出值D(,8)计算公式如下。X-X1a-(5)2-3.2 局部权值共享策略局部权值共享策略旨在对输入特征映射图进行PXqA等区域划分,每个区域内部共享卷积核权值,相当于提取一种局部纹理特征,局部权值共享策略原理图如图3所示:1ayerm-1hidden1ayerm图3局部权值共享策略局部权值
11、共享策略将原图像划分成等大小区域,每个区域内共享权值,并提取该区域的一种纹理特征。由于每个子区域内部的结构特征比较单一,使得提取的特征更具代表性。当然,子区域划分个数可根据需要人为选取,划分区域过多,会增加计算量,并导致过拟合,因此选择适合于检测对象的子区域个数尤为重要。假设/(/z,w,m)A代表卷积层的前一层特征映射图参数,尺寸为BZIXw,特征映射图的个数为m。C(S,04)C代表卷积层参数,其中,s为卷积核尺寸,n为卷积层特征映射图个数,并且该卷积层采用局部权值共享策略,被划分成D个等大小区域,采用Sigmoi1d激活函数。则卷积层节点输出值计算公式为:(、y-j=Sigmoi1dES
12、乩+9产+/叫r=0k=0i=04案例分析本节实验采用的训练样本集共10000张,其中4150张来自1FW数据集,1000张来自网络数据集,剩余4850张来自网络截取图片,并获得人脸框坐标和特征点坐标。测试集共分为两个子集,共1872张样本。子集1共有1440张样本,均来自1FW数据集;子集2共432张样本,均来自网络数据集。1FW数据集为复杂背景下无约束人脸数据集,人脸在肤色、表情、角度、姿态、遮挡等方面存在差异性。数据集则包含20个测试者在正面拍摄、不同光照条件、不同表情下的人脸图像,如图4所示。分别对数据集每张图像中的人脸位置进行标注,得到左上角和右下角坐标,并获取五个特征点的准确坐标值
13、,用于计算标定误差。图4基于并行卷积神经网络的人脸关键点定位效果图表1不同模型下的误差对比分析方法左眼误差右眼误差鼻尖误差左侧嘴角误差右侧嘴角误差总平均误差单CNN(F1)1.5641.7952.2792.0782.1991.983并行CNN0.8690.8641.1051.2891.2891.083卷积神经网络的训练过程需求很高的内在并行度,并存在着大量的浮点数据运算以及大规模的矩阵运算,有着高度并行结构的图形处理器可以很好的解决这些问题。在相同情况下,GPU模式下的卷积神经网络训练速度远超于CPU模式下的训练速度。在CNN(F1)的训练过程中,GPU模式下迭代IOoO次用时仅为34.7秒,
14、而CPU模式下用时611.3秒,GPU模式下Caffe训练卷积神经网络的速度是CPU的17.6倍。使用支持GPU加速的开源深度学习框架Caffe可以大幅度缩短卷积神经网络的训练耗时。5文章小结随着数字图像技术和深度学习技术的飞速发展,利用深度学习算法进行数字图像领域的信息获取成为研究热点。而人脸作为有效的生物学特征,一直备受关注。本文着眼于利用深度学习领域里的卷积神经网络模型对人脸检测和特征点标定方法进行研究,并通过扩充训练样本、构建级联结构等方式提出了更加高效的人脸检测和特征点标定算法。文中提出的算法对光照、遮挡、姿态、表情等干扰,表现出较好的抗干扰能力,将该算法应用于人脸识别程序中,必然可
15、以提高人脸识别的准确率。参考文献1靳一凡.基于级联卷积神经网络的人脸关键点检测算法D.2015.2杨海燕,蒋新华,聂作先.基于并行卷积神经网络的人脸关键点定位方法研究J计算机应用研究,2015,32(8):2517-2519.3顾吻钺,邱卫东.基于卷积神经网络的胡须及帽子特征检测J信息技术,2017(9):121-124.4郭明金,倪佳佳,陈姝.混合卷积神经网络的人脸验证J计算机系统应用,2018,27(2).5唐杰,陈仁文,余小庆.基于卷积神经网络的车载疲劳驾驶检测系统的实现J国外电子测量技术,2018(1).6毛艺.基于深度神经网络的人脸识别算法研究D.2017.|7汪济民,陆建峰.基于卷积神经网络的人脸性别识别J.现代电子技术,2015,v.38;No.438(7):81-84.18顾佳玲,彭宏京.增长式卷积神经网络及其在人脸检测中的应用J.系统仿真学报,2009,21(8):2441-2445.