《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 卷積神經網絡人臉檢測算法
卷積神經網絡人臉檢測算法
2020年電子技術應用第1期
王靜波,孟令軍
中北大學 電子測試技術國防科技重點實驗室,山西 太原030051
摘要: 傳統人臉檢測算法往往不能自動地從原始圖像中提取有用的檢測特征,而卷積神經網絡可以輕易地提取高維度的特征信息,廣泛用于圖像處理領域。針對上述缺點,采用簡單高效的深度學習Caffe框架并通過AlexNet網絡訓練,數據集為LFW人臉數據集,得出一個模型分類器,對原始圖像數據進行圖像金字塔變換,并通過前向傳播得到特征圖,反變換得出人臉坐標,采用非極大值抑制算法得出最優位置,最后達到一個二分類的人臉檢測結果。該方法可以實現不同尺度的人臉檢測,具有較高的精度,可用于構建人臉檢測系統。
中圖分類號: TN98;TP391
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.190870
中文引用格式: 王靜波,孟令軍. 卷積神經網絡人臉檢測算法[J].電子技術應用,2020,46(1):34-38.
英文引用格式: Wang Jingbo,Meng Lingjun. Convolutional neural network face detection algorithm[J]. Application of Electronic Technique,2020,46(1):34-38.
Convolutional neural network face detection algorithm
Wang Jingbo,Meng Lingjun
National Key Laboratory for Electronic Measurement Technology,North University of China,Taiyuan 030051,China
Abstract: Traditional face detection algorithms often cannot extract useful detection features from the original image, and convolutional neural networks can easily extract high-dimensional feature information, which is widely used in image processing. In view of the above shortcomings, a simple and efficient deep learning Caffe framework is adopted and trained by AlexNet network. The data set is LFW face dataset, and a model classifier is obtained. Image pyramid transformation is performed on the original image data, and feature graph is obtained by forward propagation. The inverse transformation yields the face coordinates, uses the non-maximum suppression algorithm to obtain the optimal position, and finally reaches a two-class face detection result. The method can realize face detection with different scales and has high precision, and can be used to construct a face detection system.
Key words : face detection;convolutional neural network;deep learing;image pyramid;non-maximum suppression

0 引言

    近年來,人工智能行業有著日新月異的發展,深度學習[1-2](人工神經網絡)在其中扮演著至關重要的角色,人臉檢測也是深度學習領域的熱點,它的研究用來鑒別人的身份,可以廣泛地應用于公共安全、企業辦公、教育、人機交互等領域。區別于指紋、虹膜無需特定的采集裝置,人臉識別系統[3]只需要具有拍照功能的設備(例如手機、相機等)就可滿足要求,有著獨特的優勢。

    目前,人臉檢測落地技術已經隨處可見,廣為人知。例如為確保安全,悉尼板球場已全部覆蓋人臉檢測技術;為了避免假冒開戶,工商銀行在215個網點啟用了人臉檢測; 為了保護未成年人,人臉檢測防火墻被添加到抖音中;“人臉檢測”有助于救援站尋找親屬等。與此同時,互聯網+[4]的時代已經來臨,隱私保護越來越受到人們的重視,也更加促進人臉檢測技術研究的迅速發展。

    智能人臉檢測系統大致的流程如圖1所示。

rgzn2-t1.gif

    如今,人臉檢測技術主要有以下三大類:

    (1)基于Harr特征的級聯Adaboost[5]分類器,該方法由VIOLA P和JONES M J共同提出。最開始粗密度提取特征,將分類不明確的數據和下一階段的數據一起進行優化訓練,反復迭代獲得精密度的特征提取器,然后將多個強提取器級聯成更高精度的級聯器,使用積分圖像提取圖像有效特征值。

    (2)基于可變形零件模型(Deformable Parts Model)[6],將面部視為零件的組合。最開始計算每個分量的方向梯度以獲得直方圖,然后使用支持向量機[7](Surpport Vector Machine)訓練分類器,并且分類操作可以由該分類器執行。

    (3)基于神經網絡的人臉檢測,采用兩級卷積神經網絡進行人臉檢測,第一級執行面部的粗略定位,第二級執行面部的精細定位。2015年,在ImageNet[8]比賽的大熱下,雅虎的Sachin等人使用上述方法進行人臉檢測和定位,取得了很好的效果。在人臉檢測后還需進行預處理操作,目的是通過一些圖像處理技術來減小噪聲對圖像的影響,將對比度、亮度和飽和度適當修改,達到提升準確率的效果[9]

    現實生活中拍攝存在許多不確定因素,例如相機的硬件噪聲、光照和變形。為了消除外在因素的影響,需要對原始圖片進行相關的預處理操作。預處理主要包括人臉圖像的亮度補償、直方圖均衡化和降噪濾波。初期的預處理一般基于2D圖像的簡單操作,隨著技術的發展逐步衍變為基于3D建模的預處理步驟[9]

    利用上述第3種方法進行一定程度的實現。本文采用數據集LFW(Labled Faces in the Wild)人臉數據集20 000多張的圖像數據經過訓練,并迭代5萬次得出一個全連接的caffemodel,圖2為部分人臉數據和非人臉數據,圖3、圖4為數據標注形式與訓練得出的模型分類器[10],標注數據包括人臉ID、數據路徑和人臉坐標位置,且該模型已被證實具有良好的分類效果。然后使用其檢測人臉圖像。待檢測的圖像數據使用訓練好的caffemodel進行前向傳播得到特征圖,從中可以確定待檢測人臉的坐標。

rgzn2-t2.gif

rgzn2-t3.gif

rgzn2-t4.gif

1 AlexNet卷積神經網絡結構

    一般的卷積神經網絡是由卷積層、池化層、全連接層堆疊而成的[11]。卷積層是網絡中提取圖像高維特征的重要結構,相當于人腦局部感知:在檢測圖片的過程中,不是同時檢測整個圖像,而是對于圖片中的每一個特征首先局部感知,然后更高層次對局部進行綜合操作,從而得到全局信息。

    激活函數ReLU對卷積層的輸出結果做一次非線性映射。池化層Pool也稱為欠采樣或下采樣,它主要用于減少特征尺寸,壓縮數據和參數的數量,減小過擬合,提高模型的容錯性,使模型更快更好地朝著最優的方向擬合。

    AlexNet是成功應用上述操作的經典結構。它由KRIZHEVSKY A和其他人設計并在2012年ILSVRC[12-13]中贏得了冠軍,它將對象分類錯誤率從之前的25.8%降低到16.4%,在當時達到最優水平。AlexNet可以訓練更大的數據集和更深的網絡。該模型分為8層,5個卷積層和3個完全連接的層[14]。圖5是AlexNet網絡結構圖以及各層的詳細參數,Caffe在構建網絡時就可使用這些參數定義每一層,但是對于人臉檢測,它是一種二分類任務,需要把最后一層全連接層改成所需任務的類別個數,原來的1 000修改成2。

rgzn2-t5.gif

    圖6為采用Caffe內置卷積函數之后的提取效果,之后還可以再進行卷積池化操作提取更高維的抽象有用信息,圖中的坐標代表像素大小及變化。

rgzn2-t6.gif

2 Caffe深度學習框架

    Caffe是一個清晰而高效的深度學習框架[11,15],由加州大學伯克利分校畢業的賈揚青博士撰寫。Caffe是純粹的C++/CUDA架構,有著如下的優勢:

    (1)模塊化:Caffe從頭開始設計為盡可能模塊化,允許擴展新的數據格式、網絡層和損失功能。

    (2)表示和實現分割:無需代碼編程,只需使用Protocol Buffer語言在配置文件中自定義網絡模型[16]。在任何有向非循環圖的形式中,Caffe支持網絡架構。Caffe會根據網絡大小自動調用合適的內存,避免內存過多占用,同時也可以在CPU和GPU之間自由切換。

    (3)測試覆蓋:在Caffe中,每個模塊對應一個測試。

    (4)Caffe官方有Python和MATLAB兩個編譯版本,本實驗編譯的為Python版本,最后在Python 2.7上驗證實現。

    (5)預訓練參考模型:對于視覺項目,Caffe提供了一些僅用于學術和非商業領域的參考模型,大部分的模型都可以在caffe model zoo里找到,但其許可證不是BSD開源協議。

    后來賈揚清和他在Facebook的團隊研究開發了新一代框架Caffe2。2018年4月18日,Facebook開源了Caffe2。新一代框架更注重模塊化,在移動端、大規模部署上表現卓越。如同TensorFlow,Caffe2使用 C++ Eigen庫,支持ARM架構。

3 算法實現原理

    根據AlexNet網絡的輸入特性,需要圖像的大小為227×227的輸入。但原始圖像數據中的人臉尺寸有可能不是227×227,有的過大,有的過小。因此需要使用圖像金字塔(Image Pyramid)進行多尺度變換,然后經過卷積神經網絡的前向傳播得出特征圖,之后映射到原圖上得到所有窗口的人臉概率值。該方法中是將概率值大于0.95的特征點反變換到原圖得到對應的一塊區域,即為人臉框的位置。

    盡管人臉框的坐標已經得出,但會發現有許多符合要求的窗口,僅需要給出一個最有可能表征人臉的窗口,因此,有必要應用 NMS(非極大抑制)算法來消除交叉重復窗口并找到面部的最佳位置,找到人臉的最佳位置。如圖7所示,NMS算法的原理大致為,假設A框與B框同為包含人臉的候選框,它們之間的交并比IOU(Intersection-over-Union)大于0.8,被視為是高度重疊的,根據它們屬于人臉的概率值P(B)>P(A),將候選框A剔除。

rgzn2-t7.gif

    圖8為整體檢測算法流程圖。首先使用OpenCV讀入待檢測的圖片,然后進行下列操作。

rgzn2-t8.gif

4 結果展示

    該方法實現平臺為Linux系統,版本號為Ubuntu16.04,GPU顯卡型號為GTX1080。軟件采用Caffe+Python 2.7+OpenCV 3.4.1。

    訓練中由于顯存原因,batch_size設置為64,而不是普遍的128。圖9為訓練的結果,每經過100次記錄損失值,可以看到Training Loss:0.003 01和Test Loss:0.001 39,基本滿足需求,也無過擬合現象。

rgzn2-t9.gif

    圖10為圖像數據先進行圖像金字塔變換,然后每個尺度變換后的圖片經過前向傳播得出的特征圖的熱度圖。圖中坐標變化與圖6相同,可以很簡單地看到圖像尺度的變化,顏色越深代表對應原圖中的區域屬于人臉的概率值越大。隨著尺度不斷變換,所有可能為人臉的位置全部得出,最后通過NMS算法得出一個最優的人臉框。

rgzn2-t10.gif

    圖11為不同大小、清晰度不同的人臉圖像數據(圖片來自網絡和300W數據集,包含正臉、側臉和多人臉)的實際檢測結果,從中可以很好地檢測出人臉框,說明模型具有很好的分類效果,達到檢測人臉的功能。

rgzn2-t11.gif

5 結束語

    本文人臉檢測的實現,采用簡單高效易操作的深度學習框架Caffe,構建AlexNet網絡,通過大量的數據訓練得出caffemodel分類器,該算法沿用傳統的滑動窗口方法,利用金字塔變換和非極大值抑制等算法并使用強大的計算機視覺工具OpenCV框出人臉,整體實現了卷積神經網絡的人臉檢測。但是不足之處在于模型不能有效識別多人臉,圖片亮度較低也不能識別,下一步擬采用更龐大的數據和優化更好的網絡(如VGGNet、GoogleNet和ResNet等)進行訓練,實現多人臉檢測、關鍵點的定位和表情的檢測等功能,或者嘗試使用Caffe2實現移動端的人臉相關檢測。

參考文獻

[1] 楊丹輝,鄧洲.人工智能發展的重點領域和方向[J].人民論壇,2018(2):22-24.

[2] 李衛.深度學習在圖像識別中的研究及應用[D].武漢:武漢理工大學,2014.

[3] 蔣兆軍,成孝剛,彭雅琴,等.基于深度學習的無人機識別算法研究[J].電子技術應用,2017,43(7):84-87.

[4] 徐貴寶.“互聯網+”人工智能技術發展策略解析[J].世界電信,2016(3):71-75.

[5] VIOLA P,JONES M J.Robust real-time face detection[J].International Journal of Computer Vision,2004,57(2):137-154.

[6] 宋瑨,王世峰.基于可變形部件模型HOG特征的人形目標檢測[J].應用光學,2016,37(3):380-384.

[7] 胡發煥,劉國平,胡瑢華,等.基于機器視覺和支持向量機的臍橙品質分級檢測[J].北京工業大學學報,2014(11):1615-1620.

[8] RUSSAKOVSKY O,DENG J,SU H,et al.ImageNet large scale visual recognition challenge[J].International Journal of Computer Vision,2015,115(3):211-252.

[9] 魏正.基于Caffe平臺深度學習的人臉識別研究與實現[D].西安:西安電子科技大學,2015.

[10] 王茜,張海仙.深度學習框架Caffe在圖像分類中的應用[J].現代計算機,2016(5):72-75.

[11] Jia Yangqing,SHELHAMER E,DONAHUE J,et al.Caffe:convolutional architecture for fast feature embedding[J].arXiv:1408.5093[cs.cv],2014.

[12] KRIZHEVSKY A,SUTSKEVER I,HINTON G.ImageNet classification with deep convolutional neural networks[J].Advances in Neural Information Processing Systems,2012,25(2):1097-1105.

[13] BADAWI A A,CHAO J,LIN J,et al.The AlexNet moment for homomorphic encryption:HCNN,the first homomorphic CNN on encrypted data with GPUs[J].arXiv:1811.00778v2[cs.CR],2019.

[14] 宋婷婷,徐世許.基于全采樣和L1范數降采樣的卷積神經網絡圖像分類方法[J].軟件,2018,39(2):75-80.

[15] 許少尉,陳思宇.基于深度學習的圖像分類方法[J].電子技術應用,2018,44(6):122-125.

[16] 解駿,陳瑋.基于卷積神經網絡的人臉識別研究[J].軟件導刊,2018(1):25-27.



作者信息:

王靜波,孟令軍

(中北大學 電子測試技術國防科技重點實驗室,山西 太原030051)

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲日本国产| 最新国产成人av网站网址麻豆| 国内精品视频一区| 国产欧美精品| 国产精品一级二级三级| 国产精品系列在线| 国产精品国内视频| 国产精品成av人在线视午夜片| 欧美人与性动交cc0o| 欧美a级一区二区| 巨乳诱惑日韩免费av| 老司机凹凸av亚洲导航| 老司机一区二区| 欧美成人网在线| 欧美不卡视频一区发布| 美女视频一区免费观看| 另类春色校园亚洲| 欧美成人一品| 欧美另类变人与禽xxxxx| 欧美激情精品久久久久久免费印度| 欧美成人a视频| 欧美剧在线免费观看网站| 欧美日韩国产一区二区三区| 欧美日韩国产区| 国产精品成人一区| 国产精品视频久久| 国产在线日韩| 亚洲成人原创| 亚洲精品一区二区三区樱花| 一区二区激情视频| 亚洲综合精品自拍| 欧美尤物巨大精品爽| 久久精品一区中文字幕| 最新国产拍偷乱拍精品| 一区二区三区日韩欧美| 午夜欧美不卡精品aaaaa| 久久国产精品久久久| 久久久久这里只有精品| 欧美.com| 欧美午夜免费| 国产视频久久| 1769国产精品| 国产精品99久久久久久久久久久久| 亚洲欧美另类中文字幕| 久久精品一区二区三区中文字幕| 亚洲精品系列| 午夜精品999| 久久综合伊人77777麻豆| 欧美精品在线一区二区三区| 国产精品欧美日韩| 黄色日韩网站| 99re6热在线精品视频播放速度| 亚洲摸下面视频| 亚洲国产欧美日韩精品| 亚洲桃色在线一区| 久久精品国产一区二区电影| 欧美福利一区| 国产乱码精品一区二区三区不卡 | 国产一区二区三区黄视频| 亚洲第一主播视频| 亚洲在线一区二区| 亚洲裸体俱乐部裸体舞表演av| 亚洲欧美日韩国产综合在线| 久久久久久穴| 欧美日韩另类丝袜其他| 国产专区综合网| 在线亚洲免费视频| 亚洲欧洲一区二区天堂久久 | 欧美自拍丝袜亚洲| 亚洲一级在线观看| 欧美1区视频| 国产亚洲精品自拍| 在线一区观看| 最新日韩精品| 久久精品久久99精品久久| 欧美日韩精品久久| 黄色一区二区三区| 亚洲女女做受ⅹxx高潮| 在线亚洲激情| 欧美福利专区| 激情综合色丁香一区二区| 亚洲一区二区三区成人在线视频精品| 亚洲国产老妈| 久久久久看片| 国产精品视频专区| 亚洲久久视频| 亚洲人成在线观看| 久久精品亚洲| 国产精品久久久久久亚洲毛片| 亚洲人成网在线播放| 亚洲第一页自拍| 久久精品日产第一区二区三区| 欧美视频免费在线观看| 亚洲激情亚洲| 91久久久久久| 老牛影视一区二区三区| 国产一区二区三区丝袜 | 在线视频精品一| 欧美激情精品久久久久久免费印度| 国产一区二区三区在线观看免费| 亚洲一区二区三区视频播放| 一本久久综合| 欧美人与性动交a欧美精品| 亚洲国产高清aⅴ视频| 亚洲二区在线观看| 久久精品视频一| 国产欧美一区在线| 亚洲欧美区自拍先锋| 亚洲欧美在线aaa| 国产精品xxx在线观看www| 99国内精品久久| 一本色道久久综合亚洲精品不卡| 欧美jizzhd精品欧美巨大免费| 一区三区视频| 亚洲黄一区二区三区| 久久中文久久字幕| 一区二区三区在线视频免费观看| 久久精品国产99| 久久综合伊人77777| 一区免费观看| 亚洲欧洲在线免费| 欧美精品粉嫩高潮一区二区 | 久热精品视频| 在线观看亚洲专区| 亚洲欧洲一区二区在线播放| 欧美91福利在线观看| 亚洲国产日韩精品| 一区二区三区视频观看| 欧美三日本三级少妇三2023| 一区二区av在线| 性欧美1819sex性高清| 国产日韩亚洲欧美精品| 久久精品亚洲精品| 欧美激情a∨在线视频播放| 亚洲区免费影片| 这里只有精品在线播放| 国产精品免费网站| 性欧美超级视频| 老鸭窝91久久精品色噜噜导演| 在线免费观看日本一区| 99精品免费| 国产精品海角社区在线观看| 午夜在线视频一区二区区别| 久久精品国产精品| 1000部国产精品成人观看| 日韩午夜在线电影| 国产精品成av人在线视午夜片| 亚洲男人的天堂在线aⅴ视频| 久久久国产一区二区| 亚洲国产成人不卡| 亚洲一区久久久| 国产伪娘ts一区| 亚洲精品久久嫩草网站秘色| 欧美日韩国产精品一区二区亚洲| 亚洲婷婷综合久久一本伊一区| 午夜精品视频在线观看| 国内外成人在线| 一区二区免费在线视频| 国产精品一区久久| 亚洲欧洲日本国产| 国产精品入口66mio| 亚洲国产小视频在线观看| 欧美日韩亚洲一区三区| 亚洲欧美一区二区原创| 牛牛国产精品| 亚洲一区美女视频在线观看免费| 久久久噜噜噜久久中文字幕色伊伊| 亚洲国产婷婷| 性欧美8khd高清极品| 亚洲福利视频免费观看| 亚洲一区三区在线观看| 韩国欧美一区| 亚洲综合导航| 亚洲国产mv| 欧美一区二区三区日韩| 亚洲激情六月丁香| 欧美影视一区| 日韩视频免费看| 久久亚洲捆绑美女| 一本不卡影院| 久久综合99re88久久爱| 亚洲图片欧美日产| 欧美国产亚洲精品久久久8v| 香蕉久久夜色精品国产| 欧美精品久久久久久久久久| 欧美诱惑福利视频| 欧美性久久久| 亚洲精品一品区二品区三品区| 国产精品入口| 一本久久a久久免费精品不卡 | 在线观看欧美亚洲| 欧美一区二区啪啪| 亚洲精品欧洲| 久久中文在线| 性欧美xxxx视频在线观看| 欧美色图首页| 亚洲精品日韩欧美| 国产一区二区在线免费观看 | 亚洲高清在线观看| 国产精品私房写真福利视频|