《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于深度學習的人體行為識別算法
基于深度學習的人體行為識別算法
2018年電子技術應用第10期
黃友文,萬超倫
江西理工大學 信息工程學院,江西 贛州341000
摘要: 為改善人體行為識別任務中準確率低的問題,提出了一種基于批歸一化的卷積神經網絡(CNN)與長短期記憶(LSTM)神經網絡結合的神經網絡。CNN部分引入批歸一化思想,將輸入網絡的訓練樣本進行小批量歸一化處理,經過全連接之后,送入長短期記憶神經網絡中。該算法采用時空雙流網絡模型結構,視頻數據的RGB圖像作為空間流網絡輸入,光流場圖像作為時間流網絡輸入,再將時空雙流網絡各自得到的識別結果進行加權融合得到最終的行為識別結果。實驗結果表明,本文設計的時空雙流神經網絡算法在人體行為識別任務上具有較高的識別準確率。
中圖分類號: TP183
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.182201
中文引用格式: 黃友文,萬超倫. 基于深度學習的人體行為識別算法[J].電子技術應用,2018,44(10):1-5,10.
英文引用格式: Huang Youwen,Wan Chaolun. Human behavior recognition algorithm based on deep learning[J]. Application of Electronic Technique,2018,44(10):1-5,10.
Human behavior recognition algorithm based on deep learning
Huang Youwen,Wan Chaolun
School of Information Engineering,Jiangxi University of Science and Technology,Ganzhou 341000,China
Abstract: In order to improve the problem of low accuracy in human behavior recognition task, a neural network based on batch normalization convolution neural network(CNN) and long short-term memory(LSTM) neural network is proposed. The CNN part introduces the idea of batch normalization, and the training data of the input network are normalized in mini-batch. After full connection, they are sent to long short-term memory neural network. The algorithm adopts the space-time dual stream network model structure. The RGB image of video data is taken as spatial stream network input, and the optical flow field image is taken as time flow network input. Then the recognition results obtained by the time-space dual-stream network are combined in a certain proportion to obtain the final behavior recognition result. The experimental results show that the space-time dual stream neural network algorithm designed in this paper has a high recognition accuracy in human behavior recognition tasks.
Key words : behavior recognition;batch normalization;long short-term memory neural network;deep learning

0 引言

    人體行為識別是計算機視覺領域的一個重要的課題。其在行為檢測、視頻監控等領域都有著廣泛的應用價值。與單純的圖片識別不同,人體行為識別會受到諸多因素的干擾,例如光照、背景等。傳統方法中,通常通過手動設計某些特定的特征,對數據集中特定的動作進行識別,典型的有HOG/HOF[1]等。文獻[2]提出一種基于稠密光流軌跡與稀疏編碼算法的行為識別方法,將融合框架提取出的行為特征進行處理后,送入支持向量機中得到模型進行分類;文獻[3]利用顯著性檢測獲取到動作主體位置并提取稠密軌跡,采用Fisher Vector去增強特征,再利用SVM進行識別;文獻[4]利用序列化的思想提取骨骼特征矢量,利用SVM訓練并識別靜態特征。然而,傳統方法在面對諸多與現實場景接近的情況時,往往很難取得好的識別效果[5]

    近些年,隨著人工智能技術的崛起,深度學習模型也被應用到了人體行為識別任務中去。利用深度學習模型去自動提取特征,良好地避免了人工設計特征過程中的盲目性和差異性。深度學習模型的一種——卷積神經網絡,通過對輸入數據的卷積操作,逐層提取特征,從而對圖像進行識別分類,其在圖像識別領域已經取得了優異的成果。2012年的AlexNet網絡[6],將ImageNet數據集上的top-5錯誤率降低到了16.4%;2015年的Inception v2網絡[7],提出了批量歸一化的方法;2017年的SeNet網絡[8],再次取得了ILSVRC比賽的冠軍。

    而針對視頻人體行為識別問題,由于幀與幀之間具有著時間相關性,因此,單純將提取到的RGB數據輸入卷積神經網絡進行分類并不能得到一個很好的結果。文獻[9]將視頻數據的稠密光流與RGB數據分別送入CNN進行訓練,使網絡良好處理了時空信息,再將雙流網絡各自得到的結果進行融合;文獻[10]將數據通過一組硬連接內核進行處理后,利用3D卷積網絡訓練提取信息進行人體行為識別。

    除此之外,遞歸神經網絡(RNN)也經常被采用來處理此類問題。RNN是一個具有循環的網絡,可以被看作對同一神經網絡的多次賦值,其允許了信息的持久化。然而,RNN有著梯度消失的問題,為此HOCHREITER S等人提出了一個新的RNN單元,長短期記憶遞歸神經網絡單元[11],通過刻意的設計避免了長期依賴問題的出現。文獻[12]首次將CNN與LSTM進行結合運用在了視頻識別與視頻描述領域;文獻[13]用3D卷積提取數據特征,再送入LSTM網絡中,用于行為識別。

    本文設計了一種采用批歸一化方法的CNN與LSTM結合的網絡,將批歸一化處理運用到了設計的CNN中,通過全連接層,送入LSTM單元對得到的特征序列進行處理,采用Softmax層映射類別。算法提取視頻數據的RGB圖像作為空間流輸入,光流場圖像作為時間流輸入,再將各自得出的分類結果進行加權融合,得出最終的分類結果,用于人體行為識別。該算法在KTH視頻數據集上的識別率達到了95.8%,可有效地運用在人體行為識別任務上。

1 模型結構

1.1 雙流模型框架

    視頻數據具有時間和空間兩部分的特性。空間部分RGB圖像包含了物體的外觀信息,時間部分光流場圖像包含了物體的運動信息。因此,分別提取出視頻的光流場圖像與RGB圖像作為輸入數據,得出各自分類結果后進行加權融合,網絡結構如圖1所示。

rgzd1-t1.gif

1.2 卷積神經網絡

    卷積神經網絡通常由卷積層、池化層、全連接層堆疊而成。卷積層利用多個不同的卷積核,提取目標的特征,生成特征圖;池化層用來進行下采樣,將相鄰特征圖的特征進行合并,減小維度;全連接層起到將學到的分布式特征映射到樣本標記空間的作用。

    然而深度神經網絡在訓練時,各層網絡的輸入分布會受到上一層的影響,隨著網絡的不斷加深,網絡層的微小變動產生的影響會被放大,從而導致梯度消失、梯度爆炸、網絡收斂到一個局部最優值等問題。為此,本文將批歸一化思想[7]從圖像分類領域引入到了行為識別領域,對網絡輸入的樣本進行小批量歸一化處理。

    傳統的批歸一化操作公式如下:

rgzd1-gs1-2.gif

    而對于此式,由于需要對全部的訓練樣本集合進行操作,計算其協方差矩陣,計算量極其龐大。對此,文獻[7]提出了兩點改進措施:

    (1)輸入數據的每一維進行獨立的批歸一化處理;

    (2)采用小批量(mini-batch)。

    對于有d維輸入x=(x(1)…x(d))的神經網絡層,利用式(3)去歸一化每一維:

    rgzd1-gs3.gif

    式(3)的期望與方差在每個mini-batch上對每層進行運算得出。該歸一化操作能加速收斂,即使特征之間不具有相關性。并且通過mini-batch的方式,批歸一化所需的信息能被運用在了反向傳播之中。

    同時,對每一個輸入參數x(k)都引入一對參數λ(k)和β(k),如式(4)所示:

rgzd1-gs4.gif

rgzd1-gs5-6.gif

rgzd1-gs5-6-x1.gif

1.3 長短期記憶神經網絡

    人體動作識別的數據是一組連續的數據,相鄰幀之間有著極大的相關性,因此遞歸神經網絡被用來處理這種問題。傳統的遞歸神經網絡包含輸入序列X,隱藏序列H,輸出序列Y。其隱藏層中包含著時間序列的歷史信息,前向公式可表述為:

rgzd1-gs7-8.gif

1.4 融合模型

    本文的CNN結構由卷積層、池化層、全連接層堆疊而成,并在每個卷積層之后加入batchnorm操作進行小批量歸一化。

    實驗數據采用25 f/s的圖像序列,對提取的每幀圖片,將尺寸擴充為227×227。輸入數據的維度為25×227×227×3。25為視頻數據幀數,227×227為圖片尺寸,3為RGB圖片的3個通道。融合模型的CNN部分如圖2所示。

rgzd1-t2.gif

    圖2中上方的是特征圖的維度大小,下方的是神經網絡的操作層。人體行為識別CNN部分的模型一共有5個卷積層,每個卷積層后都有一個非線性激活函數ReLU去增加非線性,同時,每個卷積層之后也都有一個batchnorm層與scale層組合共同完成小批量歸一化操作。CNN的最后是一個全連接層,將輸入的數據進行矢量化操作后,再送入LSTM網絡中。

    數據輸入LSTM中后,在長短期遞歸神經網絡中按時序做遞歸運算,每次遞歸運算的結果是之前所有特征和當前特征的總和。本文采用一層的LSTM模型,結構如圖3所示。

rgzd1-t3.gif

    融合后的模型如圖4所示,將視頻數據的光流場與RGB形式分別作為時間與空間兩種數據流輸入設計的網絡中進行分別的訓練,再將各自得到的分類結果進行加權融合,最終用于人體行為識別任務。

rgzd1-t4.gif

2 實驗過程

2.1 數據集

    本文使用公開的KTH視頻數據集作為實驗數據來檢驗算法的效果,部分動作的示意圖如圖5所示。數據集包含由固定攝像機拍攝的600個動作視頻。視頻的幀數為25 f/s,視頻每幀圖片的分辨率都為160像素×120像素。共有25名不同的實驗對象,4個不同的實驗場景:室外、室內、室外尺度變化、室外著裝變化,6種不同的人體行為:散步、慢跑、奔跑、揮手、拍手、拳擊。

rgzd1-t5.gif

2.2 實驗結果與分析

    本文在Linux系統下搭建的平臺上用單核GTX 1070 GPU進行訓練。將KTH數據集以動作類別進行劃分,每個動作的前80%作為訓練集,后20%作為測試集。視頻數據的光流場圖像與RGB圖像被預先提取出來,提取出的每張圖片被擴充為227×227,在保證特征不損失的情況下,為加載該訓練網絡的CNN部分在ImageNet數據集下訓練30萬次的預訓練模型參數做準備,用以增強模型的魯棒性,防止過擬合,并加速收斂。

    圖6顯示了訓練過程中,光流場時間網絡和RGB空間網絡隨著訓練次數的增加,對訓練數據識別準確率的變化情況。從圖中可以看出,在空間流上,當迭代次數接近10 000次時,準確率達到86%,趨于穩定,隨著迭代的進行,準確率緩慢上升;在時間流上,當迭代次數接近16 000次時,準確率達到90%以上,隨著迭代的進行,準確率增長趨于平緩,收斂近乎飽和。

rgzd1-t6.gif

    在得到時空網絡各自訓練出的模型后,將雙流的分類結果進行加權融合。圖7中, RGB空間網絡分類結果的權重以0.05的步長進行增加,逐步提高占比。

rgzd1-t7.gif

    可以看出,當純粹以空間流網絡或者時間流網絡進行人體行為識別時,時間流網絡提取出的運動信息比空間流網絡提取出的外觀與背景信息具有更高的識別率,這也說明了在行為識別任務中,光流數據所包含的運動信息比RGB數據包含的外觀信息更為有效。當識別的權重比為RGB:光流場=0.35:0.65時,本文設計的模型達到最好的識別效果,以一定權重比融合的時空雙流神經網絡能有效改善單獨的網絡在識別上的準確率。

    在表1中,本文選取了融合的時空雙流網絡在KTH數據集上得到的最好的識別結果與已有的一些算法模型進行了對比。

rgzd1-b1.gif

    可以看出,本文設計的基于批歸一化的卷積神經網絡與LSTM結合的網絡結構在將其在RGB空間圖像與光流場時間圖像分別得到的分類結果以0.35:0.65的比例進行加權融合之后,可以得到優于文獻[2]與文獻[3]提出的兩種傳統算法的結果。在和同樣是以深度學習為基礎的算法進行對比時,本文設計的模型結構同樣也優于文獻[10]與文獻[13]提出的兩種算法。這充分說明本文提出的算法在人體行為識別任務上具有可行性。

    表2所示的混淆矩陣對測試集中6種不同的動作行為的識別結果做了可視化,對角線元素表示正確識別率。可以看出,在KTH數據集中模型對“拳擊”和“揮手”動作的識別率最高,由于“拍手”與“揮手”之間有部分的相似性,因此,有部分“拍手”被識別成了“揮手”。 “慢跑”和“散步”、“跑步”之間相似性較高,因此,這三者之間產生了一些誤識別率。但就總體而言模型依舊具有良好的泛化能力和魯棒性。

rgzd1-b2.gif

3 結論

    本文提出了一種采用批歸一化的卷積神經網絡與LSTM網絡結合的深度學習網絡結構。采用視頻數據的RGB圖像與光流場圖像分別作為空間流網絡輸入與時間流網絡輸入,再將時空雙流網絡分別得到的分類結果以一定的權重比例進行融合。本文模型在KTH數據集的測試集上的識別率達到了95.8%。相較于文中對比的兩種傳統方法與兩種深度學習方法,本文模型能更好地提取視頻中的時序特征與空間特征,識別率較好。整個模型基于深度神經網絡,無需先驗經驗,具有良好的泛化性與實用性。

參考文獻

[1] LAPTEV I,MARSZALEK M,SCHMID C,et al.Learning realistic human actions from movies[C].IEEE Conference on Computer Vision and Pattern Recognition,2008.CVPR 2008.IEEE,2008:1-8.

[2] 趙曉健,曾曉勤.基于稠密光流軌跡和稀疏編碼算法的行為識別方法[J].計算機應用,2016,36(1):181-187.

[3] 鹿天然,于鳳芹,楊慧中,等.基于顯著性檢測和稠密軌跡的人體行為識別[J].計算機工程與應用,2018,54(4):163-167.

[4] 胡青松,張亮.人體行為序列化識別算法研究[J].電子技術應用,2018,44(4):122-125.

[5] 羅海波,許凌云,惠斌,等.基于深度學習的目標跟蹤方法研究現狀與展望[J].紅外與激光工程,2017(5):6-12.

[6] KRIZHEVSKY A,SUTSKEVER I,HINTON G E.Imagenet classification with deep convolutional neural networks[C].Advances in Neural Information Processing Systems,2012:1097-1105.

[7] IOFFE S,SZEGEDY C.Batch normalization: accelerating deep network training by reducing internal covariate shift[C].Proceedings of the 32nd International Conference on Machine Learning,2015:448-456.

[8] HU J,SHEN L,SUN G.Squeeze-and-excitation networks[J].arXiv preprint arXiv:1709.01507,2017,7.

[9] WANG L,XIONG Y,WANG Z,et al.Temporal segment networks:towards good practices for deep action recognition[C].European Conference on Computer Vision.Springer,Cham,2016:20-36.

[10] JI S,XU W,YANG M,et al.3D convolutional neural networks for human action recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(1):221-231.

[11] HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.

[12] DONAHUE J,ANNE HENDRICKS L,GUADARRAMA S,et al.Long-term recurrent convolutional networks for visual recognition and description[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2015:2625-2634.

[13] 秦陽,莫凌飛,郭文科,等.3D CNNs與LSTMs在行為識別中的組合及其應用[J].測控技術,2017(2):28-32.



作者信息:

黃友文,萬超倫

(江西理工大學 信息工程學院,江西 贛州341000)

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲国产片色| 亚洲欧美日韩成人| 国产精品毛片a∨一区二区三区|国 | 国产一区 二区 三区一级| 欧美视频在线观看视频极品| 欧美精品高清视频| 欧美激情成人在线视频| 欧美成人情趣视频| 欧美电影免费观看| 欧美精品18+| 欧美另类人妖| 欧美日韩免费精品| 欧美日韩国产一区| 欧美午夜激情小视频| 欧美视频一区二区三区在线观看 | 亚洲一区视频在线| 亚洲自拍电影| 亚洲一区中文| 午夜欧美不卡精品aaaaa| 亚洲欧美日韩直播| 欧美综合二区| 亚洲国产精品热久久| 亚洲精品极品| 中文一区在线| 欧美一区二区三区在线看| 欧美综合国产| 久久中文字幕导航| 免费成人av在线| 欧美人成网站| 国产精品扒开腿爽爽爽视频| 国产精品免费网站| 国产视频一区三区| 在线日韩欧美视频| 亚洲美女淫视频| 亚洲综合国产精品| 欧美中文字幕精品| 亚洲美女在线观看| 亚洲永久免费精品| 久久免费视频在线| 欧美国产一区二区在线观看 | 国产日韩精品在线播放| 激情婷婷亚洲| 日韩网站在线看片你懂的| 亚洲一区二区三区四区五区黄| 欧美在线一二三四区| 日韩一区二区精品葵司在线| 亚洲欧美经典视频| 久久中文久久字幕| 欧美涩涩网站| 国内伊人久久久久久网站视频| 亚洲韩国精品一区| 亚洲一区二区视频| 亚洲欧洲一区二区在线播放| 亚洲午夜一区二区| 久久躁日日躁aaaaxxxx| 欧美日韩国产欧| 国产性天天综合网| 亚洲伦理在线| 久久精品国产免费看久久精品| 一区二区三区国产精品| 久久国内精品自在自线400部| 欧美电影电视剧在线观看| 国产精品女人久久久久久| 一区二区在线视频| 亚洲一区免费| 亚洲卡通欧美制服中文| 欧美在线免费观看视频| 欧美伦理91i| 精久久久久久| 亚洲欧美成人一区二区在线电影| 亚洲精品自在久久| 久久精品国产精品亚洲精品| 欧美日韩精品在线视频| 黄色成人在线| 亚洲综合电影| 中文一区在线| 欧美成人日本| 国产一区二区三区成人欧美日韩在线观看 | 亚洲第一中文字幕| 亚洲欧美在线一区| 宅男噜噜噜66国产日韩在线观看| 久久欧美肥婆一二区| 国产精品日韩专区| 亚洲免费不卡| 91久久精品国产91性色| 欧美中文字幕在线观看| 欧美日韩日韩| 亚洲国产国产亚洲一二三| 欧美在线一区二区| 欧美一区二区三区久久精品茉莉花| 欧美久色视频| 精品91视频| 欧美怡红院视频| 欧美一级专区免费大片| 欧美日韩精品一区二区在线播放| 亚洲成色www8888| 久久国产精品久久国产精品| 欧美一区二区精品久久911| 欧美午夜精品电影| 日韩天堂在线视频| 日韩网站在线观看| 欧美激情视频免费观看| 在线视频观看日韩| 亚洲第一主播视频| 久久疯狂做爰流白浆xx| 国产精品香蕉在线观看| 亚洲网友自拍| 亚洲小视频在线| 欧美三区美女| 日韩一区二区电影网| 一区二区三区产品免费精品久久75 | 欧美亚洲在线| 欧美在线视屏| 国产精品自拍在线| 亚洲综合日韩中文字幕v在线| 午夜精品免费在线| 国产精品毛片a∨一区二区三区|国 | 亚洲视频一区二区免费在线观看| 一本色道久久综合亚洲精品不| 欧美高清视频在线| 亚洲国产精品成人综合| 亚洲精品欧美一区二区三区| 嫩模写真一区二区三区三州| 伊人蜜桃色噜噜激情综合| 亚洲第一偷拍| 欧美成人一区在线| 亚洲激情视频在线播放| 日韩图片一区| 欧美日韩在线视频一区| 一区二区三区高清不卡| 亚洲一区免费在线观看| 国产精品一区二区三区四区五区| 亚洲天堂成人在线视频| 午夜久久美女| 国语自产精品视频在线看| 亚洲国产高清自拍| 欧美激情2020午夜免费观看| 亚洲日本在线视频观看| 一本色道久久99精品综合| 欧美日本一区二区高清播放视频| 亚洲免费av网站| 亚洲欧美日韩国产综合精品二区| 国产精品一区二区在线| 久久av一区二区三区漫画| 狼人天天伊人久久| 亚洲精品黄网在线观看| 亚洲一区免费| 国产日韩欧美一区二区三区在线观看| 久久爱91午夜羞羞| 欧美电影免费观看高清完整版| 亚洲欧洲综合| 亚洲综合精品四区| 国产日韩在线不卡| 亚洲国产毛片完整版| 欧美精品播放| 亚洲已满18点击进入久久| 久久精品首页| 亚洲国产精品ⅴa在线观看| 亚洲视频精品| 国产一区欧美| 日韩视频在线你懂得| 国产精品日韩一区二区三区| 久久精品道一区二区三区| 欧美电影免费观看网站| 亚洲午夜精品久久久久久浪潮| 久久久999精品| 亚洲美女中文字幕| 久久国产精品99国产精| 亚洲黄色性网站| 性欧美xxxx大乳国产app| 在线精品亚洲一区二区| 亚洲小说区图片区| 国产一区深夜福利| 一区二区三区免费网站| 国产视频一区二区在线观看| 日韩视频不卡| 国产一二精品视频| 亚洲视频一区二区| 国自产拍偷拍福利精品免费一| 9色国产精品| 国产综合香蕉五月婷在线| 中文精品一区二区三区| 黄色亚洲大片免费在线观看| 亚洲午夜精品一区二区三区他趣 | 久久精品国产999大香线蕉| 欧美色大人视频| 最新成人av网站| 国产精品视频精品| 亚洲精品一区二区在线| 国产亚洲精品bv在线观看| 亚洲一区国产| 亚洲国产一成人久久精品| 欧美一区二区精品在线| 99视频超级精品| 乱码第一页成人| 亚洲欧美成人一区二区三区| 欧美日韩ab片| 亚洲黄页视频免费观看| 国产欧美日韩免费看aⅴ视频| aa级大片欧美|