文獻(xiàn)標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.08.011
引用格式: 王文成,蔣慧,喬倩,等. 基于深度學(xué)習(xí)的魚類識別與檢測的算法研究[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,
39(8):57-61,66.
海洋作為地球上最大的生態(tài)系統(tǒng)包含極其豐富的生物和非生物資源。雖然我國海洋面積有300多萬平方千米,但是漁業(yè)資源作為海洋資源中重要的一項資源,近年來呈現(xiàn)逐漸衰退趨勢。對周圍海域內(nèi)海底環(huán)境進(jìn)行實時監(jiān)測,分析研究海域中代表性魚類的分布概況及生活習(xí)性,對于漁業(yè)資源可持續(xù)發(fā)展、探測未知生物資源有著重要意義。
目標(biāo)識別是計算機視覺領(lǐng)域重要的研究方向之一。隨著科學(xué)技術(shù)的進(jìn)步、計算硬件設(shè)備水平的提高,基于深度學(xué)習(xí)的目標(biāo)識別檢測方法受到了人們廣泛關(guān)注。杜衛(wèi)東等提出一種基于支持向量機(SVM)的多方位聲散射數(shù)據(jù)決策融合的魚類識別方法,識別準(zhǔn)確率達(dá)到90%以上,姚潤璐等通過分割魚體,獲得魚肚、魚背圖像,通過提取紋理特征和形狀特征,識別率達(dá)到75%,相較于傳統(tǒng)的目標(biāo)檢測算法,基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的目標(biāo)檢測算法通過學(xué)習(xí)自動提取顏色、輪廓等底層的特征和更高級、抽象的特征,然后利用分類模型進(jìn)行分類檢測,其檢測結(jié)果具有更高的精度和魯棒性。林明旺等采用VGG16模型進(jìn)行魚類分類識別,但是數(shù)據(jù)集背景干擾強度大,雖然進(jìn)行微調(diào),穩(wěn)定性仍然不好。王文成等用ResNet50網(wǎng)絡(luò)模型對十種魚類做了分類識別,準(zhǔn)確率達(dá)到了93.33%,但是數(shù)據(jù)集數(shù)量有限,識別精度不高;張俊龍等提出在預(yù)處理過程中使用權(quán)重化卷積操作,對海洋魚類識別準(zhǔn)確率提升23%,在視頻觀測中精準(zhǔn)識別魚類;梁紅等通過對圖像進(jìn)行水下降噪的方法,并且對預(yù)訓(xùn)練的網(wǎng)絡(luò)微調(diào)參數(shù),在海洋魚類數(shù)據(jù)集上識別準(zhǔn)確率達(dá)到85.08%。
基于CNN的目標(biāo)檢測算法依據(jù)是否需要提取候選區(qū)域分為:基于有候選區(qū)域的目標(biāo)檢測算法和基于無候選區(qū)域的目標(biāo)檢測算法兩種。區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(R-CNN)、快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Fast R-CNN)、超快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Faster R-CNN),都屬于代表性的基于候選區(qū)域的目標(biāo)檢測算法。該類算法從圖像中事先提取一系列可能的對象候選區(qū)域,然后從這些候選區(qū)域中提取特征并進(jìn)行判斷分類。2019年,袁紅春等人利用Faster R-CNN目標(biāo)檢測方法應(yīng)用到水下魚類種類識別中,識別準(zhǔn)率達(dá)到98.12%。該類算法的檢測準(zhǔn)確率較高,但是處理速度較慢。無候選區(qū)域的目標(biāo)檢測算法的代表性算法有單級式目標(biāo)檢測(YOLO)、單點多盒檢測器(SSD)及其改進(jìn)的算法YOLO v2和深度監(jiān)督對象檢測器(DSOD)。此類算法去除候選區(qū)域提取過程,使用神經(jīng)網(wǎng)絡(luò)直接將一整張圖片輸入神經(jīng)網(wǎng)絡(luò),然后預(yù)測出bounding box的坐標(biāo)和物體的類別、置信度,檢測物體速度較快。李慶忠等對YOLO實時目標(biāo)檢測算法進(jìn)行了改進(jìn),采用遷移學(xué)習(xí)法訓(xùn)練網(wǎng)絡(luò),預(yù)處理中圖像增強以及視頻幀數(shù)檢測速率上做了改變,該算法提升了對海底小目標(biāo)檢測的性能,但存在檢測精度低、檢測小目標(biāo)會有遺漏等問題。SSD算法同時融合了proposal-free的提取和Faster R-CNNs算法的優(yōu)點,與其他檢測算法相比,即使輸入圖像尺寸小,SSD依然有更好的精度。DSOD是一種改進(jìn)的SSD網(wǎng)絡(luò)框架算法。相比于SSD目標(biāo)檢測算法,DSOD整個網(wǎng)絡(luò)采用密集的短連接和通道拼接技術(shù),使得DSOD 的模型參數(shù)更小,同時能直接在目標(biāo)數(shù)據(jù)集上進(jìn)行訓(xùn)練,而無需在ImageNet、COCO、PASCAL VOC等公開數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練。
基于上述的分析,由于分類識別和檢測任務(wù)在統(tǒng)計分布和損失函數(shù)的差異,存在學(xué)習(xí)上的偏差,為了解決這個問題,本文利用深度監(jiān)督對象檢測器(DSOD)方法對選定魚類圖像進(jìn)行檢測分類識別研究,該模型具有高效的目標(biāo)檢測網(wǎng)絡(luò),保持了處理速度,提升了對小目標(biāo)的檢測性能。
本文詳細(xì)內(nèi)容請下載:http://m.jysgc.com/resource/share/2000003248
作者信息:
王文成1,蔣 慧1,喬 倩1,祝捍皓2,鄭 紅2
(1.浙江海洋大學(xué) 船舶與機電工程學(xué)院,浙江 舟山316022;
2.浙江海洋大學(xué) 海洋科學(xué)與技術(shù)學(xué)院,浙江 舟山316022)