《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 設計應用 > 基于改進CenterNet的發票檢測算法
基于改進CenterNet的發票檢測算法
電子技術應用
萬成凱1,李居朋2
1.北京世紀瑞爾技術股份有限公司;2.北京交通大學 電子信息工程學院
摘要: 為了提高發票檢測準確性和效率,提出了一種基于CenterNet的發票檢測算法。首先,算法模型采用類似CSPDarkNet作為主干網絡,將Triplet Attention引入CSP結構中形成TA-CSP結構,主干網絡末端引入ASPP以提高網絡的感受野范圍,使模型能夠更好地理解圖像的上下文信息;其次,在網絡的Neck部分,采用CBAM來引導高低層特征融合,利用高層特征圖中語義信息對低層特征圖進行監督,以抑制低層特征圖中的背景噪聲;再次,在網絡的Head部分,算法在CenterNet網絡的基礎上增加4個通道的特征圖輸出,在發票檢測的同時實現發票朝向的預測;最后,在損失函數中增加朝向損失項,以解決發票朝向的優化。在測試數據集上的實驗結果表明,本文算法mAP優于CenterNet和YOLOv5s算法達到84.3%,有效提高了發票檢測準確率和魯棒性。
中圖分類號:TP391.41;U418.6 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.245560
中文引用格式: 萬成凱,李居朋. 基于改進CenterNet的發票檢測算法[J]. 電子技術應用,2025,51(6):71-78.
英文引用格式: Wan Chengkai,Li Jupeng. Detection algorithm for invoice based on improved CenterNet[J]. Application of Electronic Technique,2025,51(6):71-78.
Detection algorithm for invoice based on improved CenterNet
Wan Chengkai1,Li Jupeng2
1.Beijing Century Real Technology Co., Ltd.; 2.School of Electronic and Information Engineering, Beijing Jiaotong University
Abstract: In order to improve the accuracy and efficiency of invoice detection, a CenterNet based invoice detection algorithm is proposed. Firstly, the algorithm model adopts a backbone network similar to CSPDarkNet, introducing Triplet Attention into the CSP structure to form a TA-CSP structure, and introducing ASPP at the end of the backbone network to improve the receptive field range of the network, enabling the model to better understand the contextual information of the image; Secondly, in the Neck part of the network, CBAM is used to guide the fusion of high-level and low-level features, and the semantic information in high-level feature maps is used to supervise low-level feature maps to suppress background noise in low-level feature maps; Thirdly, in the Head section of the network, the algorithm adds four channels of feature map outputs based on the CenterNet network, achieving invoice orientation prediction while detecting invoices; Finally, an orientation loss term is added to the loss function to optimize the orientation of invoices. The experimental results on the test dataset show that the mAP of the proposed algorithm in this paper is superior to CenterNet and YOLOv5s algorithms reaching 84.3%, effectively improving the accuracy and robustness of invoice detection.
Key words : CenterNet;YOLO;object detection;CBAM;ASPP;Triplet Attention

引言

隨著社會的不斷發展,大量發票的錄入和歸檔,對于財務人員是相當繁重的工作。在以往的工作中,財務人員往往采用手工錄入的方式,這種錄入方式不但效率低下,而且常常因為工作人員的疲勞產生錯誤而造成損失。隨著圖像處理與深度學習技術的興起,越來越多的研究人員開始研究基于數字圖像技術的發票自動識別算法[1-2]。

基于數字圖像技術的發票自動識別通常包括發票檢測、發票信息區定位、字符定位、字符識別等步驟。其中首要的步驟就是發票檢測。發票檢測是檢測出一張圖像中是否存在發票,并對每張存在的發票進行精確定位。由于在實際的財務歸檔工作中發票的朝向往往上下左右各不相同,因此發票檢測不但要檢測出發票的類型、位置,還要同時檢測出發票的朝向。

目前基于深度學習的目標檢測方法可以分為one-stage和two-stage方法兩類。two-stage的方法如Faster R-CNN[3]。這類檢測方法整個檢測過程分為兩個階段。在第一個階段,算法需要找到一些可能的目標存在區域;在第二個階段,算法在這可能的區域上進行分類和位置回歸。這類方法檢測精度高,但運行速度通常會比較慢,難以滿足實時檢測的需求。

one-stage的方法如YOLO系列[4-8]、SSD[9]等。這類檢測方法是一個端到端的檢測過程,它可以直接回歸出物體的類別和位置。該類方法過程簡潔、檢測速度快,目前已被廣泛應用于各種目標檢測任務當中,但其準確性仍有待提高。

YOLO系列、SSD等檢測方法均屬于基于錨點(anchor)的方法,需要事先統計anchor尺寸和比例等先驗知識,而且在計算過程中,會計算大量無用的候選框。雖然算法后期可以通過非極大值抑制等方法去除多余的候選框,但會帶來計算開銷的增加。以CenterNet[10]為代表的無anchor檢測方法克服了基于anchor方法的缺點,可以直接對目標中心點和尺寸進行預測。

本文結合YOLOv5的主干網絡和CenterNet各自的優點,提出了一種改進的CenterNet發票檢測算法。算法模型采用參考了CSPDarkNet的主干網絡,引入了注意力機制,并且采用新的輸出結構和損失函數,可以端到端地檢測出發票的分類、位置和朝向。


本文詳細內容請下載:

http://m.jysgc.com/resource/share/2000006565


作者信息:

萬成凱1,李居朋2

(1.北京世紀瑞爾技術股份有限公司 北京 100085;

2.北京交通大學 電子信息工程學院,北京 100044)


Magazine.Subscription.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 日韩免费视频播播| 母子俩肥水不流外人田| 国产区香蕉精品系列在线观看不卡| 91福利精品老师国产自产在线| 女仆的胸好大揉出奶水| 中文字幕在线免费| 日本精品一卡二卡≡卡四卡| 亚洲av成人无码久久精品老人| 欧美欧洲性色老头老妇| 人人澡人人透人人爽| 精品人妻一区二区三区四区| 四虎永久免费地址ww1515| 隔壁老王国产在线精品| 国产成人久久精品| 日本三级做a全过程在线观看| 国产精品美女一区二区| 97精品国产97久久久久久免费| 天天做天天做天天综合网| 一二三四在线观看免费高清视频| 成全动漫视频在线观看免费播放 | 无码国产精品一区二区免费模式| 久久精品亚洲综合专区| 曰本一区二区三区| 亚洲av无码欧洲av无码网站| 欧美三级日韩三级| 亚洲女初尝黑人巨高清| 欧美日韩国产高清视频| 厨房切底征服岳| 美女视频黄A视频全免费| 国产一级毛片网站| 蕾丝视频在线看片国产| 国产亚洲日韩欧美一区二区三区 | 人妻精品久久久久中文字幕一冢本| 精品国产人成亚洲区| 厨房掀起馊子裙子挺进去视频| 色偷偷狠狠色综合网| 国产丝袜制服在线| 蜜桃一区二区三区| 国产一区二区三区露脸| 色噜噜狠狠狠狠色综合久一| 国产一区二区三区视频在线观看|