《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于多特征的打印文件層級分類研究
基于多特征的打印文件層級分類研究
2016年電子技術應用第3期
周晶晶,陳慶虎,彭文花,鄢煜塵
武漢大學 電子信息學院,湖北 武漢430072
摘要: 打印文件鑒別是一種廣泛應用于安全領域的取證技術,因此對其檢測的準確率和速度均有較高要求??紤]到單個特征的信息不全,基于多特征融合的方法來提高準確率,同時使用基于AdaBoost的SVM級聯分類器進行分類判定。研究過程包括數據采集、圖像預處理、GMM和LBP特征提取、特征融合、單個SVM分類器分類以及基于AdaBoost的層級SVM分類器分類。通過對4 000張圖片集提取GMM和LBP特征,然后進行特征融合,輸入分類器分類,結果表明,該方法能夠在一定程度上提高鑒別的準確率和速度,具有良好的可擴展性。
中圖分類號: TP391.4
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2016.03.032
中文引用格式: 周晶晶,陳慶虎,彭文花,等. 基于多特征的打印文件層級分類研究[J].電子技術應用,2016,42(3):113-115,119.
英文引用格式: Zhou Jingjing,Chen Qinghu,Peng Wenhua,et al. Printed document identification with cascade classifier based on multi-feature[J].Application of Electronic Technique,2016,42(3):113-115,119.
Printed document identification with cascade classifier based on multi-feature
Zhou Jingjing,Chen Qinghu,Peng Wenhua,Yan Yuchen
School of Electronic Information,Wuhan University,Wuhan 430072,China
Abstract: Printed document identification is a kind of technology which is widely used in the security field. So it needs higher accuracy and speed. Considering the information of a single feature is not complete, this paper improves the accuracy based on multi-feature. The research process includes data acquisition, image preprocessing, GMM and LBP feature extraction, feature fusion, SVM classifier and cascade detector. Through extracting the GMM and LBP features from 4 000 image sets, the feature fusion is performed, and the results show that the proposed method can improve the accuracy and speed of the identification in a certain extent.
Key words : gaussian mixture model;local binary pattern;feature fusion;cascade classifier;print document identification

0 引言

    隨著信息時代的發展,各類圖像處理軟件及高質量激光打印機應運而生,與此同時激光打印機的成本越來越低,這導致其越來越普遍。激光打印機的使用數量增長,犯罪分子制造偽證的技術更加高明,所以取證技術變得非常重要。打印文件的鑒別是一種廣泛應用于安全領域的取證技術,可以通過對打印文件的分析判別打印設備的特性,當發現打印設備偽造假文件時,即可幫助抓獲犯罪分子。

    自打印機應用以來,打印文件鑒別相關的研究有很多,針對傳統的噴墨打印機多通過分析打印文件中的墨粉、墨水等打印材料,查找打印機在打印文件中留下的痕跡,有基于墨粉紋理進行的研究[1]。隨著激光打印機的普遍,越來越多的研究從打印機文件中提取打印特性的各種特征,Delp等人[2]提出了利用不同激光打印機的不同條帶頻率進行識別的方案,然而這種方法并不適用于文本文檔。由于條帶頻率方案不能用于文本文檔,Deng等人[3]提出了一種激光打印機識別文本文檔的方法,他們通過字符匹配來進行識別。Mikkilineni 等人[4]利用灰度共生矩陣特征(GLCM)方法, 通過提取特定字體的打印字符“e”的紋理特征來鑒別打印文件的源打印機。Choi等人[5]提出基于小波變換的打印機識別方案。

    本文算法思想是基于多特征融合和層級分類器來提高準確率,通過源于10臺打印機的4 000張圖片來進行驗證,證明該方法能在一定程度上提高檢測準確率和速度。

1 圖像特征提取

1.1 高斯混合模型

    高斯混合模型(GMM)是一種利用多個單高斯函數建模的方式,其概率密度函數是由多個高斯概率密度函數加權求和得到的,如下所示:

w3-gs1.gif

    對于打印字符,字符、字符邊緣以及背景三部分具有顯著的差異,這是典型的聚類問題。圖1(a)所示為原始圖像,圖1(b)所示為三階高斯混合模型建模后的圖像,圖中灰度值為零(黑色)的部分表示字符本身,灰度值為255(白色)的部分表示字符邊緣,灰度值為128(灰色)的部分表示紙張背景,可以看出三階高斯混合模型描述出了字符圖像的三部分信息。

w3-t1.gif

1.2 LBP算子

    局部二值模式(LBP)是由OJALA T[6]等人提出的一種簡單但非常有效的描述圖像局部紋理特征的算子,原始的LBP特征提取是通過在3×3的矩形框內,以矩形框中心點gc的灰度值作為閾值,與周圍領域內像素點(g0,g1…gp-1)的灰度值進行比較,得到的二進制碼來表征圖像的紋理特征。gc的LBP特征值LBP(P,R)定義為:

    w3-gs2.gif

    本文采用圓域均勻模式的LBP算子,對于測試圖像集X={x1,x2…xN},通過將字符圖像劃分為若干個區域,計算該區域內所有像素點的LBP特征值,再統計該區域的LBP特征直方圖,最后將LBP特征譜的統計直方圖作為紋理分類的依據,最終的LBP圖譜直方圖如圖2所示。

w3-t2.gif

2 多分類器級聯算法

    多分類器級聯訓練算法如圖3所示,SVM作為基分類器,每一級訓練結果作為一個分類器模版,使用boosting[7]策略集成融合,具體訓練步驟如下:

w3-t3.gif

    (1)輸入樣本集X={x1,x2…xN},對應的Y={y1,y2…yM}為類別矩陣。

    (2)初始化樣本權重。

    (3)設置級聯層級T,對于t=1,2…T,根據樣本權重選擇訓練樣本,訓練每一級分類器Ht,新一層分類器會側重上一輪分錯的樣本,也就是難以區分的樣本,下文稱之為hard樣本。同時每一輪訓練會加入部分新樣本,提高級聯分類器的穩定性和適應性。

    (4)測試所有訓練樣本,計算每一輪的錯誤率et。

    (5)當滿足錯誤率小于0.5時,計算分類器權重w3-gs3-s1.gif

    (6)更新權重,分類錯誤的樣本權重增加,分類正確的樣本權重減少,計算公式為 :

    w3-gs3.gif

3 實驗與分析

    為了測試本文的方法,建立了包含10臺激光打印機的打印文件數據庫,該數據庫共有4 000張完整圖像集,分別使用單一SVM分類器與級聯分類器作對比性研究,選取原始數據的3/4作為訓練集,剩下的作為測試集。由于訓練樣本是隨機挑選的,實際試驗中在相等訓練集大小的情況下做了10次測試,并取測試的平均值作為識別率。具體實現步驟如下:

    (1)特征提取。本文采用三階高斯混合模型,每一個高斯模型有均值、均方差、權重3個參數,最終特征集為9維。LBP特征提取采用圓域均勻模式LBP算子,圓域半徑r=2.5,取樣點p=12,LBP紋理特征向量以圖像的分塊LBP直方圖表示,其中N=14。

    (2)特征融合。實驗中采用的是加權融合的辦法,具體思路是:

    ①歸一化:為了消除量綱影響,對數據集進行歸一化操作,統一數據的標準,歸一化操作之后,GMM和LBP特征集就會被統一到一個特定的區間中。

    ②加權:通過循環判定,找出最優權重,權重計算公式如下:

    w3-gs4-6.gif

其中,wGMM表示GMM特征集的權重,wLBP表示LBP特征集的權重,w0x(x=0,1)表示權重,初始值為w00=0,w01=1,步長step=0.01,k的取值為0,1,2…,50。最終取得的最優權重為wGMM=0.54 ,wLBP=0.46。

    ③融合:GMM特征集的大小為4 000×9,LBP特征集大小為4 000×14,本文將GMM 的9維特征和LBP的14維特征融合成23維特征,圖像特征數量和種類的增加會更好地改善分類結果。特征融合模型圖4所示。

w3-t4.gif

    通過上述加權融合算法將GMM特征和LBP特征融合在同一特征空間中,分別對GMM和LBP單一特征集及融合特征集做分類研究,表1所示為SVM分類器的鑒別結果,GMM特征集和LBP特征集鑒別的準確率分別為85.5%和84.7%。因為打印機自身的差異性以及打印設備使用過程中的不穩定性,導致鑒別結果有一定的誤差,例如打印過程中可能出現的噴墨漏墨以及斷筆等情況,會一定程度上影響鑒別結果。融合特征集鑒別的準確率為94.45%,說明高斯混合模型和局部二值模式相結合的算法可以提高打印文件識別率。

w3-b1.gif

    表2所示為GMM特征集、LBP特征集和融合特征集輸入級聯分類器的結果。對比表1的數據,級聯分類器一定程度上提高了分類的準確度,融合特征集的識別率高達97.10%,驗證了本文算法的可行性。圖5所示的混淆矩陣描述了每一類打印樣本的識別效果。分類器級聯層數會影響分類的速度,圖6為訓練10輪得到的層級分類器錯誤率,三層級聯即可取得較好的處理效果,級聯五層之后分類的準確率變化不大,基本趨于平穩,本文選取的是五層SVM分類器級聯。

w3-b2.gif

w3-t5.gif

w3-t6.gif

4 結語

    眾所周知,紋理分析有許多潛在的應用,比如金屬表面、遙感圖片等,紋理分析應用于打印文件鑒別中常用的是灰度共生矩陣,但是灰度共生矩陣的計算量太大,本文采用GMM和LBP特征集相結合的方法,特征集維度為23維,大大降低了計算量。同時,由于單一特征集包含的圖片信息不全,鑒別準確率不高,采用多特征會大大提高鑒別的準確率與速度。

    GMM特征多用于語音識別,LBP特征常見的應用場景是人臉識別,本文將這兩種特征應用于打印文件鑒別,是一個重大突破。同時訓練了基于AdaBoost的SVM級聯分類器,提高了分類的準確度,使得打印文件鑒別工作的研究在安全領域的應用更加可靠。

參考文獻

[1] 鄧偉.基于打印墨粉紋理分析的打印文件檢驗研究[J].電子測量技術,2014,37(2):70-74.

[2] MIKKILINENI A K,KHANNA N,DELP E J.Texture based attacks on intrinsic signature based printer identification[C].IS&T/SPIE Electronic Imaging. International Society for Optics and Photonics,2010:175-178.

[3] DENG W,CHEN Q,YUAN F,et al.Printer identification based on distance transform[C].First International Conference on Intelligent Networks and Intelligent Systems.IEEE Computer Society,2008:565-568.

[4] MIKKILINENI A K,CHIANG P J,ALI G N,et al.Printer identification based on graylevel co-occurrence features for security and forensic applications[C].Proceedings of SPIE-The International Society for Optical Engineering,2005,5681:430-440.

[5] CHOI J H,IM D H,LEE H Y,et al.Color laser printer identification by analyzing statistical features on discrete wavelet transform[C].Image Processing(ICIP),2009 16th IEEE International Conference on.IEEE,2009:1505-1508.

[6] OJALA T,PIETIKAINEN M,HARWOOD D.Performance evaluation of texture measures with classification based on Kullback discrimination of distributions[C].Pattern Recognition,1994.Vol.1-Conference A:Computer Vision & Image Processing.,Proceedings of the 12th IAPR International Conference on.IEEE,1994,1:582-585.

[7] VIOLA P,JONES M.Fast and robust classification using asymmetric AdaBoost and a detector cascade[C].Advances in Neural Information Processing Systems,2002,14:1311-1318.

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲午夜视频在线| 女人色偷偷aa久久天堂| 久久精品国产一区二区电影| 一区二区三区四区在线| 亚洲精品美女在线观看播放| 亚洲国产精品电影在线观看| 在线观看91久久久久久| 一区三区视频| 伊人狠狠色丁香综合尤物| 国产一区二区三区日韩| 国产日韩欧美麻豆| 国产欧美一级| 国产日韩欧美在线视频观看| 国产精品综合| 国产日韩欧美日韩大片| 国产欧美日韩综合一区在线观看| 国产精品久久久久久久久久久久 | 国产一区二区电影在线观看| 国产欧美日韩不卡| 国产精品在线看| 国产视频欧美| 激情久久影院| 亚洲国产影院| 亚洲六月丁香色婷婷综合久久| 亚洲乱码日产精品bd| 在线视频你懂得一区| 亚洲在线观看视频| 欧美专区亚洲专区| 亚洲国产成人精品女人久久久| 亚洲国产91精品在线观看| 亚洲欧洲综合另类| 在线亚洲精品| 国产一区视频网站| 精品999日本| 在线成人免费视频| 亚洲激情第一区| 日韩网站在线| 亚洲欧美一区二区精品久久久| 欧美中在线观看| 日韩午夜电影在线观看| 亚洲网站在线播放| 久久精品视频在线播放| 美国成人直播| 欧美日韩亚洲91| 国产日韩欧美亚洲一区| 亚洲电影有码| 亚洲视频免费在线观看| 欧美一进一出视频| 亚洲美女av黄| 欧美在线免费一级片| 鲁大师影院一区二区三区| 欧美日韩国产亚洲一区 | 欧美午夜精品理论片a级按摩 | 亚洲激情视频网| 亚洲一级在线观看| 久久久久久久久一区二区| 欧美精品一区二区三区在线播放| 国产精品久久亚洲7777| 精品成人国产| 日韩一区二区精品视频| 欧美中文字幕久久| 正在播放亚洲一区| 久久久久女教师免费一区| 欧美伦理影院| 国产亚洲制服色| aaa亚洲精品一二三区| 久久精品亚洲一区二区| 亚洲一级电影| 免费成人毛片| 国产日韩一区| 99国产精品久久久久久久久久| 欧美中文在线观看国产| 一区二区三区四区五区精品| 久久九九国产精品| 国产精品初高中精品久久| 黄色欧美日韩| 亚洲欧美www| 一片黄亚洲嫩模| 免费成人高清| 国产亚洲精品资源在线26u| 一区二区冒白浆视频| 久久国产综合精品| 亚洲欧美亚洲| 欧美日韩激情网| 伊人成人在线视频| 亚洲高清精品中出| 亚洲人体影院| 亚洲日本免费| 久久香蕉国产线看观看网| 欧美色欧美亚洲另类二区| 精品动漫3d一区二区三区免费版 | 亚洲高清资源综合久久精品| 亚洲欧美日韩在线一区| 欧美精品videossex性护士| 国产一区二区三区高清| 亚洲午夜伦理| 制服诱惑一区二区| 欧美国产91| 一区二区三区在线视频观看| 亚洲欧美在线免费| 午夜电影亚洲| 国产精品高潮久久| 99精品欧美| 一本色道久久综合| 欧美激情一区二区| 亚洲国产精品电影在线观看| 亚洲高清视频在线观看| 久久精品日产第一区二区三区| 国产精品乱人伦中文| 99精品视频免费观看| 一区二区三区欧美日韩| 欧美福利视频一区| 在线免费日韩片| 久久国产精品久久久| 亚洲免费在线视频| 欧美日韩精品一区二区| 韩日精品视频一区| 欧美亚洲一级片| 久久av资源网站| 国产日韩亚洲欧美精品| 亚洲欧美日韩在线综合| 午夜日韩av| 国产日产亚洲精品系列| 午夜精品久久久久久久久久久久| 性8sex亚洲区入口| 国产精品网站在线播放| 亚洲欧美国产77777| 久久9热精品视频| 国际精品欧美精品| 亚洲激精日韩激精欧美精品| 美日韩精品免费| 亚洲国产高潮在线观看| 日韩视频精品| 欧美日韩国产麻豆| 宅男精品视频| 欧美一区二区三区四区在线观看| 国产精品私拍pans大尺度在线| 亚洲男人第一网站| 久久久99精品免费观看不卡| 一区二区三区中文在线观看| 亚洲欧洲精品一区二区三区| 欧美激情在线观看| 午夜激情久久久| 亚洲高清在线精品| 欧美激情一区| 一级成人国产| 欧美一区二区女人| 激情久久久久| 99视频精品全国免费| 欧美视频不卡| 亚洲欧美中文日韩v在线观看| 久久久久国产一区二区三区| 激情小说亚洲一区| 亚洲乱码国产乱码精品精可以看| 欧美日韩精品欧美日韩精品| 亚洲四色影视在线观看| 久久精品夜色噜噜亚洲a∨ | 免费h精品视频在线播放| 91久久久国产精品| 亚洲综合日韩中文字幕v在线| 国产亚洲免费的视频看| 亚洲欧洲日产国产网站| 欧美午夜欧美| 久久精品国产第一区二区三区最新章节| 麻豆国产精品一区二区三区| 亚洲精品中文字幕在线| 欧美在线视频在线播放完整版免费观看| 激情成人av在线| 亚洲夜间福利| 精品盗摄一区二区三区| 亚洲小视频在线观看| 黄色一区二区在线| 亚洲色无码播放| 国产亚洲一区二区三区| 一区二区av| 黄色成人在线| 亚洲欧美中文在线视频| 亚洲国产经典视频| 欧美在线免费视频| 亚洲精品一区二区在线观看| 欧美伊久线香蕉线新在线| 亚洲精品国产欧美| 久久精品一级爱片| 一本大道久久a久久精二百| 久久精品国产清高在天天线| 日韩午夜一区| 久久久久久久综合日本| 9i看片成人免费高清| 美女网站久久| 性欧美暴力猛交另类hd| 欧美日韩国产综合在线| 久久精品国产亚洲一区二区三区| 欧美日韩在线视频首页| 亚洲福利视频专区| 国产精品亚洲综合色区韩国| 一二三区精品| 亚洲电影免费| 亚洲女女女同性video| 伊人成人网在线看| 亚洲一区二区三区在线播放|