《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 基于多特征的打印文件層級(jí)分類研究
基于多特征的打印文件層級(jí)分類研究
2016年電子技術(shù)應(yīng)用第3期
周晶晶,陳慶虎,彭文花,鄢煜塵
武漢大學(xué) 電子信息學(xué)院,湖北 武漢430072
摘要: 打印文件鑒別是一種廣泛應(yīng)用于安全領(lǐng)域的取證技術(shù),因此對(duì)其檢測(cè)的準(zhǔn)確率和速度均有較高要求。考慮到單個(gè)特征的信息不全,基于多特征融合的方法來提高準(zhǔn)確率,同時(shí)使用基于AdaBoost的SVM級(jí)聯(lián)分類器進(jìn)行分類判定。研究過程包括數(shù)據(jù)采集、圖像預(yù)處理、GMM和LBP特征提取、特征融合、單個(gè)SVM分類器分類以及基于AdaBoost的層級(jí)SVM分類器分類。通過對(duì)4 000張圖片集提取GMM和LBP特征,然后進(jìn)行特征融合,輸入分類器分類,結(jié)果表明,該方法能夠在一定程度上提高鑒別的準(zhǔn)確率和速度,具有良好的可擴(kuò)展性。
中圖分類號(hào): TP391.4
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.2016.03.032
中文引用格式: 周晶晶,陳慶虎,彭文花,等. 基于多特征的打印文件層級(jí)分類研究[J].電子技術(shù)應(yīng)用,2016,42(3):113-115,119.
英文引用格式: Zhou Jingjing,Chen Qinghu,Peng Wenhua,et al. Printed document identification with cascade classifier based on multi-feature[J].Application of Electronic Technique,2016,42(3):113-115,119.
Printed document identification with cascade classifier based on multi-feature
Zhou Jingjing,Chen Qinghu,Peng Wenhua,Yan Yuchen
School of Electronic Information,Wuhan University,Wuhan 430072,China
Abstract: Printed document identification is a kind of technology which is widely used in the security field. So it needs higher accuracy and speed. Considering the information of a single feature is not complete, this paper improves the accuracy based on multi-feature. The research process includes data acquisition, image preprocessing, GMM and LBP feature extraction, feature fusion, SVM classifier and cascade detector. Through extracting the GMM and LBP features from 4 000 image sets, the feature fusion is performed, and the results show that the proposed method can improve the accuracy and speed of the identification in a certain extent.
Key words : gaussian mixture model;local binary pattern;feature fusion;cascade classifier;print document identification

0 引言

    隨著信息時(shí)代的發(fā)展,各類圖像處理軟件及高質(zhì)量激光打印機(jī)應(yīng)運(yùn)而生,與此同時(shí)激光打印機(jī)的成本越來越低,這導(dǎo)致其越來越普遍。激光打印機(jī)的使用數(shù)量增長(zhǎng),犯罪分子制造偽證的技術(shù)更加高明,所以取證技術(shù)變得非常重要。打印文件的鑒別是一種廣泛應(yīng)用于安全領(lǐng)域的取證技術(shù),可以通過對(duì)打印文件的分析判別打印設(shè)備的特性,當(dāng)發(fā)現(xiàn)打印設(shè)備偽造假文件時(shí),即可幫助抓獲犯罪分子。

    自打印機(jī)應(yīng)用以來,打印文件鑒別相關(guān)的研究有很多,針對(duì)傳統(tǒng)的噴墨打印機(jī)多通過分析打印文件中的墨粉、墨水等打印材料,查找打印機(jī)在打印文件中留下的痕跡,有基于墨粉紋理進(jìn)行的研究[1]。隨著激光打印機(jī)的普遍,越來越多的研究從打印機(jī)文件中提取打印特性的各種特征,Delp等人[2]提出了利用不同激光打印機(jī)的不同條帶頻率進(jìn)行識(shí)別的方案,然而這種方法并不適用于文本文檔。由于條帶頻率方案不能用于文本文檔,Deng等人[3]提出了一種激光打印機(jī)識(shí)別文本文檔的方法,他們通過字符匹配來進(jìn)行識(shí)別。Mikkilineni 等人[4]利用灰度共生矩陣特征(GLCM)方法, 通過提取特定字體的打印字符“e”的紋理特征來鑒別打印文件的源打印機(jī)。Choi等人[5]提出基于小波變換的打印機(jī)識(shí)別方案。

    本文算法思想是基于多特征融合和層級(jí)分類器來提高準(zhǔn)確率,通過源于10臺(tái)打印機(jī)的4 000張圖片來進(jìn)行驗(yàn)證,證明該方法能在一定程度上提高檢測(cè)準(zhǔn)確率和速度。

1 圖像特征提取

1.1 高斯混合模型

    高斯混合模型(GMM)是一種利用多個(gè)單高斯函數(shù)建模的方式,其概率密度函數(shù)是由多個(gè)高斯概率密度函數(shù)加權(quán)求和得到的,如下所示:

w3-gs1.gif

    對(duì)于打印字符,字符、字符邊緣以及背景三部分具有顯著的差異,這是典型的聚類問題。圖1(a)所示為原始圖像,圖1(b)所示為三階高斯混合模型建模后的圖像,圖中灰度值為零(黑色)的部分表示字符本身,灰度值為255(白色)的部分表示字符邊緣,灰度值為128(灰色)的部分表示紙張背景,可以看出三階高斯混合模型描述出了字符圖像的三部分信息。

w3-t1.gif

1.2 LBP算子

    局部二值模式(LBP)是由OJALA T[6]等人提出的一種簡(jiǎn)單但非常有效的描述圖像局部紋理特征的算子,原始的LBP特征提取是通過在3×3的矩形框內(nèi),以矩形框中心點(diǎn)gc的灰度值作為閾值,與周圍領(lǐng)域內(nèi)像素點(diǎn)(g0,g1…gp-1)的灰度值進(jìn)行比較,得到的二進(jìn)制碼來表征圖像的紋理特征。gc的LBP特征值LBP(P,R)定義為:

    w3-gs2.gif

    本文采用圓域均勻模式的LBP算子,對(duì)于測(cè)試圖像集X={x1,x2…xN},通過將字符圖像劃分為若干個(gè)區(qū)域,計(jì)算該區(qū)域內(nèi)所有像素點(diǎn)的LBP特征值,再統(tǒng)計(jì)該區(qū)域的LBP特征直方圖,最后將LBP特征譜的統(tǒng)計(jì)直方圖作為紋理分類的依據(jù),最終的LBP圖譜直方圖如圖2所示。

w3-t2.gif

2 多分類器級(jí)聯(lián)算法

    多分類器級(jí)聯(lián)訓(xùn)練算法如圖3所示,SVM作為基分類器,每一級(jí)訓(xùn)練結(jié)果作為一個(gè)分類器模版,使用boosting[7]策略集成融合,具體訓(xùn)練步驟如下:

w3-t3.gif

    (1)輸入樣本集X={x1,x2…xN},對(duì)應(yīng)的Y={y1,y2…yM}為類別矩陣。

    (2)初始化樣本權(quán)重。

    (3)設(shè)置級(jí)聯(lián)層級(jí)T,對(duì)于t=1,2…T,根據(jù)樣本權(quán)重選擇訓(xùn)練樣本,訓(xùn)練每一級(jí)分類器Ht,新一層分類器會(huì)側(cè)重上一輪分錯(cuò)的樣本,也就是難以區(qū)分的樣本,下文稱之為hard樣本。同時(shí)每一輪訓(xùn)練會(huì)加入部分新樣本,提高級(jí)聯(lián)分類器的穩(wěn)定性和適應(yīng)性。

    (4)測(cè)試所有訓(xùn)練樣本,計(jì)算每一輪的錯(cuò)誤率et。

    (5)當(dāng)滿足錯(cuò)誤率小于0.5時(shí),計(jì)算分類器權(quán)重w3-gs3-s1.gif

    (6)更新權(quán)重,分類錯(cuò)誤的樣本權(quán)重增加,分類正確的樣本權(quán)重減少,計(jì)算公式為 :

    w3-gs3.gif

3 實(shí)驗(yàn)與分析

    為了測(cè)試本文的方法,建立了包含10臺(tái)激光打印機(jī)的打印文件數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)共有4 000張完整圖像集,分別使用單一SVM分類器與級(jí)聯(lián)分類器作對(duì)比性研究,選取原始數(shù)據(jù)的3/4作為訓(xùn)練集,剩下的作為測(cè)試集。由于訓(xùn)練樣本是隨機(jī)挑選的,實(shí)際試驗(yàn)中在相等訓(xùn)練集大小的情況下做了10次測(cè)試,并取測(cè)試的平均值作為識(shí)別率。具體實(shí)現(xiàn)步驟如下:

    (1)特征提取。本文采用三階高斯混合模型,每一個(gè)高斯模型有均值、均方差、權(quán)重3個(gè)參數(shù),最終特征集為9維。LBP特征提取采用圓域均勻模式LBP算子,圓域半徑r=2.5,取樣點(diǎn)p=12,LBP紋理特征向量以圖像的分塊LBP直方圖表示,其中N=14。

    (2)特征融合。實(shí)驗(yàn)中采用的是加權(quán)融合的辦法,具體思路是:

    ①歸一化:為了消除量綱影響,對(duì)數(shù)據(jù)集進(jìn)行歸一化操作,統(tǒng)一數(shù)據(jù)的標(biāo)準(zhǔn),歸一化操作之后,GMM和LBP特征集就會(huì)被統(tǒng)一到一個(gè)特定的區(qū)間中。

    ②加權(quán):通過循環(huán)判定,找出最優(yōu)權(quán)重,權(quán)重計(jì)算公式如下:

    w3-gs4-6.gif

其中,wGMM表示GMM特征集的權(quán)重,wLBP表示LBP特征集的權(quán)重,w0x(x=0,1)表示權(quán)重,初始值為w00=0,w01=1,步長(zhǎng)step=0.01,k的取值為0,1,2…,50。最終取得的最優(yōu)權(quán)重為wGMM=0.54 ,wLBP=0.46。

    ③融合:GMM特征集的大小為4 000×9,LBP特征集大小為4 000×14,本文將GMM 的9維特征和LBP的14維特征融合成23維特征,圖像特征數(shù)量和種類的增加會(huì)更好地改善分類結(jié)果。特征融合模型圖4所示。

w3-t4.gif

    通過上述加權(quán)融合算法將GMM特征和LBP特征融合在同一特征空間中,分別對(duì)GMM和LBP單一特征集及融合特征集做分類研究,表1所示為SVM分類器的鑒別結(jié)果,GMM特征集和LBP特征集鑒別的準(zhǔn)確率分別為85.5%和84.7%。因?yàn)榇蛴C(jī)自身的差異性以及打印設(shè)備使用過程中的不穩(wěn)定性,導(dǎo)致鑒別結(jié)果有一定的誤差,例如打印過程中可能出現(xiàn)的噴墨漏墨以及斷筆等情況,會(huì)一定程度上影響鑒別結(jié)果。融合特征集鑒別的準(zhǔn)確率為94.45%,說明高斯混合模型和局部二值模式相結(jié)合的算法可以提高打印文件識(shí)別率。

w3-b1.gif

    表2所示為GMM特征集、LBP特征集和融合特征集輸入級(jí)聯(lián)分類器的結(jié)果。對(duì)比表1的數(shù)據(jù),級(jí)聯(lián)分類器一定程度上提高了分類的準(zhǔn)確度,融合特征集的識(shí)別率高達(dá)97.10%,驗(yàn)證了本文算法的可行性。圖5所示的混淆矩陣描述了每一類打印樣本的識(shí)別效果。分類器級(jí)聯(lián)層數(shù)會(huì)影響分類的速度,圖6為訓(xùn)練10輪得到的層級(jí)分類器錯(cuò)誤率,三層級(jí)聯(lián)即可取得較好的處理效果,級(jí)聯(lián)五層之后分類的準(zhǔn)確率變化不大,基本趨于平穩(wěn),本文選取的是五層SVM分類器級(jí)聯(lián)。

w3-b2.gif

w3-t5.gif

w3-t6.gif

4 結(jié)語(yǔ)

    眾所周知,紋理分析有許多潛在的應(yīng)用,比如金屬表面、遙感圖片等,紋理分析應(yīng)用于打印文件鑒別中常用的是灰度共生矩陣,但是灰度共生矩陣的計(jì)算量太大,本文采用GMM和LBP特征集相結(jié)合的方法,特征集維度為23維,大大降低了計(jì)算量。同時(shí),由于單一特征集包含的圖片信息不全,鑒別準(zhǔn)確率不高,采用多特征會(huì)大大提高鑒別的準(zhǔn)確率與速度。

    GMM特征多用于語(yǔ)音識(shí)別,LBP特征常見的應(yīng)用場(chǎng)景是人臉識(shí)別,本文將這兩種特征應(yīng)用于打印文件鑒別,是一個(gè)重大突破。同時(shí)訓(xùn)練了基于AdaBoost的SVM級(jí)聯(lián)分類器,提高了分類的準(zhǔn)確度,使得打印文件鑒別工作的研究在安全領(lǐng)域的應(yīng)用更加可靠。

參考文獻(xiàn)

[1] 鄧偉.基于打印墨粉紋理分析的打印文件檢驗(yàn)研究[J].電子測(cè)量技術(shù),2014,37(2):70-74.

[2] MIKKILINENI A K,KHANNA N,DELP E J.Texture based attacks on intrinsic signature based printer identification[C].IS&T/SPIE Electronic Imaging. International Society for Optics and Photonics,2010:175-178.

[3] DENG W,CHEN Q,YUAN F,et al.Printer identification based on distance transform[C].First International Conference on Intelligent Networks and Intelligent Systems.IEEE Computer Society,2008:565-568.

[4] MIKKILINENI A K,CHIANG P J,ALI G N,et al.Printer identification based on graylevel co-occurrence features for security and forensic applications[C].Proceedings of SPIE-The International Society for Optical Engineering,2005,5681:430-440.

[5] CHOI J H,IM D H,LEE H Y,et al.Color laser printer identification by analyzing statistical features on discrete wavelet transform[C].Image Processing(ICIP),2009 16th IEEE International Conference on.IEEE,2009:1505-1508.

[6] OJALA T,PIETIKAINEN M,HARWOOD D.Performance evaluation of texture measures with classification based on Kullback discrimination of distributions[C].Pattern Recognition,1994.Vol.1-Conference A:Computer Vision & Image Processing.,Proceedings of the 12th IAPR International Conference on.IEEE,1994,1:582-585.

[7] VIOLA P,JONES M.Fast and robust classification using asymmetric AdaBoost and a detector cascade[C].Advances in Neural Information Processing Systems,2002,14:1311-1318.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
中文av一区二区| 米奇777超碰欧美日韩亚洲| 欧美制服第一页| 亚洲一区二区三区在线视频| 亚洲靠逼com| 亚洲欧洲另类| 亚洲电影有码| 亚洲国产精品久久人人爱蜜臀| 国产曰批免费观看久久久| 国产日韩欧美一二三区| 国产日韩精品综合网站| 国产欧美日韩综合精品二区| 国产精品一区二区在线| 国产精品网曝门| 国产精品区二区三区日本| 国产精品久久久久久久久久ktv| 欧美日韩亚洲在线| 国产精品啊啊啊| 国产精品久久久99| 国产精品视频在线观看| 国产乱码精品一区二区三区忘忧草 | 亚洲天堂av图片| 亚洲天堂久久| 亚洲欧美日韩精品综合在线观看 | 亚洲欧美日韩直播| 欧美影院成年免费版| 久久精品国产一区二区三| 亚洲第一精品电影| 亚洲人成在线观看| 一区二区免费看| 亚洲欧美国产三级| 欧美亚洲视频一区二区| 久久经典综合| 美日韩免费视频| 欧美精品一区二区三区在线看午夜 | 国产视频亚洲精品| 好看的日韩视频| 亚洲第一二三四五区| 日韩视频在线观看一区二区| 亚洲一区999| 亚洲盗摄视频| av成人免费| 午夜欧美不卡精品aaaaa| 久久久久久久久综合| 欧美成人精品一区二区| 欧美视频三区在线播放| 国产欧美日韩不卡| 伊人色综合久久天天| 亚洲精品少妇| 亚洲欧美不卡| 亚洲欧洲精品一区二区三区不卡 | 国外成人性视频| 亚洲激情在线| 亚洲视频播放| 欧美在线免费| 99热在这里有精品免费| 午夜精品在线观看| 猛干欧美女孩| 国产精品入口福利| 亚洲国产小视频在线观看| 中日韩在线视频| 久久精品一本| 亚洲伊人色欲综合网| 久久夜色精品一区| 欧美亚一区二区| 在线观看三级视频欧美| 亚洲无线一线二线三线区别av| 亚洲丰满在线| 亚洲欧美在线高清| 欧美成人精品一区二区三区| 国产精品自在欧美一区| 亚洲国产色一区| 欧美一区二区三区另类| 亚洲天堂久久| 猫咪成人在线观看| 国产精品热久久久久夜色精品三区 | 国产精品每日更新| 亚洲欧洲一区| 欧美在线一级视频| 亚洲欧美高清| 欧美精品一卡二卡| 国内综合精品午夜久久资源| 亚洲视频精品在线| 99re这里只有精品6| 久久久www成人免费毛片麻豆| 欧美日韩综合网| 精品成人在线观看| 亚洲欧美国内爽妇网| 一区二区三区www| 美女脱光内衣内裤视频久久网站| 国产精品日韩二区| 99re6这里只有精品视频在线观看| 久久精品国产精品亚洲综合| 午夜在线精品偷拍| 欧美三区免费完整视频在线观看| 在线日韩av片| 欧美一区深夜视频| 午夜视频一区| 国产精品wwwwww| 亚洲精品在线视频观看| 亚洲精品黄网在线观看| 久久理论片午夜琪琪电影网| 国产精品系列在线播放| 在线一区二区三区做爰视频网站| 亚洲精品乱码久久久久久久久| 久久精品一区二区国产| 国产日韩欧美三级| 亚洲欧美国产视频| 性色av一区二区三区| 国产精品久久久久av| 亚洲美女视频在线观看| 亚洲精品在线三区| 欧美大片免费| 亚洲国产三级在线| 亚洲精品视频在线| 欧美国产日韩视频| 亚洲高清123| 91久久夜色精品国产九色| 久久青青草综合| 狠狠干成人综合网| 欧美在线日韩在线| 久久久www成人免费无遮挡大片 | 欧美一区二区三区男人的天堂| 国产精品二区在线观看| 在线亚洲自拍| 午夜精品久久久久久久白皮肤| 国产精品久久久久久妇女6080 | 亚洲欧美区自拍先锋| 欧美在线999| 国产中文一区二区三区| 久久av一区二区| 美国十次了思思久久精品导航| 黄色影院成人| 亚洲日韩成人| 欧美欧美午夜aⅴ在线观看| 亚洲看片网站| 午夜精品久久一牛影视| 国产精品专区第二| 亚洲大胆av| 欧美肥婆bbw| 亚洲精品在线免费观看视频| 一区二区高清视频在线观看| 欧美日韩在线观看一区二区三区| 亚洲午夜精品网| 久久精品72免费观看| 在线播放不卡| 夜夜嗨一区二区三区| 国产精品久久久久91| 羞羞色国产精品| 免费日韩视频| 99在线热播精品免费| 欧美伊人久久久久久午夜久久久久 | 亚洲欧美久久久| 麻豆成人在线| 亚洲毛片一区二区| 午夜欧美精品| 在线成人av| 中文av字幕一区| 国产日韩欧美在线播放| 91久久精品日日躁夜夜躁欧美| 欧美日本在线视频| 亚洲欧美成人一区二区在线电影| 久久一区二区三区av| 日韩网站在线看片你懂的| 欧美在线观看视频在线| 韩日成人av| 在线亚洲自拍| 国模 一区 二区 三区| 99精品欧美一区二区三区综合在线| 国产精品大片免费观看| 欧美中文字幕第一页| 欧美精品手机在线| 亚洲欧美视频在线观看视频| 欧美成人午夜免费视在线看片| 亚洲深夜激情| 蜜臀99久久精品久久久久久软件| 99re8这里有精品热视频免费 | 黄网站色欧美视频| 亚洲天堂成人在线观看| 国精品一区二区三区| 亚洲一区二区三区免费视频 | 亚洲手机视频| 嫩模写真一区二区三区三州| 亚洲天堂av在线免费观看| 葵司免费一区二区三区四区五区| 亚洲麻豆av| 免费久久99精品国产| 亚洲欧美日韩一区二区在线 | 久久精品视频播放| 欧美视频一区二| 亚洲国产欧洲综合997久久| 国产精品v欧美精品∨日韩| 久久精品一区二区三区四区| 欧美亚日韩国产aⅴ精品中极品| 亚洲激情成人| 国产人成一区二区三区影院| 中日韩午夜理伦电影免费| 136国产福利精品导航网址应用| 亚洲欧美综合精品久久成人 | 久久国产精品久久久久久电车|