《電子技術應用》
您所在的位置:首頁 > 其他 > 業界動態 > 改進水印圖片里文字識別效果的新方法

改進水印圖片里文字識別效果的新方法

2009-07-22
作者:駱劍鋒1,諶 頏2

  摘 要: 現今,OCR文字識別技術已經飛快發展,如一般的車牌識別、掃描文本識別等技術的識別率已達到非常高的水平,但這些識別技術在帶水印圖片的文字識別這一方面表現一般。其原因主要在識別前后的處理還不夠。主要講述了文字識別的新預處理的方法和后期處理的實現。
??? 關鍵詞: USM銳化;最大類間方差;閾值;平均灰度值;二值化閾值;拼寫與語法檢查

?

  所謂帶水印的圖片,其實就是在文字的上面加上一層半透明的圖像,如圖1所示。這層圖像不會影響讀者對文字的閱讀,但如果計算機要提取圖片里面的內容就會非常的困難。

?


  為了能準確且方便地從帶水印的圖片中提取內容,本文對圖片的預處理分成三步:第一步是進行灰度處理,第二步是用自動獲取閾值的USM銳化,最后是對圖片進行二值化處理。
  在眾多文字識別技術中,暫時還沒有一種識別方法能保證識別出來的內容是準確的,因此,在進行識別后的檢查和糾正就顯得很重要。為了在識別錯誤后能盡量地糾正,需要對識別結果進行拼寫和語法檢查及糾正。所以在本文的后部分還介紹一種簡單的識別結果糾正程序。
1 文字識別的預處理
1.1 灰度處理
  灰度處理主要是對圖片中每一像素的RGB值進行映射,映射到0至255的灰度值。所以得出來的圖片就像黑白照片一樣。這樣做就可以降低后面步驟的運算量,并且使得圖片更加易于辨認。效果圖如圖2所示。

1.2 USM銳化
  由于水印是半透明地蓋在文字資料上,使得水印下的文字的邊緣變得模糊且難以辨認,因此要對圖片銳化,這樣會突顯圖片中的文字,有利于實現圖片中的文字與水印分離。
?  在這里不用一般的銳化方法,因為一般的銳化方法只是對邊緣進行增強,而USM銳化則不一樣。USM銳化前和USM銳化后的圖分別為圖3和圖4。

?  從圖3和圖4的對比中,可以清楚地看到,USM銳化不單可以把文字一邊的邊緣增強,同時它還把文字邊緣的另外一邊明顯地減弱。通過這種方法,文字就會被突顯出來,而文字附近的圖像就會被減弱,從而減少半透明水印的面積。并且文字的邊緣還會出現白邊(其實是由于邊緣減弱造成的部份),這就為下一步二值化埋下了伏筆。
  USM銳化算法中的閾值是需要設定的,閾值過大,銳化就不能產生出效果;設定的閾值過小,那么就會同時把文字與水印的邊緣都增強,什么都分不清楚了。由于閾值的設定至關重要,閾值是通過最大類間方差法定下來的,方法如下:
  對于圖像I(x,y),前景(即目標)和背景的分割閾值記作T,屬于前景的像素點數占整幅圖像的比例記為w0,其平均灰度u0;背景像素點數占整幅圖像的比例為w1,其平均灰度為u1。圖像的總平均灰度記為u,類間方差記為g。
  假設圖像的大小為M×N,圖像中像素的灰度值小于閾值T的像素個數記作N0,像素灰度大于閾值T的像素個數記作N1,則有:

  然后,在程序中使T值遍歷0到255,每次都算出方差值g,最后能使g最大的T值就是需要的閾值。但T值無需遍歷那么多次,因為文字一般都接近黑色,所以可以遍歷從1到90。灰度圖片USM銳化后的效果如圖5所示。


1.3 二值化處理
??? 通過二值化處理就可以得到主要的文字的圖片了。而這一步最重要的地方是二值化處理時要選取的閾值,閾值決定了能否把圖片中的水印圖除掉。通過以下方法算出閾值:
??? (1)橫向掃描全圖,把兩邊為淺色、中間為深色的所有點(如圖6中F被橫框選中處)的灰度值累加(設總值為sum1),同時也累記點數(設總數為p1)。
??? (2)縱向掃描全圖,把上下兩邊為淺色、中間為深色的所有點(如圖6中F被縱框選中處)的灰度值累加(設總值為sum2),同時也累記點數(設總數為p2)。


??? (3)得出的二值化的閾值就為:(sum1+sum2)/(p1+p2)。
??? 簡單來說,就是把被白邊圍上的黑點的灰度值進行累加,它的和與黑點的數量相除,就得到了這些黑點的平均灰度值。這也正是在第二步用USM銳化的原因。用該閾值對圖片進行二值化后的效果如圖7所示。

2 文字識別的后期處理
  經過預處理后,就可以用很多現有的OCR文字識別算法把圖7中的文字提取出來,這里就不再進行闡述了。
??? 不難發現,無論預處理做得有多好,識別算法技術有多高,都難免有出錯的時候,因此要對識別的結果進行拼寫和語法的檢查和糾正,這里直接給出實現該功能的程序。眾所周知,微軟office中的word里有拼寫和語法的檢查糾正功能,并且比較完善。
??? 使用VB.NET實現拼寫和語法檢查糾正功能的過程如下:
??? (1)確定已安裝office 2003。VB中已建立windows窗體,窗體中有TextBox,它是存放OCR識別的結果,還有Button,Button中的事件就是拼寫與語法檢查與糾正代碼。
??? (2)在VB中引用Word組件:在解決方案瀏覽器中的“引用”上右鍵->添加引用->標簽頁中選“COM”->選中“Microsoft Word 9.0 Object Library”,單擊“確定”即可。
??? (3)在代碼的最前端添加三個語句:Imports Microsoft.Office.Core,Imports Microsoft.Office.Interop.Word和Imports System. Runtime. Interop Services,然后在Button的單擊事件中加如下代碼即可。
??? Dim objWord,objTempDoc As Object
    ′創建Word對象和臨時文檔
?? Dim iData As IDataObject
    ′聲明IDataObject存放從剪貼板返回的內容
??? objWord=New Word.Application
??? objTempDoc=objWord.Documents.Add
    ′實例化Word對象
??? Clipboard.SetDataObject(TextBox1.Text)
    ′復制文本框中的識別結果到剪貼板
??? With objTempDoc
??? .Content.Paste()?   ′把剪貼板中的內容粘貼到臨時文檔
??? .Activate()
??? .CheckSpelling()   ′拼寫檢查
??? .CheckGrammar()?   ′語法檢查
??? .Content.Copy()
??? iData=Clipboard.GetDataObject()
??? TextBox1.Text=CType(iData.GetData(DataFormats.Text), String) ′利用剪貼板把修改后的內容返回給文本框
??? .Close()
??? End With
??? objWord.Quit()
??? 本文中所講述的最大類間方差定USM銳化閾值法、基于USM銳化后求黑點平均灰度值的圖像二值化處理法和對識別結果進行檢查糾正,經過多次實驗,針對帶水印圖片的文字識別率可高達98.64%。而前面兩種處理圖像的方法及它們的巧妙結合正是本文的亮點,并且是原創的。但本算法的運行速度并不理想,在以后的研究中希望有新的突破。


參考文獻
[1] 楊柳,牛秦洲.啤酒瓶凸性模號圖像預處理算法[J].電腦知識與技術,2007(11):1089-1091.
[2] 王勇智.數字圖象的二值化處理技術探究[J].湖南理工學院學報(自然科學版),2005(1).
[3] 呂學強,遲呈英.英文光學字符識別的后處理[J].鞍山鋼鐵學院學報,2002(25):192-196.

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲与欧洲av电影| 噜噜噜噜噜久久久久久91| 欧美一级成年大片在线观看| 亚洲精品午夜| 亚洲第一网站免费视频| 激情综合网激情| 国产一区二区中文字幕免费看| 国产麻豆午夜三级精品| 国产精品人成在线观看免费 | 亚洲一区美女视频在线观看免费| 一区二区免费在线观看| 一区二区日韩伦理片| 中文一区在线| 亚洲桃花岛网站| 亚洲小视频在线| 亚洲免费影视第一页| 亚洲欧美日韩一区二区在线| 亚洲免费在线电影| 欧美亚洲一区| 久久精品日产第一区二区| 久久久久成人精品| 免费一级欧美在线大片| 欧美福利在线| 欧美日韩国产综合一区二区| 欧美日韩中文字幕在线| 国产精品久久久久永久免费观看| 国产精品乱码人人做人人爱 | 国产亚洲精品久| 黑人操亚洲美女惩罚| 在线日韩精品视频| 日韩特黄影片| 亚洲视频在线观看免费| 午夜精品剧场| 亚洲国产精品成人一区二区| 亚洲美女精品一区| 亚洲一区二区三区国产| 欧美一区二区三区日韩| 美女久久一区| 欧美三级日韩三级国产三级| 国产欧美一区二区三区国产幕精品| 国产亚洲欧美日韩在线一区| 亚洲电影观看| 亚洲视频导航| 久久经典综合| 中日韩美女免费视频网址在线观看| 午夜视频久久久| 老鸭窝毛片一区二区三区| 欧美久久精品午夜青青大伊人| 国产精品免费在线 | 亚洲第一成人在线| 一区二区国产日产| 久久国产视频网| 欧美成人一区二区三区在线观看 | 一本大道久久精品懂色aⅴ| 午夜精品久久久久久久99黑人| 亚洲国产岛国毛片在线| 亚洲手机在线| 久久精品视频播放| 欧美日韩国产电影| 国产欧美一区二区精品性色| 最新中文字幕亚洲| 性欧美大战久久久久久久久| 99国产精品久久| 久久精品观看| 欧美日韩在线视频一区| 国产自产女人91一区在线观看| 亚洲精品美女在线观看| 午夜精品一区二区三区四区 | av成人毛片| 久久久久久久久综合| 欧美日韩在线播放三区四区| 国内精品一区二区三区| 日韩亚洲一区二区| 亚洲第一区在线观看| 亚洲免费在线观看视频| 嫩草成人www欧美| 国产伦理一区| 一本色道**综合亚洲精品蜜桃冫 | 久久av一区二区三区漫画| 欧美日韩国产一级片| 激情成人在线视频| 亚洲欧美激情视频在线观看一区二区三区 | 久久国产日本精品| 亚洲午夜av在线| 奶水喷射视频一区| 国产主播精品| 亚洲欧美国内爽妇网| 亚洲一区二区三区精品在线| 欧美韩日一区二区| 韩国自拍一区| 性色av一区二区三区红粉影视| 亚洲一区亚洲| 欧美色道久久88综合亚洲精品| 亚洲国产三级| 亚洲国产精品一区二区www| 久久九九久精品国产免费直播| 国产精品美女xx| 一区二区三区www| 一个色综合导航| 欧美女同视频| 亚洲人被黑人高潮完整版| 亚洲黄色免费| 开元免费观看欧美电视剧网站| 国产一区二区视频在线观看| 亚洲欧美在线免费| 欧美一区二区精美| 国产精品日韩在线| 亚洲一区观看| 久久国产色av| 久久精品麻豆| 欧美在线视屏| 国产精品免费久久久久久| 一区二区三区欧美亚洲| 亚洲午夜高清视频| 欧美视频免费在线| 一区二区三区.www| 亚洲综合久久久久| 国产精品xxx在线观看www| 一本大道久久a久久精二百| 在线中文字幕一区| 欧美视频三区在线播放| 一区二区国产日产| 亚洲男人的天堂在线观看| 国产精品家庭影院| 亚洲欧美大片| 欧美有码视频| 国产亚洲精品激情久久| 久久国产加勒比精品无码| 久久看片网站| 1024国产精品| 亚洲免费观看在线观看| 欧美欧美天天天天操| 99精品视频免费全部在线| 亚洲与欧洲av电影| 国产麻豆午夜三级精品| 欧美一区二区高清在线观看| 久久精品最新地址| 精品二区视频| 日韩视频国产视频| 欧美色图首页| 亚洲免费影院| 久久精视频免费在线久久完整在线看| 狠狠色伊人亚洲综合网站色| 日韩午夜黄色| 久久国产99| 亚洲第一精品夜夜躁人人爽| 亚洲精品乱码久久久久久蜜桃麻豆 | 欧美国产91| 99在线精品免费视频九九视| 亚洲欧美怡红院| 国产综合欧美| 亚洲免费av观看| 国产精品国产三级国产专区53 | 国产精品视频xxxx| 久久精品国产免费看久久精品| 欧美成人免费网站| 一本色道久久综合亚洲精品婷婷| 欧美一级一区| 亚洲电影av在线| 亚洲欧美国产另类| 黄页网站一区| 亚洲五月婷婷| 国内偷自视频区视频综合| 日韩亚洲不卡在线| 国产伦理精品不卡| 亚洲精品视频免费观看| 国产精品国产三级国产a| 亚洲大胆女人| 欧美午夜精品久久久久免费视| 欧美自拍偷拍| 欧美视频国产精品| 亚洲福利专区| 国产精品久久久久国产a级| 久久精品国产一区二区三| 欧美日韩一区二区免费在线观看| 欧美一级久久久| 欧美日韩免费视频| 久久国产精品一区二区三区四区| 欧美日韩日日夜夜| 久久精品99久久香蕉国产色戒 | 亚洲在线中文字幕| 欧美mv日韩mv国产网站| 宅男精品视频| 欧美电影打屁股sp| 香蕉久久夜色精品国产使用方法| 欧美久久久久中文字幕| 欧美尤物一区| 国产精品久久久久秋霞鲁丝| 亚洲精品国产精品国自产观看浪潮| 国产欧美 在线欧美| 日韩系列在线| 激情五月婷婷综合| 香蕉久久夜色精品国产使用方法| 亚洲国产高清高潮精品美女| 欧美在线高清| 一区二区欧美在线观看| 欧美激情欧美激情在线五月| 欧美一区免费视频| 国产精品劲爆视频| 一本久久a久久免费精品不卡|