《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 語音識別中DTW改進算法的研究
語音識別中DTW改進算法的研究
來源:微型機與應用2011年第3期
胡金平,陳若珠,李戰明
(蘭州理工大學 電氣工程與信息工程學院,甘肅 蘭州 730050)
摘要: 動態時間規整DTW是語音識別中的一種經典算法。對此算法提出了一種改進的端點檢測算法,特征提取采用了Mel頻率倒譜系數MFCC,并采用計算量相對較小的改進的動態時間規整算法實現語音參數模板匹配,能夠實現孤立詞、特定人、小詞匯量的語音識別,并用Matlab進行了算法仿真。試驗結果表明,改進后的算法能夠有效地提高系統對語音的識別率。
Abstract:
Key words :

摘  要: 動態時間規整DTW是語音識別中的一種經典算法。對此算法提出了一種改進的端點檢測算法,特征提取采用了Mel頻率倒譜系數MFCC,并采用計算量相對較小的改進的動態時間規整算法實現語音參數模板匹配,能夠實現孤立詞、特定人、小詞匯量的語音識別,并用Matlab進行了算法仿真。試驗結果表明,改進后的算法能夠有效地提高系統對語音的識別率。
關鍵詞: 語音識別;端點檢測;Mel倒譜參數;動態時間規整

 在孤立詞語音識別中,最為簡單有效的方法是采用動態時間規整DTW(Dynamic Time Warping)算法,該算法基于動態規劃(DP)的思想,解決了發音長短不一的模板匹配問題,是語音識別中出現較早、較為經典的一種算法。DTW是把時間規整和距離測度計算結合起來的一種非線性規整技術,算法較為簡潔,正確率也較高,在語音識別系統中有較廣泛的應用。
 本文對DTW算法提出了一種改進的端點檢測算法,對提高系統的識別率有很好的實用價值[1]。
1 語音識別系統與DTW算法原理    
 本質上講,語音識別就是語音信號模式識別[2],它由訓練和識別兩個過程完成。訓練過程是從某一說話人大量語音信號中提取出該說話人的語音特征,并形成參考模式。識別過程是從待識語音中提取特征形成待識模式,與參考模式進行模式匹配、比較和判決,從而得出識別結果。本系統的結構如圖1所示。

 假設測試和參考模板分別用T和R表示,它們之間的相似度用其之間的距離D[T,R]來度量,距離越小相似度越高[3]。為了計算這一失真距離,要從T、R中各個對應幀之間的距離算起。設n、m分別是T、R中任意選擇的幀號,d[T(n),R(m)]表示這兩幀特征矢量之間的距離(在DTW算法中通常采用歐式距離)。
 如圖2所示,橫軸上標出的是測試模板T的各個幀號n=1~N,縱軸上是參考模板R的各個幀號m=1~M,N≠M。網格中的每一個交叉點(n,m)表示測試模式中某一幀與訓練模式中某一幀的交匯點。DP算法就是尋找一條通過此網格中若干個格點的路徑。路徑不是隨意選擇的,首先任何一種語音的發音快慢都有可能變化,但是其各部分的先后次序不可能改變,因此所選的路徑必定是從左下角出發,在右上角結束。


 式中,sgn[ ]是符號函數。
 為了提高端點檢測的精度,采用短時能量和過零率進行端點檢測[4]。語音采樣頻率為8 kHz,量化精度為16 bit。數字PCM碼首先經過預加重濾波器H(z)=1-0.95z-1,再進行分幀和加窗處理。在實驗中發現,雙門限端點檢測算法對于兩個漢字和三個漢字的語音命令端點檢測效果不好。以語音“你好”為例,如圖3語音波形圖中,端點檢測只能檢測到第1個字。

 如果語音命令中兩個字的間隔過長,使用雙門限端點檢測法會發生只檢測到第一個字的情況,從而可能造成語音匹配錯誤。為避免該錯誤,把可容忍的靜音區間擴大到15幀,如15幀內一直沒有能量和過零率超過最低門限,則認為語音結束;如發現仍然有話音,則把能量和過零率計算在內[5]。
 整個語音信號的端點檢測流程設計為四個階段:靜音段、過渡段、語音段和語音結束。在靜音段,如果能量或過零率超越低門限,就開始標記起始點,進入過渡段。在過渡段,由于參數的數值較小,不能確信是否處于語音段,因此只要兩個參數的數值都回落到低門限以下,就將當前狀態恢復到靜音狀態;而如果在過渡段中兩個參數中的任何一個超過了高門限,就可以確信進入語音段。在語音段,如果兩個參數的數值降低到低門限以下,且一直持續15幀,則語音進入停止;如果兩個參數的數值降低到低門限以下,但并沒有持續到15幀,后續又有語音超越過低門限,則認為還沒有結束;如果檢測出的這段語音總長度小于可接受的最小的語音幀數(設為15幀),則認為是一段噪音而放棄。
 采用改進后的端點檢測算法,對單個漢字或多個漢字的語音命令均識別正常。圖4為語音“你好”的端點檢測圖。

2.2 語音識別的DTW高效算法
 通常,路徑函數Φ(ni)被限制在一個平行四邊形內,平行四邊形的一條邊斜率為2,另一條邊的斜率為1/2。路徑函數的起點為(1,1),終止點為(N,M)。Φ(ni)的斜率為0、1或2。這是一種簡單的路徑限制,如圖5所示。

   本文的目的是尋找一個路徑函數,在平行四邊形內由點(1,1)到點(N,M)具有最小代價函數。由于對路徑進行了限制,在匹配過程中許多格點實際上是到達不了的,因此,平行四邊形之外的格點對應的幀匹配距離是不需要計算的。另外,也沒有必要保存所有的幀匹配距離矩陣和累積距離矩陣,因為每一列各格點上的匹配計算只用到了前一列的3個網格。利用這兩個特點可以減少計算量和存儲空間的需求。

 如果出現Xa>Xb的情況,此時彎折匹配的三段為(1,Xb)、(Xb+1,Xa)和(Xa+1,N)。沿X軸上每前進一幀,雖然所要比較的Y軸上的幀數不同,但彎折特性是一樣的,累積距離的更新都是用下式實現:
 D(x,y)=d(x,y)+min[D(x-1,y),D(x-1,y-1),D(x-1,y-2)]
 由于X軸上每前進一幀,只需要用到前一列的累積距離,所以只需要兩個列矢量D和d分別保存前一列的累積距離和計算當前列的累積距離,而不用保存整個距離矩陣,這樣可達到減少存儲量和存儲空間的目的。
2.3 試驗結果    
 本系統采用改進的端點檢測方法,采用MFCC(Mel Frequene Cepstrum Coeffiients)特征提取和DTW算法來實現語音識別。語音采樣頻率為8 kHz,16 bit量化精度,預加重系數a=0.95,語音每幀為30 ms,240點為一幀,幀移為80,窗函數采用Hamming窗。采集5個女生,10個男生的數據。共分為兩組,第一組是對0~9十個數字的識別,第二組是對孤立詞的識別,試驗數據如表1所示。

 本文研究了語音識別DTW算法和理論,在應用中對雙門限端點檢測算法作了延長可容忍靜音的改進,在說話語音識別算法上對DTW進行了改進和設計,實驗結果表明,該算法可以有效地提高系統的識別率。
參考文獻
[1]  何強,何英.MATLAB 擴展編程 [M].北京:清華大學出 版社,2002.
[2] CHANWOO K, KWANG D S. Robust DTW-based recognition algorithm for hand-held consumer devices[J]. IEEE Transactions on Consumer Electronics, 2005, 51(2):699-709.
[3] MIZUHARA Y, HAYASHI A, SUEMATSU N. Embedding of time series data by using dynamic time warping distances[J]. Systems and Computers in Japan, 2006, 37(3):1-9.
[4] BDULLA A, CHOW W H, SIN D, G. Cross-words reference template for DTW-based speech recognition systems[C]. Conference on Convergent Technologies for the Asia-Pacific Region,TENCON, 2003, 2003:1576-1579.
[5] 劉金偉,黃樟欽,侯義斌.基于片上系統的孤立詞語音識別算法設計[J]計算機工程,2007,33(13):25-27.

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲黄色性网站| 欧美一区2区视频在线观看| 国产精品婷婷| 欧美日韩国产在线播放| 欧美xart系列高清| 老色鬼精品视频在线观看播放| 久久av老司机精品网站导航| 午夜精品视频在线观看一区二区 | 91久久综合亚洲鲁鲁五月天| 欧美在线日韩在线| 欧美诱惑福利视频| 欧美在线视频一区二区三区| 销魂美女一区二区三区视频在线| 一区二区三区成人| 在线亚洲欧美视频| 亚洲午夜一区二区三区| 亚洲婷婷国产精品电影人久久| 一本色道久久综合亚洲精品不 | 99精品国产一区二区青青牛奶| 日韩亚洲欧美一区| 中文欧美在线视频| 亚洲欧美成人网| 欧美伊人影院| 亚洲激情综合| 亚洲精品1234| 一本色道久久综合亚洲精品按摩 | 亚洲在线免费观看| 亚洲男女自偷自拍| 欧美一区二区三区免费视| 久久9热精品视频| 久热这里只精品99re8久| 欧美成人综合网站| 欧美少妇一区| 国产精品视频九色porn| 国产有码在线一区二区视频| 在线观看一区| 99精品欧美一区二区蜜桃免费| 亚洲一卡久久| 久久不射网站| 日韩视频在线观看免费| 亚洲在线免费观看| 久久精品中文字幕免费mv| 老司机精品视频一区二区三区| 欧美精品成人一区二区在线观看 | 亚洲激情社区| 国产精品99久久99久久久二8| 午夜久久资源| 美女视频一区免费观看| 欧美精品综合| 国产日韩在线看片| 亚洲精品社区| 性伦欧美刺激片在线观看| 亚洲三级免费| 午夜久久资源| 欧美肥婆在线| 国产精品一区久久久| 在线成人中文字幕| 亚洲一区二区三区精品视频| 亚洲第一精品夜夜躁人人躁 | 久久这里有精品视频| 欧美另类在线观看| 国产欧美日韩免费看aⅴ视频| 亚洲国产高清aⅴ视频| 亚洲午夜免费福利视频| 亚洲国产成人精品久久| 亚洲综合色在线| 欧美成人精品激情在线观看| 国产精品美女999| 亚洲二区在线视频| 亚洲欧美日韩人成在线播放| 亚洲精选成人| 久久久久久久999精品视频| 欧美日韩不卡视频| 国产自产2019最新不卡| 一区二区三区成人| 亚洲日本va午夜在线电影| 亚洲欧美在线播放| 欧美激情无毛| 国内自拍一区| 亚洲一区三区在线观看| 亚洲美女视频在线观看| 久久精品72免费观看| 欧美特黄一区| 亚洲精品国产精品国自产在线 | 一区二区激情小说| 亚洲人久久久| 久久久精品久久久久| 国产精品高潮呻吟| 亚洲片区在线| 亚洲国产专区校园欧美| 久久福利资源站| 国产精品久久久久影院亚瑟| 亚洲黄页一区| 亚洲第一精品久久忘忧草社区| 性欧美videos另类喷潮| 欧美日韩免费看| 亚洲国产精品精华液2区45| 欧美一区二区黄色| 亚洲欧美日韩综合| 欧美视频二区36p| 亚洲欧洲一级| 亚洲精品视频在线播放| 免费h精品视频在线播放| 国产色产综合色产在线视频| 亚洲午夜精品久久久久久app| 一二美女精品欧洲| 欧美激情中文不卡| 亚洲激情不卡| 亚洲精品中文字幕在线| 欧美 日韩 国产一区二区在线视频| 国产日韩欧美不卡| 午夜精品av| 久久精品视频免费| 国产日韩在线不卡| 欧美在线观看一区二区| 久久久www成人免费精品| 国产欧美日韩亚洲精品| 亚洲欧美日韩精品一区二区| 香蕉av777xxx色综合一区| 国产精品久久久久久久午夜| 一片黄亚洲嫩模| 亚洲校园激情| 国产精品久久一区二区三区| 宅男噜噜噜66一区二区66| 亚洲午夜女主播在线直播| 欧美日韩影院| 制服丝袜激情欧洲亚洲| 性欧美在线看片a免费观看| 国产精品性做久久久久久| 亚洲免费在线精品一区| 欧美一级片在线播放| 国产日韩精品电影| 欧美专区日韩专区| 美女精品在线| 亚洲日本一区二区三区| 亚洲网站视频| 国产精品乱人伦中文| 香蕉精品999视频一区二区| 久久久精品五月天| 亚洲成色最大综合在线| 99精品福利视频| 欧美日韩综合视频| 亚洲一区二区三区国产| 久久精品亚洲国产奇米99| 国内精品美女在线观看| 亚洲精品在线免费| 欧美体内she精视频| 午夜一区二区三区不卡视频| 久久亚洲一区二区| 亚洲精品乱码久久久久久| 亚洲一区久久久| 国产欧美午夜| 亚洲欧洲精品一区二区三区| 欧美日韩一区二区在线视频| 亚洲在线一区二区三区| 六月天综合网| 艳妇臀荡乳欲伦亚洲一区| 先锋影音国产精品| 曰韩精品一区二区| 国产精品99久久久久久久久| 国产精品资源在线观看| 亚洲国产经典视频| 欧美视频一区二区在线观看 | 在线视频你懂得一区二区三区| 欧美亚洲综合在线| 樱花yy私人影院亚洲| 一本色道久久综合亚洲精品不 | 国产有码一区二区| 日韩一区二区免费高清| 国产精品一区免费观看| 91久久国产综合久久| 国产精品成av人在线视午夜片| 久久国产精品久久久久久| 欧美日本韩国一区二区三区| 亚洲欧美一区二区三区极速播放| 美国成人毛片| 亚洲一区在线免费观看| 欧美v日韩v国产v| 亚洲影视九九影院在线观看| 另类天堂av| 亚洲一区尤物| 欧美欧美天天天天操| 欧美一区二区精品| 欧美日韩亚洲综合| 亚洲第一页自拍| 国产精品久久| 亚洲免费av片| 国产在线一区二区三区四区| 亚洲一区二区动漫| 亚洲国产高清视频| 欧美在线亚洲综合一区| 日韩一级黄色av| 鲁鲁狠狠狠7777一区二区| 亚洲一区二区三区乱码aⅴ| 欧美高清在线视频观看不卡| 欧美一区二区三区四区高清 | 欧美日韩亚洲三区| 亚洲韩国精品一区| 国产视频一区在线观看| 亚洲女性喷水在线观看一区|