《電子技術應用》
您所在的位置:首頁 > 其他 > 業界動態 > 基于離散小波變換的語音激活檢測

基于離散小波變換的語音激活檢測

2008-11-19
作者:陳明義, 李 微, 黎 華

  摘 要: 為提高在噪聲環境" title="噪聲環境">噪聲環境下語音檢測的性能,提出了一種基于小波" title="小波">小波變換" title="離散小波變換" title="離散小波變換">離散小波變換">離散小波變換的語音激活檢測" title="語音激活檢測">語音激活檢測(VAD)的方法。算法將語音信號" title="語音信號">語音信號進行3層離散小波變換,通過Teager能量算子(TEO),提取能量比值和能量差值兩個參數,最后進行門限判決。實驗結果表明,本算法在噪聲環境中能夠有效地正確判別語音段和噪聲段,并且優于G.729B和AMR所提出的VAD的算法。
  關鍵詞: 離散小波變換; 語音激活檢測; Teager能量算子

?

  語音激活檢測(VAD)技術即根據人們日常談話的話音和靜默特性,對檢測到的靜音加以抑制。目前該技術在語音識別、語音編碼以及語音增強等領域獲得了廣泛的應用。由于語音處理系統常常工作在噪聲環境中,所以在低信噪比環境中,VAD檢測的性能對語音信號的處理至關重要[1][2]。雖然目前VAD技術已經取得較大的發展,仍需進一步研究以提高其對噪聲的魯棒性。本文給出了基于離散小波變換的語音激活檢測方法,這種方法提出了能量比值和能量差值兩個參數。通過對帶噪語音的實驗比較,證實了該方法的有效性。
1 離散小波變換的語音激活檢測的算法
1.1 離散小波變換(DWT)
  離散小波變換相當于離散信號經過一組濾波器而被分成一系列子帶信號。濾波器組由低通濾波器和高通濾波器組成,低通濾波器的輸出是近似信號,高通濾波器的輸出是細節信號[3][4]。小波的多分辨分析只是對低頻部分進行進一步分解,使低頻的分辨率變得越來越高,而高頻部分不予考慮。cm,n和dm,n分別表示DWT輸出的近似部分和細節部分。l(n)、h(n)分別表示低通濾波器和高通濾波器。m表示分解的層數,n表示分解系數的索引值。
    

  為了進一步研究離散小波變換的逼近信號和細節信號對于語音的影響,對原始語音進行3層的離散小波變換,選取的小波函數為Daubechies(db5)。分別對清音、濁音和靜音進行細節部分和逼近部分的比較,如圖1和圖2。圖1表現了濁音的主要能量集中在近似部分,而很少在細節部分,從圖2中看出,清音正好與濁音相反,而靜音能量分布則相對比較平衡。

?

?

1.2? TEO
  TEO是一種極為有效的、非線性的演算法,它能夠有效提取語音信號的能量。由于聲音部分是屬于穩定或半穩定的信號,而無聲部分是屬于不穩定信號,TEO的功用是強化穩定或半穩定信號,并衰減不穩定信號,可以更加突出細節部分和近似分布的特性[5]。公式(3)為TEO計算公式,i表示語音信號的幀數,tm,i(n)表示離散小波變換的第m層的第n個小波系數,Tm,i(n)是經過TEO處理后的結果。????????????????????????????????????
  
1.3 提取特征參數
  根據上面的分析提取出能量比值Ri和能量差值Di兩個特征參數。具體公式如(4)、(5),其中Nd、Na分別表示第一次分解的細節部分的長度和其近似部分的長度。
  (1) 能量比值
  每一幀的第一次分解的細節部分與其近似部分的比值。
  
?  (2) 能量差值
  每一幀的近似部分與第一次分解的細節部分的差值。
  
1.4 門限判定
??? 提取特征參數之后進行門限的設定,對門限值的計算公式如式(6)、(7)、(8)、(9),thd、thr分別是能量差值和能量比值的門限。R1、D1分別表示能量比值和能量差值的最大值,R0、D0分別表示能量比值和能量差值的估計噪聲平均值,Ra、Da分別表示能量比值和能量差值的平均值。
  
2 實驗分析
  在進行離散小波變換時,本文選取小波函數為Daubechies,運用了Mallat算法進行分解運算,可以減少算法的運算量。在噪聲環境下,用本文的方法進行了實驗分析。實驗所用的語音信號是在實驗室環境下錄制的,采樣頻率為8kHz,將噪聲加入語音信號,形成不同的信噪比。如圖3和圖4 即為原始語音和加噪語音信號的檢測結果。

?

  圖5、圖6是由本文提出的VAD算法與G.729、AMR的VAD算法比較的結果。從語音信號中選取了無噪聲、20dB、15dB、10dB、5dB 、0dB各40個語音作比較。實驗結果表明,本文提出的方法在噪聲環境中要優于AMR、G.729B語音編碼器中的VAD方法。

?


  根據濁音、清音和靜音離散小波變換后的系數進行分析,提出了基于離散小波變換的語音激活檢測方法。該方法對清音的特性作了提升,使得判決誤差更進一步減小了。實驗結果表明,該方法在低信噪比的情況下,基于離散小波變換的語音激活檢測方法具有較高準確率和穩定性。


參考文獻
[1]?KUBIN G, WERUAGA L, SIGMUND M. Time-frequency analysis for voice activity detection. Processing of the 24th?IASTED International Multi-Conference,Inns-bruck,Austria,?2006.
[2]?郭莉,殷南,王炳錫.語音業務中魯棒性VAD算法分析. ?語音技術, 2005,(9):41-45.
[3]?李建平,唐遠炎.小波分析方法的應用.重慶:重慶大學出版社,2000.
[4]?黃炳剛,周志杰,鄭翔. 基于小波變換的語音激活檢測. ?解放軍理工大學學報(自然科學版),2006,7(3):210-213.
[5]?HUANG S, CHEN H T, CHANG Wuyukon, et al. Robust ?voice activity detection using perceptual wavelet-packet?transform and teager energy operator. Advances on Pattern ?Recognition for Speech and Audio Processing, 2007,(28):1327-1332.

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 在线播放国产不卡免费视频| 欧美精品亚洲一区二区在线播放| 国产高潮国产高潮久久久| 九九热在线视频播放| 正点嫩模大尺度写真在线视频| 国产亚洲欧美视频| 亚洲一区二区三区高清| 在线天堂bt种子资源| yellow高清在线观看完整视频在线 | 老子的大ji巴cao死你| 国产成人a大片大片在线播放| 99精品国产一区二区| 成人午夜视频精品一区| 久久久久久曰本av免费免费| 日韩精品无码一区二区三区免费| 亚洲精品第五页中文字幕| 精品brazzers欧美教师| 午夜老司机在线观看免费| 色综合久久综合欧美综合网| 国产女人18毛片水真多18精品| 91成人在线免费观看| 天堂网在线观看| sss欧美一区二区三区| 日本一区二区三区四区五区| 久久精品国产精品亚洲艾草网| 永久看日本大片免费35分钟| 侵犯小太正bl浴室子开张了| 精品人妻AV区波多野结衣| 哒哒哒免费视频观看在线www| 成人a在线观看| 国产福利2021最新在线观看| 怡红院国产免费| 在线黄视频网站| igao在线观看| 天天躁狠狠躁狠狠躁性色av| 一本岛一区在线观看不卡| 愉拍自拍视频在线播放| 中文字幕亚洲一区二区va在线| 日韩欧美二区在线观看| 九一在线完整视频免费观看| 欧美日韩国产在线观看|