《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計應(yīng)用 > 基于統(tǒng)計模型的語音激活檢測算法改進
基于統(tǒng)計模型的語音激活檢測算法改進
2015年微型機與應(yīng)用第12期
張金榜1,尹冬梅2
1.武警警官學(xué)院 信息工程系,四川 成都 610213;2.武警江蘇省總隊 通信站修理所,江蘇 南京 210019
摘要: 語音激活檢測技術(shù)是應(yīng)用于語音偵聽領(lǐng)域降低節(jié)點能耗的關(guān)鍵技術(shù)之一,其核心是語音激活檢測算法。針對基于統(tǒng)計模型的語音激活檢測算法僅采用當(dāng)前語音幀的參數(shù)來判斷有無語音信號而帶來的誤檢率高的問題,提出用相鄰語音幀邏輯與運算的方法對其進行改進。試驗表明:改進后的算法在誤檢率上明顯低于改進前,提高了語音信號檢測的準(zhǔn)確性,有效地降低了節(jié)點能耗。
Abstract:
Key words :

  摘  要語音激活檢測技術(shù)是應(yīng)用于語音偵聽領(lǐng)域降低節(jié)點能耗的關(guān)鍵技術(shù)之一,其核心是語音激活檢測算法。針對基于統(tǒng)計模型的語音激活檢測算法僅采用當(dāng)前語音幀的參數(shù)來判斷有無語音信號而帶來的誤檢率高的問題,提出用相鄰語音幀邏輯與運算的方法對其進行改進。試驗表明:改進后的算法在誤檢率上明顯低于改進前,提高了語音信號檢測的準(zhǔn)確性,有效地降低了節(jié)點能耗。
  關(guān)鍵詞: 統(tǒng)計模型;語音激活檢測;檢測算法
0 引言
  語音激活檢測技術(shù)是利用語音激活檢測算法,僅當(dāng)檢測到語音信號時激活節(jié)點,使之從休眠狀態(tài)轉(zhuǎn)換到工作狀態(tài),其余時間處于休眠狀態(tài),是降低節(jié)點能耗的關(guān)鍵技術(shù)之一。基于統(tǒng)計模型的語音激活檢測算法,通過選取特征參數(shù)建立統(tǒng)計分布模型,根據(jù)當(dāng)前幀的信息計算出模型中的未知參數(shù),得出判決準(zhǔn)則,并據(jù)此判斷有無語音信號[1]。其優(yōu)點是能夠適應(yīng)時變噪聲的特點,在復(fù)雜環(huán)境下,檢測的準(zhǔn)確率較高[2-4]。但只根據(jù)當(dāng)前語音幀的參數(shù)來判斷有無語音信號具有一定的局限性,極易出現(xiàn)誤判的情況。因此,對基于統(tǒng)計模型的語音激活檢測算法加以改進來降低誤檢率,對語音偵聽領(lǐng)域具有十分重要的意義。
1 基于統(tǒng)計模型的語音激活檢測算法
  1.1 算法的基本步驟
  基于統(tǒng)計模型的語音激活檢測算法[2-3,5]以貝葉斯定理和似然比檢驗為基礎(chǔ),檢驗過程分提出假設(shè)、分析參數(shù)和檢驗判決三步。
  1.1.1 提出假設(shè)
  待測音信號X有兩種假設(shè):一是只有噪聲N存在,則原假設(shè)H0為真,判定未檢測到語音;二是語音S與噪聲N同時存在(S與N互不相關(guān)),則備選假設(shè)H1為真,判定檢測到語音,可以描述為:
  H0∶X(t)=N(t)(1)
  判定不存在語音信號。
  H1∶X(t)=N(t)+S(t)(2)
  判定存在語音信號。
  1.1.2 分析參數(shù)
  首先要根據(jù)其頻率特征進行周期性采樣,使波形參數(shù)由連續(xù)時間序列變?yōu)殡x散時間序列。然后根據(jù)采樣信號的振幅絕對值描繪直方圖,計算概率密度表達式,將模擬的語音信號用數(shù)字參數(shù)表示出來[1]。第t幀加噪信號、純語音信號和噪聲信號的離散傅里葉變換系數(shù)如下。
  X(t)=[X0(t),X1(t),…,XM-1(t)]T(3)
  S(t)=[S0(t),S1(t),…,SM-1(t)]T(4)
  N(t)=[N0(t),N1(t),…,NM-1(t)]T(5)
  在X(t)、S(t)、N(t)中,第k個譜分量的系數(shù)分別為Xk、Sk和Nk。用Xk(R)和Xk(I)分別表示離散傅里葉變換系數(shù)Xk的實部和虛部,假設(shè)每個DFT系數(shù)的實部和虛部都服從拉普拉斯概率密度函數(shù),如果其實部和虛部的方差相同,則Xk(R)和Xk(I)的概率密度分布如式(6)和式(7)所示。
  (GUJU376}[`Z(`0{6T5BKTF.png

  其中,8OOJ~X(269M]UIA68]UG~KK.png是指Xk方差的平方根。因為Xk的實部和虛部近似獨立,其方差可以看作相等,則Xk的概率密度函數(shù)可以表示為[1,6]:
 NLQZ$HWN@G9KR0JVA3UK)UO.png  

     H0和H1的條件概率密度函數(shù)分別為:
 X}D91I~XBJ[[N030[~G4$XC.png

  其中,λs,k和λn,k分別代表Sk和Nk的方差。
  1.1.3 檢驗判決
  根據(jù)兩個假設(shè)的條件概率密度函數(shù),計算出第k個頻譜分量的似然比:
  MBG()VL$UHT_XQC9$M~XD[R.png

  其中,Λk是基于拉普拉斯統(tǒng)計分布模型的語音激活檢測算法的第k個頻譜分量的判決統(tǒng)計量。將加噪語音分析后,根據(jù)式(11)計算出信號第k個頻譜分量的似然比,在實際應(yīng)用中,為了使計算簡單,可以用瞬時譜幅度|Xk|代替N]TMPO$FWDD%C}]KHUPRUWG.png

  `$5E)Z(RADMWA@3KLSTSH{R.png

  兩個假設(shè)的拉普拉斯概率密度如圖1所示。在兩個概率密度曲線的交點處,P(Xk|H0)=P(Xk|H1),似然比Λk=1;在兩個交點之間,P(Xk|H0)>P(Xk|H1),Λk<1,H1的概率小于H0的概率,H0成立,檢測不存在語音信號;在兩個交點之外,P(Xk|H0)<P(Xk|H1),Λk>1,則H1的概率大于H0的概率,H1成立,即檢測到語音信號。

Image 001.png

  1.2 算法的流程
  基于統(tǒng)計模型的語音激活檢測算法流程如圖2所示。

Image 002.png

2 算法的改進
  2.1 改進的思想
  算法的改進參照邏輯與運算的思想,真值表如表1所示。在基于統(tǒng)計模型算法的基礎(chǔ)上:(1)如果第k幀(k為大于等于1的正整數(shù))信號檢測判定結(jié)果是“0”,第k-1幀信號輸出結(jié)果是“0”,那么經(jīng)過與運算的結(jié)果是“0”,表示無語音信號;(2)如果第k幀信號檢測判定結(jié)果是“0”,第k-1幀信號檢測判定結(jié)果是“1”,與運算后的結(jié)果是“0”,同樣判斷無語音信號;(3)如果第k幀信號檢測判定的結(jié)果是“1”,第k-1幀信號檢測判定結(jié)果是“0”,那么經(jīng)過與運算的結(jié)果還是“0”,依然判為無語音信號;(4)只有兩次檢測的結(jié)果均為“1”,與運算后的結(jié)果才是“1”,才能證明有語音信號存在。只有當(dāng)前幀信號的判決結(jié)果是“1”時,才有可能判斷有語音信號存在。所以為簡便判決,只在當(dāng)前幀判決結(jié)果為“1”時執(zhí)行與運算。

Image 007.png

  2.2 改進算法的流程
  改進算法的工作原理是將一段語音信號采樣分幀處理后,對第k幀信號依據(jù)上節(jié)的檢測激活算法完成檢驗判決,將結(jié)果存于寄存器,若結(jié)果為“0”,返回繼續(xù)完成后續(xù)幀的檢驗;若結(jié)果為“1”,與上一幀信號進行與運算,根據(jù)運算結(jié)果完成最后判決。改進后的算法流程如圖3所示。

Image 003.png

3 改進算法的驗證與分析
  3.1 試驗步驟和結(jié)果
  語音信號的檢測仿真選用MATLAB平臺。仿真主要完成不同噪聲環(huán)境下基于統(tǒng)計模型的語音激活檢測算法(用算法1表示)和其改進算法(用算法2表示)誤檢率的測試。
  試驗步驟如下:(1)在較為安靜的環(huán)境下錄制一段長約6 s的語音片段作為原始樣本,保存為.wav格式;(2)將語音原始樣本分別與車輛噪聲和人群噪聲混合;(3)將混合信號在信噪比0~20 dB之間應(yīng)用兩種檢測算法進行仿真,得出誤判率。試驗結(jié)果如圖4、圖5所示。

Image 004.png

  3.2 試驗結(jié)果分析
  在車輛噪聲環(huán)境下,算法的誤檢率隨信噪比的增加而增加,這是由于車輛噪聲和語音信號的差異性導(dǎo)致信噪比增加時算法的正確率和錯誤率同時增加,而錯誤率的增長幅度大于正確率的增長幅度。在人群噪聲環(huán)境下,算法的誤檢率隨信噪比的增加而減少。
  在兩種噪聲環(huán)境且信噪比相同的情況下,改進后的算法在語音信號的誤檢率上均明顯低于改進前的誤檢率,提高了語音信號檢測的準(zhǔn)確性;而語音激活檢測技術(shù)是當(dāng)且僅當(dāng)檢測到語音信號時,才激活語音偵聽節(jié)點從休眠狀態(tài)轉(zhuǎn)換為工作狀態(tài),因此改進后的算法降低了節(jié)點能耗,延長了節(jié)點的生命周期。
4 結(jié)論
  改進的基于統(tǒng)計模型的語音激活檢測算法是通過相鄰幀邏輯與的方法來實現(xiàn)的。試驗結(jié)果表明:算法改進后,語音信號的誤檢率明顯低于改進之前,降低了節(jié)點能耗,延長了節(jié)點壽命,適用于便攜式語音檢測裝置中。
參考文獻
  [1] 彭利華.高噪聲環(huán)境下語音激活檢測技術(shù)的研究[D].武漢:華中科技大學(xué),2007.
  [2] SOHN J S, SUNG W Y. A voice activity detector employing soft decision based noise spectrum adaptation[C]. Proceeding of the IEEE Speech Coding Workshop, 1998:365-368.
  [3] CHO Y D, KONDOZ A. Analysis and improvement of a statisticalmodel-based voice activity detector[J]. IEEE Signal Processing Letters, 2001,8(10):276-278.
  [4] 戴啟軍,卞正中,陳硯圃,等.基于統(tǒng)計模型實現(xiàn)語音信號有聲/無聲檢測的研究[J].西安交通大學(xué)學(xué)報,2002,36(8):839-846.
  [5] EPHRAIM Y, MALAH D. Speech enhancement using a minimummean-square error short-time spectral amplitude estimator[J]. IEEE Transactions on Acoust Speech and Signal Processing,1984,32(6):1109-1121.
  [6] 景占榮,羊彥.信號檢測與估計[M].北京:化學(xué)工業(yè)出版社,2004.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
主站蜘蛛池模板: 99r在线视频| 中文字幕在线观看你懂的| 欧美精品手机在线| 免费人成网址在线观看国内| 色妞www精品视频免费看| 国产成人精品一区二三区在线观看 | 永久在线免费观看| 夜夜影院未满十八勿进| 一出一进一爽一粗一大视频免费的| 无码一区二区三区在线| 久久久精品久久久久久96| 最好看的免费观看视频| 亚洲人色大成年网站在线观看| 欧美高清视频一区| 亚洲综合伊人久久大杳蕉| 真实国产乱子伦精品免费| 午夜看一级特黄a大片| 老子午夜精品我不卡影院| 国产乱理伦片在线观看| 韩日视频在线观看| 国产在线精品一区二区不卡| 国产成人精品免费视频动漫| 国产特级毛片aaaaaa高清| 1000部啪啪未满十八勿入免费| 国产色xx群视频射精| 97精品国产高清自在线看超| 大学生久久香蕉国产线看观看 | 欧美人禽杂交狂配动态图| 亚洲天天综合网| 欧美成人看片黄a免费看| 亚洲欧美成人完整版在线| 毛片在线播放a| 亚洲第一性网站| 正能量网站不用下载免费观看视频软件| 亚洲老妈激情一区二区三区| 爱豆在线观看网址91|免费| 人妖系列免费网站观看| 特黄AAAAAAAAA毛片免费视频| 人人妻人人澡人人爽超污| 爱豆传媒在线视频观看网站入口 | 一本色道久久综合狠狠躁篇|