《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 一種基于PCA的段級特征
一種基于PCA的段級特征
來源:電子技術(shù)應(yīng)用2011年第5期
張興明,王科人,黃山奇
國家數(shù)字交換系統(tǒng)工程技術(shù)研究中心, 河南 鄭州 450002
摘要: 提出了一種基于PCA的段級特征(PCAULF)。該特征以現(xiàn)有的幀級語音特征為基礎(chǔ),通過計算段級特征引入了語音的長時特性。對段級特征使用PCA降維,一方面去除由于引入段級特征帶來的冗余,實現(xiàn)數(shù)據(jù)降維,提高識別速度;另一方面抑制了噪聲對識別系統(tǒng)的影響,提高了段級特征的魯棒性。在訓(xùn)練階段,計算所有語音的段級特征,使用PCA方法得到變換矩陣;在測試階段,先使用變換矩陣對段級特征進行降維,再進行判別。實驗結(jié)果表明,采用該特征有效地提高了識別精度和速度,更加適用于實時說話人識別系統(tǒng)。
中圖分類號: TN912.3
文獻標(biāo)識碼: A
文章編號: 0258-7998(2011)05-0110-04
A PCA-based utterance level feature
Zhang Xingming, Wang Keren, Huang Shanqi
National Digital Switch System Engineering & Technological R & D Center, Zhengzhou 450002, China
Abstract: A PCA based utterance level feature (PCAULF) is proposed for speaker recognition. Based on existing frame level speech feature, this feature takes long-time characteristics of speech into account by calculating the utterance level feature. In this feature extraction algorithm, PCA method is used for dimension reduction of utterance level feature. On the one hand, PCA removes redundancy caused by utterance level feature, which realizes dimension reduction and improves recognition speed; on the other hand, it suppresses the effect of noise to recognition, which improves robustness. In the training phase, utterance level features of all the speech are calculated, and transformation matrix is received through PCA method; in the testing phase, utterance level feature is dimension-reduced before being discriminated. Experimental results show that this feature can effectively improve the accuracy and speed of recognition, and it’s more suitable for real-time speaker recognition systems.
Key words : PCAULF; utterance level feature; speaker recognition; PCA; robustness


 一個典型的說話人識別系統(tǒng)提取的說話人特征通常為時變特性參數(shù)如梅爾倒譜系數(shù)MFCC(Mel-Frequency Cepstrum Coefficients)[1]、感知線性預(yù)測系數(shù)PLP(Perceptual Linear Prediction)[2]或韻律特征[3]。然而,實際使用時由于受到噪音干擾,或者訓(xùn)練與識別傳輸通道不匹配,識別系統(tǒng)通常不能表現(xiàn)良好[4]。目前解決這一問題的手段主要集中在特征域、模型域和得分域。現(xiàn)有特征域魯棒性處理方法主要有:RASTA濾波[5]、倒譜均值歸一化(CMN)[6]、直方圖均衡[7]和倒譜規(guī)整[8-11]等。這些算法通常以在識別前增加額外的運算來換取魯棒性的提高,如統(tǒng)計概率密度分布及計算各階矩等。
    本文算法主要從特征域入手,旨在減少識別階段運算時間的同時提高識別系統(tǒng)的魯棒性。參考文獻[12]采用了觀察值的各階矩和中心矩作為段級特征,并與模型結(jié)合,在不顯著影響識別率的情況下提高了識別速度。其缺點是,采用段級特征與采用幀級特征相比較識別率較低。參考文獻[13]提出了一種改進的PCA方法用于掌紋識別,通過提取更有利于分類的基向量,提高了降維后特征的魯棒性。本文結(jié)合了兩者的優(yōu)點,提出了一種基于PCA的段級特征PCAULF(PCA based Utterance Level Feature)提取算法。該算法特點如下:
 (1)以段級特征代替幀級特征,可減少識別過程中模板匹配的次數(shù),通過減少運算量來提高識別速度;
 (2)在段級特征降維時引入改進的PCA算法,一方面實現(xiàn)了數(shù)據(jù)的降維,既抑制了噪聲對識別系統(tǒng)的影響,又提高了識別的速度;另一方面,選擇更利于分類的特征向量組成變換矩陣,提高識別系統(tǒng)的魯棒性。
 實驗結(jié)果表明,在三種不同噪聲背景下進行測試比對,段級特征獲得了較高的識別率和較快的識別速度。
1 段級特征提取算法
1.1 段級特征的定義

     由于語音的短時平穩(wěn)特性,可以考慮在一段語音中提取特征,這樣就使得同樣的語音長度用更少的語音特征去描述,該特征被稱為段級特征。它是和傳統(tǒng)的按幀提取語音特征相對應(yīng)的一個概念。段級特征的一般表示形式是:

其中,ULFi、ULFi′代表第i個段級特征矢量,式(1)表示ULFi′從連續(xù)的G幀語音信號s中直接提取,式(2)表示ULFi從連續(xù)的G個幀級特征矢量a中提取。使用段級特征的關(guān)鍵在于段長G的選取和函數(shù)fG(·)的選取。首先討論函數(shù)的選取,段級特征是觀察值的函數(shù)。本文中,fG(·)主要包括以下兩個步驟:
 (1)以G為段長、Ginc為段移,將G個幀級特征矢量組合成超矢量。組成超矢量的操作類似于對數(shù)據(jù)的取幀操作,如圖1所示。

    (2)采用改進的主成分分析方法對超矢量進行降維,得到段級特征。

 


1.2 PCA方法
 主成分分析PCA(Principal Component Analysis)是一種掌握事物主要矛盾的統(tǒng)計分析方法,它可以從多元事物中解析出主要影響因素,簡化復(fù)雜的問題。PCA假定具有大變化的方向的數(shù)據(jù)比有很少變化的方向上的數(shù)據(jù)攜帶有更多的信息,因而它尋找具有最大方差的那些稱之為主軸的方向來表征原始數(shù)據(jù)。計算主成分的目的是在最小均方誤差意義下將高維數(shù)據(jù)投影到較低維空間。

的形式有效表示X。其中,通過K-L變換(Karhunen-Loeve Transform)計算相互正交的一組基向量,可以得到P。
 具體的PCA分析步驟如下:
 
2 實驗配置及結(jié)果分析
 采用PCAULF作為特征參數(shù)的說話人識別模型如圖2所示。語音數(shù)據(jù)經(jīng)過預(yù)處理和特征提取兩個步驟,得到幀級特征矢量集。訓(xùn)練時,由PCA對所有語音的段級特征求取降維變換矩陣,之后通過訓(xùn)練得到模板參數(shù);識別時,首先使用訓(xùn)練時得到的變換矩陣對待測語音的段級特征進行降維,之后再通過模板匹配得到識別結(jié)果。

    語音數(shù)據(jù)采用TIMIT語音數(shù)據(jù)庫,隨機選取50人,每人共10條語音,每條語音長4~6 s,其中8條用于訓(xùn)練,2條用于識別,保證了訓(xùn)練與識別語音的不一致。噪聲庫采用NoiseX-92專業(yè)噪聲庫中的三種常見噪聲,分別為平穩(wěn)高斯白噪聲、粉噪聲和Babble噪聲。基線系統(tǒng)聲學(xué)特征采用能量和12階MFCC特征以及衍生的ΔMFCC,共26維,之后進行了倒譜提升和RASTA濾波;模型采用訓(xùn)練和識別較為快速的矢量量化(VQ),碼本大小取32。語音采樣頻率為8 kHz,幀長為32 ms,幀移為12.5 ms。
 本節(jié)主要開展了以下三個實驗:
 實驗一:對純凈的語音進行訓(xùn)練,以段長分別為G=1,2,…,8,段移分別為Ginc=1,2,…,G求取段級特征,設(shè)累積貢獻率門限為1,得到變換矩陣(該變換矩陣并沒有實現(xiàn)降維);在識別階段,先對G幀語音特征組成的超矢量進行變換,再測試其識別率。該實驗主要用于分析合適的段長和段移。
 實驗二:在純凈語音基礎(chǔ)上,以信噪比SNR(Signal Noise Ratio)為20 dB、10 dB、5 dB分別混疊了NoiseX-92專業(yè)噪聲庫中的平穩(wěn)高斯白噪聲(White)、粉噪聲(Pink)和Babble噪聲(Babble),取實驗一分析得出的段長和段移,采用不同的PCA降維參數(shù),對幀級特征和段級特征進行變換,測試識別率,并對各種噪聲和SNR條件下的識別率求平均,得到不同PCA參數(shù)所對應(yīng)的識別率。該實驗主要用于分析降維參數(shù)對識別率的影響。
 實驗三:根據(jù)實驗一、二得到的段長、段移和降維參數(shù),采用實驗二的加噪方法對純凈語音進行加噪,對段級特征、經(jīng)過PCA降維處理的幀級特征以及基線系統(tǒng)的幀級特征的識別性能進行了測試。該實驗主要用于對本文提出的算法的識別精度和速度進行測試。
2.1 段長與段移分析
 實驗一結(jié)果如表1所示。

    由表1可見,當(dāng)以幀級特征作為訓(xùn)練和識別的特征時,其識別率明顯低于經(jīng)PCA方法變換后的段級特征的識別率。總體來說,當(dāng)G固定時,隨著Ginc的增加,識別率逐漸降低;當(dāng)Ginc固定時,隨著G的增加,識別率也逐漸降低。當(dāng)G≥8時,段級特征識別率不如幀級特征。當(dāng)G=1,Ginc=1時,等效為直接用PCA方法對幀級特征進行變換。由于幀級特征(能量+MFCC+ΔMFCC)中計算一階差分時引入了冗余,PCA方法正是為了去除各個主成分之間的冗余,故經(jīng)PCA變換后的幀級特征(G=1,Ginc=1)擁有更好的識別性能。但當(dāng)語音信號為帶噪數(shù)據(jù)時,該特征識別性能不如段級特征(見2.3節(jié))。
 由于當(dāng)G和Ginc均較大時,模板匹配次數(shù)減小,識別速度會得到明顯提高,因此,為了兼顧識別速度和精度,結(jié)合表1的結(jié)果,本文選取G=6,Ginc=4。
2.2 PCA降維參數(shù)分析
 實驗二結(jié)果如圖3(a)、(b)所示。其中,PCA參數(shù)主要指的是設(shè)定的累積貢獻率門限,即選用累積貢獻率不小于累積貢獻率門限的多個特征矢量組成降維變換矩陣。

    由圖3(a)可見,對于幀級特征,當(dāng)訓(xùn)練語音和待測語音較純凈時,累積貢獻率門限值越大,識別率越高。圖3(b)表明,對于段級特征,累積貢獻率門限值位于94%附近時,識別效果較好。門限太大易造成噪聲參與識別,影響識別精度;門限太小,易造成降維后的特征包含語音信息不充分,雖然能提高識別速度,但卻降低了識別精度。因此,本文在進行PCA降維時,選用累積貢獻率不小于94%的特征向量組成降維變換矩陣。
2.3 帶噪環(huán)境下基于PCAULF的說話人識別系統(tǒng)性能分析
 實驗三結(jié)果如圖4~圖6所示。

 由圖4~6可以看出:(1)總體來說,在三種常見噪聲環(huán)境下,段級特征與經(jīng)PCA降維后的幀級特征識別率相近,均高于直接采用幀級特征時的識別率。(2)由于段級特征引入了長時特征,且PCA降維在一定程度上抑制了噪聲對識別的影響,因此,在SNR較低時(SNR<20 dB時)具有更好的魯棒性。
 以上實驗的PC配置為:Intel Core(TM)2 Duo CPU E7500 @2.93 GHz,1.96 GB內(nèi)存。三種特征在所有語音的識別階段的平均運算時延如表2所示。

    可見,由于識別時,模板匹配的運算時延遠(yuǎn)大于對數(shù)據(jù)進行降維的運算時延,而段級特征的引入帶來了模板匹配次數(shù)的減小,因此,段級特征在識別階段的運算速度明顯大于幀級特征,約為幀級特征的2.8倍,更加適用于實時說話人識別系統(tǒng)。
    本文以現(xiàn)有的幀級語音特征為基礎(chǔ),結(jié)合語音的長時特性和改進PCA方法,提出了一種適用于說話人識別的段級語音特征,并分析了算法中的參數(shù)對識別性能的影響。實驗結(jié)果表明,該算法在提高語音特征魯棒性的同時,提高了識別速度,適用于實時說話人識別系統(tǒng)。
參考文獻
[1] FURUI S. Digital speech processing, synthesis, and recognition[M]. New York: Marcel Dekker, 2001.
[2] GISH H, SCHMIDT M. Text independent speaker identification[J]. IEEE Signal Proc, 1994,11(4):18-32.
[3] REYNOLDS D A. The super SID project: Exploiting high level information for high accuracy speaker recognition[A]. In IEEE International Conference on Acoustics, Speech and Signal Processing[C]. Hong Kong, China, 2003:784-787.
[4] DRYGAJLO A,MALIKI M E. Speaker verification in noisy environments with combined spectral subtraction and missing feature theory[A]. In IEEE International Conference on  Acoustics, Speech and Signal Processing[C]. Seattle, USA, 1998,1:121-124.
[5] HERMANSKY H, MORGAN N. Rasta processing of speech[J]. IEEE Trans on Speech and Audio Processing. 1994,2(4):578-589.
[6] WANG L ,KITAOKA N,NAKAGAWA S. Analysis of effect of compensation parameter estimation for CMN on speech/speaker recognition[A]. In 9th International Symposium on Signal Processing and Its Applications(ICASSP&rsquo;07)[C]. Sharjah, 2007:1-4.
[7] TORRE A, SEGURA J C,BENITEZ C. Non-linear transformations of the feature space for robust speech recognition[A]. In IEEE Proc. Of ICASSP[C]. Orlando, USA, 2002:401-404.
[8] VIIKKI O, LAURILA K. Cepstral domain segmental feature vector normalization for noise robust speech recognition[J].  Speech Communication, 1998, 25(1):133-147.
[9] HSU C W, LEE L S. High order cestral moment normalization(HOCMN) for robust speech recognition[A]. In IEEE Proc of ICASSP[C]. Montreal, Canada, 2004:197-200.
[10] LIU B, DAI L R,LI J Y. Double gaussian based feature normalization for robust speech recognition[A]. In Proc of ISCSLP[C]. Hong Kong, 2004:253-256.
[11] DU J, Wang Renhua. Cepstral shape normalization(CSN) for robust speech recognition[A]. In Proc of ICASSP[C]. Las Vegas, USA, 2008: 4389-4392.
[12] 王波, 徐毅瓊, 李弼程. 基于段級特征的對話環(huán)境下說話人分段算法[J]. 計算機工程與應(yīng)用, 2007, 28(10):2401-2416.
[13] 任蘇亞, 基于改進的PCA和ICA算法的掌紋識別研究[D]. 北京: 北京交通大學(xué), 2007:35-39.
[14] NALIN P S, MAYUR D J, PRAKASH C,et al. Palm  print recognition: two level structure matching[A]. In Proc.  of IJCNN [C]. Vancouver, Canada, 2006: 664-669.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
久久精品观看| 先锋影音国产精品| 亚洲午夜免费视频| 亚洲欧洲在线看| 亚洲电影免费| 在线观看日韩av先锋影音电影院| 国产深夜精品福利| 国产日韩精品视频一区| 国产欧美一区二区精品性色| 国产精品乱人伦中文| 国产精品久久久亚洲一区| 欧美日韩一区三区| 欧美视频日韩视频| 国产精品a久久久久| 欧美日韩在线影院| 欧美视频手机在线| 国产精品成人观看视频国产奇米| 欧美日韩在线三区| 欧美性大战久久久久久久蜜臀| 欧美日韩在线视频一区| 国产精品国产福利国产秒拍| 国产精品草莓在线免费观看| 国产精品免费一区二区三区在线观看 | 亚洲综合色噜噜狠狠| 亚洲亚洲精品在线观看| 亚洲一区在线看| 久久av资源网| 狂野欧美激情性xxxx| 欧美成人国产一区二区| 欧美精品国产一区二区| 欧美三区在线| 国产精品日韩一区二区三区| 国产自产在线视频一区| 亚洲大胆av| 99综合视频| 西瓜成人精品人成网站| 亚洲国产成人av| 亚洲毛片在线| 亚洲欧美日韩国产综合| 久久久99免费视频| 欧美激情1区2区| 欧美午夜视频一区二区| 国产色产综合色产在线视频| 在线观看的日韩av| 99成人精品| 欧美亚洲在线播放| 亚洲欧洲日韩女同| 亚洲综合三区| 久久影音先锋| 欧美视频一区在线| 韩国女主播一区| 亚洲精品久久久久久久久久久久| 一区二区三区日韩欧美| 欧美伊人久久久久久久久影院| 亚洲精品中文字幕在线| 午夜欧美电影在线观看| 久久色在线播放| 欧美日韩在线三区| 国产在线麻豆精品观看| 亚洲精品日韩综合观看成人91| 亚洲在线视频观看| 最新日韩精品| 欧美亚洲尤物久久| 欧美 日韩 国产一区二区在线视频 | 欧美日韩和欧美的一区二区| 国产精品专区h在线观看| 亚洲第一综合天堂另类专| 亚洲一区二区三区精品视频| 亚洲国产精品专区久久| 亚洲欧美中文日韩在线| 欧美阿v一级看视频| 国产美女精品| 日韩午夜免费| 亚洲高清不卡| 亚洲欧美日韩国产| 欧美高潮视频| 国产主播精品在线| 日韩亚洲综合在线| 亚洲成人中文| 性欧美18~19sex高清播放| 欧美肥婆bbw| 国产一区二区三区黄视频| 99精品久久久| 91久久精品国产91久久| 欧美在线黄色| 欧美视频1区| 亚洲国产老妈| 欧美一区观看| 亚洲欧美日韩人成在线播放| 欧美精品一区二区三区久久久竹菊| 国产一区视频网站| 亚洲一区二区三区视频播放| 在线视频精品一区| 欧美成人69av| 国内激情久久| 亚洲欧美在线另类| 国产精品99久久久久久人| 美日韩精品视频免费看| 国产日韩在线不卡| 亚洲午夜精品国产| 99亚洲视频| 男同欧美伦乱| 伊人久久亚洲美女图片| 欧美一区午夜视频在线观看| 亚洲在线免费视频| 欧美日韩一区综合| 亚洲精品乱码| 91久久精品国产91性色| 久久免费国产精品| 国产三级精品三级| 午夜视频在线观看一区二区| 午夜精品短视频| 国产精品黄页免费高清在线观看| 鲁大师成人一区二区三区| 国产综合色产在线精品| 欧美在线播放高清精品| 久久精品国产久精国产一老狼| 国产女主播一区二区三区| 亚洲欧美精品suv| 欧美一区二区三区婷婷月色| 国产精品一区免费观看| 亚洲欧美日韩国产综合| 欧美一区二区三区视频| 国产精品视频久久一区| 亚洲欧美激情视频在线观看一区二区三区 | 六月婷婷一区| 在线观看一区二区精品视频| 91久久久亚洲精品| 欧美大色视频| 亚洲精品视频在线观看免费| 一区二区三区三区在线| 欧美三级在线视频| 亚洲伊人久久综合| 欧美一区二区三区免费观看视频| 国产农村妇女精品一二区| 欧美一区国产在线| 另类专区欧美制服同性| 91久久精品美女高潮| 99这里有精品| 国产精品久久久久99| 午夜视频在线观看一区二区| 久久久久在线观看| 亚洲高清视频一区二区| 99精品国产在热久久| 欧美午夜欧美| 性色av一区二区三区| 久久综合999| 亚洲精选国产| 亚洲欧美日韩国产综合在线 | 欧美日韩一区二区免费视频| 亚洲视频自拍偷拍| 久久国产福利| 亚洲国产欧美日韩另类综合| 亚洲视频视频在线| 国产精品入口夜色视频大尺度| 欧美一区二区三区精品| 欧美成人精品三级在线观看| 日韩一区二区高清| 欧美专区在线观看一区| 在线观看免费视频综合| 一区二区日韩欧美| 国产精品久久午夜| 亚洲国产精品美女| 欧美视频在线观看| 久久国产精品免费一区| 欧美激情精品久久久久| 亚洲一区二区三区欧美| 久热综合在线亚洲精品| 一级日韩一区在线观看| 久久久福利视频| 日韩视频一区| 久久久久国产精品午夜一区| 亚洲三级免费电影| 久久精品91| 亚洲国产人成综合网站| 亚洲欧美中文日韩v在线观看| 在线看日韩欧美| 亚洲欧美在线磁力| 亚洲春色另类小说| 欧美一级黄色录像| 亚洲欧洲一区二区三区| 欧美亚洲一区三区| 亚洲精品少妇30p| 久久久久综合网| 一区二区av在线| 美女主播精品视频一二三四| 亚洲香蕉视频| 欧美国产免费| 欧美一区二区在线| 欧美性久久久| 亚洲精品久久久久中文字幕欢迎你 | 亚洲免费高清| 美女图片一区二区| 午夜精品久久久久久久99黑人| 欧美激情一区二区三区在线视频观看 | 欧美日韩1区2区3区| 久久av一区二区三区| 国产精品国产| 日韩午夜激情| 激情另类综合|