《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 基于DTW的編碼域說話人識別研究
基于DTW的編碼域說話人識別研究
來源:電子技術(shù)應(yīng)用2010年第8期
李榕健, 于洪濤, 李邵梅
國家數(shù)字交換系統(tǒng)工程技術(shù)研究中心, 河南 鄭州 450002
摘要: 相對解碼重建后的語音進(jìn)行說話人識別,從VoIP的語音流中直接提取語音特征參數(shù)進(jìn)行說話人識別方法具有便于實(shí)現(xiàn)的優(yōu)點(diǎn),針對G.729編碼域數(shù)據(jù),研究基于DTW算法的快速說話人識別方法。實(shí)驗(yàn)結(jié)果表明,在相關(guān)的說話人識別中, DTW算法相比GMM 在識別正確率和效率上有了很大提高。
中圖分類號: TN912.3
文獻(xiàn)標(biāo)識碼: A
文章編號: 0258-7998(2010)08-0119-03
Research on speaker recognition from coding domain based on DTW algorithm
LI Rong Jian, YU Hong Tao, LI Shao Mei
National Digital Switching System and Researching Center, Zhengzhou 450002, China
Abstract: The direct extraction of speech feature parameters from VoIP voice stream for speaker recognition in relation to reconstructing the decoded speech for speaker recognition has the advantages of easy implementation.This paper focuses on data in G.729 coding domain and proposes a method of quick speaker recognition based on DTW algorithm. Experimental results show that, compared with GMM, DTW has advantage of high rcognition accuracy and process speed in the text-dependent speaker recognition.
Key words : speaker recognition; G.729 coding stream; voice feature parameter; DTW algorithm

 說話人識別又被稱為話者識別,是指通過對說話人語音信號的分析處理,自動確認(rèn)說話人是否在所記錄的話者集合中,以及進(jìn)一步確認(rèn)說話人的身份。說話人識別的基本原理如圖1所示。

   按照語音的內(nèi)容,說話人識別可以分為文本無關(guān)的(Text-Independent)和文本相關(guān)的(Text-Dependent)兩種。文本無關(guān)的識別系統(tǒng)不規(guī)定說話人的發(fā)音內(nèi)容,模型建立相對困難,但用戶使用方便。與文本有關(guān)的說話人識別系統(tǒng)要求用戶按照規(guī)定的內(nèi)容發(fā)音,而識別時也必須按規(guī)定的內(nèi)容發(fā)音,因此可以達(dá)到較好的識別效果。
 隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,通過Internet網(wǎng)絡(luò)傳遞語音的網(wǎng)絡(luò)電話VoIP(Voice over IP)技術(shù)發(fā)展迅速,已經(jīng)成為人們?nèi)粘=涣鞯闹匾侄危絹碓蕉嗟挠脩魭仐墏鹘y(tǒng)的通信方式,通過計(jì)算機(jī)網(wǎng)絡(luò)等媒介進(jìn)行語音交流。由于VoIP工作方式的特點(diǎn),語音在傳輸中經(jīng)過了語音編譯碼處理,VoIP設(shè)備端口同時要處理多路、海量的壓縮話音數(shù)據(jù)。所以VoIP說話人識別技術(shù)主要研究的是如何高速、低復(fù)雜度地針對解碼參數(shù)和壓縮碼流進(jìn)行說話人識別。
 現(xiàn)有的針對編碼域說話人識別方法的研究主要集中在編碼域語音特征參數(shù)的提取上,香港理工大學(xué)研究從G.729和G.723編碼比特流以及殘差中提取信息,并采用了分?jǐn)?shù)補(bǔ)償?shù)姆椒āV袊茖W(xué)技術(shù)大學(xué)主要研究了針對AMR語音編碼的說話人識別。西北工業(yè)大學(xué)在說話人確認(rèn)中針對不同的語音編碼差異進(jìn)行了補(bǔ)償算法研究,并且研究了直接在G.729編碼的比特流中提取參數(shù)的方法。說話人模型則主要采用在傳統(tǒng)說話人識別中應(yīng)用最廣泛的GMM-UBM(Gaussian Mixture Model-Universal Background Model)。GMM-UBM的應(yīng)用效果和混元數(shù)目密切相關(guān),在保證識別率的基礎(chǔ)上,其處理速度無法滿足VoIP環(huán)境下高速說話人識別的需求。
 本文研究VoIP語音流中G.729編碼域的說話人實(shí)時識別,將DTW識別算法成功應(yīng)用在G.729編碼域的文本相關(guān)的說話人實(shí)時識別。
1 G.729編碼比特流中的特征提取
1.1  G.729編碼原理

 ITU-T在1996年3月公布G.729編碼,其編碼速率為8 kb/s,采用了對結(jié)構(gòu)代數(shù)碼激勵線性預(yù)測技術(shù)(CS-ACELP),編碼結(jié)果可以在8 kb/s的碼率下得到合成音質(zhì)不低于32 kb/s ADPCM的水平。 G.729的算法延時為15 ms。由于G.729編解碼器具有很高的語音質(zhì)量和很低的延時,被廣泛地應(yīng)用在數(shù)據(jù)通信的各個領(lǐng)域,如VoIP和H.323網(wǎng)上多媒體通信系統(tǒng)等。
    G.729的編碼過程如下:輸入8 kHz采樣的數(shù)字語音信號先經(jīng)過高通濾波預(yù)處理,每10 ms幀作一次線性預(yù)測分析,計(jì)算10階線性預(yù)測濾波器系數(shù),然后把這些系數(shù)轉(zhuǎn)換為線譜對(LSP)參數(shù),采用兩級矢量量化技術(shù)進(jìn)行量化。自適應(yīng)碼本搜索時,以原始語音與合成語音的誤差知覺加權(quán)最小為測度進(jìn)行搜索。固定碼本采用代數(shù)碼本機(jī)構(gòu)。激勵參數(shù)(自適應(yīng)碼本和固定碼本參數(shù))每個子幀(5 ms,40個樣點(diǎn))確定一次。
1.2 特征參數(shù)提取
    直接從G.729 編碼流中按照量化算法解量化可以得到LSP參數(shù)。由于后段的說話人識別系統(tǒng)還需要激勵參數(shù),而在激勵參數(shù)的計(jì)算過程中經(jīng)過了LSP的插值平滑,所以為了使特征矢量中聲道和激勵參數(shù)能準(zhǔn)確地對應(yīng)起來,要對解量化的LSP參數(shù)采用插值平滑。



 本文選擇G.729編碼幀中第一子幀的LSP(1)參數(shù)的反余弦LSF及由其轉(zhuǎn)換得到的LPC、LPCC參數(shù)作為聲道特征參數(shù)。
 參考文獻(xiàn)[1]發(fā)現(xiàn)識別特征加入G.729壓縮幀中的語音增益參數(shù),說話人識別性能發(fā)生了下降。去除G.729壓縮碼流特征中的增益參數(shù)GA1、GB1、GA2、GB2,結(jié)果發(fā)現(xiàn),當(dāng)采用了去除增益參數(shù)的特征矢量方案X=(L0,L1,L2,L3,P1,P0,P2),識別性能得到了提高,所以本文最終采用的G.729壓縮碼流特征為X=(L0,L1,L2,L3,P1,P0,P2),共7維。
2 動態(tài)時間規(guī)整(DTW)識別算法
 動態(tài)時間規(guī)整DTW(Dynamic Time Warping)是把時間規(guī)整和距離測度計(jì)算結(jié)合起來的一種非線性規(guī)整技術(shù)。該算法基于動態(tài)規(guī)劃思想,解決了發(fā)音長短不一的模版匹配問題。
 算法原理:假設(shè)測試語音和參考語音分別用R和T表示,為了比較它們之間的相似度,可以計(jì)算它們之間的距離D[T,R],距離越小則相似度越高。具體實(shí)現(xiàn)中,先對語音進(jìn)行預(yù)處理,再把R和T按相同時間間隔劃分成幀系列:

   然后采用動態(tài)規(guī)劃進(jìn)行識別。如圖2所示。

   把測試模版的各個幀號n=1,…,N在一個二維直角坐標(biāo)系的橫軸上標(biāo)出,把參考模版的各幀號m=1,…,M在縱軸上標(biāo)出,通過這些表示幀號的整數(shù)坐標(biāo)畫出的橫縱線即可形成一個網(wǎng)格,網(wǎng)格中的每一個交叉點(diǎn)(n,m)表示測試模版中某一幀與訓(xùn)練模版中某一幀的交叉點(diǎn)。動態(tài)規(guī)劃算法可以歸結(jié)為尋找一條通過此網(wǎng)格中若干格點(diǎn)的路徑,路徑通過的格點(diǎn)即為測試和參考模版中距離計(jì)算的幀號。

 整個算法主要?dú)w結(jié)為計(jì)算測試幀和參考幀間的相似度及所選路徑的矢量距離累加。
 識別流程如圖3所示。

3  實(shí)驗(yàn)結(jié)果與性能分析及結(jié)論
 為測試上述識別性能,對其進(jìn)行了固定文本的說話人識別試驗(yàn)。試驗(yàn)中,采用電話信道863語料庫30個說話人共300個錄音文件,文件格式為16 bit線性PCM。為了模擬VoIP中語音壓縮幀,使用G.729聲碼器對原始語音文件進(jìn)行壓縮。使用每個說話人的一個文件訓(xùn)練成為模板。測試語音長度為10 s~60 s以5 s為間隔的共11個測試時間標(biāo)準(zhǔn)。這樣,模板庫中有30個模板,測試語音有270個,使用微機(jī)配置是:CPU Pentium 2.0 GHz,內(nèi)存512 MB。
 在實(shí)驗(yàn)中,M和N取64,通過各模版間的匹配,確定了判決門限為0.3時,識別效果最佳。
 為了對比DTW算法的識別性能,采用在傳統(tǒng)說話人識別中廣泛使用的GMM模型作為對比實(shí)驗(yàn),其中GMM模型使用與DTW算法相同的編碼流特征。
   圖4給出基于DTW識別方法與GMM模型(混元數(shù)64)識別G.729編碼方案863語料庫的文本相關(guān)說話人的誤識率對比圖。橫坐標(biāo)代表的測試語音的時長,縱坐標(biāo)代表識別誤識率。由實(shí)驗(yàn)結(jié)果可知在文本相關(guān)的說話人識別中,基于DTW算法的識別率在絕大多數(shù)情況下高于GMM模型,且隨著測試語音的增長,優(yōu)勢更明顯。

 為比較特征提取的時間性能和總的時間性能,實(shí)驗(yàn)條件如下:
   (1)選擇的50個說話人的語音只進(jìn)行特征提取,測試語音長度總和在25 min左右;
   (2)對測試語音分別進(jìn)行解碼識別和編碼流的識別,模板數(shù)為10個;
   (3)微機(jī)配置為:CPU Pentium 2.0 GHz,內(nèi)存512 MB。
   表1為特征提取時間比較結(jié)果,表2為說話人識別時間比較結(jié)果。

 由實(shí)驗(yàn)結(jié)果可以看出,在編碼比特流中進(jìn)行特征提取時間和識別的(上接第121頁)
時間都遠(yuǎn)小于解碼重建后的語音特征提取時間和識別時間,滿足實(shí)時說話人識別的需要。
    在文本相關(guān)的說話人識別中,對比使用同樣G.729壓縮碼流特征的GMM模型, DTW方法的識別率和處理效率均高于GMM模型,能夠?qū)崟r應(yīng)用于VoIP網(wǎng)絡(luò)監(jiān)管中。
參考文獻(xiàn)
[1]  石如亮.編碼域說話人識別技術(shù)研究[D].鄭州:解放軍信息工程大學(xué),2007.
[2]  PETRACCA M, SERVETTI A, DEMARTIN J C. Performance analysis of compressed-domain automatic speaker recognition as a function of speech coding technique and  bit rate [A]. In: International Conference on Multimedia and Expo (ICME) [C]. Toronto,Canada, 2006:1393-1396.
[3]  石如亮,李弼程,張連海,等. 基于編碼比特流的說話人識別[J].信息工程大學(xué)學(xué)報(bào),2007,8(3): 323-326.
[4]  王炳錫,屈丹,彭煊.實(shí)用語音識別基礎(chǔ)[M].北京:國防工業(yè)出版社,2004: 264-286.
[5]  李邵梅,劉力雄,陳鴻昶.實(shí)時說話人辨別系統(tǒng)中改進(jìn)的DTW算法[J].計(jì)算機(jī)工程,2008,34(4):218-219.
[6]  DUNN R B, QUATIERI T F, REYNOLDS D A. et al.  Speaker recognition from coded speech in matched and mismatched conditions [A]. In: Proc. Speaker Recognition Workshop’01 [C]. Grete, Greece, 2001:115-120.
[7]  AGGARWAL C C, OLSHEFSKI D, SAHA D et al. CSR: Speaker recognition from compressed VoIP packet stream [A]. In: International Conference on Multimedia and Expo (ICME) [C]. Amsterdam, Holand, 2005: 970-973.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
国产视频自拍一区| 亚洲欧美另类中文字幕| 国产精品成人一区二区| 欧美国产先锋| 欧美成人一区二区| 欧美 日韩 国产 一区| 久久婷婷蜜乳一本欲蜜臀| 久久精品国产99精品国产亚洲性色 | 国产精品毛片大码女人| 欧美日韩一二三区| 欧美精品九九| 欧美日韩国产黄| 欧美视频在线观看 亚洲欧| 欧美日韩不卡在线| 欧美日韩免费精品| 欧美午夜激情小视频| 欧美性一二三区| 国产精品久久久久久久一区探花 | 欧美综合国产精品久久丁香| 欧美一级理论性理论a| 亚洲欧美日韩直播| 欧美中文日韩| 亚洲国产中文字幕在线观看| 最新国产精品拍自在线播放| 亚洲第一黄色| 国产一区二区精品| 国产欧美在线观看一区| 欧美激情aaaa| 欧美精品三级在线观看| 欧美日韩国产首页在线观看| 欧美日韩在线影院| 国产精品一区二区三区久久| 国产欧亚日韩视频| 狠狠久久亚洲欧美| 亚洲人成久久| 亚洲小视频在线| 久久国产精品黑丝| 亚洲美女在线国产| 亚洲在线免费视频| 久久精品夜色噜噜亚洲a∨ | 久久成人av少妇免费| 久久天堂av综合合色| 欧美金8天国| 亚洲淫性视频| 亚洲精品一区在线观看香蕉| 一本一本大道香蕉久在线精品| 欧美黄色大片网站| 欧美日韩情趣电影| 久久久www成人免费毛片麻豆| 亚洲欧美日韩在线高清直播| 久久精品国内一区二区三区| 欧美xx69| 国产精品入口麻豆原神| 亚洲电影在线| 国内精品久久久久影院 日本资源| 欧美电影打屁股sp| 欧美网站在线| 99在线精品免费视频九九视| 国产午夜精品美女毛片视频| 1000部国产精品成人观看| 亚洲欧洲三级| 国产精品成人一区二区| 国产丝袜一区二区三区| 亚洲福利视频一区二区| 中国女人久久久| 久久国产欧美精品| 亚洲一区二区成人| 久久色在线观看| 国产精品成人免费| 在线日韩电影| 亚洲欧美成人精品| 99精品视频免费在线观看| 久久久国产精品亚洲一区| 欧美日本亚洲视频| 国内成人精品2018免费看 | 99成人免费视频| 久久电影一区| 亚洲欧美日韩精品久久| 欧美黄色aaaa| 国内成人精品2018免费看| 亚洲婷婷在线| 亚洲精品欧洲精品| 久久久国产亚洲精品| 欧美视频一区二区三区| 亚洲激情精品| 久久激情久久| 香蕉免费一区二区三区在线观看| 欧美顶级少妇做爰| 国产一区二区中文字幕免费看| 中文精品视频| 99精品视频免费观看| 卡通动漫国产精品| 国产亚洲欧美色| 亚洲男人的天堂在线aⅴ视频| 在线午夜精品自拍| 欧美激情久久久| 曰韩精品一区二区| 久久成人免费网| 欧美在线视频日韩| 国产精品日韩在线| 一区二区激情小说| 日韩视频在线观看国产| 美女精品在线| 国产综合在线视频| 欧美伊人久久| av成人免费在线| 欧美高清在线视频| 原创国产精品91| 亚洲国产欧美一区| 久久尤物视频| 国内精品亚洲| 久久精品亚洲一区| 可以看av的网站久久看| 在线播放豆国产99亚洲| 亚洲人成网站999久久久综合| 老司机久久99久久精品播放免费 | 1000部精品久久久久久久久| 亚洲国产成人91精品| 久久久久久亚洲精品杨幂换脸 | 91久久精品日日躁夜夜躁欧美| 久久综合九色综合久99| 国内精品久久久久影院色| 久久国产色av| 日韩午夜在线视频| 中文亚洲免费| 欧美激情一区二区三区成人| 揄拍成人国产精品视频| 最新国产乱人伦偷精品免费网站 | 亚洲一区bb| 欧美视频三区在线播放| 亚洲激情电影在线| 亚洲综合日韩| 性欧美暴力猛交69hd| 国产色视频一区| 久久国产精品久久精品国产| 久久久水蜜桃| 亚洲国产精品www| 一区二区三区 在线观看视| 欧美日韩视频一区二区| 亚洲天堂视频在线观看| 久久国产精品黑丝| 亚洲第一黄色网| 一本久久知道综合久久| 国产精品美女| 久久精品二区| 欧美激情视频在线播放| 亚洲视频 欧洲视频| 久久激情视频| 一区二区亚洲精品| 一本色道久久综合亚洲二区三区| 国产精品99免费看| 久久激情视频免费观看| 欧美激情影音先锋| 亚洲综合欧美日韩| 美女久久网站| 一道本一区二区| 久久精品水蜜桃av综合天堂| 亚洲大黄网站| 午夜精品久久久久影视| 伊人蜜桃色噜噜激情综合| 夜夜夜精品看看| 国产日产亚洲精品系列| 亚洲欧洲日韩综合二区| 国产精品久久久久毛片大屁完整版 | 一区二区三区久久网| 国产日韩欧美日韩大片| 91久久精品国产91久久| 国产精品老牛| 亚洲国产小视频| 国产精品国产自产拍高清av王其| 欧美在线91| 欧美日韩三级视频| 久久成人免费网| 欧美视频一区二区在线观看| 久久精品一区二区三区四区| 欧美日韩一区三区| 亚洲国产高清在线观看视频| 欧美日精品一区视频| 欧美在线不卡视频| 欧美日韩影院| 亚洲欧洲一区二区在线播放| 国产精品入口福利| 一本久道久久综合中文字幕| 国产一区二区三区日韩| 一区二区三区你懂的| 国内精品一区二区| 亚洲欧美日韩精品久久奇米色影视 | 亚洲精品你懂的| 国产网站欧美日韩免费精品在线观看 | 欧美激情第一页xxx| 欧美在线播放视频| 国产精品久久久久久亚洲调教| 日韩视频久久| 极品尤物久久久av免费看| 亚洲欧美日韩国产一区| 亚洲国产精品va在线观看黑人| 久久久www成人免费无遮挡大片| 在线视频精品| 欧美日韩国产综合视频在线| 久久精品一区二区三区四区 |