《電子技術應用》
您所在的位置:首頁 > 其他 > 業界動態 > 語音識別在家電遙控器中的應用

語音識別在家電遙控器中的應用

2008-12-22
作者:周季華 史媛媛 劉潤生

  摘? 要: 介紹一種適合家電遙控器應用的語音識別" title="語音識別">語音識別算法,該算法使用雙模" title="雙模">雙模板和兩級端點檢測" title="端點檢測">端點檢測方法,能有效地提高識別率和穩健性;介紹利用該技術實現的一種新型學習型遙控器,展現了語音識別技術在家電領域的廣闊前景。?

  關鍵詞: 語音識別? DTW? FED? FRED? 學習型遙控器?

?

  家用電器發展的一個重要方面是讓用戶界面更加人性化,更加方便自然,做到老年人和殘疾人可以無障礙地使用。利用語音識別技術實現語音控制是提高家電產品用戶界面質量的一條重要途徑。本文以語音控制遙控器為例,說明語音識別技術如何應用在家用電器領域。?

  適合家用電器應用的語音識別嵌入式系統結構如圖1所示,它由四個部分組成。第一部分為模/數轉換部分,其輸入端接收輸入的語音信號" title="語音信號">語音信號,并將其轉化成數字芯片可處理的數字采樣信號;在輸出端將解碼后的語音數字信號轉換為音頻模擬信號,通過揚聲器放聲。第二部分為語音識別部分,它的作用是對輸入的數字語音詞條信號進行分析,識別出詞條信號所代表的命令,一般由DSP完成。第三部分為語音提示和語音回放部分,它一般也是在DSP中完成的,其核心是對語音信號進行數字壓縮編碼和解碼,目的是提示用戶操作并對識別語音的響應,完成人機的語音交互。第四部分是系統控制部分,它將語音識別結果轉換成相應的控制信號,并將其輸出轉換成物理層操作,完成具體功能。語音識別與系統控制的有機結合是完成聲控交互的關鍵,下面將對語音識別算法及遙控系統控制部分作詳細的討論。

?

?

1 語音識別算法?

  目前,常以單片機(MCU)或DSP作為硬件平臺來實現消費類電子產品中的語音識別。這類語音識別主要為孤立詞識別,它有兩種實現方案:一種是基于隱含馬爾科夫統計模型(HMM)框架的非特定人" title="特定人">特定人識別;另一種是基于動態規劃(DP)原理的特定人識別。它們在應用上各有優缺點。HMM非特定人識別的優點是用戶無需經過訓練,可以直接使用;并且具有良好的穩定性(即對使用者而言,語音識別性能不會隨著時間的延長而降低)。但非特定人語音識別也有其很難克服的缺陷。首先,使用該方法需要預先采集大量的語料庫,以便訓練出相應的識別模型,這就大大提高了應用此技術的前期成本;其次,非特定人語音識別很難解決漢語中不同方言的問題,限制了它的使用區域;另外還有一個因素也應予以考慮,家電中用于控制的具體命令詞語最好不要完全固定,應當根據用戶的習慣而改變,這一點在非特定人識別中幾乎不可能實現。因此大多數家電遙控器不適合采用此方案。DP特定人識別的優點是方法簡單,對硬件資源要求較低;此外,這一方法中的訓練過程也很簡單,不需預先采集過多的樣本,不僅降低了前期成本,而且可以根據用戶習慣,由用戶任意定義控制項目的具體命令語句,因而適合大多數家電遙控器的應用。DP特定人識別的嚴重缺點是它的穩健性不理想,對有些人的語音識別率高,有的人識別率卻不高;剛訓練完時識別率較高,但隨著時間的推遲而識別率降低。這些缺點往往給用戶帶來不便。為克服這些缺陷,對傳統方法作了改進,使識別性能和穩健性都有顯著的提高,取得令人滿意的結果。?

1.1 端點檢測方法?

  影響孤立詞識別性能的一個重要因素是端點檢測準確性[4]。在10個英語數字的識別測試中,60毫秒的端點誤差就使識別率下降3%。對于面向消費類應用的語音識別芯片系統,各種干擾因素更加復雜,使精確檢測端點問題更加困難。為此,提出了稱為FRED(Frame-based Real-time Endpoint Detection)算法[3]的兩級端點檢測方案,提高端點檢測的精度。第一級對輸入語音信號,根據其能量和過零率的變化,進行一次簡單的實時端點檢測,以便去掉靜音得到輸入語音的時域范圍,并且在此基礎上進行頻譜特征提取工作。第二級根據輸入語音頻譜的FFT分析結果,分別計算出高頻、中頻和低頻段的能量分布特性,用來判別輕輔音、濁輔音和元音;在確定了元音、濁音段后,再向前后兩端擴展搜索包含語音端點的幀。FRED端點檢測算法根據語音的本質特征進行端點檢測,可以更好地適應環境的干擾和變化,提高端點檢測的精度。?

  在特定人識別中,比較了常用的FED(Fast Endpoint Detection)[5]和FRED兩種端點檢測算法的性能。兩種算法測試使用相同的數據庫,包括7個人的錄音,每個人說100個人名,每個人名讀3遍。測試中的DP模板訓練和識別算法為傳統的固定端點動態時間伸縮(DTW)模板匹配算法[4]。兩種端點檢測算法的識別率測試結果列在表1中。?

?

?

  測試結果說明:使用FRED端點檢測算法,所有說話人的識別率都有了不同程度的提高。因此,本系統采用這種兩級端點檢測方案。?

1.2 模板匹配算法?

  DTW是典型的DP特定人算法,為了克服自然語速的差異,用動態時間規整方法將模板特征序列和語音特征序列進行匹配,比較兩者之間的失真,得出識別判決的依據。?

  假設存儲的一個詞條模板包括M幀倒譜特征R={r(m);m=1,2,Λ,M};識別特征序列包括N幀倒譜特征T={t(n);n=1,2,Λ,N}。在r(i)和t(j)之間定義幀局部失真D(i,j),D(i,j)=|r(i)-t(j)|2,通過動態規劃過程,在搜索路徑中找到累積失真最小的路徑,即最優的匹配結果。采用對稱形式DTW:?

???

??? 其中S(i,j)是累積失真,D(i,j)是局部失真。?

  當動態規劃過程計算到固定結點(N,M)時,可以計算出該模板動態匹配的歸一化距離,識別結果即該歸一化距離最小的模板詞條:?

  為了提高DTW識別算法的識別性能和模板的穩健性,提出了雙模板策略,第一次輸入的訓練詞條存儲為第一個模板,第二次輸入的相同訓練詞條存儲為第二個模板,希望每個詞條通過兩個較穩健的模板來保持較高的識別性能。與上面測試相同,也利用7個人說的100個人名,每個人名念3遍的數據庫,比較DTW單模板和雙模板的性能差別,結果列在表2中。?

?

?

  測試結果說明:通過存儲兩個模板,相當大地提高了DTW識別的性能,其穩健性也有很大的提高。因此,對特定人識別系統,采用DTW雙模板是簡單有效的策略。?

  綜上所述,該嵌入式語音識別芯片系統采用了改進端點檢測性能的FRED算法,12階Mel頻標倒譜參數(MFCC)作為特征參數,使用雙模板訓練識別策略。通過一系列測試,證明該系統對特定人的識別達到了很好的識別性能,完全可以滿足家用電器中聲控應用的要求。?

2 語音控制遙控器設計?

  目前家用遙控器主要為按鍵式,并有兩種類型:一種是固定碼型,每個鍵對應一種或幾種碼型,都是生產廠家預先設定好的,用戶不能更改;另一種是學習型,具有自我學習遙控碼的功能,可由用戶定義遙控器的每個鍵對應的碼型,它能夠將多種遙控器集于一身,用一個遙控器就可控制多個家電,又可以作為原配遙控器的備份。由于現代家電功能不斷增加,上述兩種遙控器都有按鍵過多,用戶不易記住每個鍵的含義等問題。將語音識別技術應用于學習型遙控器,利用語音命令代替按鍵,制成語音控制的學習型遙控器。這樣,既方便了使用者對命令的記憶和使用,同時省去了大量按鍵,縮小了遙控器的體積。?

  語音控制遙控器的硬件框圖如圖2所示,它由兩個獨立的子模塊組成:語音信號處理模塊和系統控制模塊。?

?

?

  語音信號處理模塊由DSP、快閃存儲器(FLASH)、編解碼器(CODEC)組成。其中DSP是整個語音識別模塊的核心,負責語音識別、語音編解碼,以及FLASH的讀寫控制。DSP的優點是運算速度快、內存空間大、數據交換速度快,可用來實現復雜的算法,提高識別率,減小反應延時,得到較高的識別性能。DSP芯片選用Analog Devices公司的AD2186L,它具有如下特點:①運算速度達40MIPS,且均為高效的單周期指令;②提供了40K字節的片內RAM,其中8K字(16Bit/字)為數據RAM,8K字(24Bit/字)為程序RAM,最大可達4兆字節的存儲區,用于存儲數據或程序;③3.3V工作電壓,具有多種省電模式。AD2186L既能完成與語音信號處理相關的算法,又適合使用電池作能源的遙控器。FLASH和CODEC也都選用3.3V工作電壓的芯片。FLASH為美國ATMEL公司的AT29LV040A(4M Bit),它作為系統的存儲器,主要用于存放以下內容:提示語音合成所需的參數,特定人訓練后的碼本數據,DSP系統的應用程序和學習的遙控碼數據。CODEC選用美國TI公司的TLV320AC37,用來進行A/D、D/A變換、編碼和解碼。?

  系統控制模塊由單片機、紅外接收發送器、電源管理電路組成。單片機負責整個遙控器的系統控制。單片機作為主控芯片,進行鍵盤掃描,根據用戶通過鍵盤輸入的指令,分別完成學習遙控碼;控制DSP進行語音訓練、回放、識別;將識別結果轉換成相應的遙控碼,通過紅外發光管發射出去。單片機與DSP之間通過標準的RS232串口協議通訊。?

??? 系統的控制軟件流程圖如圖3所示。在使用前,按“學習鍵”進入學習狀態,用戶先對學習型遙控器訓練語音命令,并使其學習與各語音命令相對應的原遙控碼型。使用時按“識別鍵”,進入語音識別狀態,等待語音處理模塊返回結果,若返回正確的識別結果,則把相應的遙控碼發射出去。例如,原電視遙控器數字鍵“1”對應中央1臺,用戶的訓練命令為“中央1臺”,學習了原遙控器的數字鍵“1”的遙控碼,并使其與訓練命令“中央1臺”對應起來。于是使用時只需對著學習型遙控器的麥克風說出“中央1臺”,電視就會切換到中央1臺。這樣用戶不需要記住每個電視臺與臺號的對應關系,相對于枯燥的頻道數字,用戶自定義的命令更容易記住。?

?

?

  若連續30秒無正確的命令則遙控器進入休眠狀態,單片機控制電源管理電路切斷DSP和FLASH電源,單片機本身也進入休眠狀態,直至用戶按鍵,喚醒單片機,再由單片機控制恢復DSP和FLASH供電,重新開始工作。這是因為整個系統中,DSP的功耗最大,長時間不用時,關閉語音信號處理模塊,可以顯著地降低整個系統的功耗。?

  從實驗室走向市場的過程中,可靠性與成本是遇到的最大挑戰。采用雙模板的DTW和兩級端點檢測FRED算法,可在系統資源和反應延時增加極小的情況下,有效地提高識別率和穩健性。該項技術成功地運用在學習型遙控器上,展現了語音識別技術在家電領域的廣闊前景。?

參考文獻?

1 楊行峻,遲惠生.語音信號數字處理.北京:電子工業出版社?

2 鄭 方.ADSP-2100系列處理器原理及應用.北京:清華ADI DSP技術研究中心?

3 李虎生,劉 加,劉潤生.高性能漢語數碼語音識別算法.北京:清華大學學報(自然科學版)2000;40(1):32~34?

4 L.Rabiner,B.H.Juang.語音識別基本原理(影印版).北京:清華大學出版社,1999?

5 E.S.Dermatas.Fast Endpoint detection algorithm for isolated word Recongnition in offical Enaironment.ICASSP 1991:733~736
本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
久久一区欧美| 国产嫩草影院久久久久| 午夜激情综合网| 亚洲精品资源| 亚洲精品国产系列| 亚洲欧洲日韩在线| 最新国产乱人伦偷精品免费网站| 欧美在线视频二区| 亚洲欧美春色| 亚洲欧美一区二区视频| 亚洲一区二区三区久久| 亚洲视频成人| 亚洲视频一区| 亚洲午夜精品在线| 亚洲一区免费网站| 亚洲欧美另类在线观看| 亚洲一区精彩视频| 亚洲欧美激情精品一区二区| 亚洲在线观看视频| 亚洲免费中文| 先锋影院在线亚洲| 久久国产综合精品| 亚洲国产精品一区二区第四页av| 亚洲国产国产亚洲一二三| 久久精品国产在热久久| 亚洲东热激情| 日韩视频欧美视频| 这里只有精品视频在线| 亚洲欧美卡通另类91av| 午夜激情综合网| 久久精品亚洲国产奇米99| 久久久久久久一区二区三区| 久久亚洲欧洲| 欧美精品日韩精品| 欧美午夜精品伦理| 国产伦精品一区| 好看的日韩av电影| 亚洲狠狠婷婷| 亚洲视频电影在线| 欧美在线免费播放| 最近看过的日韩成人| 日韩天堂在线观看| 亚洲欧美日韩综合国产aⅴ| 久久精品国产成人| 欧美xxx在线观看| 欧美日韩在线三区| 国产日本欧美在线观看| 在线观看一区视频| 亚洲精品在线三区| 亚洲欧美怡红院| 亚洲国产精品一区二区第四页av| 一本色道久久综合狠狠躁的推荐| 亚洲免费网站| 美女免费视频一区| 欧美日韩一区二区精品| 国产精品久久久久99| 国产主播一区| 亚洲人成啪啪网站| 欧美一级淫片aaaaaaa视频| 91久久中文| 午夜精品久久久久久久久久久| 可以免费看不卡的av网站| 欧美日韩国产a| 国产亚洲欧美一区| 日韩视频在线播放| 欧美在线视频观看免费网站| av成人免费观看| 久久精品亚洲| 欧美性大战久久久久久久蜜臀| 国产一区二区日韩| 日韩一二三在线视频播| 久久国产成人| 午夜精品久久久久久久男人的天堂 | 久久精品卡一| 在线综合欧美| 美日韩在线观看| 国产精品久久精品日日| 亚洲黄色大片| 欧美一区中文字幕| 亚洲欧美国产视频| 欧美大色视频| 国产亚洲人成网站在线观看| 亚洲免费观看| 亚洲激情成人在线| 欧美主播一区二区三区| 欧美日韩视频不卡| 在线欧美三区| 欧美淫片网站| 欧美一级播放| 国产精品igao视频网网址不卡日韩| 在线成人中文字幕| 午夜在线观看免费一区| 亚洲一区二区高清| 欧美人与性动交α欧美精品济南到| 韩日欧美一区二区三区| 亚洲欧美另类国产| 亚洲专区一区| 欧美日韩高清在线观看| 亚洲国产cao| 久久精品日产第一区二区三区| 欧美一级网站| 国产精品大片免费观看| 99国内精品久久久久久久软件| 亚洲精品视频一区| 另类欧美日韩国产在线| 国产欧美日韩在线| 亚洲欧美日韩精品一区二区 | 免费成人小视频| 国产自产v一区二区三区c| 先锋影音久久| 久久国产日韩欧美| 国产日本欧美一区二区三区在线| 亚洲一区三区电影在线观看| 亚洲无限av看| 欧美日韩亚洲视频一区| 日韩手机在线导航| 在线视频免费在线观看一区二区| 欧美精品午夜视频| 亚洲欧洲美洲综合色网| 亚洲美女精品久久| 欧美日韩国产成人在线| 亚洲乱码国产乱码精品精可以看| 一本色道久久88综合日韩精品| 欧美精品一区二区三区在线播放| 最新成人av网站| 一本综合久久| 国产精品电影在线观看| 亚洲一区三区电影在线观看| 欧美一区二区精美| 国产日韩在线看| 久久精品动漫| 欧美freesex交免费视频| 亚洲国产另类 国产精品国产免费| 亚洲精品一区二区三区樱花| 欧美久久综合| 宅男66日本亚洲欧美视频| 亚洲欧美激情一区| 国产日韩精品久久久| 亚洲成在线观看| 欧美成人久久| 亚洲美女av网站| 亚洲欧美高清| 国产在线不卡精品| 91久久综合亚洲鲁鲁五月天| 欧美日韩国产精品一卡| 亚洲色图制服丝袜| 久久精品中文字幕一区| 精品999网站| 一区二区av在线| 国产精品一区久久久久| 亚洲第一区在线| 欧美啪啪一区| 亚洲一区三区电影在线观看| 久久精品夜色噜噜亚洲a∨| 亚洲国产精品美女| 亚洲淫性视频| 国内精品久久久久久久影视蜜臀| 亚洲精品自在久久| 国产精品国产三级国产| 久久精品99久久香蕉国产色戒| 欧美激情中文字幕一区二区| 一本大道av伊人久久综合| 久久精品国产一区二区三| 亚洲国产视频直播| 西西人体一区二区| 激情六月综合| 亚洲一区二区精品在线观看| 国产日韩精品视频一区| 亚洲精品一区二区三| 国产精品午夜av在线| 亚洲国产色一区| 国产精品美女久久久浪潮软件| 久久精品一区二区三区四区| 欧美日韩亚洲一区三区| 久久福利影视| 国产精品mv在线观看| 亚洲国产一区二区a毛片| 欧美亚洲成人精品| 亚洲国产精品va在线观看黑人 | 在线观看日韩专区| 午夜精品国产| 最新国产乱人伦偷精品免费网站| 午夜日韩福利| 亚洲精品国产精品国产自| 久久久国产精彩视频美女艺术照福利| 最新高清无码专区| 久久激五月天综合精品| 亚洲精品一区二区三区四区高清| 久久久国产精品一区| 一本色道久久综合精品竹菊| 玖玖玖免费嫩草在线影院一区| 中日韩视频在线观看| 欧美成人首页| 久久av在线看| 国产精品麻豆欧美日韩ww| 亚洲另类视频| 激情视频一区二区| 欧美一区二区三区四区夜夜大片| 亚洲三级网站| 欧美jizz19hd性欧美|