《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業界動態 > 基于16位單片機的語音電子門鎖系統

基于16位單片機的語音電子門鎖系統

2008-08-25
作者:張 成,蔣皓石,林嘉宇

  摘 要: 介紹采用聲紋識別" title="聲紋識別">聲紋識別技術、在凌陽SPCE061A[1]單片機上實現的一種語音電子門鎖身份認證系統。實驗結果表明,系統性能穩定,識別效果好,可以推廣使用。
  關鍵詞: 聲紋識別 基音周期 線性預測 模式匹配 DTW


  生物識別技術[2]是利用人體生物特征進行身份認證的一種技術,是目前公認的最為方便與安全的識別技術。由于每個人的生物特征具有與其他人不同的惟一性和在一定時期內不變的穩定性,不易偽造和假冒,所以利用生物識別技術進行身份認定,安全、準確、可靠。
  在生物識別領域中,聲紋識別,也稱為說話人識別" title="說話人識別">說話人識別,以其獨特的方便性、經濟性和準確性等優勢受到世人矚目,并日益成為人們日常生活和工作中重要且普遍的安全認證方式。聲紋識別是一種根據說話人語音波形中反映說話人生理和行為特征的語音參數,自動識別說話人身份的技術。
  聲紋識別技術可分為兩類,即說話人辨認和說話人確認。前者用以判斷某段語音是若干人中的哪一個所說的,是多選一的問題;而后者用以確認某段語音是否是指定的某個人所說的,是一對一判別的問題。從另一方面,聲紋識別又有與文本有關和與文本無關兩種,根據特定的任務和應用,應用范圍不同。與文本有關的聲紋識別系統要求用戶按照規定的內容發音,每個人的聲紋模型逐個被精確地建立,而識別時也必須按規定的內容發音,因此可以達到較好的識別效果;而與文本無關的識別系統則不規定說話人的發音內容,模型建立相對困難,但用戶使用方便,應用范圍較寬。
  本文介紹的語音電子門鎖是一種在凌陽16位單片機SPCE061A上實現的與文本有關的說話人確認系統。該系統主要由說話人識別模塊、門鎖控制電機以及門鎖等部分組成。在訓練時,說話人的聲音通過麥克風進入說話人語音信號" title="語音信號">語音信號采集前端電路,由語音信號處理電路對采集的語音信號進行特征化和語音處理,提取說話人的個性特征參數" title="特征參數">特征參數并進行存儲,形成說話人特征參數數據庫。在識別時,將待識別語音與說話人特征參數數據庫進行匹配,通過輸出電路控制門鎖電機,最終實現對門鎖的控制。
1 算法原理
  說話人識別算法原理框圖如圖1所示。


1.1 預處理
  (1)去噪
  對麥克風輸入的模擬語音信號進行量化和采樣,獲得數字化的語音信號;再將含噪的語音信號通過去噪處理,得到干凈的語音信號后并通過預加重技術濾除低頻干擾,尤其是50Hz或60Hz的工頻干擾,提升語音信號的高頻部分,而且它還可以起到消除直流漂移、抑制隨機噪聲和提升清音部分能量的作用。
  (2)端點檢測
  本系統采用語音信號的短時能量和短時過零率進行端點檢測。語音信號的采樣頻率為8kHz,每幀數據為20ms,共計160個采樣點。每隔20ms計算一次短時能量和短時過零率。通過對語音信號的短時能量和短時過零率檢測可以剔除掉靜默幀、白噪聲幀和清音幀,最后保留對求取基音、LPCC等特征參數非常有用的濁音信號。
1.2 特征提取
  在語音信號預處理后,接著是特征參數的提取。特征提取的任務就是提取語音信號中表征人的基本特征。
1.2.1 特征參數的選取
  選取的特征必須能夠有效地區分不同的說話人,且對同一說話人的變化保持相對穩定,同時要求特征參數計算簡便,最好有高效快速算法,以保證識別的實時性。
  說話人特征大體可歸為下述幾類:
  (1)基于發聲器官如聲門、聲道和鼻腔的生理結構而提取的參數。如譜包絡、基音、共振峰等。其中基音能夠很好地刻畫說話人的聲帶特性,在很大程度上反映了人的個性特征。
  (2)基于聲道特征模型,通過線性預測分析得到的參數。包括線性預測系數(LPC)以及由線性預測導出的各種參數,如線性預測倒譜系數(LPCC)、部分相關系數、反射系數、對數面積比、LSP線譜對、線性預測殘差等。根據前人的工作成果和實際測試比較,LPCC參數不但能較好地反映聲道的共振峰特性,具有較好地識別效果,而且可以用比較簡單的運算和較快的速度求得。
  (3)基于人耳的聽覺機理,反映聽覺特性,模擬人耳對聲音頻率感知的特征參數。如美爾倒譜系數(MFCC)等。MFCC參數與基于線性預測的倒譜分析相比,突出的優點是不依賴全極點語音產生模型的假定,在與文本無關的說話人識別系統中MFCC參數能夠比LPCC參數更好地提高系統的識別性能[3]
  此外,人們還通過對不同特征參量的組合來提高實際系統的性能。當各組合參量間相關性不大時,會有較好的效果,因為它們分別反映了語音信號的不同特征。
  在計算機平臺的仿真實驗中,通過各種參數的實際比較,采用MFCC參數比采用LPCC參數有更好的識別效果。但在SPCE061A平臺上做實時處理時,與LPCC系數相比,MFCC系數計算有兩個缺點:一是計算時間長;二是精度難以保證。由于MFCC系數的計算需要FFT變換和對數操作,影響了計算的動態范圍;要保證系統識別的實時性,就只有犧牲參數精度。而LPCC參數的計算有遞推公式,速度和精度都可以保證,識別效果也滿足實際需要。
  本系統采用了基音周期和線性預測倒譜系數(LPCC)共同作為說話人識別的特征參數。
1.2.2 LPCC參數的提取
  基于線性預測分析的倒譜參數LPCC可以通過簡單的遞推公式由線性預測系數求得。遞推公式如下:
  
  其中p為LPC模型的階數,也是模型的極點個數。
  (1)LPC模型階數p的確定
  為使模型假定更好地符合語音產生模型,應該使LPC模型的階數p與共振峰個數相吻合,其次是考慮聲門脈沖形狀和口唇輻射影響的補償。通常一對極點對應一個共振峰,10kHz采樣的語音信號通常有5個共振峰,取p=10,對于8kHz采樣的語音信號可取p=8。此外為了彌補鼻音中存在的零點以及其他因素引起的偏差,通常在上述階數的基礎上再增加兩個極點,即分別是p=12和p=10。實驗表明,選擇LPC分析階數p=12,對絕大多數語音信號的聲道模型可以足夠近似地逼近。p值選得過大雖然可以略微改善逼近效果,但也帶來一些負作用,一方面是加大了計算量,另一方面有可能增添一些不必要的細節。
  (2)線性預測系數的求取
  自相關解法主要有杜賓(Durbin)算法、格型(Lattice)算法和舒爾(Schur)算法等幾種遞推算法。其中杜賓算法是目前最常用的算法,而且在求取LPC系數時計算量也最小,本系統采用該遞推算法[4]
1.2.3 基音參數的提取
  基音估計的方法很多,主要有基于短時自相關函數和基于短時平均幅度差函數(AMDF)等基音估計方法。
  (1)基于短時自相關函數的基音估計[4]
  短時自相關函數在基音周期的整數倍位置存在較大的峰值,只要找出第一最大" title="最大">最大峰值的位置就可以估計出基音周期。
  (2)基于短時平均幅度差函數(AMDF)的基音估計[4]
  基于短時平均幅度差函數(AMDF)在基音周期的整數倍位置存在較大的谷值,找到第一最大谷值的位置就可以估計出基音周期。這種方法的缺點是當語音信號的幅度快速變化時,AMDF函數的谷值深度會減小,從而影響基音估計的精度。
  實際上第一最大峰(谷)值點的位置有時并不能與基音周期吻合,第一最大峰(谷)值點的位置與短時窗的長度有關且會受到共振峰的干擾。一般窗長至少應大于兩個基音周期,才可能獲得較好的估計效果。語音中最長基音周期值約為20ms,本系統在估計基音周期時窗長選擇40ms。為了減小共振峰的影響,首先對語音進行頻率范圍為[60,900]Hz的帶通濾波。因為最高基音頻率為450Hz,所以將上限頻率設為900Hz可以保留語音的一、二次諧波,下限頻率為60Hz是為了濾除50Hz的電源干擾。
  以上兩種方法都是對語音信號本身求相應的函數。本系統采用的基音估計方法是:首先對帶通濾波后的短時語音信號進行線性預測,求取預測殘差;再對殘差信號求自相關函數,找出第一最大峰值點的位置,即得到該段語音的基音估計值。實驗表明,通過殘差求取的基音軌跡比直接通過語音求取的基音軌跡效果更好,如圖2所示。圖2中橫坐標為語音幀數,縱坐標為8000/f,其中f為基音頻率。


1.3 模式匹配
  目前針對各種特征參數提出的模式匹配方法的研究越來越深入。典型的方法[4]有:矢量量化方法、高斯混合模型方法、隱馬爾可夫模型方法、動態時間規整(DTW)方法和人工神經網絡方法。
  這些方法都有各自的優點和缺點。其中DTW算法對于較長語音的識別,模板匹配運算量太大,但對短語音(有效語音長度低于3s)的識別既簡單又有效,而且并不比其他方法識別率低,特別適用于短語音、與文本有關的說話人識別系統。本系統采用端點松弛兩點的(DTW)算法,端點松弛引起的計算量增加并不大,還可以放松對端點檢測的精度要求。
  動態時間規整(DTW)算法基于動態規劃的思想,解決了說話人不同時期發音長短、語速不一樣的匹配問題。DTW算法用于計算兩個長度不同的模板之間的相似程度,用失真距離表示。假設測試模板和參考模板分別用T和R表示,按時間順序含有N幀和M幀的語音參數(本系統為12維LPCC參數),失真距離越小,表示T、R越接近。把測試模板的各個幀號n=1~N在一個二維直角坐標系中的橫軸上標出,把參考模板的各幀號m=1~M在縱軸上標出,如圖3所示。通過這些表示幀號的整數坐標畫出縱橫線即形成網格,網格中的每一個交叉點(n,m)表示測試模板中某一幀與參考模式中某一幀的交會點,對應兩個向量的歐氏距離。DTW算法可以歸結為尋找一條通過此網格中若干交叉點的路徑,使得該路徑上節點的距離和(即失真距離)為最小[4]。對于端點松弛的情況,路徑搜索原理相同,只是增加了搜索路徑。


2 硬件系統
  語音電子門鎖系統的核心是說話人識別模塊。包括按鍵輸入、語音信號采集、語音信號處理、FLASH存儲擴展、揚聲器輸出、控制輸出以及LCD模組等。說話人識別模塊的原理框圖如圖4所示。其核心為語音信號處理,本系統選用特別適用于數字語音識別領域的凌陽16位單片機SPCE061A,并通過SPCE061A實現對其他各組成部分的編程控制。


  SPCE061A是凌陽公司開發的一種性價比非常高的16位單片機。在2.6V~3.6V工作電壓范圍內,工作頻率范圍為0.32MHz~49.152MHz,較高的處理速度使其能夠非常容易、快速地處理復雜的數字信號;中斷系統支持10個中斷向量以及14個可來自系統時鐘、定時器/計數器、時間基準發生器、外部中斷、鍵喚醒、通用異步串行通信及軟中斷的中斷源,非常適合實時應用領域;內嵌2K字的SRAM和32K字的FLASH,具有32位可編程的多功能I/O端口;包含有7通道10位通用A/D轉換器和內置麥克風放大器與自動增益控制AGC功能的單通道聲音A/D轉換器,以及具有音頻輸出功能的雙通道10位D/A轉換器;SPCE061A采用CMOS制造工藝,同時增加了軟件激發的弱振方式、空閑方式和掉電方式,系統處于備用狀態下(時鐘處于停止狀態),耗電僅為2μA 3.6V,極大地降低了其功耗;另外,μ’nSPTM的指令系統還提供具有較高運算速度的16位×16位的乘法運算指令和內積運算指令,為其應用增添了DSP功能,在復雜的數字信號處理方面既非常便利,又比專用的DSP芯片便宜得多。
  說話人識別模塊各組成部分完成的功能如下:
  (1)按鍵輸入部分:共有數字鍵、訓練鍵、刪除鍵、確認鍵和取消鍵等16個按鍵,用于密碼輸入和工作模式選擇。采用4×4矩陣式鍵盤輸入,只使用具有鍵喚醒功能IOA的低8位,可以合理利用硬件資源,且編程靈活。
  (2)語音信號采集部分:通過SPCE061A內置麥克風放大器與自動增益控制AGC功能的單通道聲音A/D轉換器完成8kHz語音信號采集。
  (3)FLASH存儲擴展部分:用于存儲說話人的個性特征參數參考模板。
  (4)揚聲器輸出部分:通過SPCE061A具有音頻輸出功能的雙通道10位D/A轉換器完成用戶訓練、識別等各種操作的語音提示。
  (5)控制輸出部分:通過SPCE061A的可編程I/O口控制門鎖控制電機。
  (6)LCD模組部分:用以顯示系統的工作狀態,該部分根據成本和實際需要可選。
  (7)SPCE061A:說話人的語音信號處理以及各部分的編程控制均由SPCE061A完成。
  說話人識別模塊有三種工作模式:訓練模式、認證模式和密碼模式,這三種模式都可通過工作模式按鍵選擇。
  (1)訓練模式,說話人的聲音通過麥克風進入語音信號采集前端電路。第一次語音輸入時,由16位單片機SPCE061A對采集的語音信號進行處理,提取說話人的個性特征參數,并存儲到外擴的FLASH內,形成說話人特征參數模板。可以進行三次訓練,第二語音輸入時,提取的個性特征參數與由第一次語音輸入形成的特征參數模板進行匹配,在匹配距離小于模板更新閾值時,將說話人特征參數模板更新為兩次特征參數的平均值。第三次語音輸入時,提取的個性特征參數與由第一、二次語音輸入形成的特征參數模板進行匹配,在匹配距離小于模板更新閾值時,將說話人特征參數模板更新為三次特征參數的平均值,形成最后的該說話人的特征參數模板。
  (2)認證模式,同樣通過麥克風錄入說話人的聲音,再由SPCE061A對采集的語音信號進行處理,將提取的說話人特征參數與存儲在外擴FLASH內的特征參數模板進行匹配,匹配距離小于認證閾值時,通過認證;然后再判斷匹配距離是否小于認證模式下的模板更新閾值,決定是否對模板進行更新。
  (3)密碼工作模式,在說話人感冒或其他使其聲音發生暫時改變的情況下,可以采用長密碼方式進行認證,以免因為非常原因被拒之門外。
  另外,每個用戶都有一個短密碼(用戶可自行修改),無論在訓練模式還是認證模式都要輸入此密碼,以形成或找到與該用戶相對應的特征參數模板。系統還設置一個具有長密碼的超級管理員用戶,可以通過鍵盤對用戶模板進行添加或刪除。
3 實驗結果
  對于說話人確認系統,表征其性能的最重要的兩個參量是拒識率和誤識率。前者是拒絕真實的說話人而造成的錯誤,后者是接受假冒者而造成的錯誤,二者與匹配閾值的設定相關。匹配閾值的設定與語音鎖系統的應用場合、功能側重有關,對于家庭、賓館等門鎖用戶,要求誤識率盡可能低,甚至為零;若用于公司員工考勤等同類功能,就不能有太高的拒識率。表1是對以下每種情況各進行100次實時匹配的結果,其中設定的閾值適合門鎖用戶。


  由以上實驗結果可知,對于同一個人相同發音的拒識率為8%;對于同一個人相似發音情況,因為系統是對說話的人進行判別,對于這種情況,無論拒絕或接受都是合理的;對于同一個人不同發音和不同人發音的情況,誤識率為零。使用錄音機錄音進行多次實驗,通過認證的次數為零。對于門鎖用戶,這個結果是十分理想的。若用于考勤等同類功能,可通過修改匹配閾值實現。
  聲紋識別與其他生物識別技術相比,除具有不會遺失和忘記、不需記憶、使用方便等優點外,還具有以下特性:用戶接受程度高,由于不涉及隱私問題,用戶無任何心理障礙;聲音輸入設備造價低廉,而其他生物識別技術的輸入設備通常造價昂貴。與利用虹膜、指紋和人臉等技術的門鎖相比,基于SPCE061A構建的語音電子門鎖系統具有成本低、使用方便、保密性好等優點。經大量實驗測試表明,該系統性能穩定、識別效果好。下一步將進行小批量的試用,以發現問題并加以完善。但是,在環境噪聲或干擾信號高于語音信號時,該系統將無法進行正確的語音識別,在背景噪聲處理及其工程實現上還需進一步改進。
參考文獻
1 http://www.unsp.com.cn
2 孫冬梅,裘正定.生物特征識別技術綜述.電子學報,2001;(12A)
3 S. Tsekeridou, C. Kotropoulos, A. Xafopoulos, I. Pitas.Com-parative study of speaker verification techniques based on vector quantization, sphericity models and dynamic time war-ping. in Proc. of European Conf. on Circuit Theory and De-sign, Helsinki, Finland, 2001
4 楊行峻,遲惠生.語音信號數字處理.北京:電子工業出版社,1995

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲一区3d动漫同人无遮挡| 久久蜜桃精品| 亚洲六月丁香色婷婷综合久久| 久久久国产亚洲精品| 亚洲校园激情| 国产精品99久久久久久久女警 | 欧美色图五月天| 欧美极品色图| 欧美精品乱码久久久久久按摩| 久久综合色影院| 久久久久久久久岛国免费| 欧美一区深夜视频| 欧美在线观看你懂的| 欧美一区二区高清| 久久精品成人一区二区三区| 久久精品观看| 久久伊人一区二区| 久久免费偷拍视频| 久久嫩草精品久久久久| 久久亚洲国产精品一区二区| 久久久久久伊人| 老司机67194精品线观看| 老司机精品视频一区二区三区| 久久久久国产精品一区二区| 久久久www成人免费无遮挡大片| 久久精品亚洲精品| 久久综合五月| 欧美国产日韩二区| 欧美日韩午夜剧场| 国产精品久久久久久久久搜平片 | 国产综合色产在线精品| 国内精品久久久久久久影视蜜臀 | 亚洲美女啪啪| 一区二区三区四区五区视频| 在线视频欧美日韩精品| 亚洲无线一线二线三线区别av| 亚洲视频www| 亚洲欧美综合精品久久成人| 欧美一区二区三区精品电影| 久久精品国产清高在天天线| 亚洲人精品午夜| 国产精品99久久久久久久女警| 亚洲免费在线精品一区| 欧美在线999| 久久综合影音| 欧美日韩久久| 国产麻豆精品视频| 国产一区二区三区四区hd| 伊人色综合久久天天| 91久久精品国产91性色tv| 一区二区三区精品视频| 午夜精品美女自拍福到在线| 亚洲二区在线视频| 一区二区三区产品免费精品久久75| 亚洲天堂偷拍| 久久精品在线免费观看| 欧美激情第4页| 国产精品黄视频| 在线高清一区| 一区二区三区日韩精品| 久久黄色网页| 亚洲午夜精品| 久久免费黄色| 欧美网站在线观看| 一区二区视频免费在线观看 | 欧美一区二区三区免费在线看| 美日韩丰满少妇在线观看| 欧美日韩精品高清| 国产真实乱偷精品视频免| 亚洲精品乱码久久久久久按摩观| 亚洲一区二区三区中文字幕| 亚洲国产精彩中文乱码av在线播放| 一本大道久久精品懂色aⅴ| 欧美在线观看网站| 欧美精品在线网站| 国产一区二区成人| 一区二区国产精品| 91久久视频| 久久成人18免费观看| 欧美人与性禽动交情品| 国语自产精品视频在线看| 一本色道久久加勒比88综合| 久久激情综合网| 亚洲女爱视频在线| 欧美不卡在线视频| 国产午夜精品久久久| 一区二区91| 亚洲精品国偷自产在线99热| 久久av一区二区三区漫画| 欧美日韩国产麻豆| 1204国产成人精品视频| 亚洲一区二区精品在线观看| 亚洲免费播放| 另类图片国产| 国产一区视频在线观看免费| 一区二区三区产品免费精品久久75 | 国产欧美日韩麻豆91| 亚洲精品视频在线观看网站| 久久国内精品视频| 欧美专区亚洲专区| 国产精品盗摄久久久| 亚洲国产影院| 亚洲国产成人在线| 久久久久久电影| 国产色产综合产在线视频| 中文在线一区| 在线亚洲欧美专区二区| 欧美电影免费观看| 在线成人国产| 亚洲国产精品免费| 久久深夜福利免费观看| 国产日韩欧美综合一区| 亚洲视频免费在线观看| 一本大道久久a久久精品综合| 欧美国产在线观看| 亚洲高清色综合| 亚洲人成在线观看网站高清| 麻豆freexxxx性91精品| 国内精品久久久久久久果冻传媒| 欧美亚洲三区| 久久久国际精品| 红桃视频一区| 亚洲黄色影片| 久久在线精品| 伊人天天综合| 亚洲精品在线观| 欧美激情一区二区三级高清视频| 1769国内精品视频在线播放| 亚洲激情影院| 欧美激情视频网站| 亚洲精选久久| 中文精品一区二区三区 | 亚洲毛片在线| 一区二区三区欧美日韩| 欧美日韩亚洲高清| 一本到高清视频免费精品| 亚洲综合视频网| 国产精品一区二区久激情瑜伽| 亚洲男人的天堂在线| 欧美一区1区三区3区公司| 国产欧美日韩精品专区| 欧美在线免费播放| 久热精品在线| 最新日韩欧美| 亚洲视频欧美在线| 国产精品夜夜夜| 先锋影音一区二区三区| 久久久久久九九九九| 亚洲国产精品成人精品| 一区二区国产日产| 欧美偷拍一区二区| 午夜精彩视频在线观看不卡| 久久久久久国产精品mv| 亚洲成色777777女色窝| av不卡在线| 国产精品入口福利| 久久成人综合网| 欧美极品色图| 亚洲综合不卡| 老司机精品导航| 日韩视频中午一区| 欧美一级黄色网| 激情久久久久久久| 在线视频亚洲一区| 国产麻豆91精品| 亚洲欧洲日本国产| 欧美丝袜一区二区| 欧美一区二视频| 欧美激情一区在线| 亚洲女人天堂av| 欧美成年人网| 亚洲一区在线观看免费观看电影高清| 久久精品国产久精国产爱| 亚洲国产经典视频| 欧美一区二区播放| 亚洲国产综合在线| 先锋影音久久| 亚洲国产精品久久91精品| 亚洲欧美成人一区二区三区| 国内精品久久久久伊人av| 一本大道久久精品懂色aⅴ| 国产日韩欧美亚洲一区| 亚洲精品国产系列| 国产目拍亚洲精品99久久精品| 亚洲三级电影全部在线观看高清| 国产精品xnxxcom| 亚洲欧洲精品一区二区三区不卡 | 亚洲国产精品ⅴa在线观看| 亚洲男人av电影| 亚洲激情网站| 久久精品一区二区三区四区 | 老**午夜毛片一区二区三区| 一级成人国产| 欧美不卡在线| 亚洲免费网址| 欧美日韩三级电影在线| 久久激情综合网| 国产色爱av资源综合区| 亚洲一区二区三区视频| 伊人男人综合视频网|