《電子技術應用》
您所在的位置:首頁 > 通信與網(wǎng)絡 > 業(yè)界動態(tài) > 智能語音科技簡史(2018版),這場技術革命從哪開始?

智能語音科技簡史(2018版),這場技術革命從哪開始?

2018-04-26

   1952年,貝爾實驗室(Bell Labs)制造一臺6英尺高自動數(shù)字識別機“Audrey”,它可以識別數(shù)字0~9的發(fā)音,且準確度高達90%以上。并且它對熟人的精準度高,而對陌生人則偏低。

  1956年,普林斯頓大學RCA實驗室開發(fā)了單音節(jié)詞識別系統(tǒng),能夠識別特定人的十個單音節(jié)詞中所包含的不同音節(jié)。

  1959年,MIT的林肯實驗室開發(fā)了針對十個元音的非特定人語音識別系統(tǒng)。

1524107969214034890.jpg

  二十世紀六十年代初,東京無線電實驗室、京都大學和NEC實驗室在語音識別領域取得了開拓性的進展,各自先后制作了能夠進行語音識別的專用硬件。

  1964年的世界博覽會上,IBM向世人展示了數(shù)字語音識別的“shoe box recognizer”。

  二十世紀七十年代,語音識別的研究取得了突破性的進展,研究重心仍然是孤立詞語語音識別。

  1971年,美國國防部研究所(Darpa)贊助了五年期限的語音理解研究項目,希望將識別的單詞量提升到1000以上。參與該項目的公司和學術機構包括IBM、卡內基梅隆大學(CMU)、斯坦福研究院。就這樣,Harpy在CMU誕生了。不像之前的識別器,Harpy可以識別整句話。

  二十世紀八十年代,NEC提出了二階動態(tài)規(guī)劃算法,Bell實驗室提出了分層構造算法,以及幀同步分層構造算法等。同時,連接詞和大詞匯量連續(xù)語音的識別得到了較大發(fā)展,統(tǒng)計模型逐步取代模板匹配的方法,隱馬爾科夫模型(HMM)成為語音識別系統(tǒng)的基礎模型。

  八十年代中期,IBM創(chuàng)造了一個語音控制的打字機—Tangora,能夠處理大約20000單詞。IBM的研究就是基于隱形馬爾科夫鏈模型(hidden Markov model),在信號處理技術中加入統(tǒng)計信息。這種方法使得在給定音素情況下,很有可能預測下一個因素。

  1984年,IBM發(fā)布的語音識別系統(tǒng)在5000個詞匯量級上達到了95%的識別率。

  1985年AT&T貝爾實驗室建造了第一個智能麥克風系統(tǒng),用來研究大室內空間的聲源位置追蹤問題。

  1987年開始,國家開始執(zhí)行963計劃后,國家863智能計算機主題專家組為語音識別研究立項,每兩年一次。

  1987年12月,李開復開發(fā)出世界上第一個“非特定人連續(xù)語音識別系統(tǒng)”。


1524107969275073830.jpg

    1988年,卡耐基梅隆大學結合矢量量化技術(VQ),用VQ/HMM方法開發(fā)了世界上第一個非特定人大詞匯量連續(xù)語音識別系統(tǒng)SPHINX,能夠識別包括997個詞匯的4200個連續(xù)語句。

1524107969323042643.jpg

  同年,清華大學和中科院聲學所在大詞庫漢語聽寫機的研制上取得了突破性進展。

  1990年,聲龍發(fā)布了第一款消費級語音識別產品Dragon Dictate,價格高達9000美元。

  1992年,IBM引入了它的第一個聽寫系統(tǒng),稱為“IBM Speech Server Series (ISSS)”。

  1992年研發(fā)的Sphinx-II在同年美國國防部先進技術研究計劃署(DARPA)資助的語音基準評測中獲得了最高的識別準確度,這主要得益于其在高斯混合和馬爾可夫狀態(tài)層次上用栓連參數(shù)平衡了可訓練性和高效性。

  1995年,Windows 95上首次搭載微軟SAPI,它使應用程序開發(fā)者能夠在Windows上創(chuàng)建語音程序。

  1995年,AT&T研究院的 Dave Ladd, Chris Ramming, Ken Rehor 以及 Curt Tuckey 在頭腦風暴關于互聯(lián)網(wǎng)會如何改變電話應用的時候,產生了一些新的想法:為什么不設計這樣一個系統(tǒng)來運行一種可以解析某種語音標記語言的語音瀏覽器,用來把互聯(lián)網(wǎng)的內容和服務提供到千家萬戶的電話上。于是,AT&T就開始“電話網(wǎng)絡項目”(Phone Web Project)。之后,Chris繼續(xù)留在AT&T,Ken去了朗訊,Dave和Curt去了摩托羅拉。(1999年初的時候,他們分別在各自的公司邁出了語音標記語言規(guī)范實質性的第一步。因為他們的密友關系,這幾家公司合作成立了一個VoiceXML論壇組織,IBM也作為一個創(chuàng)始公司加入了進來。)

  1997年IBM ViaVoice首個語音聽寫產品問世,你只要對著話筒喊出要輸入的字符,它就會自動判斷并且?guī)湍爿斎胛淖帧4文暧珠_發(fā)出可以識別上海話、廣東話和四川話等地方口音的語音識別系統(tǒng)ViaVoice’ 98。

  1998年,微軟在北京成立亞洲研究院,將漢語語音識別納入重點研究方向之一。

  2001年,比爾蓋茨在美國消費電子展上展示了一臺代號為MiPad的原型機。Mipad展現(xiàn)了語音多模態(tài)移動設備的愿景。

  2002年,中科院自動化所及其所屬模式科技公司推出了“天語”中文語音系列產品——Pattek ASR,結束了該領域一直被國外公司壟斷的局面。

  2002年,美國國防部先進技術研究計劃署(DARPA)首先啟動了EARS項目和TIDES 項目; 由于EARS項目過于敏感,EARS和TIDES兩個項目合并為“全球自主語言開發(fā)”(Global Autonomous Language Exploitation,GALE)。GALE目標是應用計算機軟件技術對海量規(guī)模的多語言語音和文本進行獲取、轉化、分析和翻譯。

  2006年,辛頓(Hinton)提出深度置信網(wǎng)絡(DBN),促使了深度神經(jīng)網(wǎng)絡(Deep Neural Network,DNN)研究的復蘇,掀起了深度學習的熱潮。

  2009年,辛頓以及他的學生默罕默德(D. Mohamed)將深度神經(jīng)網(wǎng)絡應用于語音的聲學建模,在小詞匯量連續(xù)語音識別數(shù)據(jù)庫TIMIT上獲得成功。

  2009年微軟Win7集成語音功能。

  2010年Google Vioce Action支持語音操作與搜索。

  2011年初,微軟的DNN模型在語音搜索任務上獲得成功。

  同年科大訊飛將DNN 首次成功應用到中文語音識別領域,并通過語音云平臺提供給廣大開發(fā)者使用。

1524107969383016858.jpg

  2011年10月,蘋果iPhone 4S發(fā)布,個人手機助理Siri誕生,人機交互翻開新篇章。

  2012年,科大訊飛在語音合成領域首創(chuàng)RBM技術。

  2012年,谷歌的智能語音助手Google Now 的形式出現(xiàn)在眾人面前,用在安卓 4.1 和 Nexus 手機上。

  2013年,Google發(fā)布Google Glass,蘋果也加大了對iWatch的研發(fā)投入,穿戴式語音交互設備成為新熱點。

  同年,科大訊飛在語種識別領域首創(chuàng)BN-ivec技術。

  2014 年,思必馳推出首個可實時轉錄的語音輸入板。

  2014年11月,亞馬遜智能音箱Echo發(fā)布。

  2015 年,思必馳推出首個可智能打斷糾正的語音技術。

1524107969432042194.jpg

  2016年,Google Assistant伴隨Google Home 正式亮相,搶奪亞馬遜智能音箱市場。(亞馬遜Echo在2016年的智能音箱市場占有率達到了巔峰的88%)

  同年,科大訊飛上線DFCNN(深度全序列卷積神經(jīng)網(wǎng)絡,Deep Fully Convolutional Neural Network)語音識別系統(tǒng)。

  同年11月,科大訊飛、搜狗、百度先后召開發(fā)布會,對外公布語音識別準確率均達到“97%”。

  2017年3月,IBM結合了 LSTM 模型和帶有 3 個強聲學模型的 WaveNet 語言模型。“集中擴展深度學習應用技術終于取得了 5.5% 詞錯率的突破”。相對應的是去年5月的6.9%。

  2017年8月,微軟發(fā)布新的里程碑,通過改進微軟語音識別系統(tǒng)中基于神經(jīng)網(wǎng)絡的聽覺和語言模型,在去年基礎上降低了大約12%的出錯率,詞錯率為5.1%,聲稱超過專業(yè)速記員。相對應的是去年10月的5.9%,聲稱超過人類。

  2017年12月,谷歌發(fā)布全新端到端語音識別系統(tǒng)(State-of-the-art Speech Recognition With Sequence-to-Sequence Models),詞錯率降低至5.6%。相對于強大的傳統(tǒng)系統(tǒng)有 16% 的性能提升。

  市場分析公司Canalys在2018年1月分布一份報告,其預測2018年將是普及智能音箱的“決定性一年”,相比全年出貨量剛過3000萬臺的2017年,2018年智能音箱全球出貨量預計將達到5630萬臺。

 

1524107969473000577.jpg

  中投顧問發(fā)布的《2018-2022年中國智能語音行業(yè)深度調研及投資前景預測報告》顯示我國智能語音市場整體處于啟動期,智能車載,智能家居,智能可穿戴等垂直領域處于爆發(fā)前夜。

  

1524107969514008009.jpg

  文章引用

  [1] 李曉雪. 基于麥克風陣列的語音增強與識別研究[D]. 浙江大學, 2010.

  [2] 倪崇嘉, 劉文舉, 徐波. 漢語大詞匯量連續(xù)語音識別系統(tǒng)研究進展[J]. 中文信息學報, 2009, 23(1):112-123.

  [3] 高朝煌. 非特定人漢語連續(xù)數(shù)字語音識別系統(tǒng)的研究與實現(xiàn)[D]. 西安電子科技大學, 2011.

  [4] 《2017年的語音識別,路只走了一半》

  [5] 《2018-2022年國內外智能語音發(fā)展的分析》

  [6] 《四十年的難題與榮耀—從歷史視角看語音識別發(fā)展》

  [7] 《幾個常見的語音交互平臺的簡介和比較》

  [8] 《VoiceXML簡介》

  [9] 《思必馳官方介紹資料》


本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美视频第二页| 在线观看国产欧美| 久久精品免费播放| 亚洲欧美日韩国产综合| 在线一区观看| 一区二区三区欧美激情| av成人老司机| 一区二区日韩免费看| av不卡免费看| av成人免费观看| 一区二区av在线| 99精品国产热久久91蜜凸| 亚洲精品四区| 日韩视频免费在线| 99精品国产高清一区二区| 一二美女精品欧洲| 亚洲婷婷综合久久一本伊一区| 亚洲最黄网站| 一二三四社区欧美黄| 宅男66日本亚洲欧美视频| 一区二区毛片| 亚洲欧美www| 欧美一区二区三区播放老司机 | 久久狠狠亚洲综合| 欧美专区在线观看| 香蕉成人伊视频在线观看| 亚洲一区二区三区色| 亚洲毛片av在线| 亚洲精品一区二区三区在线观看 | 亚洲精品国产视频| 亚洲精品一区在线观看| 9l视频自拍蝌蚪9l视频成人 | 亚洲婷婷综合色高清在线 | 亚洲一区二区成人| 亚洲自拍偷拍麻豆| 久久久精品国产99久久精品芒果| 久久婷婷人人澡人人喊人人爽| 男人的天堂亚洲| 欧美精品aa| 国产精品亚洲综合| 狠狠爱www人成狠狠爱综合网| 曰韩精品一区二区| 99视频国产精品免费观看| 亚洲伊人观看| 亚洲福利视频一区二区| 夜夜嗨av一区二区三区中文字幕| 亚洲一区图片| 久久久久欧美精品| 欧美理论电影在线观看| 国产精品女主播在线观看| 韩国三级电影久久久久久| 亚洲欧洲中文日韩久久av乱码| 亚洲视频免费在线| 久久激情网站| 亚洲一区二区三区涩| 久久频这里精品99香蕉| 欧美母乳在线| 国产一区二区三区黄| 亚洲精品国产拍免费91在线| 亚洲欧美日韩在线高清直播| 亚洲三级视频在线观看| 亚洲欧美国产日韩中文字幕| 久久综合网hezyo| 欧美视频在线观看| 激情久久五月| 亚洲午夜精品网| 亚洲精品美女免费| 久久国产精品黑丝| 欧美日韩免费观看一区三区| 国产日韩欧美在线视频观看| 亚洲精品1区2区| 欧美一区二区三区视频在线观看| 中文日韩欧美| 美国十次成人| 国产区二精品视| 亚洲精品一区二区三区福利| 久久精品国产清自在天天线| 亚洲欧美日韩国产中文| 欧美国产一区视频在线观看| 国产一区二区欧美| 亚洲天堂激情| 亚洲免费精彩视频| 久久伊伊香蕉| 国产麻豆一精品一av一免费| 亚洲美女福利视频网站| 亚洲福利在线视频| 欧美在线免费视屏| 欧美午夜在线视频| 亚洲国产激情| 亚洲福利电影| 久久久国产精品一区二区中文| 国产精品久久久久久影视| 最新中文字幕一区二区三区| 久久国产免费| 久久riav二区三区| 国产精品黄视频| 99热在这里有精品免费| 日韩一区二区精品视频| 免费高清在线一区| 加勒比av一区二区| 欧美影视一区| 久久国产精品色婷婷| 国产精品主播| 亚洲女女女同性video| 亚洲在线观看免费视频| 欧美人与性动交a欧美精品| 亚洲国产女人aaa毛片在线| 久久成人久久爱| 久久精品一区二区国产| 国产日韩精品在线观看| 亚洲免费在线精品一区| 亚洲欧美999| 国产精品s色| 一本色道久久综合亚洲精品不卡| 日韩一区二区精品视频| 欧美久久电影| 日韩视频一区| 亚洲色图在线视频| 欧美日韩大片| aa成人免费视频| 亚洲视频自拍偷拍| 欧美日韩一区在线视频| 99人久久精品视频最新地址| 国产精品99久久不卡二区| 欧美日韩第一页| 一区二区国产日产| 亚洲欧美国产视频| 国产精品自在在线| 欧美与欧洲交xxxx免费观看 | 欧美日韩成人在线播放| 亚洲精品一区二| 亚洲图片欧美一区| 国产精品一区毛片| 欧美在线网站| 美女视频一区免费观看| 亚洲国产精品一区在线观看不卡 | 99精品欧美一区二区三区综合在线| 一区二区av在线| 欧美三级午夜理伦三级中文幕| 一区二区三区高清不卡| 亚洲欧美影音先锋| 国内偷自视频区视频综合| 亚洲激情在线视频| 欧美日韩精品国产| 亚洲免费网站| 久久亚洲精品网站| 91久久夜色精品国产九色| 正在播放欧美一区| 国产欧美亚洲精品| 亚洲国产一区二区三区高清| 欧美片第一页| 亚洲自拍偷拍福利| 另类综合日韩欧美亚洲| 亚洲精品久久久久久一区二区| 亚洲一区二区三区欧美| 国产亚洲午夜| 99re6热只有精品免费观看| 国产精品久久久久久久久免费樱桃| 香蕉av777xxx色综合一区| 嫩草伊人久久精品少妇av杨幂| 日韩一区二区久久| 久久国产精品免费一区| 亚洲国产精品999| 亚洲欧美视频一区| 娇妻被交换粗又大又硬视频欧美| 一本色道久久综合亚洲二区三区| 国产老女人精品毛片久久| 亚洲福利视频网| 欧美系列亚洲系列| 久久精品国产99国产精品| 欧美日本在线看| 欧美永久精品| 欧美日韩在线观看一区二区| 午夜精品久久久久久久久| 欧美大片免费观看| 亚洲一区自拍| 欧美精品久久99久久在免费线| 亚洲欧美日韩综合aⅴ视频| 欧美福利视频在线| 午夜精品久久久久久久| 欧美极品在线播放| 欧美一级片在线播放| 欧美精品18videos性欧美| 性色av香蕉一区二区| 欧美精品三级日韩久久| 欧美亚洲在线视频| 欧美日韩一区二区三区高清| 欧美一区国产在线| 国产精品成人一区二区三区吃奶 | 精品成人a区在线观看| 亚洲午夜激情免费视频| 影音先锋日韩有码| 久久av免费一区| 一区二区三区日韩欧美| 免费美女久久99| 欧美一区二区| 国产精品理论片在线观看| 日韩网站在线观看| 激情欧美一区二区三区| 欧美亚洲网站|