《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業界動態 > 扎克伯格的尷尬與 AI 的真實進展

扎克伯格的尷尬與 AI 的真實進展

2016-12-26
關鍵詞: 人工智能 扎克伯格

扎克伯格日前公開了他自己打造的 AI 管家,從演示結果看,其語音識別功能差強人意,而語音識別技術卻在今年各大公司報道中屢次取得突破,是當前 AI 發展代表領域之一。這就涉及到一個深層次的問題:本次 AI 熱潮起于深度學習的突破,但真要想創造價值并不能停步在深度學習技術本身——AI創造價值的鏈條比較長,必須打破軟硬的邊界,補全整個鏈條,價值才會體現出來。

近來扎克伯格向記者公開演示了他 2016 年的作品,一個類似 Jarvis 的人工智能助手,從記者的描述來看,這人工智能助手大部分時候還比較不錯,但在語音交互環節則不太理想,對此騰訊科技做了如下報道:

扎克伯格還建立了響應語音指令的系統,并通過定制iOS應用控制。但這部分展示不太理想,他重復了四次指令才讓系統弄明白:天黑前不要開燈。扎克伯格略顯尷尬地說:“喔,這應該是它最失敗的表現了!”。不過,Jarvis播放音樂的展示還算成功。扎克伯格下令:“給我們放段音樂吧!”幾秒鐘后,大衛·庫塔(David Guetta)的《Would I Lie to You》 開始通過客廳揚聲器響起來。他說了兩次“把音量調高”后,系統照做無誤。最后,他同樣說了兩次才讓系統停止播放。

這非常有意思,因為從新聞來看“天黑前不要開燈”和“把音量調高”的失誤顯然都不是命令理解(語義)上有問題,否則你說八百遍 Jarvis 該不好使還是不好使。如果不是語義的問題,那顯然就會和各大公司所宣稱的已經被解決的問題——語音識別有關。

標準環境解決≠真實效果好

關于語音識別的精度今年官方的報道一般是這樣的:

11月21日到23日,搜狗、百度和科大訊飛三家公司接連召開了三場發布會向外界展示了自己在語音識別和機器翻譯等方面的最新進展。值得注意的是,這三家公司幾乎在同一時段宣布了各自中文語音識別準確率達到了97%。

類似的報道也會發生在微軟等的身上,我們假設Facebook做的不是太差,水平也與此類似達到97%的準確率。97%的具體含義是100個單詞上只有3個錯誤(刪除、被替換、被插入),那么問題就來了,如果真實環境里真的達到了這個精度,那么小扎的演示絕對不應該是上面這個樣子。

那問題出在那里?

關鍵問題并不復雜,扎克伯格用手機當做家庭里的終端,這樣距離稍微一遠,環境稍微嘈雜一點,那再好的手機也沒辦法幫Jarvis聽清楚你在說什么。手機本身是設計給近場用的,手機上的語音識別基本也是給近場優化過的,怎么也不能彌補遠場上帶來的不適應。

扎克伯格對此非常坦誠,他在博客這么寫道:

In the case of Jarvis, training an AI that you'll talk to at close range is also different from training a system you'll talk to from all the way across the room, like Echo. These systems are more specialized than it appears, and that implies we are further off from having general systems than it might seem.(原文:

https://www.facebook.com/notes/mark-zuckerberg/building-jarvis/10154361492931634/)

上面這段英文簡單來講就是,語音識別更多時候是專門場景下好用,想做一個萬能的版本仍然還很遙遠。語音識別只能做限定場景的最佳。

但事實上扎克伯格仍然只認識到了部分問題,因為單純靠改善語音識別比如做一個匹配遠場的版本也還是解決不了他遇到的問題(上面說的重復指示幾次系統才起作用問題)。我們可以注意到開始播放音樂之后,報道中提到的兩條命令都需要重復兩次,這很可能是音樂自身對語音識別形成了干擾,這種情形下單純的優化語音識別(不管遠場還是近場)是解決不了問題的。

扎克伯格接下來的路

如果扎克伯格不放棄這事,而是持續對此進行改善,那下面會發生什么?他可能會掉到坑里面。他用了150小時做到上面那程度,但很可能再花1500小時,效果并沒有實質性改善。

整個語音交互事實上依賴于三層:聲學的信號處理(麥克風陣列+聲學算法),語音識別(SR),自然語言理解(NLU)。扎克伯格演示時的問題核心原因不在于自然語言理解(語義),而在于聲學與語音識別。聲學和語音識別的關系可以大致類比成耳朵和大腦,如果聲學部分的信號很差,那相當于耳朵不好使,基本語音識別的算法再怎么好也不可能把命令是什么弄清楚。

扎克伯格如果要優化效果,那么基本方法有下面幾類:

一種可能是扎克伯格覺得真實場景下的信號優化(聲學、硬件等)也沒什么,找幾個人做做就完了,如果這么想 Facebook 可能會自己組建個硬件、聲學團隊來做Echo Dot那樣的終端。但這么做很可能短期就不會有下次演示了。因為讓語音識別匹配前端聲學信號是容易的,但反過來讓牽涉硬件和物理的聲學來適應語音識別則基本會做掛。而在互聯網公司里通常后端偏算法的勢力會大,所以很容易走到前面那條路上去(這事情國內至少做掛了兩撥人了)。國內的大公司很容易走上這條路,但從分工習慣來看,國外公司更愿意在技術棧上卡住特定位置,非自己核心的部分會更愿意開放給其它人,所以扎克伯格這么干的可能性不高,除非他覺得自己也得搞Amazon Echo那種產品了。

一種可能是扎克伯格和深度學習科學家思路一致,認為所有東西都可以通過深度學習在云端算法層面來解決。這種思路下,就會通過深度學習來做降噪等信號層面的工作,用算法挑戰各種物理層面的問題。如果走上這條路,那估計短期也不會有下次演示了,因為他碰到的問題并非單純的降噪問題,回聲抵消、Beamforming、降噪、聲源定向這些東西是關聯在一起的,指望深度學習短期突破這些問題更像科研上的一種設想而非工程上的一種實踐?!霸O想”是說可以成為一種探索的思路,但結果完全沒譜,高度不確定,相當于把不確定性引入產品開發之中。

一種可能是扎克伯格走下一步的時候想的很清楚,知道自己這類公司的能力邊界,因此把這部分開放出去,讓專業的人做專業的事。物理的事情歸物理,算法的事情歸算法,這樣的話就會滿世界找聲學和遠場語音識別供貨商,但這反倒是最快的一種方式。

不知道扎克伯格具體會走那條路,如果是最后一種,我們聲智科技這樣的公司應該會很快收到消息。

打破原子與比特的邊界

扎克伯格這件事情事實上也提供了一個跳出來看AI的機會。

下圖是 Jarvis 的系統架構圖:

a0e2f6589e9a46e6903d7325206a5bce_th.jpeg  

一般來講,從產品體驗上可以看出技術水平,從架構圖則可以看出來認知上的差異。

根據上圖,顯然在扎克伯格這里 Jarvis 被理解成了一個命令控制型的系統,但感知這環節被忽略了,盡管扎克伯格自己在文章里也提到感知上下文是非常關鍵的一個環節(Understanding context is important for any AI)。

這種理解在互聯網企業那里很可能非常有代表性,但問題就在于感知恰恰是打造一個初級的Jarvis這樣的系統時最難的環節。因為感知總是要打穿原子和比特的邊界。Language Processing、Speech Recognition、Face Recognition 總是立刻可用的,只受限于算法的發展程度和數據,但感知部分不是這樣,不單要算法行,器件、生產都要行才能有好的結果。比如說麥克風陣列,你算法再好但MEMS麥克風不給力,那你一樣抓瞎。如果要說的短板的話,在深度學習突破后,感知這一環節才是真的短板。

這就涉及到這次AI突破的一個深層次問題:這次的AI起于深度學習的突破,但真要想創造價值并不能停步在深度學習本身。關鍵原因就在于其AI創造價值的鏈條比較長,必須打破軟硬的邊界,補全整個鏈條,價值才會體現出來。幾乎我們所有能想到的大機會都是這樣,語音交互(需要打穿聲學和識別邊界),自動駕駛(打穿計算機視覺、雷達、機械控制的邊界)等。這部分難度通常是被忽略了,似乎是有幾個深度學習專家問題就可以搞定一切問題。后者不是不行,但要限定在特定類別的事情上,比如圖普科技做的鑒黃等。正是同時做好軟硬這部分在拉長投資-回報的周期。投資和創業如果對此沒有自己的判斷,那準備的耐心可能就不夠。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
在线观看视频一区| 欧美中文字幕第一页| 国产欧美日韩精品在线| 欧美日韩一区二区三区四区在线观看| 美脚丝袜一区二区三区在线观看| 欧美一区二区免费| 亚洲欧美一区二区精品久久久| 一区二区不卡在线视频 午夜欧美不卡'| 亚洲电影毛片| 久久精品毛片| 久久精品一区蜜桃臀影院 | 久久高清福利视频| 欧美亚洲免费在线| 久久国产精品亚洲va麻豆| 久久精品91| 亚洲黄色毛片| 亚洲精品综合精品自拍| 亚洲精品资源| 在线亚洲成人| 亚洲一区日韩| 午夜精品视频在线观看一区二区 | 另类尿喷潮videofree| 浪潮色综合久久天堂| 毛片av中文字幕一区二区| 免费亚洲电影在线观看| 欧美黄色免费网站| 欧美日本一区二区三区 | 国产精品国产三级国产aⅴ浪潮| 欧美色精品天天在线观看视频| 欧美午夜一区二区三区免费大片 | 亚洲国产精品t66y| 亚洲三级影院| 亚洲一区二区精品视频| 性伦欧美刺激片在线观看| 欧美一区=区| 久久天天躁狠狠躁夜夜爽蜜月| 美女脱光内衣内裤视频久久影院| 欧美激情在线| 国产精品第十页| 国产性猛交xxxx免费看久久| 激情欧美国产欧美| 亚洲欧洲在线观看| 在线中文字幕不卡| 欧美亚洲一区二区在线| 亚洲欧洲一二三| 亚洲一区二区高清视频| 久久国产日本精品| 欧美mv日韩mv国产网站app| 欧美日韩精品综合| 国产伦精品一区二区三| 在线观看不卡| 在线一区二区日韩| 亚洲国产91精品在线观看| 99国产精品99久久久久久粉嫩| 午夜精品久久久久久99热| 久久影视精品| 欧美三级特黄| 国内外成人免费激情在线视频| 亚洲精华国产欧美| 亚洲一区自拍| 亚洲欧洲综合| 性欧美超级视频| 欧美福利视频在线| 国产女主播视频一区二区| 在线日韩av片| 亚洲一区二区三区乱码aⅴ蜜桃女| 久久精品首页| 亚洲专区欧美专区| 欧美成年人视频网站| 国产欧美精品在线观看| 亚洲破处大片| 欧美一区二区网站| 99在线|亚洲一区二区| 久久精品99| 欧美日韩一区在线观看视频| 国内成+人亚洲| 中文日韩欧美| 亚洲黑丝在线| 久久成人av少妇免费| 欧美日韩国产区| 黄色成人在线观看| 亚洲一区二区欧美| 99视频精品在线| 麻豆乱码国产一区二区三区| 国产精品视频网| 99精品视频免费在线观看| 亚洲国产精品一区二区第一页| 午夜一区在线| 欧美日韩国产综合视频在线观看中文 | 一区二区三区四区精品| 亚洲激情在线视频| 久久精品国产在热久久| 国产精品porn| 亚洲毛片在线看| 亚洲黄页视频免费观看| 欧美中文日韩| 国产精品视频网址| 中文亚洲欧美| 一区二区三区精品| 欧美精品自拍| 最近看过的日韩成人| 亚洲国产欧美一区二区三区同亚洲| 欧美亚洲免费电影| 国产精品成人一区二区三区夜夜夜| 亚洲激情六月丁香| 亚洲精品久久久久久久久久久久久 | 一区二区三区毛片| 欧美精品粉嫩高潮一区二区| 在线日韩电影| 亚洲欧洲另类| 欧美第十八页| 亚洲高清视频一区| 亚洲精品久久| 欧美高清在线观看| 亚洲激情av| 一本色道久久88综合亚洲精品ⅰ | 久久精品国产欧美激情| 国产精品乱码妇女bbbb| 中文日韩在线视频| 亚洲欧美日韩中文视频| 国产精品久久网站| 亚洲欧美国产精品va在线观看| 亚洲欧美在线aaa| 国产噜噜噜噜噜久久久久久久久| 亚洲欧美日韩另类精品一区二区三区 | 久久精品视频99| 国外成人在线| 亚洲国产视频直播| 欧美激情第8页| 日韩视频在线永久播放| 亚洲永久在线| 国产欧美日韩一区二区三区| 香蕉久久夜色精品国产| 久久青青草原一区二区| 在线成人www免费观看视频| 亚洲日韩成人| 欧美日韩免费观看中文| 亚洲天堂av高清| 欧美在线视频观看| 激情综合网激情| 99精品福利视频| 欧美视频日韩| 亚洲欧美文学| 久久综合伊人77777蜜臀| 91久久久一线二线三线品牌| 一区二区三区久久久| 国产精品嫩草影院一区二区| 午夜精品久久久久久久蜜桃app | 亚洲精品在线观看视频| 欧美日韩色综合| 亚洲欧美春色| 久久中文字幕导航| 亚洲精品美女91| 性欧美大战久久久久久久久| 黑人一区二区三区四区五区| 亚洲激情图片小说视频| 欧美日本三区| 午夜欧美精品| 欧美极品影院| 亚洲免费视频在线观看| 另类春色校园亚洲| 日韩一级精品| 久久麻豆一区二区| 亚洲精选视频在线| 久久精品国亚洲| 日韩网站在线看片你懂的| 欧美一区日韩一区| 亚洲国产精品传媒在线观看| 亚洲永久免费| 亚洲国产91| 羞羞漫画18久久大片| 亚洲国产精品成人综合色在线婷婷 | 午夜免费电影一区在线观看| 狠狠综合久久av一区二区老牛| 亚洲麻豆国产自偷在线| 国产毛片久久| 夜夜嗨av一区二区三区| 国产亚洲欧美一区在线观看| 一本色道久久综合亚洲精品不 | 国产精品成人v| 亚洲国产你懂的| 国产精品久久久久久久久久三级| 亚洲高清资源| 国产欧美日韩亚洲一区二区三区| 亚洲精品一区二区三区蜜桃久| 国产精品日韩精品欧美精品| 91久久午夜| 国产亚洲网站| 亚洲一区欧美一区| 亚洲黄色av| 久久久久久夜精品精品免费| 中文亚洲欧美| 欧美精品 日韩| 久久国产高清| 国产精品综合久久久| 一区二区冒白浆视频| 尤物网精品视频| 欧美在线国产| 亚洲素人一区二区| 欧美日韩精品久久|