《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > 基于神經(jīng)網(wǎng)絡的深度解析

基于神經(jīng)網(wǎng)絡的深度解析

2019-06-28

  本來想把題目取為“從煉丹到化學”,但是這樣的題目太言過其實,遠不是近期可以做到的,學術研究需要嚴謹。但是,尋找適當?shù)臄?shù)學工具去建模深度神經(jīng)網(wǎng)絡表達能力和訓練能力,將基于經(jīng)驗主義的調(diào)參式深度學習,逐漸過渡為基于一些評測指標定量指導的深度學習, 是新一代人工智能需要面對的課題,也是在當前深度學習渾渾噩噩的大背景中的一些新的希望。

  這篇短文旨在介紹團隊近期的ICML工作——”Towards a Deep and Unified Understanding of Deep Neural Models in NLP”(這篇先介紹NLP領域,以后有時間再介紹類似思想解釋CV網(wǎng)絡的論文)。這是我與微軟亞洲研究院合作的一篇論文。其中,微軟研究院的王希廷研究員在NLP方向有豐富經(jīng)驗,王老師和關超宇同學在這個課題上做出了非常巨大的貢獻,這里再三感謝。

5d12f3492c025-thumb.png

  大家說神經(jīng)網(wǎng)絡是“黑箱”,其含義至少有以下兩個方面:一、神經(jīng)網(wǎng)絡特征或決策邏輯在語義層面難以理解;二、缺少數(shù)學工具去診斷與評測網(wǎng)絡的特征表達能力(比如,去解釋深度模型所建模的知識量、其泛化能力和收斂速度),進而解釋目前不同神經(jīng)網(wǎng)絡模型的信息處理特點。

  過去我的研究一直關注第一個方面,而這篇ICML論文同時關注以上兩個方面——針對不同自然語言應用的神經(jīng)網(wǎng)絡,尋找恰當?shù)臄?shù)學工具去建模其中層特征所建模的信息量,并可視化其中層特征的信息分布,進而解釋不同模型的性能差異。

  其實,我一直希望去建模神經(jīng)網(wǎng)絡的特征表達能力,但是又一直遲遲不愿意下手去做。究其原因,無非是找不到一套優(yōu)美的數(shù)學建模方法。深度學習研究及其應用很多已經(jīng)被人詬病為“經(jīng)驗主義”與“拍腦袋”,我不能讓其解釋性算法也淪為經(jīng)驗主義式的拍腦袋——不然解釋性工作還有什么意義。

  研究的難點在于對神經(jīng)網(wǎng)絡表達能力的評測指標需要具備“普適性”和“一貫性”。首先,這里“普適性”是指解釋性指標需要定義在某種通用的數(shù)學概念之上,保證與既有數(shù)學體系有盡可能多的連接,而與此同時,解釋性指標需要建立在盡可能少的條件假設之上,指標的計算算法盡可能獨立于神經(jīng)網(wǎng)絡結(jié)構和目標任務的選擇。

  其次,這里的“一貫性”指評測指標需要客觀的反應特征表達能力,并實現(xiàn)廣泛的比較,比如

  診斷與比較同一神經(jīng)網(wǎng)絡中不同層之間語義信息的繼承與遺忘;

  診斷與比較針對同一任務的不同神經(jīng)網(wǎng)絡的任意層之間的語義信息分

  比較針對不同任務的不同神經(jīng)網(wǎng)絡的信息處理特點。

  具體來說,在某個NLP應用中,當輸入某句話x=[x1,x2,…,xn]到目標神經(jīng)網(wǎng)絡時,我們可以把神經(jīng)網(wǎng)絡的信息處理過程,看成對輸入單詞信息的逐層遺忘的過程。即,網(wǎng)絡特征每經(jīng)過一層傳遞,就會損失一些信息,而神經(jīng)網(wǎng)絡的作用就是盡可能多的遺忘與目標任務無關的信息,而保留與目標任務相關的信息。于是,相對于目標任務的信噪比會逐層上升,保證了目標任務的分類性能。

  我們提出一套算法,測量每一中層特征f中所包含的輸入句子的信息量,即H(X|F=f)。當假設各單詞信息相互獨立時,我們可以把句子層面的信息量分解為各個單詞的信息量H(X|F=f) = H(X1=x1|F=f) + H(X2=x2|F=f) + … + H(Xn=xn|F=f). 這評測指標在形式上是不是與信息瓶頸理論相關?但其實兩者還是有明顯的區(qū)別的。信息瓶頸理論關注全部樣本上的輸入特征與中層特征的互信息,而我們僅針對某一特定輸入,細粒度地研究每個單詞的信息遺忘程度。

  其實,我們可以從兩個不同的角度,計算出兩組不同的熵H(X|F=f)。(1)如果我們只關注真實自然語言的低維流形,那么p(X=x|F=f)的計算比較容易,可以將p建模為一個decoder,即用中層特征f去重建輸入句子x。(2)在這篇文章中,我們其實選取了第二個角度:我們不關注真實語言的分布,而考慮整個特征空間的分布,即x可以取值為噪聲。在計算p(X=x,F=f) = p(X=x) p(F=f|X=x)時,我們需要考慮“哪些噪聲輸入也可以生成同樣的特征f”。舉個toy example,當輸入句子是"How are you?"時,明顯“are”是廢話,可以從“How XXX you?”中猜得。這時,如果僅從真實句子分布出發(fā),考慮句子重建,那些話佐料(“are” “is” “an”)將被很好的重建。而真實研究選取了第二個角度,即我們關注的是哪些單詞被神經(jīng)網(wǎng)絡遺忘了,發(fā)現(xiàn)原來“How XYZ you?”也可以生成與“How are you?”一樣的特征。

  這時,H(X|F=f)所體現(xiàn)的是,在中層特征f的計算過程中,哪些單詞的信息在層間傳遞的過程中逐漸被神經(jīng)網(wǎng)絡所忽略——將這些單詞的信息替換為噪聲,也不會影響其中層特征。這種情況下,信息量H(X|F=f)不是直接就可以求出來的,如何計算信息量也是這個課題的難點。具體求解的公式推導可以看論文,知乎上只放文字,不談公式。

  首先,從“普適性”的角度來看,中層特征中輸入句子的信息量(輸入句子的信息的遺忘程度)是信息論中基本定義,它只關注中層特征背后的“知識量”,而不受網(wǎng)絡模型參數(shù)大小、中層特征值的大小、中層卷積核順序影響。其次,從“一貫性”的角度來看,“信息量”可以客觀反映層間信息快遞能力,實現(xiàn)穩(wěn)定的跨層比較。如下圖所示,基于梯度的評測標準,無法為不同中間層給出一貫的穩(wěn)定的評測。

2.png

  下圖比較了不同可視化方法在分析“reverse sequence”神經(jīng)網(wǎng)絡中層特征關注點的區(qū)別。我們基于輸入單詞信息量的方法,可以更加平滑自然的顯示神經(jīng)網(wǎng)絡內(nèi)部信息處理邏輯。

3.png

  下圖分析比較了不同可視化方法在診斷“情感語義分類”應用的神經(jīng)網(wǎng)絡中層特征關注點的區(qū)別。我們基于輸入單詞信息量的方法,可以更加平滑自然的顯示神經(jīng)網(wǎng)絡內(nèi)部信息處理邏輯。

4.png

  基于神經(jīng)網(wǎng)絡中層信息量指標,分析不同神經(jīng)網(wǎng)絡模型的處理能力。我們分析比較了四種在NLP中常用的深度學習模型,即BERT, Transformer, LSTM, 和CNN。在各NLP任務中, BERT模型往往表現(xiàn)最好,Transformer模型次之。

  如下圖所示,我們發(fā)現(xiàn)相比于LSTM和CNN,基于預訓練參數(shù)的BERT模型和Transformer模型往往可以更加精確地找到與任務相關的目標單詞,而CNN和LSTM往往使用大范圍的鄰接單詞去做預測。

5.png

  進一步,如下圖所示,BERT模型在預測過程中往往使用具有實際意義的單詞作為分類依據(jù),而其他模型把更多的注意力放在了and the is 等缺少實際意義的單詞上。

6.png

  如下圖所示,BERT模型在L3-L4層就已經(jīng)遺忘了EOS單詞,往往在第5到12層逐漸遺忘其他與情感語義分析無關的單詞。相比于其他模型,BERT模型在單詞選擇上更有針對性。

7.png

  我們的方法可以進一步細粒度地分析,各個單詞的信息遺忘。BERT模型對各種細粒度信息保留的效果最好。

8.png

  十多年前剛剛接觸AI時總感覺最難的是獨立找課題,后來發(fā)現(xiàn)追著熱點還是很容易拍腦袋想出一堆新題目,再后來發(fā)現(xiàn)真正想做的課題越來越少,雖然AI領域中學者們的投稿量一直指數(shù)增長。

  回國以后,身份從博后變成了老師,帶的學生增加了不少,工作量也翻倍了,所以一直沒有時間寫文章與大家分享一些新的工作,如果有時間還會與大家分享更多的研究,包括這篇文章后續(xù)的眾多算法。信息量在CV方向應用的論文,以及基于這些技術衍生出的課題,我稍后有空再寫。

  作者介紹:

  張拳石,上海交通大學副教授。2009年獲北京大學機器智能學士學位,并于2011年和2014年獲得日本東京大學空間信息科學中心理科碩士和博士學位。2014年至2018年,他是加州大學洛杉磯分校的博士后研究員,師從朱松純教授。他的研究興趣涵蓋計算機視覺和機器學習。目前,他正在領導一個可解釋AI小組,相關主題包括可解釋神經(jīng)網(wǎng)絡、預訓練神經(jīng)網(wǎng)絡解釋,以及無監(jiān)督/弱監(jiān)督學習。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲精品欧美在线| 亚洲欧美卡通另类91av| 欧美日产在线观看| 欧美在线观看一区二区三区| 亚洲日本欧美| 亚洲欧美日韩国产综合| 亚洲成色777777在线观看影院| 欧美午夜片在线观看| 免费成人av在线| 亚欧美中日韩视频| 99成人精品| 久久精品视频导航| 亚洲直播在线一区| 日韩天堂在线视频| 精品99视频| 国产欧美精品一区二区三区介绍| 欧美日本网站| 欧美成熟视频| 久久久久久亚洲综合影院红桃| 亚洲自拍另类| 日韩亚洲欧美精品| 亚洲第一搞黄网站| 激情综合色综合久久| 国产精品日韩欧美一区二区三区| 欧美日韩精品一区| 牛牛国产精品| 老司机成人网| 久久在线观看视频| 久久久www成人免费无遮挡大片 | 亚洲资源av| 亚洲最新中文字幕| 亚洲精品在线一区二区| 久久精品视频亚洲| 欧美在线视频全部完| 欧美一区2区三区4区公司二百| 日韩视频第一页| 国产女精品视频网站免费| 国产精品久久久一本精品| 欧美日一区二区三区在线观看国产免| 欧美二区在线播放| 欧美韩日精品| 欧美高清在线一区| 欧美特黄一级大片| 国产精品国产成人国产三级| 欧美视频免费在线观看| 国产精品va在线播放我和闺蜜| 欧美性jizz18性欧美| 欧美性大战久久久久久久蜜臀| 欧美日韩另类在线| 欧美日一区二区在线观看| 欧美午夜寂寞影院| 国产精品日韩精品欧美在线| 国产精品自在在线| 国精产品99永久一区一区| 伊伊综合在线| 亚洲精品久久久久久下一站| 亚洲免费高清视频| 99精品国产高清一区二区| 一片黄亚洲嫩模| 在线亚洲免费| 夜夜精品视频| 亚洲宅男天堂在线观看无病毒| 午夜精品www| 亚洲成色777777女色窝| 亚洲国产成人tv| 亚洲精品一区二区三区av| 一本久久a久久免费精品不卡| 在线一区二区视频| 欧美亚洲午夜视频在线观看| 久久精品欧洲| 美日韩免费视频| 欧美日韩亚洲一区在线观看| 国产精品九色蝌蚪自拍| 国产夜色精品一区二区av| 在线观看91精品国产麻豆| 91久久久久久久久久久久久| 亚洲素人一区二区| 午夜精品国产更新| 亚洲欧美日韩国产综合| 久久久免费观看视频| 欧美高清一区| 欧美午夜宅男影院在线观看| 国产亚洲激情| 亚洲茄子视频| 亚洲欧美日本国产有色| 亚洲国产另类精品专区| 一区二区三区日韩欧美| 欧美专区18| 欧美韩日高清| 国产欧美日韩亚洲| 亚洲欧洲综合另类| 午夜伦理片一区| 日韩一本二本av| 欧美与欧洲交xxxx免费观看| 免费亚洲一区| 国产精品v日韩精品| 欧美精品97| 国产精品萝li| 韩国av一区二区三区四区| 亚洲高清久久| 亚洲欧美日韩一区二区三区在线观看| 一级日韩一区在线观看| 久久激情网站| 国产精品夜夜夜| 亚洲国语精品自产拍在线观看| 亚洲午夜精品一区二区| 亚洲激情视频在线播放| 欧美一区二区精品久久911| 欧美成人免费播放| 国产欧美日韩在线| 日韩视频免费在线观看| 久久精品一区二区三区中文字幕| 亚洲视频视频在线| 久久综合一区二区| 国产裸体写真av一区二区| 亚洲精品日本| 亚洲电影自拍| 欧美在线视屏| 欧美午夜片在线观看| 亚洲国产高清一区二区三区| 欧美一级二区| 亚洲欧美bt| 欧美日本一道本| 在线观看一区| 欧美一区二粉嫩精品国产一线天| 日韩一区二区电影网| 麻豆成人在线观看| 国产一二精品视频| 亚洲一区二区三区视频播放| 亚洲最快最全在线视频| 欧美成人免费视频| 狠狠色综合播放一区二区 | 国产在线不卡| 亚洲欧美日韩中文视频| 亚洲婷婷综合色高清在线| 欧美v国产在线一区二区三区| 国产一区二区三区精品欧美日韩一区二区三区 | 亚洲欧美在线aaa| 欧美视频在线播放| 亚洲精品国产欧美| 亚洲精品乱码视频| 久久野战av| 狠狠色综合色综合网络| 欧美一区二区在线| 久久精品综合一区| 国产亚洲福利一区| 欧美在线一级视频| 久久九九热re6这里有精品| 国产欧美欧美| 午夜精品www| 久久国产精品99国产精| 国产日韩一区| 欧美一区三区三区高中清蜜桃 | 欧美国产日韩a欧美在线观看| 国语自产精品视频在线看8查询8 | 销魂美女一区二区三区视频在线| 午夜精品视频在线观看| 国产精品久久久久久久久动漫| 一本色道久久88综合亚洲精品ⅰ| 一区二区高清视频在线观看| 欧美日韩国产一区| 日韩亚洲一区二区| 亚洲一区二区三区在线观看视频| 欧美四级在线观看| 亚洲一级二级| 欧美一区二区三区视频免费播放| 国产人妖伪娘一区91| 欧美一区二区三区播放老司机| 久久精品亚洲国产奇米99| 国产一区二区久久久| 91久久黄色| 亚洲小视频在线| 国产精品专区第二| 91久久亚洲| 国产精品久久中文| 亚洲激情一区| 国产精品久久网站| 亚洲国产日韩欧美综合久久| 欧美三日本三级少妇三2023| 欧美一区二区| 欧美日韩黄色大片| 欧美一区二区精品| 欧美日韩岛国| 欧美影院午夜播放| 欧美日韩精品免费观看视一区二区 | 亚洲一区黄色| 欧美激情精品久久久久久蜜臀| 亚洲欧美激情诱惑| 欧美国产日韩一区| 午夜精品www| 欧美日韩aaaaa| 欧美在线视频免费| 国产精品福利av| 亚洲欧洲在线一区| 国产久一道中文一区| 日韩一区二区精品在线观看| 国产亚洲欧美日韩精品| 亚洲网站视频福利| 亚洲国产你懂的| 久久久久久九九九九|