《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > CoNLL 2018 | 最佳論文揭曉:詞嵌入獲得的信息遠比我們想象中的要多得多

CoNLL 2018 | 最佳論文揭曉:詞嵌入獲得的信息遠比我們想象中的要多得多

2018-10-31

CoNLL自然語言處理領域的頂級會議,每年由 SIGNLL 組織舉辦。CoNLL 2018 大會將于 10 月 31 日-11 月 1 日在比利時布魯塞爾舉行,地點與 EMNLP 2018 一樣(EMNLP 2018 將于 10 月 31 日-11 月 4 日舉行)。


昨日,CoNLL 公布了最佳論文,由來自西班牙巴斯克大學 IXA NLP 組的 Mikel Artetxe 等人獲得。該論文展示了詞嵌入模型能夠捕獲不同層面的信息(如語義/句法和相似度/相關度),為如何編碼不同的語言信息提供了新的視角,該研究還研究了內外部評估之間的關系。

 

近年來,詞嵌入成為自然語言處理的核心主題。業內提出了多種無監督方法來高效地訓練單詞的密集型向量表征,且成功地應用到語法解析、主題建模、文檔分類等多類任務。


機器之心Synced詞嵌入小程序


雖然從理論角度理解這些模型是更加活躍的研究路線,但這些研究背后的基本思路都是為類似的單詞分配類似的向量表征。由此,大部分詞嵌入模型依賴來自大型單語語料庫的共現統計信息(co-occurrence statistics),并遵循分布假設,也就是相似單詞傾向于出現在相似語境中。


然而,上述論點沒有定義「相似單詞」的含義,且詞嵌入模型實際中應該捕捉哪種關系也不完全清楚。因此一些研究者在真正相似度(如 car - automobile)與關聯度(如 car - road)之間進行區分。從另一個角度來說,詞語相似度可聚焦在語義(如 sing-chant)或者句法(如 sing-singing)上。我們把這兩個方面作為相似度的兩個坐標軸,且每一個坐標軸的兩端為兩種性質:語義/句法軸和相似度/關聯度軸。


本論文提出了一種新方法來調整給定的任意嵌入向量集,使其在這些坐標軸中靠近特定端點。該方法受一階和二階共現研究的啟發,可推廣為詞嵌入向量線性變換的連續參數,我們稱之為相似度階(similarity order)。雖然業內提出了多種學習特定詞嵌入的方法,但之前的研究明確地改變了訓練目標,且總是依賴知識庫這樣的外部資源。而本論文提出的方法可用做任意預訓練詞嵌入模型的后處理,不需要任何額外資源。同樣,該研究表明,標準的詞嵌入模型能夠編碼不同的語言信息,但能夠直接應用的信息有限。此外,該研究也分析了該方法與內部評估和下游任務的關系。該論文主要貢獻如下:


1. 提出了一個具備自由參數的線性變換,能夠調整詞嵌入在相似度/關聯度和語義/句法坐標軸中的性能,并在詞匯類推數據集和相似度數據集中進行了測試。


2. 展示了當前詞嵌入方法的性能受到無法同時顯現不同語言信息(例如前面提到的坐標軸)的限制。該研究提出的方法表明,詞嵌入能夠捕獲的信息多于表面顯現出的信息。


3. 展示了標準的內部評估只能給出一個靜態的不完整圖景,加上該研究提出的方法能夠幫助我們更好地理解詞嵌入模型真正編碼哪些信息。


4. 展示了該方法也能運用到下游任務中,但相比于使用一般詞嵌入作為輸入特征的監督系統,其效果在直接使用詞嵌入相似度的無監督系統上更顯著,因為監督系統有足夠的表達能力來學習最優變換。


總之,該研究揭示了詞嵌入如何表示不同語言信息,分析了它在內部評估和下游任務中所扮演的角色,為之后的發展開創了新機遇。


論文:Uncovering divergent linguistic information in word embeddings with lessons for intrinsic and extrinsic evaluation

微信圖片_20181031230220.jpg


論文鏈接:https://arxiv.org/abs/1809.02094


摘要:隨著詞嵌入最近取得成功,有人認為根本不存在詞的理想表征,因為不同的模型傾向于捕捉不同且往往互不兼容的方面,如語義/句法和相似性/相關性。本論文展示了每個詞嵌入模型捕獲的信息多于直接顯現的信息。線性轉換無需任何外部資源就能調整模型的相似度階,因此能夠調整模型以在這些方面獲得更好的結果,這為詞嵌入編碼不同的語言信息提供了新的視角。此外,我們還探索了內、外部評估的關系,我們在下游任務中的變換效果在無監督系統中的效果優于監督系統。


機器之心Synced非監督學習小程序


內部評估

微信圖片_20181031230254.jpg

表 1:原始嵌入以及具備對應 α 值的最佳后處理模型的內部評估結果。評估指標是詞匯類比任務的準確率和詞語相似度的斯皮爾曼等級相關系數。

微信圖片_20181031230312.jpg

圖 1:詞匯類比任務中,不同 α 值所對應的相對誤差減少,原始嵌入的 α = 0。


外部評估

微信圖片_20181031230329.jpg

表 2:原始嵌入和具備對應 α 值的最佳后處理模型的語義文本相似度結果,衡量標準為皮爾遜相關系數。DAM 分數是 10 次運行的平均得分。

微信圖片_20181031230347.jpg


圖 3:不同 α 值對應的語義文本相似度結果。DAM 分數是 10 次運行的平均得分。


討論


我們認為該研究為嵌入編碼不同語言信息提供了新的視角,其與內外部評估之間的關系如下所示:


標準內部評估提供的是不同詞嵌入模型編碼的靜態、不完整信息圖。

使用預訓練嵌入作為特征的監督系統具備足夠的表達能力來學習任務的最優相似度階。

盡管我們的研究展示了嵌入捕獲的默認相似度階對較大的學習系統影響較小,但它未必是最優的整合策略。如果研究者認為某個相似度階可能更適合某個下游任務,則他/她設計的整合策略很可能鼓勵這個相似度階,我們認為這是未來一個有趣的研究方向。例如,研究者可以設計正則化方法去懲罰預定義相似度階的較大偏差。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲精品日本| 久久久国产成人精品| 亚洲美女电影在线| 国产日韩精品视频一区二区三区| 欧美11—12娇小xxxx| 亚洲免费视频中文字幕| 亚洲国产片色| 欧美一区二区三区四区高清| 亚洲精品乱码久久久久久久久 | 欧美日韩一级黄| 久久亚洲精品伦理| 久久aⅴ国产欧美74aaa| 亚洲一区二区免费视频| 99国产精品视频免费观看一公开 | 亚洲视频免费观看| 亚洲精选大片| 亚洲成人自拍视频| 狠狠色丁香婷婷综合影院| 国产精品中文字幕欧美| 欧美色偷偷大香| 欧美人与性动交a欧美精品| 久久亚洲免费| 亚洲免费成人av| 一区二区欧美激情| 亚洲伦理在线观看| 亚洲欧洲日本在线| 激情综合激情| 狠狠色狠色综合曰曰| 国产视频在线观看一区二区| 国产精品久久久久久久久免费| 欧美三级午夜理伦三级中文幕| 欧美激情精品久久久| 欧美成人性网| 欧美3dxxxxhd| 欧美风情在线| 老巨人导航500精品| 久久婷婷国产综合尤物精品| 久久久久久久999| 老色批av在线精品| 久久久久国产一区二区| 久久久水蜜桃| 久久综合久色欧美综合狠狠| 另类av一区二区| 欧美大尺度在线观看| 欧美成人激情在线| 午夜精品一区二区三区在线视| 亚洲影院高清在线| 久久亚洲国产精品一区二区| 亚洲在线一区二区三区| 亚洲高清视频中文字幕| 亚洲第一黄网| 一区二区免费在线视频| 欧美伊人久久大香线蕉综合69| 91久久综合| 亚洲综合日韩在线| 久久嫩草精品久久久精品一| 欧美精品一区二| 国产区日韩欧美| 亚洲激情视频网| 亚洲欧美另类在线观看| 久久精品国产亚洲一区二区| 一二美女精品欧洲| 久久精品视频导航| 欧美日韩一区自拍| 一区国产精品| 亚洲一区区二区| 亚洲激情一区二区| 欧美一级黄色录像| 欧美国产欧美亚洲国产日韩mv天天看完整| 欧美视频日韩视频在线观看| 国产有码在线一区二区视频| 日韩天堂在线视频| 亚洲第一网站| 午夜精品网站| 欧美日本不卡视频| 影音先锋日韩有码| 午夜久久tv| 欧美日韩福利视频| 免费在线欧美黄色| 国产欧美日韩亚洲| 亚洲美女啪啪| 亚洲高清不卡| 欧美一区二区三区久久精品茉莉花| 欧美xxx成人| 国精品一区二区| 中文网丁香综合网| 99国产精品视频免费观看| 久久人人超碰| 国产日韩精品一区二区三区在线| 99精品欧美一区二区三区综合在线| 亚洲丰满在线| 久久国产婷婷国产香蕉| 国产精品久久婷婷六月丁香| 亚洲精品影视在线观看| 亚洲韩国精品一区| 久久成人久久爱| 国产精品久久久久久久久婷婷| 最新中文字幕亚洲| 亚洲国产婷婷香蕉久久久久久99| 欧美xxxx在线观看| 欧美日韩一区在线| 亚洲精品视频在线播放| 亚洲欧洲另类国产综合| 久久久噜噜噜久久中文字幕色伊伊 | 久久久国际精品| 国产美女诱惑一区二区| 中日韩视频在线观看| 一本久道久久久| 欧美精品一区二区三区在线看午夜| 一区二区三区在线视频播放| 午夜精品一区二区三区在线播放| 午夜精品剧场| 国产精品入口| 亚洲一区二区三区成人在线视频精品| 一区二区三区四区蜜桃| 欧美精品色综合| 亚洲精品在线免费观看视频| 99精品视频网| 欧美日韩性生活视频| 99亚洲一区二区| 亚洲一区二区三区高清 | 在线日韩中文| 91久久精品一区二区三区| 久久躁日日躁aaaaxxxx| 激情综合色综合久久| 亚洲二区视频在线| 欧美成人精品不卡视频在线观看| 亚洲国产高清在线观看视频| 亚洲视频第一页| 午夜精品久久久久影视| 国产精品综合| 欧美一区二区在线免费播放| 久久久精品动漫| 激情综合五月天| 亚洲精品1234| 欧美日韩 国产精品| 日韩视频在线观看| 午夜一区不卡| 国产在线国偷精品产拍免费yy| 亚洲第一天堂av| 欧美精品乱人伦久久久久久 | 亚洲欧洲在线一区| 欧美日韩亚洲网| 亚洲香蕉成视频在线观看| 香蕉乱码成人久久天堂爱免费| 国产日韩综合一区二区性色av| 亚洲福利国产精品| 国产精品美女午夜av| 亚洲欧洲精品一区二区三区不卡| 在线性视频日韩欧美| 国产精品高潮呻吟视频| 性欧美长视频| 欧美电影资源| 亚洲无亚洲人成网站77777| 欧美专区福利在线| 亚洲国产高清一区| 亚洲尤物在线| 一区在线观看视频| 亚洲视频在线二区| 国产一区91| 99热这里只有精品8| 国产精品一级| 亚洲三级电影在线观看| 国产精品久久久久久久电影| 久久精品免费| 欧美性猛交xxxx免费看久久久| 欧美一区国产二区| 欧美日韩人人澡狠狠躁视频| 午夜日韩av| 欧美日韩美女一区二区| 欧美一区二区女人| 欧美日韩第一页| 久久精品91| 国产精品vip| 亚洲欧洲三级电影| 国产女人18毛片水18精品| 亚洲精品乱码久久久久久蜜桃91 | 一区二区高清视频| 欧美精品aa| 亚洲欧美精品伊人久久| 欧美成黄导航| 亚洲欧美精品中文字幕在线| 欧美激情一区二区三区| 午夜精品视频在线| 欧美人成免费网站| 久久精品人人做人人爽| 欧美视频一区二区三区| 亚洲激情综合| 国产偷国产偷精品高清尤物| 中文国产一区| 亚洲第一区色| 久久久久久国产精品mv| 亚洲一区二区三区在线| 欧美成人中文字幕在线| 亚洲调教视频在线观看| 欧美国产高清| 午夜天堂精品久久久久| 欧美视频二区| 99综合在线| 亚洲福利免费|