《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > CoNLL 2018 | 最佳論文揭曉:詞嵌入獲得的信息遠比我們想象中的要多得多

CoNLL 2018 | 最佳論文揭曉:詞嵌入獲得的信息遠比我們想象中的要多得多

2018-10-31

CoNLL自然語言處理領域的頂級會議,每年由 SIGNLL 組織舉辦。CoNLL 2018 大會將于 10 月 31 日-11 月 1 日在比利時布魯塞爾舉行,地點與 EMNLP 2018 一樣(EMNLP 2018 將于 10 月 31 日-11 月 4 日舉行)。


昨日,CoNLL 公布了最佳論文,由來自西班牙巴斯克大學 IXA NLP 組的 Mikel Artetxe 等人獲得。該論文展示了詞嵌入模型能夠捕獲不同層面的信息(如語義/句法和相似度/相關度),為如何編碼不同的語言信息提供了新的視角,該研究還研究了內外部評估之間的關系。

 

近年來,詞嵌入成為自然語言處理的核心主題。業內提出了多種無監督方法來高效地訓練單詞的密集型向量表征,且成功地應用到語法解析、主題建模、文檔分類等多類任務。


機器之心Synced詞嵌入小程序


雖然從理論角度理解這些模型是更加活躍的研究路線,但這些研究背后的基本思路都是為類似的單詞分配類似的向量表征。由此,大部分詞嵌入模型依賴來自大型單語語料庫的共現統計信息(co-occurrence statistics),并遵循分布假設,也就是相似單詞傾向于出現在相似語境中。


然而,上述論點沒有定義「相似單詞」的含義,且詞嵌入模型實際中應該捕捉哪種關系也不完全清楚。因此一些研究者在真正相似度(如 car - automobile)與關聯度(如 car - road)之間進行區分。從另一個角度來說,詞語相似度可聚焦在語義(如 sing-chant)或者句法(如 sing-singing)上。我們把這兩個方面作為相似度的兩個坐標軸,且每一個坐標軸的兩端為兩種性質:語義/句法軸和相似度/關聯度軸。


本論文提出了一種新方法來調整給定的任意嵌入向量集,使其在這些坐標軸中靠近特定端點。該方法受一階和二階共現研究的啟發,可推廣為詞嵌入向量線性變換的連續參數,我們稱之為相似度階(similarity order)。雖然業內提出了多種學習特定詞嵌入的方法,但之前的研究明確地改變了訓練目標,且總是依賴知識庫這樣的外部資源。而本論文提出的方法可用做任意預訓練詞嵌入模型的后處理,不需要任何額外資源。同樣,該研究表明,標準的詞嵌入模型能夠編碼不同的語言信息,但能夠直接應用的信息有限。此外,該研究也分析了該方法與內部評估和下游任務的關系。該論文主要貢獻如下:


1. 提出了一個具備自由參數的線性變換,能夠調整詞嵌入在相似度/關聯度和語義/句法坐標軸中的性能,并在詞匯類推數據集和相似度數據集中進行了測試。


2. 展示了當前詞嵌入方法的性能受到無法同時顯現不同語言信息(例如前面提到的坐標軸)的限制。該研究提出的方法表明,詞嵌入能夠捕獲的信息多于表面顯現出的信息。


3. 展示了標準的內部評估只能給出一個靜態的不完整圖景,加上該研究提出的方法能夠幫助我們更好地理解詞嵌入模型真正編碼哪些信息。


4. 展示了該方法也能運用到下游任務中,但相比于使用一般詞嵌入作為輸入特征的監督系統,其效果在直接使用詞嵌入相似度的無監督系統上更顯著,因為監督系統有足夠的表達能力來學習最優變換。


總之,該研究揭示了詞嵌入如何表示不同語言信息,分析了它在內部評估和下游任務中所扮演的角色,為之后的發展開創了新機遇。


論文:Uncovering divergent linguistic information in word embeddings with lessons for intrinsic and extrinsic evaluation

微信圖片_20181031230220.jpg


論文鏈接:https://arxiv.org/abs/1809.02094


摘要:隨著詞嵌入最近取得成功,有人認為根本不存在詞的理想表征,因為不同的模型傾向于捕捉不同且往往互不兼容的方面,如語義/句法和相似性/相關性。本論文展示了每個詞嵌入模型捕獲的信息多于直接顯現的信息。線性轉換無需任何外部資源就能調整模型的相似度階,因此能夠調整模型以在這些方面獲得更好的結果,這為詞嵌入編碼不同的語言信息提供了新的視角。此外,我們還探索了內、外部評估的關系,我們在下游任務中的變換效果在無監督系統中的效果優于監督系統。


機器之心Synced非監督學習小程序


內部評估

微信圖片_20181031230254.jpg

表 1:原始嵌入以及具備對應 α 值的最佳后處理模型的內部評估結果。評估指標是詞匯類比任務的準確率和詞語相似度的斯皮爾曼等級相關系數。

微信圖片_20181031230312.jpg

圖 1:詞匯類比任務中,不同 α 值所對應的相對誤差減少,原始嵌入的 α = 0。


外部評估

微信圖片_20181031230329.jpg

表 2:原始嵌入和具備對應 α 值的最佳后處理模型的語義文本相似度結果,衡量標準為皮爾遜相關系數。DAM 分數是 10 次運行的平均得分。

微信圖片_20181031230347.jpg


圖 3:不同 α 值對應的語義文本相似度結果。DAM 分數是 10 次運行的平均得分。


討論


我們認為該研究為嵌入編碼不同語言信息提供了新的視角,其與內外部評估之間的關系如下所示:


標準內部評估提供的是不同詞嵌入模型編碼的靜態、不完整信息圖。

使用預訓練嵌入作為特征的監督系統具備足夠的表達能力來學習任務的最優相似度階。

盡管我們的研究展示了嵌入捕獲的默認相似度階對較大的學習系統影響較小,但它未必是最優的整合策略。如果研究者認為某個相似度階可能更適合某個下游任務,則他/她設計的整合策略很可能鼓勵這個相似度階,我們認為這是未來一個有趣的研究方向。例如,研究者可以設計正則化方法去懲罰預定義相似度階的較大偏差。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
久久精品国产视频| 亚洲视频免费观看| 一本大道av伊人久久综合| 樱花yy私人影院亚洲| 国产丝袜一区二区| 国产网站欧美日韩免费精品在线观看 | 国产精品尤物| 国产精品永久免费观看| 国产精品久久综合| 国产精品人人爽人人做我的可爱 | 午夜激情久久久| 亚洲天堂第二页| 亚洲图片欧洲图片av| 中文在线资源观看视频网站免费不卡| 亚洲欧洲一区二区三区| 亚洲日本电影| 9色国产精品| 一区二区三区四区五区在线| 99精品欧美一区二区蜜桃免费| 亚洲久久一区二区| 一区二区免费在线观看| 亚洲小说春色综合另类电影| 亚洲综合精品| 久久不见久久见免费视频1| 久久成人精品电影| 亚洲激情中文1区| 9l国产精品久久久久麻豆| 亚洲线精品一区二区三区八戒| 亚洲一区二区在线免费观看| 亚洲欧美日韩在线高清直播| 亚洲一区二区黄| 性欧美video另类hd性玩具| 久久er精品视频| 久久中文在线| 欧美日韩成人综合| 国产精品一区毛片| 伊人久久亚洲影院| 亚洲美女区一区| 亚洲一区精品电影| 亚洲二区在线观看| 日韩亚洲精品电影| 午夜国产精品影院在线观看| 久久另类ts人妖一区二区| 欧美成人一区二免费视频软件| 欧美日本中文字幕| 国产精品有限公司| 影音先锋一区| 亚洲四色影视在线观看| 久久精品视频一| 中文高清一区| 欧美在线视频一区二区| 免费在线播放第一区高清av| 欧美性猛交xxxx乱大交退制版| 国产免费一区二区三区香蕉精| 在线看片一区| 亚洲午夜小视频| 亚洲高清免费视频| 亚洲一区免费| 久久综合电影一区| 欧美视频在线视频| 国一区二区在线观看| 亚洲美女免费视频| 久久精品视频在线看| 亚洲视频在线观看一区| 久久人人爽人人爽爽久久| 欧美日本在线观看| 国产综合第一页| 一本久道久久久| 亚洲国产色一区| 欧美一区二区黄色| 欧美日本在线视频| 精东粉嫩av免费一区二区三区| 一区二区三区四区五区精品| 最新日韩精品| 久久黄色小说| 国产精品高清在线观看| 在线欧美视频| 亚洲欧美日韩区| 一区二区三区你懂的| 久久天天躁狠狠躁夜夜爽蜜月| 欧美视频二区| 最新高清无码专区| 欧美中文字幕在线播放| 亚洲欧美日韩一区二区| 欧美精品在线网站| 伊人久久综合| 欧美一区二区三区免费视| 亚洲一区二区三区精品在线观看 | 亚洲综合电影| 亚洲视频日本| 欧美电影电视剧在线观看| 国产午夜精品一区二区三区欧美| 99精品国产99久久久久久福利| 亚洲国产视频a| 久久精品在这里| 国产精品视频久久| 99精品国产在热久久| 亚洲人午夜精品| 久久综合99re88久久爱| 国产女优一区| 亚洲一级免费视频| 亚洲一区二区欧美| 欧美另类变人与禽xxxxx| 在线观看日韩av| 亚洲国产精品一区制服丝袜| 久久久久久久综合狠狠综合| 国产精品区二区三区日本| 日韩亚洲欧美一区| 一区二区三区**美女毛片| 欧美激情综合亚洲一二区| 亚洲福利视频网| 亚洲人体1000| 欧美激情综合| 亚洲精品日韩欧美| 亚洲美女视频在线观看| 欧美xxxx在线观看| 亚洲国产成人av好男人在线观看| 亚洲国产精品久久久久秋霞蜜臀 | 亚洲高清免费在线| 91久久午夜| 免费久久99精品国产自在现线| 国产自产女人91一区在线观看| 欧美一区二区三区男人的天堂| 欧美伊人久久大香线蕉综合69| 国产伦精品免费视频| 亚洲欧美中日韩| 久久久国产91| 黄色另类av| 亚洲欧洲免费视频| 欧美精品日韩综合在线| 亚洲精品一区二区三| 亚洲夜晚福利在线观看| 欧美午夜在线一二页| 亚洲一区二区免费视频| 性高湖久久久久久久久| 国产亚洲欧洲997久久综合| 欧美一区二区三区视频在线| 久久久午夜精品| 在线免费观看日本一区| 亚洲美女一区| 国产精品护士白丝一区av| 亚洲综合日韩在线| 久久久免费观看视频| 亚洲第一区在线观看| 9久re热视频在线精品| 国产精品国产馆在线真实露脸 | 国产精品美女主播| 午夜精品视频网站| 久热精品在线| 亚洲伦理在线观看| 亚洲女ⅴideoshd黑人| 国产美女一区二区| 亚洲国产精品热久久| 欧美日韩成人一区| 亚洲综合首页| 鲁大师成人一区二区三区| 亚洲精品视频在线观看网站| 亚洲午夜激情在线| 国产日产精品一区二区三区四区的观看方式 | 欧美激情精品| 亚洲一区二区三区四区视频| 久久精品国产99国产精品| 亚洲第一天堂av| 亚洲午夜激情| 激情成人中文字幕| 一区二区高清| 国产婷婷一区二区| 日韩亚洲精品在线| 国产日韩欧美自拍| 亚洲美女性视频| 国产农村妇女精品一二区| 亚洲欧洲在线观看| 国产精品网站在线播放| 最新国产乱人伦偷精品免费网站| 国产精品www网站| 久久精品亚洲精品国产欧美kt∨| 欧美日韩精品在线视频| 久久不射网站| 国产精品久久久久久久久久免费看| 久久er99精品| 欧美系列精品| 亚洲日产国产精品| 国产精品综合久久久| 日韩天堂在线视频| 国产亚洲综合在线| 在线视频你懂得一区二区三区| 国产亚洲精品综合一区91| 一区二区三区日韩欧美精品| 海角社区69精品视频| 亚洲伊人一本大道中文字幕| 激情综合五月天| 香蕉国产精品偷在线观看不卡| 亚洲电影在线观看| 欧美伊人久久大香线蕉综合69| 亚洲精品美女久久7777777| 久久久久这里只有精品| 亚洲天堂成人在线观看| 欧美精品一区在线播放| 亚洲高清视频一区| 国产欧美日韩亚洲一区二区三区|