《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 解決方案 > 開放的一天,吳恩達、谷歌、Facebook紛紛開源數據集

開放的一天,吳恩達、谷歌、Facebook紛紛開源數據集

2019-01-24

計算機視覺自然語言處理,這幾天很多研究者都提出了新的數據集以期解決新的問題。吳恩達幾個小時前開源的「胸片」數據集希望借助 CV 輔助疾病診斷;Facebook 幾天前開源的「BISON」希望借助 CV 與 NLP 學習文字與圖像的內在聯系;而幾個小時前谷歌更是開源了大型「自然問答」數據集,他們希望借助 NLP 學習人們谷歌問題并搜索答案的過程。


在這篇文章中,我們將介紹這幾天開源的三種數據集,它們與已有的通用數據集都不太一樣,且更關注精細化的任務。例如在谷歌開源的 QA 數據集中,它里面都是真實的搜索問題,答案也都是從維基百科查找的。這種大型的真實數據集更適合訓練一個不那么「低智商」的 QA 對話系統,也更符合成年人實際會問的一些問題。


其它如吳恩達等研究者開放的胸部影像數據集和 Facebook 開源的新型圖像描述數據集都很有特點,也許以后年年體檢的「胸片」就能使用 DL 輔助診斷了,也許文本內容和圖像內容以后就能相互轉換了。


谷歌提出自然問答數據集 Natural Questions(NQ)


開放性的問答任務一直是衡量自然語言理解的好標準,QA 系統一般能閱讀網頁并返回正確的答案。然而目前并沒有比較大的自然問答數據集,因為高質量的自然問答數據集需要大量實際問題以及尋找正確答案的人力成本。為了解決這一問題,谷歌近日開放了一個大規模數據集 Natural Questions(NQ),它可以用來訓練并評估開放性問答系統,并且再現了人類尋找問題答案的端到端過程。


NQ 數據集非常大,包含 30 萬條自然發生的問題,以及對應的回答標注,其中每一條回答都是由人工從維基百科頁面找到的。此外,這個自然問答數據集還包括 1.6 萬個特殊樣本,其中每一個樣本的答案都由 5 個不同的標注者標注,因此這種多樣性的回答更適合評估 QA 系統的效果。


因為回答 NQ 中的自然性問題比回答「小問題」有更高的要求,模型需要對提問有更深的理解,因此這樣的模型會更復雜,也會更貼近真實問答場景。所以谷歌在發布這個數據集的同時,還提出了一項挑戰賽,它希望挑戰賽能激勵研究者基于這個數據集做出更好的問答系統——更能理解自然語言的問答系統。


NQ 數據集的論文中展示了標注的過程與結果。簡而言之,谷歌的標注過程可以分為以下幾個步驟:向標注者呈現問題和維基百科頁面;標注者返回一個長回答與短回答。其中長回答(I)可以為維基百科頁面上的 HTML 邊界框,一般可以是一段話或一張表,它包含回答這些問題的答案。當然,如果沒有合適的答案或者答案太分散,標注者也可以返回 I=NULL。短回答(s)可以是 I 中的一個或一組實體,它們可回答問題。如下展示了數據集的樣本示例:

微信圖片_20190124200505.jpg


圖 1:數據集中的樣本標注。


論文:Natural Questions: a Benchmark for Question Answering Research


微信圖片_20190124200531.jpg


論文地址:https://storage.googleapis.com/pub-tools-public-publication-data/pdf/b8c26e4347adc3453c15d96a09e6f7f102293f71.pdf


摘要:我們提出了 Natural Questions(NQ)語料庫,它是一種新型問答數據集。問題都是提交到谷歌搜索引擎的匿名搜索請求。標注者會收到一條問題以及對應的維基百科頁面,該維基百科頁面通過問題的谷歌搜索結果(Top 5)確定。標注者會標注一個長回答(通常是段落)和一個短回答,其中如果頁面有明確答案,短回答是單個或多個實體,如果沒有答案,短回答和長回答標注為 NULL。


目前數據集包含 307373 對訓練樣本,它們有單個標注;7830 對開發或驗證樣本,它們有 5 種標注;還有 7842 對測試樣本,它們也有 5 種標注。我們還提出了驗證數據質量的實驗,并分析了 302 個樣本的 25 種標注,從而充分了解標注任務中的人工差異。為了評估問答系統,我們提出了魯棒性的度量方法,并表示這些指標有非常高的人類上邊界;我們同樣使用相關文獻中的競爭性方法建立了基線結果。


吳恩達提出胸部放射影像數據集 CheXpert


胸部放射影像是全球最常見的影像檢查,對很多威脅終身的疾病的篩查、診斷和治療至關重要。在本文中,作者介紹了一種用于解釋胸部放射影像的大型數據集——CheXpert (Chest eXpert)。該數據集包含來自 65,240 個病人的 224,316 張胸部放射影像,這些影像中標注了 14 種常見的胸部放射影像觀察結果。作者設計了一個標注工具(labeler),它能夠從放射報告文本中提取觀察結果并使用不確定性標簽捕捉報告中存在的不確定性。

微信圖片_20190124200550.jpg

圖 1:CheXpert 任務旨在根據多視角胸部放射影像預測不同觀察結果的概率。


CheXpert 任務要根據多視角胸部放射影像(見圖 1)來預測 14 種不同觀察結果的概率。作者尤其關注數據集中的不確定性標簽,并研究了結合這些不確定性標簽來訓練模型的不同方法。然后在包含 200 項標記的驗證集上評估了這些不確定性方法的性能,這些標注真值由 3 位放射科醫生一致確定,他們用放射影像注釋了該驗證集。作者根據病理的臨床意義和在數據集中的流行程度,在 5 個選定的觀察結果上評估其方法,發現不同的不確定性方法能夠用于不同的觀察結果。

微信圖片_20190124200610.jpg

表 1:CheXpert 數據集包含 14 個標記的觀察結果。作者報告了訓練集中包含這些觀察結果的研究數量。


論文:CheXpert: A Large Chest Radiograph Dataset with Uncertainty Labels and Expert Comparison


微信圖片_20190124200632.jpg


論文地址:https://arxiv.org/abs/1901.07031v1


摘要:大型的標記數據集使得深度學習方法在諸多醫療影像任務上獲得了專家級的表現。我們要展示的 CheXpert 是一個大型數據集,它包含來自 65,240 個病人的 224,316 張胸部放射影像。我們設計了一個標注工具(labeler)來自動檢測影像報告中的 14 種觀察結果,并捕捉影像解釋中固有的不確定性。我們研究了使用不確定性標簽訓練卷積神經網絡的不同方法,該網絡在給定可用正面和側面放射影像的情況下輸出這些觀察結果的概率。在一個包含 200 項胸部放射影像研究的驗證集上,我們發現不同的不確定性方法可以用于不同的病理,這些研究由 3 位經過認證的放射科醫生手工注釋。然后,我們在包含 500 項胸部放射影像研究(這些研究由 5 位經過認證的放射科醫生一致注釋)的測試集上評估我們的最佳模型,并將模型的表現與另外 3 位放射科醫生檢測 5 種選定病理的表現進行比較。對于心臟肥大、水腫和胸腔積液三種疾病,ROC 和 PR 模型曲線位于所有 3 個放射科醫師操作點之上。我們將該數據集作為評估胸部放射影像解釋模型性能的標準基準公開發布。


該數據集可從以下地址免費獲取:

https://stanfordmlgroup.github.io/competitions/chexpert


Facebook 提出新型視覺定位數據集 BISON

微信圖片_20190124200650.jpg


為系統提供關聯語言內容和視覺內容的能力是計算機視覺領域的一大成就。圖像描述生成和檢索等任務旨在測試這種能力,但是復雜的評估指標也同時帶來了一些其它能力和偏差。Facebook 近日發表論文,介紹了一種替代性視覺定位系統評估任務 Binary Image SelectiON (BISON) :給出圖像描述,讓系統從一對語義相似的圖像中選擇與圖像描述最匹配的圖。系統在 BISON 任務上的準確率不僅可解釋,還能夠衡量系統關聯圖像描述中精細文本內容與圖像中視覺內容的能力。Facebook 研究者收集了 BISON 數據集,它補充了 COCO Captions 數據集。研究者還使用 BISON 數據集對圖像描述生成和基于描述的圖像檢索系統進行輔助評估。圖像描述生成的度量指標表明視覺定位系統已經優于人類,但 BISON 表明這些系統與人類表現還有距離。

微信圖片_20190124200711.jpg

圖 2:COCO-BISON 數據集收集過程圖示:研究者使用 COCO captions 數據集進行 BISON 數據集收集工作。首先利用描述相似度尋找相似圖像,然后標注者選擇對圖像對中其中一個圖像的描述,最后研究者讓多個標注者分別基于描述選擇正確的圖像,從而驗證標注的準確性。


該研究由美國南加州大學博士 Hexiang Hu 和 Facebook 研究者合作完成。目前已開源了驗證數據和評估代碼。


驗證數據:https://raw.githubusercontent.com/facebookresearch/binary-image-selection/master/annotations/bison_annotations.cocoval2014.json

評估代碼:https://github.com/facebookresearch/binary-image-selection

論文地址:https://arxiv.org/abs/1901.06595


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲一区二区三区涩| 亚洲国产精品成人综合色在线婷婷| 国产欧美 在线欧美| 欧美日韩国产123| 欧美成人激情在线| 久久亚洲春色中文字幕| 欧美在线视频在线播放完整版免费观看| 亚洲视频精品| 一本色道精品久久一区二区三区| 亚洲国产精品视频| 久久爱www.| 欧美一区日韩一区| 欧美在线视频导航| 亚洲欧美在线另类| 亚洲欧美经典视频| 亚洲伊人一本大道中文字幕| 艳妇臀荡乳欲伦亚洲一区| 亚洲精品裸体| 亚洲精品视频啊美女在线直播| 最新中文字幕一区二区三区| 亚洲福利精品| 亚洲黄色免费电影| 亚洲精品日本| 亚洲九九九在线观看| 亚洲精品欧美一区二区三区| 亚洲精品中文字幕有码专区| 亚洲精选一区| 一区二区三区黄色| 夜夜精品视频一区二区| 99在线精品视频在线观看| 99热精品在线| 亚洲图片你懂的| 亚洲伊人伊色伊影伊综合网| 午夜精品美女久久久久av福利| 午夜日韩视频| 久久疯狂做爰流白浆xx| 亚洲国产欧美不卡在线观看| 亚洲欧洲美洲综合色网| 99国产精品国产精品久久| 中文精品视频一区二区在线观看| 亚洲夜间福利| 欧美亚洲一区| 久久久999成人| 欧美va天堂va视频va在线| 欧美精品在线一区二区| 欧美性猛交xxxx乱大交退制版 | 欧美日韩国产一区| 欧美视频二区36p| 国产乱码精品1区2区3区| 国产一区二区三区在线观看精品| 一区免费观看| 一区二区动漫| 久久国产日本精品| 99re在线精品| 欧美亚洲一区二区在线观看| 久久天天躁狠狠躁夜夜爽蜜月| 欧美va亚洲va香蕉在线| 欧美视频在线观看 亚洲欧| 国产情人节一区| 在线欧美电影| 亚洲视频精品| 久久岛国电影| 在线性视频日韩欧美| 欧美综合国产| 欧美精品色综合| 国产欧美日本一区视频| 在线看片一区| 亚洲欧美成人| 亚洲精选视频免费看| 欧美一区二区三区啪啪| 欧美91视频| 国产麻豆精品在线观看| 亚洲国产成人av| 亚洲欧美www| 日韩一区二区久久| 久久精品在线观看| 欧美日本三区| 红桃视频亚洲| 亚洲一区二区三区四区五区黄| 亚洲国产精品一区二区尤物区| 亚洲一区免费视频| 美女视频黄免费的久久| 国产精品麻豆va在线播放| 亚洲国产va精品久久久不卡综合| 亚洲综合99| 亚洲美女淫视频| 久久久国产一区二区| 欧美午夜精品久久久久久超碰| 韩国成人精品a∨在线观看| 国产主播精品在线| 亚洲视频综合| 99精品热视频只有精品10| 久久久久久久一区| 欧美无砖砖区免费| 亚洲国产精品www| 欧美影院午夜播放| 午夜精品久久久久久久久久久久 | 久久精品一区二区国产| 欧美日韩一区高清| 在线观看一区二区精品视频| 亚洲一区二区三区中文字幕在线| 亚洲精品一区二区三区99| 久久久久久久综合| 国产精品久久久久久久久久ktv| 亚洲黄色一区| 亚洲国产美女| 久久伊人精品天天| 国产视频在线观看一区| 亚洲小说区图片区| 亚洲高清自拍| 久久久青草青青国产亚洲免观| 国产精品久久久一区二区| 亚洲精选一区| 一个色综合导航| 欧美高清影院| 亚洲国产精品va在线看黑人动漫 | 一本色道久久加勒比精品| 亚洲精品影院在线观看| 久久免费视频观看| 国产视频在线观看一区| 亚洲欧美第一页| 性一交一乱一区二区洋洋av| 欧美视频免费| 在线亚洲欧美视频| 亚洲你懂的在线视频| 欧美日一区二区三区在线观看国产免| 亚洲精品一品区二品区三品区| 亚洲美女黄网| 欧美日韩黄色大片| 亚洲精品孕妇| 亚洲性夜色噜噜噜7777| 国产精品v亚洲精品v日韩精品| av不卡在线| 亚洲免费视频网站| 国产精品一区二区视频| 亚洲免费视频观看| 久久精品99久久香蕉国产色戒| 国产欧美在线播放| 欧美在线91| 久久五月婷婷丁香社区| 好看的日韩av电影| 亚洲国产美国国产综合一区二区| 另类av一区二区| 亚洲第一级黄色片| 日韩视频二区| 欧美三级午夜理伦三级中视频| 一区二区三区精品久久久| 亚洲午夜精品久久久久久app| 国产精品久久91| 午夜精品久久久久久久久久久久| 久久九九精品| 亚洲国产三级网| 亚洲在线成人| 欧美裸体一区二区三区| 一色屋精品亚洲香蕉网站| 亚洲精品一二三| 欧美亚洲第一页| 午夜在线a亚洲v天堂网2018| 久久裸体艺术| 亚洲欧洲一区二区天堂久久 | 亚洲精品影视| 香蕉久久国产| 激情视频一区二区| 一本色道久久综合亚洲精品不 | 夜夜嗨av一区二区三区网页| 欧美在线啊v| 影音先锋中文字幕一区二区| 99精品国产99久久久久久福利| 国产精品久久久久久影院8一贰佰| 亚洲欧美在线高清| 欧美成人免费在线视频| 一区二区三区鲁丝不卡| 久久久精品国产99久久精品芒果| 亚洲激情电影中文字幕| 亚洲一区二区三区久久| 国产亚洲欧美日韩美女| 一本久久综合| 狠狠爱www人成狠狠爱综合网| 在线一区亚洲| 国语自产偷拍精品视频偷| 中文国产成人精品久久一| 国内精品国产成人| 亚洲一区观看| 在线播放日韩专区| 午夜久久久久久| 亚洲欧洲免费视频| 久久久久久久久久久久久女国产乱 | 欧美日韩一区二区三区四区在线观看| 欧美一区二区日韩| 欧美日韩国产a| 欧美诱惑福利视频| 国产精品久久91| 9久草视频在线视频精品| 国产丝袜一区二区| 国产精品99久久99久久久二8| 国产日韩欧美日韩| 99视频精品免费观看| 国产综合久久久久久| 亚洲尤物视频在线| 在线国产精品播放|