《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 英偉達發布6.3萬億Token大型AI訓練數據庫Nemotron-CC

英偉達發布6.3萬億Token大型AI訓練數據庫Nemotron-CC

2025-01-14
來源:IT之家
關鍵詞: 英偉達 AI Nemotron-CC

1 月 13 日消息,據英偉達官方博客,英偉達宣布推出一款名為 Nemotron-CC 的大型英文 AI 訓練數據庫,總計包含 6.3 萬億個 Token,其中 1.9 萬億為合成數據。英偉達聲稱該訓練數據庫可以幫助為學術界和企業界進一步推動大語言模型的訓練過程。

2.jpg

目前,業界各類 AI 模型的具體性能主要取決于相應模型的訓練數據。然而現有公開數據庫在規模和質量上往往存在局限性,英偉達稱 Nemotron-CC 的出現正是為了解決這一瓶頸,該訓練數據庫 6.3 萬億 Token 的規模內含大量經過驗證的高質量數據,號稱是 " 訓練大型語言模型的理想素材 "。

數據來源方面,Nemotron-CC 基于 Common Crawl 網站數據構建,并在經過嚴格的數據處理流程后,提取而成高質量子集 Nemotron-CC-HQ。

在性能方面,英偉達稱與目前業界領先的公開英文訓練數據庫 DCLM(Deep Common Crawl Language Model)相比,使用 Nemotron-CC-HQ 訓練的模型在 MMLU(Massive Multitask Language Understanding)基準測試中的分數提高了 5.6 分。

進一步測試顯示,使用 Nemotron-CC 訓練的 80 億參數模型在 MMLU 基準測試中分數提升 5 分,在 ARC-Challenge 基準測試中提升 3.1 分,并在 10 項不同任務的平均表現中提高 0.5 分,超越了基于 Llama 3 訓練數據集開發的 Llama 3.1 8B 模型。

3.jpg

英偉達官方表示,Nemotron-CC 的開發過程中使用了模型分類器、合成數據重述(Rephrasing)等技術,最大限度地保證了數據的高質量和多樣性。同時他們還針對特定高質量數據降低了傳統的啟發式過濾器處理權重,從而進一步提高了數據庫高質量 Token 的數量,并避免對模型精確度造成損害。

英偉達已將 Nemotron-CC 訓練數據庫已在 Common Crawl 網站上公開(點此訪問),英偉達稱相關文檔文件將在稍晚時候于該公司的 GitHub 頁中公布。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲午夜视频| 欧美一区二区三区在线| 国产日韩欧美不卡在线| 欧美日韩视频免费播放| 欧美精品国产| 欧美激情影音先锋| 欧美高清视频一二三区| 蜜桃av噜噜一区| 久久色中文字幕| 久久久蜜臀国产一区二区| 久久久999精品| 久久久久久九九九九| 久久久久9999亚洲精品| 久久免费视频在线| 老司机67194精品线观看| 久久影院午夜论| 免费高清在线一区| 欧美ed2k| 欧美精品国产一区二区| 欧美日韩成人免费| 欧美日韩在线第一页| 国产精品扒开腿做爽爽爽视频| 欧美午夜不卡影院在线观看完整版免费 | 亚洲精品久久久久久久久久久久| 亚洲国产精品久久91精品| 亚洲国产日韩欧美在线动漫| 亚洲精品国产精品乱码不99按摩| 久久国产99| 久久精品动漫| 美国十次成人| 欧美日韩裸体免费视频| 国产精品理论片在线观看| 国产日韩欧美一二三区| 永久555www成人免费| 91久久久久久国产精品| 一本久道久久综合中文字幕| 午夜精品成人在线视频| 久久精品一区| 妖精成人www高清在线观看| 亚洲网站视频福利| 欧美亚洲专区| 卡一卡二国产精品| 欧美日韩高清在线| 国产欧美日韩一区二区三区在线| 激情91久久| 日韩西西人体444www| 亚洲欧美成人网| 亚洲国产精品va在看黑人| av不卡免费看| 欧美在线视频观看免费网站| 免费成人小视频| 国产精品va在线播放| 国产一区久久久| 在线观看国产日韩| 中文欧美日韩| 亚洲成人自拍视频| 亚洲网在线观看| 久久亚洲图片| 欧美日韩一区二区免费视频| 国产精品乱码一区二三区小蝌蚪| 国语自产精品视频在线看8查询8| 亚洲免费av片| 午夜精品福利一区二区三区av| 亚洲国产精品女人久久久| 中文高清一区| 久久人人97超碰国产公开结果| 欧美日韩一区精品| 在线观看视频一区| 亚洲视频在线播放| 亚洲精品永久免费| 久久精品一区二区三区四区| 欧美日韩国产麻豆| 欧美a级在线| 欧美精品一卡二卡| 欧美日韩另类一区| 影音先锋久久久| 亚洲欧美日韩精品久久| 亚洲精品一品区二品区三品区| 欧美亚洲三级| 欧美日韩国产综合在线| 激情六月婷婷久久| 亚洲一区二区三区在线播放| 亚洲人成网站精品片在线观看| 欧美在线|欧美| 欧美肉体xxxx裸体137大胆| 伊人夜夜躁av伊人久久| 性久久久久久久久| 亚洲一区在线直播| 欧美日韩高清在线观看| 精品1区2区| 欧美一级淫片aaaaaaa视频| 亚洲一区二区三区中文字幕在线| 欧美国产成人在线| 狠狠色综合网站久久久久久久| 亚洲性感激情| 一区二区三区成人| 欧美激情一区二区三区在线 | 国产欧美三级| 亚洲调教视频在线观看| 一本久久a久久免费精品不卡| 欧美 日韩 国产在线| 国产专区欧美精品| 国产日韩精品一区二区| 国产精品护士白丝一区av| 久久蜜桃资源一区二区老牛 | 亚洲第一毛片| 一区二区三区你懂的| 亚洲免费激情| 亚洲自拍高清| 日韩一区二区免费高清| 国产一区亚洲一区| 免费亚洲一区| 亚洲午夜羞羞片| 亚洲国产精品成人综合色在线婷婷| 日韩视频免费观看高清在线视频| 国产日韩精品一区二区浪潮av| 在线视频欧美一区| 夜夜爽夜夜爽精品视频| 国产精品yjizz| 久久精品一区二区三区不卡| 亚洲高清电影| 亚洲免费在线播放| 日韩视频在线观看国产| 亚洲精品国产欧美| 国内一区二区在线视频观看| 亚洲精品资源| 午夜国产精品视频免费体验区| 欧美在线关看| 久久久青草青青国产亚洲免观| 国产精品99久久久久久久久| 亚洲另类黄色| 一区二区三区四区国产| 亚洲视频自拍偷拍| 99国产精品久久久久老师| 亚洲美女免费精品视频在线观看| 91久久久亚洲精品| 亚洲无毛电影| 亚洲视频在线二区| 亚洲欧美日韩国产一区二区三区| 欧美一区91| 久久视频免费观看| 免费成人你懂的| 国产精品免费区二区三区观看| 亚洲美女网站| 免费看的黄色欧美网站| 亚洲黑丝一区二区| 亚洲国产一区二区三区a毛片| 欧美日韩精品免费| 欧美日韩国产成人在线观看| 国产精品理论片在线观看| 欧美日韩精品一区二区三区| 欧美一级专区| 欧美激情一二三区| 亚洲一区二区三区高清 | 一个色综合导航| 欧美午夜无遮挡| 亚洲男人的天堂在线观看| 久久久www成人免费精品| 激情综合色丁香一区二区| 91久久精品国产| 欧美深夜影院| 午夜精品av| 欧美电影资源| 亚洲网站啪啪| 久久男女视频| 亚洲精品免费一区二区三区| 午夜精品免费| 亚洲丰满少妇videoshd| 亚洲永久免费av| 国产午夜亚洲精品不卡| 日韩视频一区| 国产精品一区二区欧美| 亚洲福利视频免费观看| 欧美亚州一区二区三区| 欧美亚洲一级| 欧美日韩免费一区二区三区视频| 亚洲欧美一级二级三级| 欧美大片免费观看| 亚洲欧美日本国产专区一区| 老司机精品久久| 亚洲综合成人婷婷小说| 欧美成人dvd在线视频| 亚洲伊人一本大道中文字幕| 欧美福利专区| 午夜精品久久99蜜桃的功能介绍| 欧美精品一区二区三区一线天视频| 午夜国产欧美理论在线播放| 欧美日韩国产综合一区二区| 欧美在线啊v一区| 国产精品国产成人国产三级| 亚洲区在线播放| 国产一区二区0| 亚洲一品av免费观看| 亚洲国产精品久久久久| 久久精品99久久香蕉国产色戒| 亚洲高清久久网| 欧美一区1区三区3区公司| 黑人一区二区三区四区五区| 亚洲综合视频一区| 亚洲午夜视频在线观看|