《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > DeepSeek論文登《自然》封面 披露R1訓練費200萬

DeepSeek論文登《自然》封面 披露R1訓練費200萬

2025-09-18
來源:網易科技
關鍵詞: Deepseek 推理模型

9月18日消息,由DeepSeek團隊共同完成、梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文,登上了《自然》(Nature)雜志封面。

下載 (1).jpg

論文研究人員表示,DeepSeek強大的AI模型R1之所以能成功,并不依賴于使用其競爭對手的輸出內容進行訓練。今年一月,R1的發布曾引發美國股市暴跌。這一聲明出自今天發表于《自然》(Nature)雜志的一篇經同行評議的R1模型論文的附帶文件中。

無標題.png

R1旨在出色地完成數學和編程等“推理”任務,是美國科技公司所開發工具的一個更廉價的競爭對手。作為一個“開放權重”(open weight)模型,任何人都可以下載它,并且它也是迄今為止在AI社區平臺Hugging Face上最受歡迎的此類模型,下載量已達1090萬次。

這篇論文是對今年一月所發布的一份預印本的更新,該預印本描述了DeepSeek如何增強一個標準的大語言模型(Large Language Model, LLM)以處理推理任務。其補充材料首次披露了R1的增量訓練成本僅相當于29.4萬美元。這筆費用是在該公司(總部位于杭州)為構建R1所基于的基礎大語言模型而花費的約600萬美元之外的,但總金額仍遠低于競爭對手模型據信高達數千萬美元的成本。DeepSeek表示,R1主要是在英偉達的H800芯片上進行訓練的,而根據美國的出口管制規定,該芯片自2023年起已被禁止向中國銷售。

嚴格的同行評審

R1被認為是首個經歷同行評議過程的主流大語言模型。“這是一個非常值得歡迎的先例,”Hugging Face的機器學習工程師劉易斯·坦斯托爾(Lewis Tunstall)說,他也是這篇《自然》論文的審稿人之一。“如果我們沒有這種公開分享大部分流程的規范,就很難評估這些系統是否存在風險。”

為回應同行評議的意見,DeepSeek團隊減少了其描述中的擬人化用語,并補充了技術細節的說明,包括模型訓練所用的數據類型及其安全性。“經歷一個嚴格的同行評議過程,無疑有助于驗證模型的有效性和實用性,”位于哥倫布市的俄亥俄州立大學AI研究員孫歡(Huan Sun)說。“其他公司也應該這樣做。”

DeepSeek的主要創新在于,它使用了一種自動化的“試錯法”,即純粹的強化學習(pure reinforcement learning),來創建R1。這個過程是通過獎勵模型得出正確答案的方式進行,而不是教它遵循人類挑選的推理范例。該公司表示,其模型正是通過這種方式學會了自身的類推理策略,例如如何在不遵循人類預設策略的情況下驗證其解題過程。為提高效率,該模型還使用了被稱為“組相對策略優化”(group relative policy optimization)的技術,即利用估算值為自身的嘗試打分,而不是另外采用一個獨立的算法來做這件事。

孫歡表示,該模型在AI研究人員中“相當有影響力”。“2025年迄今為止,幾乎所有在大語言模型中進行強化學習的研究,都可能或多或少地受到了R1的啟發。”

關于訓練方式的爭議

今年一月的媒體報道曾暗示,OpenAI研究人員認為,DeepSeek利用了OpenAI模型的輸出來訓練R1,這種方法可以在使用較少資源的情況下加速模型能力的提升。

DeepSeek并未在其論文中公布其訓練數據。但是,在與審稿人的交流中,該公司的研究人員聲明,R1并非通過復制OpenAI模型生成的推理范例來學習的。不過他們承認,與大多數其他大語言模型一樣,R1的基礎模型是在海量網絡數據上訓練的,因此它會吸收互聯網上已有的任何AI生成內容。

孫歡認為,這一反駁“與我們在任何出版物中能看到的說法一樣有說服力”。坦斯托爾補充說,盡管他無法百分之百確定R1沒有在OpenAI的范例上進行訓練,但其他實驗室的復現嘗試表明,DeepSeek的這套推理方法可能已經足夠好,無需這樣做。“我認為現在的證據相當清楚,僅使用純粹的強化學習就能獲得非常高的性能,”他說。

孫歡說,對于研究人員而言,R1仍然非常有競爭力。在一項旨在完成分析和可視化數據等科學任務的挑戰,即ScienceAgentBench基準測試中,孫歡及其同事發現,盡管R1的準確率并非第一,但從平衡能力與成本的角度來看,它是表現最好的模型之一。

坦斯托爾說,其他研究人員現在正嘗試應用創建R1所用的方法,來提高現有大語言模型的類推理能力,并將其擴展到數學和編程以外的領域。他補充說,從這個意義上講,R1“引發了一場革命”。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲第一网站| 一区二区三区鲁丝不卡| 午夜精品福利一区二区三区av| 一区二区三区视频在线播放| 国产精品成av人在线视午夜片| 亚洲欧美视频| 久久精品盗摄| 91久久精品国产91久久性色tv | 欧美日韩精品免费在线观看视频| 亚洲视频axxx| 午夜免费在线观看精品视频| 狠狠干成人综合网| 欧美日韩大片一区二区三区| 亚洲欧美日韩区| 久久精品国产欧美激情| 91久久精品国产| 国产精品久久久久秋霞鲁丝| 久久久久久久性| 一区二区三区av| 欧美一区二区三区四区夜夜大片| 亚洲国产日韩欧美在线图片| 国产精品电影在线观看| 久久亚洲欧美| 亚洲一区二区毛片| 久久精品一区中文字幕| 亚洲最快最全在线视频| 国内精品美女av在线播放| 欧美日韩日日夜夜| 久久偷窥视频| 亚洲主播在线| 亚洲日本理论电影| 午夜精品视频在线观看一区二区| 亚洲国产精品一区二区久| 国产精品私人影院| 欧美激情视频一区二区三区在线播放 | 亚洲视频图片小说| 一区精品在线播放| 国产精品免费看片| 欧美精品自拍| 久久久人人人| 亚洲专区一区| 亚洲精品一区二区网址| 午夜伦理片一区| aa国产精品| 亚洲国产毛片完整版| 国产一区二区高清| 国产精品女主播| 欧美日韩亚洲免费| 欧美不卡一区| 久久不射电影网| 亚洲欧美日韩爽爽影院| 一本色道久久综合精品竹菊 | 亚洲在线1234| 日韩视频在线你懂得| 久久成人精品视频| 亚洲欧美精品中文字幕在线| 亚洲乱码国产乱码精品精天堂 | 欧美午夜宅男影院在线观看| 欧美激情aⅴ一区二区三区| 久久精品夜色噜噜亚洲aⅴ| 亚洲综合色视频| 一区二区欧美精品| 亚洲精品日韩一| 91久久黄色| 亚洲国产日韩一区二区| 午夜精品一区二区三区四区| 中文日韩在线视频| 亚洲免费观看高清完整版在线观看熊| 亚洲大片精品永久免费| 国产综合亚洲精品一区二| 国产欧美在线观看| 国产精品日韩一区二区| 欧美系列一区| 欧美天天视频| 欧美视频一区二区在线观看| 欧美日韩国产综合视频在线| 欧美福利视频一区| 欧美激情1区2区3区| 欧美国产免费| 欧美国产精品一区| 欧美大片在线看免费观看| 美女被久久久| 蜜臀91精品一区二区三区| 男女激情久久| 欧美激情一区三区| 欧美α欧美αv大片| 老鸭窝亚洲一区二区三区| 久久综合九色| 免费不卡中文字幕视频| 久久综合中文| 欧美福利一区| 欧美久久久久中文字幕| 欧美日韩日韩| 国产精品久久久久久av下载红粉 | 欧美性事免费在线观看| 国产精品地址| 国产欧美欧洲在线观看| 国产专区精品视频| 亚洲电影视频在线| 亚洲精品久久久久久久久久久久久 | 亚洲高清精品中出| 亚洲免费观看| 亚洲网站视频福利| 午夜精品一区二区三区四区 | 欧美日韩无遮挡| 国产精品免费视频xxxx| 国产日韩在线视频| 在线观看欧美精品| 日韩午夜av电影| 亚洲欧美日韩国产精品| 久久精品国产欧美亚洲人人爽| 亚洲国产毛片完整版| 99精品国产在热久久下载| 亚洲尤物视频在线| 久久久久久久久久看片| 欧美电影在线观看| 欧美日韩美女| 国产日韩欧美日韩大片| 亚洲电影免费在线观看| 一区二区精品在线观看| 欧美亚洲一区二区在线| 久久精品国产综合精品| 99国产一区二区三精品乱码| 亚洲欧美一区在线| 久久中文字幕一区二区三区| 欧美日韩国产成人高清视频| 国产精品美女999| 精品1区2区3区4区| 99国产精品久久久久老师| 午夜精品一区二区三区在线视 | 亚洲午夜电影网| 亚洲国产mv| 亚洲欧美国产不卡| 久热成人在线视频| 国产精品www994| 一区二区三区在线高清| 中文无字幕一区二区三区| 久久精品国产一区二区三区免费看 | 国产视频观看一区| 日韩视频在线观看免费| 欧美淫片网站| 亚洲一区二区成人| 牛牛国产精品| 国产欧美日韩亚洲| 亚洲精品日韩激情在线电影| 欧美一区二区三区久久精品茉莉花| 亚洲国产经典视频| 亚洲永久在线观看| 国产精品私人影院| 欧美在线观看视频在线| 久久久久中文| 亚洲精品精选| 欧美亚洲一区| 国语自产精品视频在线看一大j8| 最新亚洲一区| 欧美三级特黄| 亚洲欧美三级伦理| 美女亚洲精品| 夜夜嗨av色一区二区不卡| 午夜免费在线观看精品视频| 国产一区二区三区久久| 亚洲日本aⅴ片在线观看香蕉| 欧美激情精品久久久久久黑人| 一区二区三区日韩欧美| 欧美在线免费看| 亚洲大黄网站| 亚洲综合好骚| 一区二区在线看| 亚洲一区二区毛片| 国内一区二区三区在线视频| 日韩性生活视频| 国产欧美日韩麻豆91| 99国产精品国产精品毛片| 国产精品亚洲综合久久| 亚洲国产精品日韩| 国产精品mm| 亚洲激情女人| 国产精品扒开腿做爽爽爽软件| 久久av一区| 欧美日韩精品欧美日韩精品| 欧美中文字幕第一页| 欧美日本在线看| 亚久久调教视频| 欧美日韩综合不卡| 91久久国产综合久久91精品网站| 国产精品久久精品日日| 亚洲国产欧美一区二区三区久久| 欧美性久久久| 亚洲日本无吗高清不卡| 国产精品视频免费在线观看| 日韩视频一区二区三区| 国产午夜精品麻豆| 亚洲午夜一区二区三区| 一区二区三区在线视频观看| 亚洲免费影视| 亚洲美女91| 欧美91大片| 久久精品99国产精品酒店日本| 国产精品第13页| 亚洲最黄网站|