《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 摩爾線程大模型對齊研究獲國際頂級學(xué)術(shù)會議認(rèn)可

摩爾線程大模型對齊研究獲國際頂級學(xué)術(shù)會議認(rèn)可

URPO框架入選AAAI 2026
2025-11-14
來源:IT之家

11 月 13 日消息,摩爾線程提出的新一代大語言模型對齊框架 —— URPO 統(tǒng)一獎勵與策略優(yōu)化,相關(guān)研究論文近日被人工智能領(lǐng)域的國際頂級學(xué)術(shù)會議 AAAI 2026 收錄,為簡化大模型訓(xùn)練流程、突破模型性能上限提供了全新的技術(shù)路徑。

format,f_avif.avif.jpg

▲ 圖源:摩爾線程官方公眾號 | URPO 統(tǒng)一獎勵與策略優(yōu)化框架

據(jù)介紹,在題為《URPO:A Unified Reward & Policy Optimization Framework for Large Language Models》的論文中,摩爾線程 AI 研究團(tuán)隊提出了 URPO 統(tǒng)一獎勵與策略優(yōu)化框架,將“指令遵循”(選手)和“獎勵評判”(裁判)兩大角色融合于單一模型中,并在統(tǒng)一訓(xùn)練階段實現(xiàn)同步優(yōu)化。URPO 從以下三方面攻克技術(shù)挑戰(zhàn):

數(shù)據(jù)格式統(tǒng)一:將異構(gòu)的偏好數(shù)據(jù)、可驗證推理數(shù)據(jù)和開放式指令數(shù)據(jù),統(tǒng)一重構(gòu)為適用于 GRPO 訓(xùn)練的信號格式。

自我獎勵循環(huán):針對開放式指令,模型生成多個候選回答后,自主調(diào)用其“裁判”角色進(jìn)行評分,并將結(jié)果作為 GRPO 訓(xùn)練的獎勵信號,形成一個高效的自我改進(jìn)循環(huán)。

協(xié)同進(jìn)化機制:通過在同一批次中混合處理三類數(shù)據(jù),模型的生成能力與評判能力得以協(xié)同進(jìn)化。生成能力提升帶動評判更精準(zhǔn),而精準(zhǔn)評判進(jìn)一步引導(dǎo)生成質(zhì)量躍升,從而突破靜態(tài)獎勵模型的性能瓶頸。

實驗結(jié)果顯示,基于 Qwen2.5-7B 模型,URPO 框架超越依賴獨立獎勵模型的傳統(tǒng)基線:在 AlpacaEval 指令跟隨榜單上,得分從 42.24 提升至 44.84;在綜合推理能力測試中,平均分從 32.66 提升至 35.66。作為訓(xùn)練的“副產(chǎn)品”,該模型內(nèi)部自然涌現(xiàn)出的評判能力在 RewardBench 獎勵模型評測中取得 85.15 的高分,表現(xiàn)優(yōu)于其替代的專用獎勵模型(83.55 分)。

從摩爾線程官方獲悉,目前,URPO 已在摩爾線程自研計算卡上實現(xiàn)穩(wěn)定高效運行。同時,摩爾線程已完成 VERL 等主流強化學(xué)習(xí)框架的深度適配


subscribe.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
一区二区三区精品久久久| 亚洲精品欧美专区| 一区在线免费| 国产精品久久久久77777| 欧美国产欧美亚州国产日韩mv天天看完整 | 午夜欧美理论片| 国产精品久久久久久久久久妞妞| 亚洲一区二区三区免费在线观看| 最新中文字幕一区二区三区| 欧美在线看片| 香蕉久久夜色精品| 亚洲欧美一区在线| 亚洲欧美日韩精品| 亚洲一区二区免费看| 一区二区av| 在线综合亚洲欧美在线视频| 夜夜夜精品看看| 日韩网站免费观看| 亚洲免费精品| 日韩视频专区| 宅男噜噜噜66一区二区66| 夜夜爽99久久国产综合精品女不卡| 日韩天堂av| 夜夜狂射影院欧美极品| 一区二区三区欧美视频| 国产精品99久久久久久白浆小说| 夜夜爽av福利精品导航| 亚洲一区美女视频在线观看免费| 亚洲性夜色噜噜噜7777| 亚洲综合首页| 久久国产精品99国产精| 亚洲第一精品夜夜躁人人爽| 亚洲第一网站免费视频| 欧美在线你懂的| 亚洲国产影院| 99在线精品免费视频九九视| 在线一区欧美| 亚洲欧美在线x视频| 小黄鸭视频精品导航| 久久久久91| 欧美国产欧美亚州国产日韩mv天天看完整| 欧美激情一区二区在线| 欧美午夜片在线观看| 国产色产综合色产在线视频| 狠狠88综合久久久久综合网| 亚洲第一在线视频| 亚洲免费不卡| 午夜精品一区二区在线观看| 亚洲国产另类久久久精品极度| 99精品久久久| 亚洲欧美美女| 久久五月激情| 欧美日本高清视频| 国产精品婷婷| 怡红院精品视频在线观看极品| 亚洲国产天堂久久国产91| 一区二区三区四区五区视频| 欧美亚洲在线视频| 日韩一区二区精品| 小黄鸭视频精品导航| 亚洲国产精品ⅴa在线观看| 久久在线播放| 欧美激情精品久久久久久黑人 | 国产精品女主播一区二区三区| 亚洲精品久久久久久一区二区| 亚洲国产精品一区二区www| 亚洲美女啪啪| 香蕉尹人综合在线观看| 亚洲精选成人| 欧美在线视频一区二区三区| 欧美精品成人在线| 国产日韩欧美一区在线 | 亚洲人妖在线| 香蕉成人伊视频在线观看| 亚洲毛片播放| 欧美一区午夜精品| 欧美另类极品videosbest最新版本| 国产精品网红福利| 亚洲国产美女精品久久久久∴| 亚洲综合色婷婷| 99国产精品自拍| 久久国产精品久久久久久电车| 欧美日韩成人在线| 国内精品一区二区| 亚洲视频久久| 亚洲九九九在线观看| 欧美亚洲日本网站| 欧美日韩美女在线| 黄色工厂这里只有精品| 亚洲一区二区少妇| 中国av一区| 欧美激情aaaa| 国语自产精品视频在线看抢先版结局 | 亚洲一区日韩在线| 夜夜爽夜夜爽精品视频| 免费观看国产成人| 国内精品视频一区| 午夜在线一区二区| 午夜精品一区二区在线观看 | 一区二区三区久久网| 农村妇女精品| 狠狠色综合网站久久久久久久| 亚洲系列中文字幕| 亚洲图片欧洲图片av| 欧美日韩国产精品专区| 亚洲欧洲精品一区二区三区波多野1战4 | 欧美精品一区在线发布| 国产视频在线观看一区二区| 亚洲午夜电影在线观看| 日韩亚洲视频在线| 久久久久久久综合狠狠综合| 国产精品揄拍500视频| 日韩一级二级三级| 91久久精品国产91久久性色tv| 宅男噜噜噜66国产日韩在线观看| 欧美国产成人在线| 国产自产v一区二区三区c| 亚洲图片欧美日产| 99亚洲视频| 免费人成精品欧美精品| 国产精品日本一区二区| 在线综合亚洲欧美在线视频| 亚洲免费成人av| 久久一本综合频道| 国产日韩在线播放| 亚洲免费视频观看| 一区二区三区精密机械公司 | 亚洲精品三级| 一区二区三区高清视频在线观看| 免费久久精品视频| 国语自产在线不卡| 欧美一区二区私人影院日本| 新狼窝色av性久久久久久| 欧美激情一区二区在线 | 日韩一级在线| 日韩一区二区高清| 欧美国产一区二区在线观看| 一区二区在线观看av| 久久精品国产清自在天天线| 欧美一区日本一区韩国一区| 国产精品高清免费在线观看| 正在播放亚洲一区| 亚洲天堂久久| 欧美偷拍一区二区| 亚洲精品美女久久久久| 欧美午夜一区二区三区免费大片| 免费国产一区二区| 一区二区三区在线看| 亚洲欧洲精品一区二区三区 | 午夜精品久久久久久久| 香蕉久久久久久久av网站| 欧美日韩亚洲国产一区| 亚洲免费在线视频一区 二区| 午夜亚洲福利| 国产精品亚洲片夜色在线| 亚洲中字在线| 久久福利资源站| 国内精品一区二区| 一区二区三区.www| 欧美四级在线观看| 亚洲午夜一二三区视频| 欧美在线观看日本一区| 韩国三级电影一区二区| 欧美中日韩免费视频| 欧美伦理91| 在线亚洲+欧美+日本专区| 午夜精品久久久久久久蜜桃app| 国产日韩视频| 亚洲国产欧美一区| 欧美成人在线网站| 亚洲乱码国产乱码精品精可以看| 亚洲一区日韩在线| 国产视频在线观看一区二区| 亚洲第一在线视频| 久久亚洲电影| 宅男精品视频| 久久精品女人天堂| 亚洲夫妻自拍| 亚洲天堂网在线观看| 国产精品亚洲片夜色在线| 久久国产一二区| 欧美精品1区2区| 欧美专区一区二区三区| 欧美黄污视频| 亚洲自拍啪啪| 老司机精品视频网站| 亚洲美女av电影| 久久伊人亚洲| 亚洲精品视频在线| 亚洲欧美在线x视频| 国产一区二区在线免费观看| 日韩视频在线观看国产| 欧美日韩国产成人| 亚洲国产欧美一区二区三区同亚洲| 欧美激情一区二区三区蜜桃视频 | 国产精品99久久久久久久女警| 国产欧美日韩综合一区在线观看| 先锋资源久久| 欧美精品久久久久久久久老牛影院| 小黄鸭精品aⅴ导航网站入口|