《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 信通院公布AI代碼大模型評估

信通院公布AI代碼大模型評估

阿里云、華為、商湯等首批通過
2024-06-12
來源:IT之家

6月11日消息,中國信息通信研究院公布了可信 AI 代碼大模型評估的首輪評估名單,阿里云通義靈碼、華為云盤古、智譜 codegeex 等國產 AI 大模型均入選并首批通過。

此次大模型評估以《智能化軟件工程技術和應用要求 第 1 部分:代碼大模型》標準為依據,圍繞通用能力、專用場景能力、應用成熟度,為模型能力提升和企業選型提供規范性參考。

1.png

注:《智能化軟件工程技術和應用要求 第 1 部分:代碼大模型》(標準編號 AIIA / PG 0110-2023)標準于 2024 年 1 月 25 日正式發布,該標準由中國信通院與中國工商銀行聯合牽頭發起,涵蓋通用能力、專用場景能力和應用成熟度三大部分,包括 100 多個能力要求。

此次驗證,依據標準開展,評價指標覆蓋 6 大通用能力場景、7 大專用能力場景、3 大服務成熟度,多維度驗證研發大模型在研發場景能力和人效優化效果方面的場景豐富度,重點考察研發大模型在代碼理解、代碼生成和補全、研發問答、單元測試用例生成等方面的能力支持度,全方位評估研發大模型在數據合規性、模型成熟度、服務成熟度方面的應用成熟度。

2.png

目前,華為云盤古大模型、智譜 CodeGeeX 代碼大模型、阿里云 AI 編程助手通義靈碼、中國電信星辰政務大模型等首批通過評估,并在全部 100 多個能力評估中表現優秀,獲得 4 + 評級。

3.png

4.png

以阿里云通義靈碼為例,信通院評測結果顯示:

在通用能力方面,通義靈碼在代碼轉換、代碼檢查及修復、代碼優化等方面表現突出;

在專用場景方面,通義靈碼提供網站開發、數據庫開發、大數據開發、嵌入式開發等多個場景支持能力;

在應用成熟度方面,通義靈碼具備較完善的數據合規及數據分類分級機制,且模型穩定性及可維護性表現優異,在模型推理性能、模型服務風險可控性等方面均表現優秀。

公開資料顯示,AI 代碼大模型首輪評估于今年 3 月啟動,主要面向適用于金融、科技、互聯網、電信、軟件等各行業,生產、使用或計劃使用代碼大模型的企業,評估結果旨在為模型廠商提供代碼大模型能力的評價和指導標準,以及為模型應用方提供有效衡量其能力水平的標準依據。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: jealousvue熟睡入侵中| 久久精品无码午夜福利理论片| 精品日韩在线视频一区二区三区| 国产在线观看麻豆91精品免费| 4hu四虎永久地址| 夜夜高潮天天爽欧美| 一级免费黄色大片| 手机1024看片| 久久久久亚洲AV片无码| 日韩欧美在线综合网高清| 亚洲一区二区三区影院| 欧美无遮挡国产欧美另类| 亚洲精品123区在线观看| 电影天堂2018| 免费精品国产自产拍观看| 美国式禁忌免费| 四虎精品成人免费影视| 英国video性精品高清最新| 国产在线一区二区三区| 国产在线h视频| 国产欧美精品区一区二区三区| 18一20岁一级毛片| 国产精品自在拍一区二区不卡| 97精品国产91久久久久久久| 天堂а√8在线最新版在线| www国产91| 好男人看视频免费2019中文| 一本一本久久a久久综合精品蜜桃 一本一本久久a久久综合精品蜜桃 | 精品无码久久久久久国产| 国产成人无码aa精品一区| 免费观看美女用震蛋喷水的视频 | 女的张开腿让男人桶爽30分钟| 三级中文字幕永久在线视频| 无码av大香线蕉伊人久久| 久久久久久久久久久久久久久| 日本免费色网站| 久久久久亚洲av成人网人人软件| 日本精品久久久久久福利| 久久人午夜亚洲精品无码区| 日本猛少妇色xxxxx猛交| 久久国产精品亚洲一区二区|