《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > AMD發(fā)布首個AI小語言模型AMD-135M

AMD發(fā)布首個AI小語言模型AMD-135M

6900億token、推測解碼提速3.88倍
2024-10-08
來源:快科技

10月1日消息,AMD發(fā)布了自己的首個小語言模型(SLM),名為“AMD-135M”。

相比于越來越龐大的大語言模型(LLM),它體積小巧,更加靈活,更有針對性,非常適合私密性、專業(yè)性很強的企業(yè)部署。

1.jpg

AMD-135小模型隸屬于Llama家族,有兩個版本:

一是基礎型“AMD-Llama-135M”,擁有多達6700億個token,在八塊Instinct MIM250 64GB加速器上訓練了六天。

二是延伸型“AMD-Llama-135M-code”,額外增加了專門針對編程的200億個token,同樣硬件訓練了四天。

2.jpg

創(chuàng)建與部署流程

它使用了一種名為“推測解碼”(speculative decoding)的方法,通過較小的草稿模型,在單次前向傳播中生成多個候選token,然后發(fā)送給更大的、更精確的目標模型,進行驗證或糾正。

這種方法可以同時生成多個token,不會影響性能,還可以降低內存占用,但因為數(shù)據(jù)交易更多,功耗也會增加。

AMD還使用AMD-Llama-135M-code作為CodeLlama-7b的草案模型,測試了推測解碼使用與否的性能。

比如在MI250加速器上,性能可提升最多約2.8倍,銳龍AI CPU上可提升最多約3.88倍,銳龍AI NPU上可提升最多約2.98倍。

3.jpg

推測解碼

4.png

AMD-135M小模型的訓練代碼、數(shù)據(jù)集等資源都已經(jīng)開源,遵循Apache 2.0。

按照AMD的說法,它的性能與其他開源小模型基本相當或略有領先,比如Hellaswag、SciQ、ARC-Easy等任務超過Llama-68M、LLama-160M,Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任務則基本類似GTP2-124MN、OPT-125M。

5.jpg



Magazine.Subscription.jpg

本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 人妻体体内射精一区二区| 国产日韩欧美三级| 一本色道久久88—综合亚洲精品 | bbbbbbbbb欧美bbb| 成年性香蕉漫画在线观看| 久久国产视频网| 欧洲成人全免费视频网站 | 欧美日韩一区二区三区麻豆 | 草莓视频网站入口| 国产大陆xxxx做受视频| xxxxx日韩| 国产精品污WWW在线观看| 99re热久久资源最新获取| 女人和男人做爽爽爽免费| 丫头稚嫩紧窄小缝| 手机在线看片国产日韩生活片| 久久免费国产视频| 鲁啊鲁阿鲁在线视频播放| 国产精品无码AV天天爽播放器| 99久久99久久久精品久久| 天堂网在线最新版www| xxxx日本黄色| 日韩精品一区二区三区国语自制| 亚洲免费观看视频| 欧美日韩北条麻妃一区二区| 亚洲第一页在线视频| 男人女人做a视频| 免费看黄网站在线| 精品国产欧美一区二区| 另类图片亚洲校园小说区| 美女把尿口扒开让男人添| 四虎永久成人免费影院域名| 色妞色综合久久夜夜| 国产伦精品一区二区三区四区| 高清一区二区在线观看| 国产成人无码区免费内射一片色欲 | 动漫精品一区二区三区3d| 美女巨胸喷奶水视频www免费| 国产69精品久久久久妇女| 老司机午夜在线| 啊v在线免费观看|