《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 業界動態 > 如何為AI應用選擇合適的Arm邊緣AI解決方案?

如何為AI應用選擇合適的Arm邊緣AI解決方案?

2025-02-28
作者:Arm 物聯網事業部產品管理總監 Tim Menasveta
來源:Arm
關鍵詞: ARM Armv9 邊緣AI Cortex-A320

Arm Cortex-A320 是目前最小型的 Armv9-A 架構 CPU。得益于該處理器的推出,開發者現在能有更多選擇決定如何處理物聯網邊緣人工智能 (AI) 工作負載。然而,面對多樣化的選擇,要確定適合特定 AI 應用的處理器,系統開發者需要通過比較基于 Arm Cortex-A、Arm Cortex-M 和 Arm Ethos-U NPU 的設備及其可能的搭配進行決策。除了成本的考量,開發者還需了解各款處理器具備的 AI 功能,以及自身的項目可以通過何種軟件開發流程實現簡化。

在嵌入式設備中實現高能效 AI 計算

近年來,嵌入式設備中的 AI 計算效率突飛猛進。Arm 的 M 和 A 處理器架構的提升使得每單位能耗的機器學習 (ML) 推理性能呈數倍增長。特別是在 M 處理器架構上,基于 Armv8.1-M 架構的 Cortex-M52、Cortex-M55 和 Cortex-M85 CPU 集成了可編程的 Helium 向量擴展,從而解鎖了在微控制器級設備上實現新 AI 用例的能力。此外,得益于可伸縮向量擴展 (SVE2) 的引入,基于 Armv9 架構的 Cortex-A 處理器(如最新推出的 Cortex-A320)相較其前代產品進一步提升了 AI 性能。而 Ethos-U 系列 NPU 的最新一代產品 Ethos-U85 ,尤其在處理 Transformer 網絡時,表現更為高效。

如何選擇合適的硬件?

每種架構在不同方面各有優勢。在考慮哪款硬件最適合時,原始性能應與設計靈活性相權衡。此外,還需要將包括 CI/CD 要求在內的軟件開發流程納入考量。

性能

滿足所需的 AI 處理性能至關重要。Cortex-A 處理器本就是一款面向多種應用的可編程處理器,集成了 Neon/SVE2 向量引擎,旨在加速神經網絡和各種向量化代碼,并能原生支持多種數據類型。而帶有 Helium 向量引擎的 Cortex-M 處理器具備相同特性,且更適用于成本和能耗相對有限的目標用例。相比之下,包含 Ethos-U85 在內的 Ethos-U NPU 則專為處理神經網絡算子而設計,尤其還具備了量化的 8 位整數數據權重的能力,對于可以映射到這些 NPU 硬件的網絡算子,其任務表現十分高效。

基于 Armv9 架構的最新一代 Cortex-A CPU 支持 BF16 等廣泛的數據類型。此外,引入的新矩陣乘法指令顯著提高了神經網絡的處理性能。關于如何通過 SVE2 實現矩陣乘法的詳細解釋,推薦閱讀《Neon、SVE 和 SME 實現矩陣-矩陣乘法的比較》。

Cortex-M55 是首款集成 Helium 向量技術的 Cortex-M 處理器,此后推出的 Cortex-M85 也集成了這一技術。兩者都實現了雙節拍 (dual-beat) Helium 配置,每個時鐘周期可執行多達八次的 8 位整數乘積累加運算 (MAC) 操作。此外,Helium 還原生支持 FP16、FP32 等其他數據類型。

最后,在具有量化數據類型的模型上,具體來說是 INT8 權重,以及 INT8 或 INT16 激活數據,Ethos-U NPU 可以非常高效地處理神經網絡。這種設計雖會限制其適用的數據類型,但可提高 NPU 的執行效率。

評估處理器在實際 AI 工作負載中性能的方法之一,是分析其每種數據類型和每個時鐘周期的理論 MAC 執行能力。由于神經網絡處理使用大型數據集,因此內存訪問性能是另一大關鍵因素。不過在本例中,我們著重于處理器密集 (processor-bound) 性能,而非內存密集 (memory-bound) 性能。

神經網絡處理速率通常受限于底層硬件的 MAC 操作速率。雖然實際的網絡處理性能因網絡結構而異,但下表所示的的理論 MAC 處理速率提供了硬件能力的指標。

Untitled.png

軟件

另外一個考慮的因素是每個硬件方案的軟件支持。Arm 為包括 Cortex-A、Cortex-M 和 Ethos-U 等在內的各類 AI 硬件解決方案提供全面的開源運行時支持軟件。Arm 為各種 ML 框架和運行時提供硬件加速支持,包括 PyTorch、ExecuTorch、Llama.cpp、TensorFlow 和 LiteRT(通過 XNNPACK)。任何 ML 框架都可通過優化,進而充分利用 Arm 的 AI 特性。在 Arm 處理器上執行的運行時可利用 CMSIS-NN(針對 Cortex-M/Helium)和 Arm Compute Library 或 Arm KleidiAI(針對  Neon/SVE2 中的 INT8 和 BF16)等軟件加速庫。Vela 編譯器是一個通過優化模型來實現高效部署的離線工具,可在  Ethos-U 上進一步調優可執行二進制文件,從而實現更卓越的硬件性能。

何時使用 Ethos-U?

一些具有明確定義的  AI 工作負載的邊緣 AI 用例可以通過將神經網絡處理卸載到專用 NPU 上,從而釋放主處理器的計算密集型任務,并由此獲益。如前所述,Ethos-U NPU 在處理具有量化的 8 位整數權重的神經網絡時非常高效。Transformer 網絡特別適合在 Ethos-U85 上運行。然而,Ethos-U85 NPU 需由一個主處理器(可以是 Cortex-M 或 Cortex-A)進行驅動。

主處理器與 Ethos-U 間可以有多種配置方式。Ethos-U 可由像 Cortex-M55 等啟用 Helium 的 Cortex-M 處理器驅動使用。目前市面上已有這種系統級芯片 (SoC) 配置的示例。近期,在小語言模型 (SLM) 上運行生成式 AI 工作負載愈發受到業界關注。Ethos-U 與啟用 Helium 的Cortex-M處理器相結合,是此類用例的上佳之選。

此外,還有基于 Cortex-A 處理器的 SoC 集成了基于 Cortex-M 核心的 ML 島與 Ethos-U。這類 SoC 通常適合運行 Linux 等功能豐富的操作系統,并支持更大、更靈活的內存系統。Cortex-M CPU 擁有 32 位可尋址內存地址空間,能實現直接內存地址映射,而像 Cortex-A320 等更新款的 Cortex-A 處理器則具有 40 位內存可尋址空間,還可以通過內存管理單元 (MMU) 的虛擬內存尋址。

隨著大語言模型 (LLM) 的執行逐漸轉向邊緣 AI 設備,擁有更大和更靈活的內存系統可以簡化較大參數規模(例如大于 10 億參數的 LLM)模型的執行。Cortex-M 和 Ethos-U85 的組合很適合于越來越受到歡迎的小語言模型。Cortex-M 處理器具有 4GB 的尋址空間,并保留了其中一些空間用于系統功能。隨著 LLM 模型規模的增長,具有更大和更靈活內存的 Cortex-A 系統將變得至關重要。

Arm 近期又宣布了另一種配置方式,稱為“直接驅動 (direct drive)”,即 Cortex-A 處理器直接驅動 Ethos-U NPU。這種配置無需專門的 Cortex-M 作為“驅動”處理器。Ethos-U85 的 Linux 驅動程序可在 Cortex-A 主控制器上運行。

222.png

利用 Cortex-A320 滿足邊緣設備的生成式 AI 需求

邊緣 AI 系統開發者現在有更多的選擇來優化物聯網中最靠近邊緣側的 AI。無論選擇 Cortex-M、Cortex-A 還是 Ethos-U 加速系統,每種選擇都可滿足不同的需求。Cortex-A320 處理器能夠直接驅動 Ethos-U85,這讓設計人員獲得了更多的靈活性。作為 Arm 最小型、最高能效的  Armv9-A 處理器,Cortex-A320 在提高邊緣側 AI 能效的同時,適應嵌入式系統中生成式 AI 演進的需求。點擊此處,了解 Arm 變革性的邊緣側 AI 解決方案如何塑造物聯網的未來!


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
激情六月婷婷久久| 亚洲另类黄色| 欧美精品久久99| 免费在线观看一区二区| 久久亚洲一区二区三区四区| 欧美怡红院视频| 亚洲男人第一网站| 亚洲永久精品国产| 亚洲一区二区在线播放| 亚洲精品久久久久久一区二区| 亚洲高清视频中文字幕| 亚洲高清视频的网址| 亚洲国产日韩综合一区| 亚洲国产婷婷| 亚洲欧洲精品一区| 亚洲毛片av| 中文久久精品| 亚洲欧美国产高清va在线播| 亚洲在线一区| 欧美一区二区三区四区高清| 欧美一级欧美一级在线播放| 欧美一区二区成人| 久久久无码精品亚洲日韩按摩| 久久天堂成人| 欧美.日韩.国产.一区.二区| 欧美激情a∨在线视频播放| 欧美精品网站| 国产精品大全| 国产精品日韩欧美综合| 国产欧美丝祙| 激情一区二区三区| 亚洲欧洲一区二区三区在线观看 | 亚洲国产精品美女| 亚洲精品日韩欧美| 一本色道久久综合亚洲精品高清| 亚洲小说欧美另类婷婷| 欧美一区二区三区免费看| 久久精品视频在线免费观看| 快射av在线播放一区| 欧美日韩hd| 国产日产亚洲精品| 在线精品观看| 一区二区冒白浆视频| 亚洲欧美福利一区二区| 亚洲国产成人精品女人久久久 | 欧美日韩影院| 国产麻豆午夜三级精品| 狠狠色伊人亚洲综合成人| 亚洲国产天堂网精品网站| av成人国产| 欧美自拍偷拍午夜视频| 亚洲免费观看高清在线观看| 亚洲自拍偷拍色片视频| 久久夜色精品亚洲噜噜国产mv| 欧美久久久久免费| 国产日本欧美一区二区三区| 亚洲国产精品一区二区www在线| 中国女人久久久| 亚洲电影在线观看| 亚洲综合精品自拍| 免费试看一区| 国产精品美女久久久| 在线观看日韩| 亚洲在线一区二区三区| 91久久精品一区| 欧美一区国产二区| 欧美精品免费在线观看| 国产一区二区福利| 日韩视频在线一区二区| 久久国产精品久久久久久电车| 一区二区三区黄色| 久久综合色综合88| 国产精品嫩草影院一区二区| 亚洲国产毛片完整版 | 欧美久久久久久蜜桃| 国产欧美日韩不卡| 亚洲精品视频在线观看网站| 欧美在线免费看| 亚洲一区二区在| 欧美黑人国产人伦爽爽爽| 国产欧美视频一区二区| 日韩亚洲精品电影| 91久久一区二区| 欧美在线一二三| 国产精品a久久久久久| 亚洲黄页一区| 久久精品一二三区| 午夜精品国产精品大乳美女| 欧美精品在线一区| 国产综合一区二区| 亚洲免费网站| 亚洲视频电影图片偷拍一区| 欧美成人免费一级人片100| 国产日韩一区二区三区| 亚洲婷婷免费| 亚洲色图制服丝袜| 欧美精品粉嫩高潮一区二区 | 毛片精品免费在线观看| 国产欧美一区二区三区久久人妖| 99re热这里只有精品视频 | 亚洲午夜精品一区二区| 欧美激情视频在线播放| 精品51国产黑色丝袜高跟鞋| 欧美一级理论性理论a| 亚洲欧美日本国产专区一区| 欧美日韩综合视频| 日韩亚洲一区在线播放| 日韩视频永久免费观看| 欧美成人精品| 在线精品视频一区二区| 欧美伊久线香蕉线新在线| 欧美一区二区视频在线| 国产精品黄色| 亚洲无玛一区| 午夜日本精品| 国产精品蜜臀在线观看| 亚洲一区二区三区三| 亚洲综合第一| 国产精品自拍网站| 午夜免费电影一区在线观看| 欧美一级视频精品观看| 国产乱码精品一区二区三区五月婷| 亚洲少妇一区| 香蕉久久一区二区不卡无毒影院| 国产精品看片你懂得| 亚洲男人的天堂在线观看| 欧美一级电影久久| 国产有码一区二区| 久久精品一区二区三区不卡| 美女在线一区二区| 亚洲高清三级视频| 夜夜嗨网站十八久久| 欧美色道久久88综合亚洲精品| 中国女人久久久| 欧美在线亚洲综合一区| 国语自产精品视频在线看抢先版结局 | 亚洲精品美女久久7777777| 中文精品视频一区二区在线观看| 欧美视频一区在线| 亚洲欧美激情精品一区二区| 久久99伊人| 伊人精品在线| 亚洲巨乳在线| 欧美午夜一区二区| 午夜免费电影一区在线观看| 久久综合久久久久88| 亚洲日本va午夜在线电影| 亚洲一区视频在线| 国产欧美一区二区精品秋霞影院| 久久riav二区三区| 欧美国产成人精品| 一区二区三区波多野结衣在线观看| 亚洲欧美另类国产| 韩日欧美一区| 亚洲精品视频中文字幕| 国产精品r级在线| 久久精品99国产精品酒店日本| 欧美高清影院| 野花国产精品入口| 久久精品人人做人人综合| 亚洲电影免费观看高清完整版| 日韩视频第一页| 国产精品视频免费观看www| 久久精品国产久精国产思思| 欧美理论电影在线播放| 午夜激情一区| 欧美一区在线直播| 久久人人爽人人爽爽久久| 亚洲经典视频在线观看| 西瓜成人精品人成网站| 好吊妞这里只有精品| 一区二区欧美日韩| 国产一区二区三区在线免费观看 | 欧美激情亚洲激情| 亚洲一区一卡| 欧美sm重口味系列视频在线观看| 日韩一区二区久久| 久久久www成人免费毛片麻豆 | 亚洲狼人综合| 久久久精品2019中文字幕神马| 亚洲片在线观看| 欧美专区日韩视频| 亚洲日本成人| 久久久精品日韩| 一本色道久久综合狠狠躁的推荐| 久久精品亚洲| 一区二区高清| 麻豆av一区二区三区| 99www免费人成精品| 久久亚洲高清| 亚洲福利精品| 一区二区三区四区国产精品| 国产视频在线观看一区| 一区二区久久| 娇妻被交换粗又大又硬视频欧美| 亚洲综合三区| 亚洲人久久久| 免费成人av在线| 欧美亚洲免费| 国产精品人成在线观看免费|