COMPUTEX 2025展會上,Arm宣布今年出貨到頂尖超大規模云端服務供應商的算力,近50%是基于Arm構架。Arm也預估PC與平板市場,Arm構架將占整體出貨量40%。新構架要獲市場認可往往需要較長時間,Arm取得這成績耗時明顯更短,是如何做到?
構建AI系統的三個關鍵
“AI正以前所未有的速度改變一切”,Arm高級副總裁兼終端事業部總經理Chris Bergey說,“接下來三年,我們很快就會迎接大轉變:當這些設備自主模式運行,表現能媲美人類。”
這就需要建構完善AI系統,Chris Bergey表示建構AI系統有三個關鍵要素:
首先,從云端到邊緣打造一個無所不在的平臺將具有極大的價值。很多時候AI在端側運行,但在某些情況下,又希望能夠將工作負載轉移到云端。擁有一個高可移植的平臺,對于推動先進技術及產品的實現,以及為現有產品增加新功能,非常有價值。
其次,是電力和每瓦性能。數據中心的能耗從兆瓦級(MW)躍升至吉瓦(GW)級,其中超過50%實際上來自于機架和半導體設備。由于AI需要大量的運算能力,這意味著「每瓦性能」可能是最關鍵的衡量指標。
還有,軟件同樣至關重要。AI發展的速度非常快,這讓AI軟件開發非常具有挑戰性。如果沒有成熟的軟件及其生態系統,要跟上所有行業標準和各種AI框架,將會是一項非常繁重且具有挑戰性的工作。
Arm已經在軟件方面進行了大量投資,去年COMPUTEX,Arm發布了Arm Kleidi軟件庫,目標是讓開發者能在各種AI模型與工作負載上,包括音檔、圖象、文字或圖像,都能即時獲得最佳的性能表現。
Kleidi推出后的一年內,已整合至多個主流AI框架中,包括ExecuTorch、PyTorch、Angel、llama.cpp、MediaPipe、MNN以及ONNX Runtime。
截至目前,Kleidi已在搭載Arm構架的裝置上安裝量累計超過80億次,且仍在持續成長中。
Arm CPU更適合AI訓練與推理
Arm之所以能乘上AI的東風,關鍵原因就是Arm構架的產品能充分滿足建構AI系統的三大要素。
在數據中心領域,Arm已經深耕了十多年。全球最大的云端服務供應商亞馬遜云端科技(AWS)就對Arm服務器CPU的發展至關重要。
AWS去年秋季分享,他們有相當一部分自身的工作負載運行在基于Arm構架的AWS Graviton處理器上。
在AWS完成自身工作負載遷移至Arm平臺后,第三方工作負載也紛紛轉向Arm平臺,這為頭部云端服務供應商帶來了超過40%的能源效率提升。AWS也曾分享,其超過90%的重要客戶(不包括Amazon)也在使用Arm的構架。
這意味著,過去兩年AWS新部署的CPU算力中,有超過50%是基于Arm技術的Graviton。
除了AWS,也積極采用Arm構架,例如,NVIDIA Grace Blackwell和Vera Rubin以及許多云端服務供應商的自研加速器。
“這些加速器無論是用于訓練還是推理,通常都會與Arm處理器配合使用,因為在小芯片(Chiplet)層級,它們之間可以實現緊密耦合,從而帶來卓越的運算密度、I/O密度和頻寬表現。”Chris Bergey指出,這儼然成為一種趨勢──NVIDIA及云端服務供應商都在基于Arm構架運行AI。
“基于這樣的發展勢頭,我們預計Arm構架將占據半數2025年出貨到頭部云端服務供應商的算力,這將是一個巨大的成就。”Chris Bergey同時表示,云計算推動了這一成長,如今AI運算也成為強勁驅動力。數據中心的未來將是Arm運算與加速器的緊密耦合。
Chris Bergey也明確指出,Arm目前聚焦在邊緣側GPU,尚未有投入數據中心中GPU的計劃。
Arm構架PC與平板市場成長驚人
在云端訓練和推理使用Arm的產品的同時,英偉達也將數據中心層級的運算能力帶到了桌面級產品。
今年推出的NVIDIA DGX Spark,搭載了10個Arm Cortex-X925核心和10個Cortex-A725核心,并配備了可實現高達1PetaFLOPs(即每秒10^15次浮點運算)AI性能的GPU。
“Cortex-X925具備業界最高水準的IPC性能。這一點至關重要,因為IPC(每時脈周期指令數)與頻率的乘積決定了整個平臺的性能。相較于單純依賴提高頻率來提升性能,提升IPC可以更高效地實現性能的增強,同時顯著改善能耗表現。”Chris Bergey指出。
今年稍后Arm會推出新的Armv9旗艦CPU(代號Travis)。屆時,在目前業界IPC性能最強的Arm處理器基礎上,再次實現兩位數的IPC性能提升。
CPU的性能對于端側AI的普及非常重要,開發者在進行AI開發時,會根據具體需求來決定是在CPU、GPU或NPU上運作。大多數第三方應用是在CPU上進行AI開發,有70%會始終運作在CPU上,當然AI不斷演進,異質運算是未來發展的方向。
Arm長久的合作伙伴聯發科技,也在近期推出的Kompanio Ultra SoC,更進一步提升了Chromebook 市場的水平,讓新一代Chromebook Plus設備具備先進AI與多媒體能力。
“我們對在PC和平板領域,這些過去由x86主導的市場所取得的進展也感到滿意。Arm構架在PC與平板市場的需求大幅成長,預估在2025年將占整體出貨量的40%以上。”Chris Bergey指出。
Arm的真正優勢在于全球有超過2,200萬名的軟件開發者。幾乎所有重要的軟件開發不僅能在Arm構架上運行,而且都針對Arm構架進行了最佳化。再加上Arm構架本身的設計及商業模式,開發者只需一次開發,就能在整個半導體生態系中眾多采用Arm CPU的SoC上運作。
長久以來,Arm在手機、物聯網、汽車市場都具備絕對的領先優勢。服務器、PC和平板并不是Arm的優勢所在,然而隨著AI時代的到來,Arm成為了推動AI普及的重要運算構架,同時,AI也正成為推動Arm績效成長的重要力量。