《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 谷歌推擁有26000個H100的超算,加速AI軍備競賽

谷歌推擁有26000個H100的超算,加速AI軍備競賽

2023-05-11
來源:半導體行業觀察
關鍵詞: 谷歌 AI A3

  云提供商正在組建 GPU 大軍,以提供更多的 AI 火力。在今天舉行的年度 Google I/O 開發者大會上,Google 宣布了一款擁有 26,000 個 GPU 的 AI 超級計算機——A3 ,這個超級計算機是谷歌與微軟爭奪 AI 霸權的斗爭中投入更多資源進行積極反攻的又一證據。

  這臺超級計算機擁有大約 26,000 個 Nvidia H100 Hopper GPU。作為參考,世界上最快的公共超級計算機Frontier擁有 37,000 個 AMD Instinct 250X GPU。

  對于我們最大的客戶,我們可以在單個集群中構建多達 26,000 個 GPU 的 A3 超級計算機,并正在努力在我們最大的地區構建多個集群,”谷歌發言人在一封電子郵件中說,并補充說“并非我們所有的位置都將是縮放到這么大的尺寸?!?/p>

  該系統是在加利福尼亞州山景城舉行的 Google I/O 大會上宣布的。開發者大會已經成為谷歌許多人工智能軟件和硬件能力的展示。在微軟將 OpenAI 的技術應用于 Bing 搜索和辦公生產力應用程序之后,谷歌加速了其 AI 開發。

  該超級計算機面向希望訓練大型語言模型的客戶。谷歌為希望使用超級計算機的公司宣布了隨附的 A3 虛擬機實例。許多云提供商現在都在部署 H100 GPU,Nvidia 在 3 月份推出了自己的 DGX 云服務,與租用上一代 A100 GPU 相比價格昂貴。

  谷歌表示,A3 超級計算機是對現有 A2 虛擬機與 Nvidia A100 GPU 提供的計算資源的重大升級。谷歌正在將所有分布在不同地理位置的 A3 計算實例匯集到一臺超級計算機中。

  “A3 超級計算機的規??商峁└哌_ 26 exaflops 的 AI 性能,這大大減少了訓練大型 ML 模型的時間和成本,”谷歌的董事 Roy Kim 和產品經理 Chris Kleban 在一篇博客文章中說。

  公司使用 exaflops 性能指標來估計 AI 計算機的原始性能,但批評者仍然對其持保留意見。在谷歌的案例中,被大家詬病的是其結果在以 ML 為目標的 bfloat16(“brain floating point”)性能中計算出來的,這讓你達到“exaflops”的速度比大多數經典 HPC 應用程序仍然使用的雙精度 (FP64) 浮點數學要快得多要求。

  GPU 的數量已經成為云提供商推廣其 AI 計算服務的重要名片。微軟在 Azure 中的 AI 超級計算機與 OpenAI 合作構建,擁有 285,000 個 CPU 內核和 10,000 個 GPU。微軟還宣布了配備更多 GPU 的下一代 AI 超級計算機。Oracle 的云服務提供對 512 個 GPU 集群的訪問,并且正在研究新技術以提高 GPU 通信的速度。

  谷歌一直在大肆宣傳其TPU v4 人工智能芯片,這些芯片被用于運行帶有 LLM 的內部人工智能應用程序,例如谷歌的 Bard 產品。谷歌的 AI 子公司 DeepMind 表示,快速 TPU 正在指導通用和科學應用的 AI 開發。

  相比之下,谷歌的 A3 超級計算機用途廣泛,可以針對廣泛的 AI 應用程序和 LLM 進行調整。Kim 和 Kleban 在博文中表示:“鑒于這些工作負載的高要求,一刀切的方法是不夠的——你需要專為 AI 構建的基礎設施?!?/p>

  就像谷歌喜歡它的 TPU 一樣,Nvidia 的 GPU 已經成為云提供商的必需品,因為客戶正在 CUDA 中編寫 AI 應用程序,這是 Nvidia 專有的并行編程模型。該軟件工具包基于 H100 的專用 AI 和圖形內核提供的加速生成最快的結果。

  微信截圖_20230511104216.png

  客戶可以通過 A3 虛擬機運行 AI 應用程序,并通過 Vertex AI、Google Kubernetes Engine 和 Google Compute Engine 服務使用 Google 的 AI 開發和管理服務。公司可以使用 A3 超級計算機上的 GPU 作為一次性租用,結合大型語言模型來訓練大型模型。然后,將新數據輸入模型,更新模型——無需從頭開始重新訓練。

  谷歌的 A3 超級計算機是各種技術的大雜燴,以提高 GPU 到 GPU 的通信和網絡性能。A3 虛擬機基于英特爾第四代 Xeon 芯片(代號 Sapphire Rapids),與 H100 GPU 一起提供。目前尚不清楚 VM 中的虛擬 CPU 是否會支持 Sapphire Rapids 芯片中內置的推理加速器。VM 隨附 DDR5 內存。

  Nvidia H100 上的訓練模型比在云端廣泛使用的上一代 A100 GPU 更快、更便宜。人工智能服務公司 MosaicML 進行的一項研究發現,H100 在其 70 億參數的 MosaicGPT 大型語言模型上“比 NVIDIA A100 的成本效益高 30%,速度快 3 倍”。

  H100 也可以進行推理,但考慮到 H100 提供的處理能力,這可能被認為是矯枉過正。谷歌云提供 Nvidia 的 L4 GPU 用于推理,英特爾在其 Sapphire Rapids CPU 中擁有推理加速器。

  “A3 VM 也非常適合推理工作負載,與我們的 A2 VM 的 A100 GPU 相比,推理性能提升高達 30 倍,”Google 的 Kim 和 Kleban 說。

  A3 虛擬機是第一個通過名為 Mount Evans 的基礎設施處理單元連接 GPU 實例的虛擬機,該單元由谷歌和英特爾聯合開發。IPU 允許 A3 虛擬機卸載網絡、存儲管理和安全功能,這些功能傳統上是在虛擬 CPU 上完成的。IPU 允許以 200Gbps 的速度傳輸數據。

  “A3 是第一個使用我們定制設計的 200Gbps IPU 的 GPU 實例,GPU 到 GPU 的數據傳輸繞過 CPU 主機并流經與其他 VM 網絡和數據流量不同的接口。與我們的 A2 虛擬機相比,這使網絡帶寬增加了 10 倍,具有低尾延遲和高帶寬穩定性,”谷歌高管在一篇博客文章中說。

  IPU 的吞吐量可能很快就會受到微軟的挑戰,微軟即將推出的配備 Nvidia H100 GPU 的 AI 超級計算機將擁有該芯片制造商的 Quantum-2 400Gbps 網絡功能。微軟尚未透露其下一代 AI 超級計算機中 H100 GPU 的數量。

  A3 超級計算機建立在源自公司 Jupiter 數據中心網絡結構的主干上,該主干通過光學鏈路連接地理上不同的 GPU 集群。

  “對于幾乎每一種工作負載結構,我們都實現了與更昂貴的現成非阻塞網絡結構無法區分的工作負載帶寬,”谷歌表示。

  谷歌還分享說,A3 超級計算機將有八個 H100 GPU,它們使用 Nvidia 專有的交換和芯片互連技術互連。GPU 將通過 NVSwitch 和 NVLink 互連連接,其通信速度約為 3.6TBps。Azure 在其 AI 超級計算機上提供了相同的速度,并且兩家公司都部署了 Nvidia 的電路板設計。

  “每臺服務器都使用服務器內部的 NVLink 和 NVSwitch 將 8 個 GPU 互連在一起。為了讓 GPU 服務器相互通信,我們在 Jupiter DC 網絡結構上使用了多個 IPU,”一位谷歌發言人說。

  該設置有點類似于 Nvidia 的 DGX Superpod,它具有 127 個節點的設置,每個 DGX 節點配備八個 H100 GPU。

  谷歌博客:配備 NVIDIA H100 GPU 的 A3 超級計算機

  實施最先進的人工智能 (AI) 和機器學習 (ML) 模型需要大量計算,既要訓練基礎模型,又要在這些模型經過訓練后為它們提供服務??紤]到這些工作負載的需求,一種放之四海而皆準的方法是不夠的——您需要專為 AI 構建的基礎設施。

  我們與我們的合作伙伴一起,為 ML 用例提供廣泛的計算選項,例如大型語言模型 (LLM)、生成 AI 和擴散模型。最近,我們發布了 G2 VMs,成為第一個提供新的 NVIDIA L4 Tensor Core GPU 用于服務生成式 AI 工作負載的云。今天,我們通過推出下一代 A3 GPU 超級計算機的私人預覽版來擴展該產品組合。Google Cloud 現在提供一整套 GPU 選項,用于訓練和推理 ML 模型。

  Google Compute Engine A3 超級計算機專為訓練和服務要求最嚴苛的 AI 模型而打造,這些模型為當今的生成式 AI 和大型語言模型創新提供動力。我們的 A3 VM 結合了 NVIDIA H100 Tensor Core GPU 和 Google 領先的網絡技術,可為各種規模的客戶提供服務:

  1. A3 是第一個使用我們定制設計的 200 Gbps IPU的 GPU 實例,GPU 到 GPU 的數據傳輸繞過 CPU 主機并流過與其他 VM 網絡和數據流量不同的接口。與我們的 A2 VM 相比,這可實現高達 10 倍的網絡帶寬,同時具有低尾延遲和高帶寬穩定性。

  2. 我們行業獨一無二的智能 Jupiter 數據中心網絡結構可擴展到數萬個高度互連的 GPU,并允許全帶寬可重新配置的光學鏈路,可以按需調整拓撲。對于幾乎每種工作負載結構,我們實現的工作負載帶寬與更昂貴的現成非阻塞網絡結構沒有區別,從而降低了 TCO。

  3. A3 超級計算機的規模提供高達 26 exaFlops 的 AI 性能,這大大減少了訓練大型 ML 模型的時間和成本。

  隨著公司從訓練過渡到提供 ML 模型,A3 VM 也非常適合推理工作負載,與我們由 NVIDIA A100 Tensor Core GPU* 提供支持的 A2 VM 相比,推理性能提升高達 30 倍。

  A3 GPU VM 專門為當今的 ML 工作負載提供最高性能的訓練,配備現代 CPU、改進的主機內存、下一代 NVIDIA GPU 和主要網絡升級。以下是 A3 的主要特點:

  1. 8 個 H100 GPU,利用 NVIDIA 的 Hopper 架構,提供 3 倍的計算吞吐量

  2. 通過 NVIDIA NVSwitch 和 NVLink 4.0,A3 的 8 個 GPU 之間的對分帶寬為 3.6 TB/s

  3. 下一代第 4 代英特爾至強可擴展處理器

  4. 2TB 主機內存,通過 4800 MHz DDR5 DIMM

  5. 由我們支持硬件的 IPU、專門的服務器間 GPU 通信堆棧和 NCCL 優化提供支持的網絡帶寬增加 10 倍

  A3 GPU VM 是客戶開發最先進的 ML 模型的一個進步。通過顯著加快 ML 模型的訓練和推理,A3 VM 使企業能夠快速訓練更復雜的 ML 模型,為我們的客戶創造機會來構建大型語言模型 (LLM)、生成 AI 和擴散模型,以幫助優化運營并在競爭中保持領先地位。

  此次發布基于我們與 NVIDIA 的合作伙伴關系,旨在為我們的客戶提供用于訓練和推理 ML 模型的全方位 GPU 選項。

  NVIDIA 超大規模和高性能計算副總裁 Ian Buck 表示:“由下一代 NVIDIA H100 GPU 提供支持的 Google Cloud 的 A3 VM 將加速生成 AI 應用程序的訓練和服務?!?“在谷歌云最近推出 G2 實例之后,我們很自豪能夠繼續與谷歌云合作,通過專門構建的人工智能基礎設施幫助全球企業轉型?!?/p>

  對于希望在無需維護的情況下開發復雜 ML 模型的客戶,您可以在 Vertex AI 上部署 A3 VM,Vertex AI 是一個端到端平臺,用于在專為低延遲服務和高性能而構建的完全托管基礎設施上構建 ML 模型訓練。今天,在Google I/O 2023上,我們很高興通過向更多客戶開放 Vertex AI 中的生成 AI 支持以及引入新功能和基礎模型來構建這些產品。

  對于希望構建自己的自定義軟件堆棧的客戶,客戶還可以在 Google Kubernetes Engine (GKE) 和 Compute Engine 上部署 A3 VM,以便您可以訓練和提供最新的基礎模型,同時享受自動縮放、工作負載編排和自動升級。

  “Google Cloud 的 A3 VM 實例為我們提供了計算能力和規模,可滿足我們最苛刻的訓練和推理工作負載。我們期待利用他們在 AI 領域的專業知識和在大規模基礎設施方面的領導地位,為我們的 ML 工作負載提供強大的平臺?!?-Noam Shazeer,Character.AI 首席執行官

  在谷歌云,人工智能是我們的 DNA。我們應用了數十年為 AI 運行全球規模計算的經驗。我們設計了該基礎架構以擴展和優化以運行各種 AI 工作負載——現在,我們將其提供給您。


  更多精彩內容歡迎點擊==>>電子技術應用-AET<<

微信圖片_20210517164139.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲一二三区在线| 久久精品二区三区| 国产综合久久| 国产欧美日韩麻豆91| 国产精品久久久久免费a∨大胸 | 久久久亚洲人| 久久精品中文字幕一区二区三区| 午夜精品一区二区三区在线播放| 亚洲一区二区三区视频播放| 中国女人久久久| 99xxxx成人网| 99亚洲视频| 妖精成人www高清在线观看| 99av国产精品欲麻豆| 亚洲乱码久久| 一本到高清视频免费精品| 一本久道久久综合婷婷鲸鱼| 一区二区三区免费在线观看| av成人毛片| 亚洲视频导航| 亚洲在线中文字幕| 性色av一区二区三区红粉影视| 亚洲专区在线| 欧美一区国产一区| 久久精品视频在线播放| 久热国产精品| 欧美精品97| 国产精品v亚洲精品v日韩精品 | 亚洲精品一区二区三区99| 亚洲精品小视频在线观看| 99精品视频免费观看视频| 在线视频你懂得一区二区三区| 亚洲综合电影| 亚洲电影免费观看高清完整版在线| 亚洲国产99| 一级日韩一区在线观看| 亚洲欧美综合精品久久成人| 久久精品欧洲| 欧美国产精品va在线观看| 欧美日韩中文在线| 国产精品影音先锋| 一色屋精品视频免费看| 亚洲精品欧美一区二区三区| 中国成人在线视频| 欧美在线观看视频在线| 亚洲全部视频| 亚洲尤物在线视频观看| 久久精品国产在热久久| 欧美激情一区二区三区在线视频| 国产精品igao视频网网址不卡日韩| 国产欧美日韩一区二区三区| 在线观看日韩精品| 一区二区黄色| 亚洲福利视频在线| 亚洲午夜久久久| 久久精品一本| 欧美日韩一区二区三区在线看| 国产欧美欧美| 亚洲人成艺术| 欧美一区二区三区免费在线看| 亚洲精品乱码久久久久久黑人| 亚洲免费中文字幕| 久久综合一区| 国产精品美女久久| 亚洲国产精品黑人久久久| 亚洲一区二区三区777| 91久久在线| 亚洲欧美在线网| 欧美成人午夜影院| 国产精品揄拍一区二区| 91久久久久| 久久gogo国模裸体人体| 亚洲一区二区三区国产| 麻豆精品国产91久久久久久| 国产精品久久激情| 亚洲国产成人久久| 亚洲欧美成人| 99在线|亚洲一区二区| 久久久久久久久久码影片| 欧美日韩精品一本二本三本| 黄色亚洲大片免费在线观看| 亚洲午夜久久久久久久久电影网| 亚洲精品久久久久久久久久久久久 | 欧美视频观看一区| 一区二区三区在线高清| 亚洲男同1069视频| 一区二区三区视频在线| 久热国产精品视频| 国产欧美日韩在线| 中文亚洲视频在线| 99re热这里只有精品免费视频| 久久青草久久| 国产欧美在线观看一区| 亚洲巨乳在线| 亚洲精品一区二区在线| 久久亚洲一区二区| 国产欧美日本一区视频| 一区二区三区日韩在线观看 | 一本色道久久综合精品竹菊| 蜜桃av噜噜一区| 韩国久久久久| 先锋影院在线亚洲| 午夜精品久久久久久久白皮肤| 欧美日韩三级视频| 亚洲精品社区| 99精品视频免费观看| 欧美顶级艳妇交换群宴| 亚洲大胆女人| 亚洲人久久久| 欧美不卡视频一区| 在线观看三级视频欧美| 亚洲电影中文字幕| 久久综合图片| 在线不卡亚洲| 亚洲国产精品成人综合| 久久蜜桃香蕉精品一区二区三区| 国产欧美日韩另类一区| 亚洲欧美日韩精品一区二区| 欧美亚洲综合在线| 国产日韩欧美三级| 性娇小13――14欧美| 久久精品国产精品| 国精品一区二区| 亚洲国产精品一区二区www| 老色批av在线精品| 在线免费不卡视频| 亚洲人成高清| 欧美精品国产| 日韩视频精品| 亚洲一区二区三区在线看| 国产精品地址| 亚洲欧美一区二区三区久久| 欧美在线一级va免费观看| 国产午夜亚洲精品不卡| 欧美中文字幕在线播放| 浪潮色综合久久天堂| 亚洲国产日韩在线一区模特| 亚洲最新在线视频| 欧美午夜电影在线| 亚洲欧美日韩一区二区三区在线观看 | 亚洲午夜精品久久| 国产精品免费视频观看| 新片速递亚洲合集欧美合集| 久久精品视频在线播放| 一区二区亚洲| 一区二区毛片| 国产精品伊人日日| 久久精品一区二区国产| 欧美女同在线视频| 亚洲一区二区三区在线看| 久久国产精品一区二区三区四区| 韩国福利一区| 一本色道久久88精品综合| 国产精品久久久久久久久久尿| 午夜精品久久久久影视 | 欧美人成免费网站| 亚洲一区3d动漫同人无遮挡| 久久免费视频在线| 亚洲美女毛片| 久久精品盗摄| 亚洲激情av| 欧美影院一区| 亚洲国产精品久久久久婷婷老年 | 亚洲第一二三四五区| 亚洲香蕉在线观看| 国产亚洲a∨片在线观看| 亚洲精品欧美日韩| 国产精品久线观看视频| 久久精品一本| 国产精品高潮在线| 亚洲国产清纯| 国产精品第十页| 亚洲国产一二三| 国产精品免费aⅴ片在线观看| 亚洲高清免费在线| 国产精品黄页免费高清在线观看| 欧美专区一区二区三区| 欧美日本在线看| 欧美一区二区三区四区在线观看地址 | 亚洲少妇诱惑| 久久久久久九九九九| 亚洲三级免费观看| 久久精品在线免费观看| 亚洲另类自拍| 久久综合99re88久久爱| 宅男精品导航| 欧美福利视频网站| 香蕉久久夜色精品国产| 欧美日韩理论| 亚洲国产一成人久久精品| 国产精品久久久久高潮| 亚洲经典在线| 国产视频在线观看一区| 亚洲天堂激情| 在线免费高清一区二区三区| 欧美在线视频二区| 在线亚洲伦理| 欧美精品www在线观看| 欧美中文在线视频| 国产精品你懂的|