《電子技術應用》
您所在的位置:首頁 > 電子元件 > 業界動態 > Nvidia最新芯片暗示:堆料模式走到盡頭

Nvidia最新芯片暗示:堆料模式走到盡頭

2022-04-08
來源: 半導體行業觀察
關鍵詞: NVIDIA Hopper

  Nvidia不久前發布了下一代GPU架構,架構名字為“Hopper”(為了紀念計算機科學領域的先驅之一Grace Hopper)。根據Nvidia發布的具體GPU規格,我們認為Nvidia對于Hopper的主要定位是進一步加強對于人工智能方面的算力,而其算力升級依靠的不僅僅是硬件部分,還有不少算法和軟件協同設計部分,本文將為讀者做詳細分析。我們認為,在Nvidia更下一代的GPU中,我們有望看到芯粒技術成為新的亮點來突破其瓶頸。

  Hopper的性能有多強

  微信圖片_20220408094025.png

  根據Nvidia公布的數據,基于Hopper架構的GPU(H100)使用TSMC的4nm工藝設計,將會是Ampere架構(使用TSMC 7nm工藝)之后的又一次重大升級,其16位浮點數峰值算力(FP16)將會由之前的312 TFLOPS增加到1000 TFLOPS,INT8峰值算力則由之前的624TOPS增加到2000TOPS。由此可見FP16(常用于人工智能訓練)和INT8(常用于人工智能推理)的峰值算力基本上都是翻了三倍,這個H100相對A100峰值算力提升的比例基本符合A100和再上一代GPU V100的提升數字。

  而根據Nvidia官方公布的具體任務性能提升,我們也可以看到大多數人工智能相關任務的性能提升基本在2-4倍之間(尤其是使用transformer類模型的性能提升較為突出,接近4倍),初看也和峰值算力提升三倍基本吻合。但是如果我們仔細分析Nvidia H100具體芯片指標,我們認為在人工智能任務中,H100的提升不僅僅是來自于一些硬件指標(例如核心數量,DRAM帶寬,片上存儲器)的提升,更是來自于Nvidia做了算法硬件協同設計。例如,Nvidia在Hopper架構中引入了為Transformer系列模型專門設計的八位浮點數(FP8)計算支持,并且還加入了專門的Transformer engine硬件模塊來確保transformer模型的運行效率。因此,我們看到在Nvidia公布的人工智能任務性能提升中,使用transformer的任務(如GPT-3)的性能提升要高于傳統的基于CNN(如Mask R-CNN)的性能提升。

  微信圖片_20220408094041.jpg

  存儲方面提升相對較小

  在人工智能等高性能計算中,存儲(包括DRAM接口帶寬和片上存儲容量)和計算單元一樣重要,在很多時候存儲甚至會成為整體性能的瓶頸,例如峰值算力無法持續,導致平均計算能力遠低于峰值算力。在Hopper架構中,我們看到了峰值算力提升大約是Ampere的三倍,然而在DRAM帶寬和片上存儲方面,Hopper相對于Ampere的提升較小,只有1.5倍和1.25倍。

  在DRAM帶寬方面,我們看到H100有兩個版本,其中使用最新一代HBM3的版本的內存帶寬是3TB/s,相比于A100(2TB/s)的提升為1.5倍,相比峰值算力的三倍提升相對較小。反觀A100相對更上一代V100的內存帶寬提升為2.2倍,因此我們認為H100的HBM3內存帶寬提升幅度確實相對上一代來說較小。我們認為,HBM3帶寬提升較小可能和功耗有關。

  仔細分析Hopper發布的GPU,我們發現Hopper架構的GPU目前有兩個品類,一個是使用HBM3內存的版本,而另一個是仍然使用HBM2e的版本。HBM3版本的H100相對于使用HBM2e版本的H100在其他芯片架構上(包括計算單元)的差距不過10%(HBM3版本的計算單元較多),但是在功耗(TDP)上面,HBM3版本的H100的TDP比HBM2e版本H100整整高出兩倍(700W vs. 350W)。即使是相對于上一代使用7nm的Ampere架構,其功耗也提高了近兩倍,因此能效比方面提升并不多,或者說即使更先進的芯片工藝也沒法解決HBM3的功耗問題。因此,我們認為H100 HBM3版本DRAM內存帶寬增加可能是受限于整體功耗。而當DRAM帶寬提升較小時,如何確保DRAM帶寬不成為性能瓶頸就是一個重要的問題,因此Nvidia會提出FP4和Transformer Engine等算法-硬件協同設計的解決方案,來確保在執行下游任務的時候仍然效率不會受限。

  除了DRAM帶寬之外,另一個值得注意的點是Hopper GPU的片上存儲增長僅僅是從A100的40MB增長到了H100的50MB;相對來說,A100的片上存儲相對于更上一代V100則是增加了6倍。我們目前尚不清楚H100上片上存儲增長這么少的主要原因,究竟是因為Nvidia認為40-50MB對于絕大部分任務已經夠用,還是因為工藝良率的原因導致再加SRAM會大大提升成本。

  但是,無論如何,隨著人工智能模型越來越復雜, 對于片上存儲的需求越來越高,片上存儲容量較小就會需要有更好的人工智能模型編譯器和底層軟件庫來確保模型執行過程中能有最高的效率(例如,確保能把模型數據更好地劃分以盡量在片上存儲中執行,而盡可能少地使用DRAM)。Nvidia在這一點上確實已經有了很深厚的積累,各種高性能相關的軟件庫已經有很好的成熟度。

  我們估計Nvidia有強大的軟件生態作為后盾也是它有能力在設計中放較少片上存儲(以及較小的DRAM帶寬)的重要原因。這一點結合之前Nvidia在Hopper引入的新模型-芯片結合設計技術,例如能大大降低內存需求的FP4技術,以及為了Transformer模型專門設計的Transformer Engine,這些其實從正反兩面論證了我們的觀點,即Hopper架構很多的性能提升事實上是來自于軟硬件結合設計,而并非僅僅是芯片/硬件性能提升。

  Nvidia下一步突破點在哪里?

  如前所述,Nvidia的Hopper架構GPU的芯片領域的突破相比上一代Ampere架構并沒有特別大,而是主要由軟硬件結合設計實現性能提升。我們看到在存儲領域(包括DRAM接口和片上存儲容量)的提升尤其小,而這可能也會是Nvidia進一步提升GPU性能的一個重要瓶頸,當然突破了之后也會成為一個重要的技術壁壘。如前所述,HBM3的功耗可能是一個尚未解決的問題,而如何在芯片上放入更多的片上存儲器則將會被良率和成本所限制。

  在存儲成為瓶頸的時候,芯片粒(chiplet)將會成為突破瓶頸的重要技術。正如之前所討論的,當片上存儲容量更大時,GPU對于DRAM等片外存儲的需求就會越來越少,而片上存儲的瓶頸則是良率和成本。一般來說,芯片的良率和其芯片面積成負相關,當芯片面積越大時,則芯片良率會相應下降,尤其是在先進工藝中,良率更是一個重要考量。而芯片粒則是可以大大改善這個問題:芯片粒技術并不是簡單地增加芯片的面積(例如更多片上存儲),而是把這些模塊分散在不同的芯片粒中,這樣一來整個芯片粒的芯片面積就會大大下降,從而改善良率。

  此外,隨著GPU規模越來越大,為了能更好地控制整體良率,使用芯片粒技術也是一個自然地選擇。我們認為,在今天HBM3技術的功耗遇到瓶頸的時候,或者說HBM技術整體從功耗上遇到挑戰的時候,下一步的重要方向一定是從簡單地增加DRAM帶寬和在單個芯片上放更多晶體管變到更精細地設計架構和片上存儲,這也就讓芯片粒占到了舞臺中央。

  事實上芯片粒和GPU的結合對于業界來說并不陌生。事實上Nvidia最有力地競爭對手AMD已經把芯片粒技術使用在GPU上,此外在片上存儲部分AMD也發布了3D V-Cache,可望成為下一代繼續增加片上存儲的重要技術。Nvidia在芯片粒方面也有相關布局,這次與Hopper同時間發布的用于芯片粒互聯的UCIe標準也意味著Nvidia在芯片粒領域的投資。我們認為,在Nvidia未來公布的GPU中,非常有可能可以看到芯片粒技術的大量應用,而這結合Nvidia的軟硬件協同優化技術有可能會成為下一代Nvidia GPU的最大亮點。

 



微信圖片_20210517164139.jpg


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲日本一区二区三区| 欧美有码在线视频| 亚洲一区尤物| 9久re热视频在线精品| 亚洲国产片色| 在线免费精品视频| 黄色av日韩| 狠狠色丁香久久综合频道| 国产一区二区三区无遮挡| 国产日韩亚洲欧美综合| 国产精品中文字幕欧美| 国产精品欧美风情| 国产精品青草综合久久久久99 | 亚洲欧美影院| 亚洲欧美在线高清| 午夜视频一区二区| 欧美专区日韩视频| 亚洲国产精品99久久久久久久久| 亚洲国产成人一区| 91久久久久久| 一区二区国产精品| 亚洲影视在线播放| 性欧美大战久久久久久久久| 欧美亚洲日本国产| 久久国产精品久久国产精品| 久久久精品一区二区三区| 久久久久一区二区三区四区| 老牛嫩草一区二区三区日本| 欧美成人性网| 欧美日韩国产美女| 国产精品国产精品| 国产欧美日韩综合| 黄色另类av| 亚洲人成网站影音先锋播放| 日韩视频第一页| 亚洲一区二区三区四区中文| 性久久久久久| 亚洲日本欧美日韩高观看| 99re66热这里只有精品4| 亚洲一区三区在线观看| 欧美一级理论性理论a| 久久精品国产久精国产一老狼 | 午夜影院日韩| 亚洲大胆女人| 夜夜爽av福利精品导航| 午夜国产精品视频| 可以看av的网站久久看| 欧美精品一区在线发布| 欧美性事在线| 国精品一区二区三区| 亚洲黄一区二区| 亚洲免费视频中文字幕| 亚洲国产精品电影在线观看| 99精品福利视频| 欧美在线观看你懂的| 欧美第一黄色网| 国产精品男gay被猛男狂揉视频| 韩国一区二区在线观看| 亚洲精品在线观看视频| 亚洲一区二区三区精品在线| 亚洲第一在线综合在线| 亚洲一区在线观看免费观看电影高清 | 久久久青草婷婷精品综合日韩| 欧美国产一区二区在线观看 | 亚洲国产影院| 亚洲欧美日韩在线一区| 亚洲精品影院在线观看| 欧美一区国产一区| 欧美人与禽猛交乱配| 国产日韩av高清| 日韩午夜激情av| 亚洲第一色在线| 亚洲欧美日韩精品久久亚洲区| 欧美a级片网站| 国产情侣久久| 一区二区国产精品| 最新国产の精品合集bt伙计| 午夜在线精品| 欧美日韩一区二区三区四区五区| 国产综合色一区二区三区| 亚洲视频中文| 99天天综合性| 免费久久精品视频| 国产视频在线观看一区 | 亚洲与欧洲av电影| 99精品热6080yy久久| 久久久之久亚州精品露出| 欧美丝袜一区二区| 亚洲国产成人久久| 久久不见久久见免费视频1| 亚洲一级影院| 欧美日本精品在线| 亚洲国产另类久久久精品极度 | 久久精品91久久久久久再现| 亚洲欧美乱综合| 欧美日韩性生活视频| 亚洲高清在线精品| 久久精品国产99精品国产亚洲性色 | 欧美午夜精品久久久久久人妖| 亚洲成人资源网| 亚洲国产成人精品久久| 久久成人羞羞网站| 国产精品私人影院| 一本色道久久综合亚洲二区三区 | 亚洲视频视频在线| 欧美精品在线网站| 亚洲国产毛片完整版| 久久精品91| 久久久国产精品亚洲一区 | 久久福利资源站| 国产欧美va欧美不卡在线| 亚洲自拍三区| 亚洲一区二区三区四区五区午夜 | 国产精品天美传媒入口| 亚洲图片欧美午夜| 亚洲一区二区视频在线观看| 欧美日韩成人激情| 亚洲精品一区在线观看| 一本色道久久| 欧美日韩一区三区四区| 日韩亚洲欧美在线观看| 亚洲一级高清| 国产精品久久久久免费a∨大胸 | 久久国产福利| 国内成人自拍视频| 久久精品成人| 你懂的网址国产 欧美| 亚洲高清一二三区| 日韩亚洲国产欧美| 欧美日韩亚洲成人| 亚洲无吗在线| 欧美影院成人| 国产一区二区三区在线播放免费观看| 欧美在线播放一区二区| 快射av在线播放一区| 亚洲国产成人久久| 一区二区三区日韩欧美| 国产精品xnxxcom| 亚洲欧美另类中文字幕| 久久精品国产亚洲aⅴ| 国产一区二区精品久久| 亚洲第一免费播放区| 欧美成人精品在线| 日韩亚洲欧美成人一区| 午夜国产精品视频免费体验区| 国产农村妇女毛片精品久久麻豆 | 亚洲一区二区三| 国产精品综合久久久| 亚洲欧美综合| 免费视频亚洲| 日韩视频免费在线观看| 欧美一区二区日韩| 永久555www成人免费| 日韩午夜一区| 国产精品蜜臀在线观看| 欧美在线视频全部完| 欧美成人四级电影| 亚洲婷婷在线| 六月丁香综合| 制服丝袜亚洲播放| 久久精品最新地址| 亚洲精品免费网站| 久久激五月天综合精品| 亚洲国产经典视频| 亚洲欧美一区二区激情| 精品不卡一区| 亚洲欧美日韩精品| 尤物精品在线| 亚洲在线视频| 在线看欧美视频| 亚洲无亚洲人成网站77777| 国产日韩欧美高清免费| 亚洲精品一区二区三区av| 国产精品成av人在线视午夜片| 欧美在线网站| 欧美色区777第一页| 久久福利视频导航| 欧美视频中文在线看 | 国产精品五月天| 亚洲精品中文字| 国产一级久久| 亚洲一区二区综合| 亚洲二区在线视频| 欧美一区二区三区在线视频| 亚洲国产天堂久久国产91| 久久国产99| 中国成人黄色视屏| 欧美激情一二三区| 欧美一区网站| 国产精品大片wwwwww| 亚洲欧洲一二三| 国产无一区二区| 亚洲一区在线视频| 亚洲激精日韩激精欧美精品| 久久高清福利视频| 中国亚洲黄色| 欧美精品v日韩精品v韩国精品v| 午夜在线精品偷拍| 欧美色另类天堂2015| 亚洲肉体裸体xxxx137|