《電子技術應用》
您所在的位置:首頁 > 電子元件 > 業界動態 > ?英偉達的最強挑戰者:Graphcore用數據征服開發者

?英偉達的最強挑戰者:Graphcore用數據征服開發者

2021-01-13
來源:半導體行業觀察

  在人工智能芯片,尤其是在訓練芯片這個市場,英偉達是當之無愧的霸主。

  得益于公司在通用CPU和CUDA生態方面的多年投入,英偉達拿下了AI訓練芯片公開市場的絕大多數份額。據筆者了解,除了谷歌自用的TPU頗具規模以外,其他的AI芯片在訓練市場現在基本都難以撼動英偉達的地位。但因為這是一個巨大的市場,所以不少廠商正在投入其中,期望打破這種格局,從中分一杯羹,來自英國的Graphcore正是其中一個最強挑戰者。

  今年年中,Graphcore發布了全新一代的IPU芯片Colossus MK2 GC200 IPU,同時還帶來了搭載四顆MK2 IPU的系統解決方案IPU-Machine:M2000(IPU-M2000)。據介紹,這款產品還可以擴展到1024個IPU-POD,也就是512個機架,最多64000個MK2 IPU,進而把16bit FP的算力擴展到16 ExaFLOPs。

  從基礎數據來看,IPU給英偉達帶來了前所未有的威脅。而在最近Graphcore發布的一個benchmark測試中,基于這個芯片打造的系統也在多項應用中領先于AI芯片領域的王者。

  多維度領先GPU

  Graphcore中國工程總負責人、AI算法科學家金琛在日前的一場媒體溝通會上告訴記者,Graphcore最新的AI計算系統——IPU-M2000和縱向擴展的IPU-POD64在各種流行的模型的訓練和推理方面的表現都優于英偉達的A100(基于DGX)。

  首先看訓練方面:

  從金琛提供的數據我們可以看到,在BERT-Large(基于Transformer的自然語言處理模型)端到端的訓練方面,英偉達DGX-A100所需的訓練時間是69.5小時。來到IPU-POD64上,PopART BERT-Large的端到端訓練時間僅為13.2小時。

  2.png

  “如此看來,相比1個DGX-A100,BERT-Large能在IPU-POD64上實現5.3倍的提升”,金琛告訴記者。她進一步指出,與三個DGX-A100相比,1個IPU-POD64也能夠實現1.8倍的提升。“1個IPU-POD64和3個DGX-A100的功率和價格基本相同,但卻能夠實現接近兩倍的性能提升,這就是非常顯著的性能優勢”,金琛補充說。

  3.png

  據金琛介紹,Graphcore的IPU在Deep Voice 3的訓練性能與英偉達GPU相比,也有不小的提升。如上圖所示,IPU-M2000的吞吐量是最新GPU的13.6倍。

4.png

  來到機器視覺的訓練方面,IPU也毫不遜色。

  如上圖所示,在大家較為熟悉的ResNet-50的訓練中,IPU-M2000較之A100有2.6倍的吞吐量提升。在ResNet-101的訓練中,IPU-M2000和A100相比,更是實現了3.7倍吞吐量的提升。

5.png

  在EfficientNet-B4的訓練中,EfficientNet在IPU-M2000上實現了比A100高18倍的性能提升。從金琛的介紹我們得知,能實現這樣的飛躍,主要是因為EfficientNet是由可分離深度卷積組成的,它的卷積核比較小,使得您在調度上的開銷和算子的利用率在IPU上可能會有更好的體現。而ResNet-50則基本上是由卷積組成的。

6.png

  “如果算子小、算子比較多,在GPU上的調度開銷也會引入跟HDM內存上數據交互的開銷,這就可能會導致它們的性能折損。這也從側面證明了新一代的模型上IPU其實更具普適性。”金琛說道。

  在了解完IPU在訓練方面的優勢外,我們再來看一下它們在推理方面的杰出表現。首先被介紹的是IPU在EfficientNet上的推理性能。金琛表示,這個由谷歌在2019年開發的模型尺寸有8個等級,其中B0是一個模型尺寸比較小的模型,擁有5兆的參數量級。而B7則是其中最大的模型,參數量級大概是60兆-70兆。

7.png

  “在PyTorch和TensorFlow兩種不同的框架下,EfficientNet-B0在1臺IPU-M2000上的吞吐量大概可以達到以‘萬’為單位的級別,時延則遠遠小于5毫秒。而在最新的GPU上,即使在時延最大化的情況下,它的吞吐量也遠遠小于以‘萬’為單位的吞吐量級,由此可充分體現IPU所具備的時延優勢”,金琛告訴記者。

8.png

  “BERT-Large推理上,在IPU和GPU都處于最低時延的情況下,與A100相比,IPU-M2000也能實現3.4倍的吞吐量提升”。金琛進一步指出。

9.png

  據金琛介紹,IPU-M2000在LSTM推理和ResNeXt-101的推理方面,獲得了遙遙領先于GPU的時延和吞吐表現。其中前者以更低時延實現吞吐量提升超過600倍,后者的吞吐量提升了40倍,同時時延縮短了10倍。

10.png

  Graphcore軟件高級副總裁Matt Fyles在對測試結果發表評論時說,這一整套全面的benchmark表明Graphcore的IPU-M2000和IPU-POD64在許多流行模型上的性能均優于GPU。他進一步指出,諸如EfficientNet之類的新型模型的benchmark特別具有啟發性,因為它們證明了AI的發展方向越來越傾向于IPU的專業架構,而非圖形處理器的傳統設計。

  軟硬件是底氣

  從前文的介紹中,我們可以看到Graphcore IPU及基于IPU打造的系統的實力。毫無疑問,Graphcore獨特設計的IPU芯片是其根本。但除此以外,Graphcore基于這個芯片打造的一個可擴展的硬件生態以及一個讓開發者的工作更簡便的軟件生態,才是Graphcore叫板英偉達的底氣。

  Graphcore高級副總裁兼中國區總經理盧濤告訴記者,Graphcore的IPU-POD64是一個由16臺IPU-M2000組成的解決方案,目前也已經在全球范圍之內實現了該方案的交付。該方案具備的優勢之一是實現了x86和IPU計算的解耦。

  “在IPU-M2000里,我們通過IPU-Fabric,使其能夠實現與x86服務器芯片之間的動態搭配。您在使用IPU做計算機視覺的應用時,可以把x86配比設置得高一點。而在做自然語言處理業務的時候,您則可能可以用一臺x86服務器帶動一個IPU-POD64、甚至兩個IPU-POD64。這就是解耦的作用”,盧濤舉例說。

  此外,IPU-POD64是目前市場上非常少見的,可以同時將縱向擴展和橫向擴展都做得非常好的AI計算平臺產品。

11.png

  據盧濤介紹,所謂縱向擴展是指IPU-POD64可以實現從一臺IPU-M2000到一個IPU-POD16(4臺IPU-M2000),再到一個IPU-POD64(16臺IPU-M2000)進行軟件透明擴展。換而言之,您在一個IPU-M2000里編譯好的軟件,可以被應用到擴展后的IPU-POD64上。

  在談到為何將擴展限制在IPU-POD64的時候,盧濤表示,這是他們與很多頭部互聯網公司交流的結果。在后者看來,當前絕大部分單一工作負載最大不會超過IPU-POD64。也就是說,對于當前最主流的工作負載來說,1個IPU-POD64就能夠讓絕大多數工程師不需要擔心分布式的機器學習、分布式的機器學習框架和分布式通信等問題,可以進行軟件透明擴展。

  “與之相比,如果您把DGX-A100這樣的機器,從1個擴展到4個,就需要用一個叫做分布式的機器學習框架,對您的算法模型進行相應的改造,才能被應用到新系統上”,盧濤接著說。

  從橫向擴展的角度來看,多個IPU-POD64最多可以支持64000個IPU組成的AI計算集群。這就為開發者提供了更多的選擇。

  在介紹了Graphcore的IPU在硬件方面的擴展能力之后,盧濤還對公司在軟件方面的進展進行了分享。首先,他講到,公司在發布Poplar SDK 1.4時,還發布了面向IPU的PyTorch產品化版本。

12.png

  “在PyTorch的代碼里面,Graphcore引入了一個叫PopTorch的輕量級接口。通過這個接口,用戶可以基于他們當前的PyTorch的模型做一個輕量級的封裝。封裝之后就可以無縫的在IPU和CPU上執行這個模型了。在當前的Poplar SDK 1.4版本中,我們既支持模型并行、也支持數據并行。”

13.png

  他進一步指出,這個封裝使得模型生成了一個IPU和PyTorch兼容的一個中間模型表示格式,這個表示格式可以通過PopART編譯起來,之后生成一個可在IPU上執行的一個二進制文件。“Poplar SDK 1.4版本支持模型從1個IPU橫向擴展到64個IPU。下一代的Poplar SDK可能能夠橫向擴展到128個IPU”,金琛補充說。

  除了進一步完善自身的軟件方面以外,Graphcore還正在與微軟和阿里云進行開源相關合作。用盧濤的話來說,他們與這兩者的合作,目的就是希望能從AI編譯的角度,讓用戶能夠在GPU和IPU之間能實現盡量平滑的遷移。

  金琛也解析道,NNFusion是微軟亞洲研究院所做的一項的工作,其目的就是為了讓用戶在不同芯片平臺上開發的時候,可以避免一些重復性的工作,使用統一的平臺、統一的接口,讓模型在不同的硬件廠商的芯片上無縫的運行。

14.png

  “上圖中間表示,理想情況下,NNFusion可以做跨平臺的工作,既可以集成TensorFlow生成的模型、也可以集成PyTorch或其他框架生成的模型,用戶只要通過一個NNFusion接口就可以在不同的AI芯片上做訓練或者推理”,金琛告訴記者。

15.png

  至于阿里云的HALO,其初衷也是和NNFusion一樣,想做一個整體的框架,向上跨AI框架,向下通過ODLA這樣一個通用的硬件接口對接不同的硬件廠商的芯片。據金琛所說,阿里云的初衷多是希望處理如TensorFlow的模型、ONNX的模型、或是PyTorch的模型等不同模型,然后能夠將它一鍵式地在系統上或者是集群上運行起來。

  在問到對競爭的看法時,盧濤告訴記者,在他看來,Graphcore在AI芯片市場,唯一的一個挑戰者就是英偉達。這主要是得益于他們過去多年與開發者、社區一起共同建立的,包括GPU和CUDA在內的AI加速計算的軟硬件生態。但即使如此,他們對未來還是充滿信心,這一方面因為Graphcore的處理器在不同的地方充分體現了自己的價值;另一方面,Graphcore也在解決一些GPU所不能解決的問題。

  “目前我們從體量和生態上跟英偉達相比,肯定還是有差距的。但只要我們在所聚焦的領域跑得更快,我們之間的距離會越來越短,甚至在某些領域超過英偉達。Graphcore希望在未來幾年之內,能夠真正在數據中心的AI訓練和推理的批量部署上面,在發貨以及體量上面,做到除英偉達以外的另一個頭部企業的地位,這是我們中短期的目標”,盧濤最后說。



本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美制服丝袜| 欧美日韩综合视频网址| 99国产精品久久久久老师| 久久精品国产久精国产思思| 亚洲男人第一av网站| 亚洲网站啪啪| 亚洲视频在线一区观看| 一区二区三区色| 一区二区三区高清不卡| 99国产精品久久久久老师| 亚洲精选大片| 一本色道久久加勒比88综合| 日韩午夜电影在线观看| av成人免费观看| 在线一区二区视频| 在线亚洲高清视频| 亚洲一区自拍| 香蕉乱码成人久久天堂爱免费 | 欧美在线视频观看| 久久精品国产精品亚洲精品| 久久久久国产精品一区| 美女图片一区二区| 欧美精品videossex性护士| 欧美日韩国产一区二区三区地区| 欧美日韩1080p| 欧美视频免费看| 国产精品久久久久av| 国产精品色一区二区三区| 国产精自产拍久久久久久| 国产区在线观看成人精品| 国产综合视频| 亚洲电影免费在线观看| 91久久夜色精品国产九色| 亚洲毛片在线观看.| 亚洲视屏在线播放| 亚洲欧美久久久久一区二区三区| 久久精品123| 亚洲精品亚洲人成人网| 亚洲少妇中出一区| 欧美一级大片在线免费观看| 久久久水蜜桃av免费网站| 欧美成人dvd在线视频| 欧美日韩999| 国产精品稀缺呦系列在线| 精品福利免费观看| 中文网丁香综合网| 亚洲电影天堂av| 99国产精品一区| 亚洲欧美日韩国产综合| 一本一道久久综合狠狠老精东影业 | 亚洲午夜久久久| 亚洲自拍三区| 久久成人资源| 亚洲日本中文字幕免费在线不卡| 亚洲深夜激情| 久久亚洲视频| 欧美午夜精品久久久久久超碰| 国产欧美高清| 亚洲国产精品一区在线观看不卡| 一本色道久久综合亚洲精品按摩 | 久久噜噜噜精品国产亚洲综合| 欧美xx视频| 国产精品福利影院| 精品成人在线视频| 亚洲图片在区色| 亚洲第一在线| 亚洲免费在线视频| 你懂的国产精品| 国产精品一区二区在线| 亚洲国产裸拍裸体视频在线观看乱了| 中文日韩电影网站| 亚洲欧洲一级| 香蕉久久夜色精品国产使用方法| 免费成人美女女| 国产精品日韩高清| 亚洲全部视频| 欧美在线短视频| 亚洲一区二区视频在线观看| 老司机精品视频一区二区三区| 国产精品狠色婷| 亚洲黑丝一区二区| 欧美影院成年免费版| 亚洲伊人伊色伊影伊综合网| 美女精品网站| 国产视频久久| 亚洲精品自在在线观看| 亚洲国产精品成人va在线观看| 午夜精品视频在线观看| 欧美日韩一区二区欧美激情| 激情综合色综合久久综合| 亚洲一级黄色| 亚洲视频一区二区| 欧美www视频在线观看| 国产一区二区三区电影在线观看| 一区二区三区四区五区在线| 亚洲精品国精品久久99热| 久久久久国产一区二区| 国产精品入口尤物| 一区二区三区欧美| 艳女tv在线观看国产一区| 嫩草成人www欧美| 国产日韩欧美一区在线 | 91久久一区二区| 亚洲高清网站| 久久久亚洲一区| 国产亚洲精品成人av久久ww| 亚洲综合丁香| 午夜在线播放视频欧美| 国产精品观看| 亚洲视频视频在线| 亚洲夜间福利| 欧美午夜欧美| 一本色道久久综合| 亚洲午夜一二三区视频| 欧美日韩中文字幕在线视频| 亚洲日本激情| 亚洲精品一区二区三区不| 美日韩免费视频| 亚洲电影免费| 亚洲精品一区二区三区av| 美女精品在线观看| 亚洲国产精品成人va在线观看| 亚洲高清在线观看一区| 久久久蜜桃一区二区人| 狠狠色丁香婷婷综合| 亚洲电影免费观看高清完整版在线观看 | 久久精品国产一区二区电影| 国产精一区二区三区| 亚洲欧美综合另类中字| 欧美在线影院在线视频| 国产一区二区三区久久精品| 欧美一区永久视频免费观看| 久久亚洲一区| 亚洲电影免费观看高清完整版在线观看 | 精品999在线观看| 亚洲人成7777| 欧美国产视频在线观看| 亚洲精品在线视频| 亚洲视频一起| 国产美女精品| 久久精品视频在线| 欧美成人三级在线| 亚洲美女电影在线| 亚洲欧美日韩国产综合| 国产日韩视频一区二区三区| 久久都是精品| 欧美成人官网二区| 亚洲人www| 亚洲影院一区| 国产一区三区三区| 亚洲精品一区二| 国产精品久久久久7777婷婷| 香蕉久久夜色| 欧美电影电视剧在线观看| 99国产精品国产精品毛片| 亚洲欧美视频在线观看| 国产真实久久| 亚洲免费大片| 国产精品免费aⅴ片在线观看| 午夜精品免费在线| 免费一级欧美片在线播放| 日韩图片一区| 久久精品视频播放| 亚洲精品孕妇| 久久精品国产69国产精品亚洲| 18成人免费观看视频| 亚洲在线中文字幕| 狠狠色综合色区| 国产精品99久久久久久久女警| 国产亚洲欧美一级| 一区二区三区你懂的| 国产喷白浆一区二区三区| 日韩视频在线免费观看| 国产精品视频久久久| 亚洲国产日韩综合一区| 国产精品高潮呻吟| 最新成人在线| 国产精品手机视频| 日韩视频一区二区三区在线播放| 国产精品久久久亚洲一区 | 国产精品xxxxx| 亚洲国产另类久久精品| 国产精品vvv| 亚洲福利在线看| 国产精品大片wwwwww| 亚洲国产天堂久久综合网| 国产精品swag| 亚洲毛片在线看| 国际精品欧美精品| 亚洲一区二区三区在线| 在线精品一区二区| 午夜伦理片一区| 亚洲日本欧美| 久久人人97超碰精品888| 一区二区三区久久久| 欧美国产极速在线| 欧美一区二区三区男人的天堂| 欧美日韩国产一中文字不卡| 亚洲国产一区二区视频| 国产日韩欧美黄色|