《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業(yè)界動態(tài) > IBM和NVIDIA新款人工智能服務器又把英特爾秒了

IBM和NVIDIA新款人工智能服務器又把英特爾秒了

2016-09-12

  在傳統(tǒng)服務器芯片市場,英特爾是個巨無霸,無論是IBM Power還是ARM陣營,所占有的份額都微乎其微。但戰(zhàn)線轉移到人工智能領域,IBM似乎更有優(yōu)勢。

  據外媒報道,近日IBM和NVIDIA聯(lián)手推出了新服務器IBM Power Systems S822LC for High Performance Computing(還有兩款產品分別為IBM Power Systems S821LC和IBM Power Systems S822LC for Big Data),從這一串名字可看出,這并不是一款普通的服務器,它是專門為人工智能、機器學習和高級分析應用場景而推出的。

  IBM官方宣稱,這款服務器數數據處理速度比其它平臺快5倍,和英特爾x86服務器相比,每美元的平均性能高出80%。

HMpJ-fxvukhx4771595.jpg

  這款服務器比英特爾x86強在哪?

  據了解,該款服務器使用了兩個IBM Power8 CPU和4個NVIDIA Tesla P100 GPU。Power8是目前IBM最強的CPU,從之前媒體的評測數據來看,其性能是要優(yōu)于英特爾E7 v3的,而Tesla P100是NVIDIA今年才發(fā)布的高性能計算(HPC)顯卡,這樣的配置組合在處理性能上自然不弱。

  原因有兩個:

  其一,相比CISC指令集,采用的RISC指令集的Power處理器可同時執(zhí)行多條指令,可將一條指令分割成多個進程或線程,交由多個處理器同時執(zhí)行,因此并行處理性能要優(yōu)于基于CISC架構的英特爾x86芯片。

  另外,這款服務器的巧妙之處還在于Power8和Tesla P100之間的“配合”。

  Power架構的另一大特點就是具有充分發(fā)揮GPU性能的優(yōu)勢。

  實際上,Tesla P100有兩個版本,一個是NVIDIA今年4月推出的NVLink版,另一個是6月發(fā)布的PCI-E版本,簡單來講,前者是后者的加強版,與IBM Power8配對的正是Tesla P100 NVLink版。

  Tesla P100采用的是Pascal架構,能夠實現CPU與GPU之間的頁面遷移,不過每塊NVLink版還配置了4個每秒40 GB NVIDIA NVLink端口,分部接入GPU集群。NVLink是OpenPOWER Foundation獨有的高速互連技術,其有效帶寬高達40GB/S,堪稱PCIE的升級版,足以滿足多芯片并行計算的需求。不過支持這一標準的CPU屈指可數,Power8則是其中之一(英特爾不在此之列)。

  這就意味著,Power8 CPU能夠和Tesla P100 GPU以更高的速度完成通信,這一特性可讓IBM Power Systems S822LC for High Performance Computing中的CPU和GPU之間的連接速度遠快于普通的在PCIe總線上交換數據的表現。

  CPU、GPU這樣協(xié)作更配,IBM和NVIDIA新款人工智能服務器又把英特爾秒了

  IBM表示,“這一功能意味著,不同于在GPU處于PCI-E界面上的x86系統(tǒng)上,數據庫應用程序、高性能分析應用程序和高性能計算應用程序運行能夠在要大得多的數據集上運行。”

  另外,Tesla P100的半精度浮點運算性能達到了每秒21萬億次 —— 比插入現代PCI-E插槽的GPU高出大約14%,這樣的處理能力對訓練深度神經網絡的重要性不言而喻。

  IBM還做了個縱向對比,和老款Power S822LC服務器的Tesla K80 GPU加速器相比,新款服務器的加速能力提升了兩倍多。

  預計明年問世的IBM Power9會延續(xù)對CPU+GPU組優(yōu)化。

  為何是“CPU+GPU”?

  眾所周知,在人工智能人工智能和深度學習等計算任務上,CPU早已不堪重任。因此,不少企業(yè)紛紛推出人工智能專用芯片概念,例如谷歌的TPU(Tensor Processing Unit);還有業(yè)內人士力挺FPGA更適合深度學習的算法,這也是英特爾以高價收購Altera的主要原因。

  不過,上述兩個替代CPU的方案都還未成熟,目前大多數企業(yè)采用的依然是“CPU+GPU”的組合,或者稱為異構服務器。通常來說,在這種異構模式下,應用程序的串行部分在CPU上運行,而GPU作為協(xié)處理器,主要負責計算任務繁重的部分。

8yp2-fxvuvfp3354054.jpg

  因為和CPU相比,GPU的優(yōu)勢非常明顯:

  1.CPU主要為串行指令而優(yōu)化,而GPU則是為大規(guī)模的并行運算而優(yōu)化。所以,后者在大規(guī)模并行運算的速度更快;

  2。同等面積下,GPU上擁有更多的運算單元(整數、浮點的乘加單元,特殊運算單元等等);

  3。一般情況下,GPU擁有更大帶寬的 Memory,因此在大吞吐量的應用中也會有很好的性能。

  4.GPU對能源的需求遠遠低于CPU。

  當然,這并不代表人工智能服務器對CPU沒有需求,CPU依然是計算任務不可或缺的一部分,在深度學習算法處理任務中還需要高性能的CPU來執(zhí)行指令并且和GPU進行數據傳輸,同時發(fā)揮CPU的通用性和GPU的復雜任務處理能力,才能達到最好的效果,通俗點說就是實現CPU和GPU的協(xié)同計算。

  雖然NVIDIA和Intel等芯片商正在為GPU和CPU孰強孰弱陷入了口水戰(zhàn),但實際上這些企業(yè)已經開始在異構計算上加大了研發(fā)力度,至少在近期內,CPU和GPU的結合將繼續(xù)成為人工智能領域最有效的方案。


本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 国产一区二区三区不卡在线看 | 日本一卡2卡3卡4卡无卡免费 | 国产成人高清在线播放| 99久re热视频这里只有精品6| 岛国视频在线观看免费播放| 久久91这里精品国产2020| 日韩欧美一区二区三区免费看 | 欧美成人性色区| 亚洲系列第一页| 真实的和子乱拍免费视频| 午夜精品在线免费观看| 色偷偷91综合久久噜噜app| 国产区精品在线| 91抖音在线观看| 国产精品…在线观看| 55夜色66夜色国产精品视频| 在线天堂中文新版有限公司| h视频免费在线| 好男人在线社区www影视下载| 丝袜情趣在线资源二区| 无码aⅴ精品一区二区三区| 久久久精品国产sm最大网站| 日韩三级一区二区三区| 乱人伦中文字幕电影| 极品尤物一区二区三区| 亚洲人成在线影院| 欧美性大战久久久久久| 亚洲最新中文字幕| 欧美视频在线网站| 亚洲精品中文字幕麻豆| 泰国一级淫片免费看| 亚洲综合视频在线观看| 男人天堂综合网| 伊人久久久大香线蕉综合直播| 第一福利社区导航| 免费观看的a级毛片的网站| 精品亚洲麻豆1区2区3区| 制服丝袜中文字幕在线| 精品无码国产自产拍在线观看| 啦啦啦中文高清在线观看6| 美女又黄又免费的视频|