《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業界動態 > Intel正在謀劃新架構,或顛覆X86和馮·諾依曼

Intel正在謀劃新架構,或顛覆X86和馮·諾依曼

2018-09-05

由于摩爾定律將壽終正寢,英特爾的芯片設計專家們正另辟蹊徑解決百億億次(exascale)挑戰,他們已設想了一種新的架構,有望一舉終結通用處理器這個概念和X86指令集這個現代計算的基礎。


他們提出的這種新架構名為可配置空間加速器(CPA),但“加速器”這個詞取名不當,因為他們提出的是一種構建處理器或協處理器的方法,這種處理器或協處理器實際上是數據流引擎,而不是串行處理器或矢量協處理器,可以直接處理程序在按傳統的意義被編譯到CPU之前創建的圖形。CSA方法有點類似搭載數學協處理器的開關ASIC混合體,如果需要支持老式應用,可能還有一個可選的X86協處理器

數據流引擎并不是什么新概念?,F代開關式芯片就采用了這種工作方式,因而讓其可編程性達到一定的程度,而不是僅僅成為高速傳輸數據包的靜態器件。英特爾整合到CSA上的許多想法已經在Graphcore公司的智能處理單元(IPU)上得到了體現。這里很重要的一點是,英特爾這個巨頭擯棄X86架構(除了數據流的基本控制),讓計算的一大部分遠離嚴格定義的馮?諾依曼架構。所以,用可配置空間架構來形容這種新的計算方法可能更適合,也許應該將至強芯片視為其協處理器,而不是反過來。


不管怎樣,CSA的基本思路聽起來很簡單,但是用編譯器來實現可能很難,即便這確實看起來為處理各種工作負載的一大批計算引擎提供了幾乎無比廣闊的前景。送交阿爾貢國立實驗室(英特爾是該實驗室的主承包商)的第一代Aurora準百億億次系統在去年秋天被受挫后,我們采訪了英特爾企業和HPC部門的總經理巴里?戴維斯(Barry Davis),暢談英特爾可能采用什么技術為阿爾貢國立實驗室制造系統,當時英特爾有意含糊其辭。不過CSA方面的信息倒與戴維斯說的相一致。


基本想法是,獲取程序的數據流圖(該圖由所有編譯器創建);在處理成特定處理器的指令集、數據存儲和數據流之前,將該數據流直接放在一系列大規模并行計算元件及之間的互連件上。你可以將該數據流直接放在用硅蝕刻的靜態硬件上,而不是像FPGA那樣用Verilog或VHDL編寫語言來構建,所以別搞錯了“可配置”在這里的含義。


可配置部分是指,英特爾會有許多不同的CSA配置(可能數十種乃至數百種),針對具體應用的數據流,從以單精度和雙精度浮點運算為主的傳統模擬和建模,到結合使用不同精度的浮點和整數的機器學習,這取決于工作負載是訓練網絡還是由此而來的推理分類。這與英特爾對至強處理器采取的做法形成了對照,“Skylake”這一代至強處理器有三種版本,每種版本有10個、18個或28個核心,英特爾調整了核心數量和時鐘頻率,還調整了其他元件,出于市場對不同價位的需要。有了CSA,你想要激活該器件中盡可能多的底層元件,用正好夠用的資源來處理任何特定的工作負載。這與其說是一種批量制造做法,還不如說是針對具體應用的批量定制――我們認為,隨著摩爾定律氣數已盡,勢必會這樣。


CSA由英特爾聯合美國國防部一同開發,因向美國專利及商標局提交了專利申請而被公眾熟知(申請公告早在7月5日就發布了)。實際上英特爾早在2016年12月30日提交了專利申請。按照國防部的這份合同,英特爾提交了其他專利申請,包括涉及可擴展分級式互連拓撲結構的一項專利和涉及對稱尋址的另一項專利。CSA專利申請之所以備受關注,原因在于專利提到的設計師除了一批自英特爾多年前收購DEC Alpha芯片公司以來一直效力于英特爾的芯片設計師外,還有阿爾?加拉(Al Gara),他正是IBM的BlueGene系列并行超級計算機的架構師,以及英特爾Knights系列并行處理器的架構師。


CSA備受關注的還有一個原因是,如果傳聞屬實,英特爾會竭力將CSA推向市場,可能會先用在安裝在阿爾貢國立實驗室的“Aurora”A21超級計算機:顧名思義,這臺超級計算機預計是2021年安裝于美國的第一臺百億億次系統。坊間傳聞,CSA的后一代版本最終可能用在美國政府資助研發的其他超級計算機中;近日剛宣布的得克薩斯高級計算中心(TACC)的“Frontera”超級計算機很顯然是下一個使用CSA的系統,因為它已經使用英特爾至強用于計算,更何況TACC在使用英特爾的Knights系列方面有著豐富經驗。坦率地說,叫停Knights后,英特爾不光欠阿爾貢國立實驗室一份情,還欠TACC一份情。不過那僅僅是我們單方面的猜測。


CSA遵循極簡設計方法,只把具體工作負載必不可少的那些計算、互連、交換和存儲元件放在一塊芯片上。CSA的基礎是網格狀的計算和存儲元件,如下圖所示:

微信圖片_20180905144023.jpg



上圖中有處理整數或浮點指令的處理元件、處理元件之間的網格互連件,以及這種功能:塊(tile)上本地結合存儲元件,并與結構(fabric)連起來,供處理元件共用。這個CSA加速器可按一對一的方式與多個核心實現在一塊至強芯片上,兩者都訪問同一主內存,也可以與同一封裝件中的多塊芯片連同封裝件上的互連件一同實現,或者作為單獨的器件,有自己的插座,或者基于PCI-Express總線,使用卸載模式。我們認為,英特爾對卸載模式沒有興趣,它希望把CSA與至強封裝在一起,可能采用多對一配置:至強負責裝入CSA程序,為在一個或多個CSA上運行的應用程序從熱存儲或冷存儲提取數據。


該圖顯示了應用程序代碼、編譯器創建的數據流圖以及CSA芯片中用于執行從輸入到輸出的數據流的元件三者之間的關系:

微信圖片_20180905144051.jpg



這個例子顯然很簡單。數據流會變得很復雜,架構會變得要復雜一點,如下圖所示:


微信圖片_20180905144113.jpg


在這里,芯片上有多層開關來互連執行整數和融合乘加(FMA)運算的處理元件,它們與外面的內存控制器連起來,數據在此存儲起來,然后再進行處理。處理元件有自己的緩沖器和寄存器。這進一步構建成了更復雜的CSA器件,如下圖所示:


微信圖片_20180905144139.jpg


在這個更復雜的器件中,處理元件集群由請求地址文件充當前端,有各自的表后備緩沖器(TLB),然后將數據輸出到L2緩存接口、L2緩存組以及由整個器件共享的一片L3緩存。各個CSA塊上的結構分散到多個塊上,隨著程序變大、數據流因而變大,數據流可以無縫地分散到這些塊上的元件。問題是,有好多方法來實現CSA;必要時,CPU的傳統元件可以添加到該器件上,若不需要,可以完全避免。


據專利撰寫人聲稱,CSA方法的主要優點是,它提供了非常密集的計算和內存,能效又很高,因為程序運行時,只有某個數據流需要的元件才被激活。芯片上其他所有元件處于閑置的狀態。這到頭來會是一大塊暗硅(dark silicon),浪費了錢財,所以關鍵是研制針對具體的應用和數據流來定制的CSA器件。


專利撰寫人寫道:“處理元件(PE)陣列可能是異構的,比如說,沒有一個PE支持完整的CSA數據流架構,及/或一個或多個PE被編程(比如定制),以執行少數幾種但高效的操作。某些實施方案(embodiment)因而獲得的加速器有一組處理元件:相比路線圖架構,它們具有計算密集的特點,不過相對現有的HPC方案,能效和性能高出大約一個數量級。由于器件和數據流的性質使然,程序可供利用的并行機制是顯式的,直接映射到器件上。按照設想,CSA的軟件堆棧拿來C、C++和Fortran程序后可以直接扔給CSA,如下圖所示:


微信圖片_20180905144208.jpg


英特爾提議用于CSA的原型編譯器(我們猜測,如果CSA的確要用于超級計算機Aurora A21,英特爾已實現了該編譯器)有一個Clang前端,它拋開了針對加速的代碼區域的LLVM中間表示(IR),然后該IR直接編譯到了CSA本身。


在該器件上實現傳統的順序代碼需要一些精巧的接口,以便訪問器件上的內存,英特爾顯然意識到了這點。英特爾表示,訣竅在于將內存訪問視作與其他任何類型的數據流操作無異。


專利申請書寫道:“CSA的實施方案提供了基本的內存操作,比如加載(拿來地址通道后,往響應通道填充對應于地址的值),比如存儲。CSA的實施方案還可能提供更高級的操作,比如內存中的原子操作和一致性操作等。這些操作可能與馮?諾依曼架構的對應操作有相似的語義。CSA的實施方案還可以加速用C和Fortran等順序語言描述的現有程序。支持這些語言模型的結果是,解決了程序內存訪問順序,比如通常由這些語言規定的存儲操作的順序處理?!?/p>


再說一下,重要的是代碼方面的并行機制顯式獲取,并映射到CSA上,附有處理元件、存儲、交換等部分的特定配置。所以,各種各樣的并行機制(指令、數據、管道、矢量、內存、線程和任務)都可以按某種方式實現在CSA器件中。


專利申請書中沒有太多的信息來表明CSA的性能可與標準至強CPU相媲美,不過有幾個線索可尋。處理元件與CPU核心(核心上有許多元件來維持狀態,并保留進出順序執行單元、分支預測單元和推測執行單元的數據)相比非常小時,CSA方法可以將數量比使用矢量處理器多出16倍的FMA單元塞到一塊芯片上。大概這是與至強中的AVX-2或AVX-512單元作比較。此外,英特爾表示CSA塊的浮點性能可能比CPU核心高出一個數量級。正如HPC界所希望的,如果我們要在20兆瓦的功率范圍內達到百億億次計算能力,這種提升將必不可少。


在專利申請書中,英特爾展示了做成片上系統的CSA,多個塊裹以共享的緩存和內存控制器,而總線控制器與環狀互連件相連接。在另一種可能的配置中,一個CPU連接至CSA協處理器,南橋I/O控制器和主內存如往常那樣與CPU相連接。英特爾承認,這可能是Arm或MIPS處理器,而不只是其自己的X86處理器,這值得關注。還有一種配置顯示CSA與雙插座服務器中的芯片組相連接,這跟傳統方案一樣。但下一種配置配置兩個CSA連在同一塊板上,它們與面向外部I/O的南橋芯片組之間采用點對點互連件。專利申請書上的最后一張圖還顯示了如何在CSA上仿真二進制代碼,針對X86芯片或另一種架構。這對于方塊圖而言顯然很容易,但是在實際情況下處理計算效率卻很難。仿真是安騰芯片沒有做好的一方面,但它的編譯器也不是很好,這是安騰失敗的兩個原因。所以這方面值得深思。


最后要說的一點是,我們認為CSA基本上過了第一道關。鑒于三年前英特爾斥資167億美元收購了FPGA制造商Altera,現又準備推出至強-FPGA混合芯片,如果CSA更易于編程,能夠針對許多工作負載獲得更理想的結果,那么CSA對于英特爾的FPGA業務會帶來怎樣的影響?如果英特爾從FPGA轉向CSA,勢必要燒大量的錢。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲精品男同| 久久黄色网页| 午夜一区二区三视频在线观看 | 亚洲一区二区三区视频| 亚洲精品国产精品国自产在线| 一区二区三区自拍| 狠狠狠色丁香婷婷综合久久五月| 国产精品资源在线观看| 国产精品美女一区二区| 国产精品都在这里| 国产精品普通话对白| 国产精品久久久久影院色老大| 欧美网站大全在线观看| 国产精品wwwwww| 国产精品久久久久免费a∨大胸| 国产精品v日韩精品| 国产精品国产三级国产普通话蜜臀| 欧美三区美女| 国产精品久久久久一区| 国产精品夜夜夜| 国产视频在线观看一区二区| 国产一区二区精品久久99| 国产自产2019最新不卡| 韩日成人在线| 亚洲国产婷婷香蕉久久久久久| 亚洲人成网站在线观看播放| 亚洲日本理论电影| 999在线观看精品免费不卡网站| 一本色道婷婷久久欧美| 亚洲免费一区二区| 久久精品亚洲一区二区| 最新国产精品拍自在线播放| 一本久道综合久久精品| 亚洲欧美一区二区三区在线| 欧美专区在线| 欧美大片一区二区| 欧美日韩黄色大片| 国产精品外国| 国产在线视频欧美| 在线日本欧美| 亚洲日韩成人| 亚洲永久精品大片| 亚洲国产精品视频| 日韩小视频在线观看专区| 亚洲一区二区三区四区五区黄| 欧美在线3区| 欧美激情精品久久久久久久变态 | 久久久99久久精品女同性| 欧美成va人片在线观看| 欧美视频一区| 一区二区在线观看视频在线观看| 亚洲精品视频在线| 午夜精品国产更新| 亚洲日韩欧美视频一区| 亚洲女同性videos| 牛夜精品久久久久久久99黑人| 欧美日韩ab| 国产日韩欧美三级| 91久久精品一区二区别| 亚洲综合不卡| 91久久精品一区| 亚洲欧美日韩第一区| 久久婷婷国产综合精品青草| 欧美日韩岛国| 国内精品国产成人| 日韩一区二区久久| 久久精品免费| 亚洲免费一在线| 蜜桃av一区二区三区| 国产精品二区在线观看| 1000精品久久久久久久久| 亚洲视频免费观看| 亚洲日本中文字幕| 久久精品国产亚洲5555| 欧美色网在线| 在线观看国产精品网站| 亚洲无线视频| 亚洲美女精品久久| 久久这里只有精品视频首页| 国产精品美女久久久| 亚洲激情网站| 亚洲电影毛片| 欧美一区久久| 欧美午夜片在线免费观看| 亚洲高清二区| 欧美在线免费一级片| 亚洲欧美日韩在线播放| 欧美精品一区二区高清在线观看| 国产综合亚洲精品一区二| 亚洲午夜日本在线观看| 亚洲免费观看| 麻豆精品视频在线观看视频| 国产日韩1区| 一区二区三区日韩在线观看| 日韩视频在线观看免费| 美玉足脚交一区二区三区图片| 国产日韩一区二区三区在线| 亚洲网友自拍| 亚洲一区二区三区视频| 欧美日韩成人综合在线一区二区| 伊人蜜桃色噜噜激情综合| 性做久久久久久久免费看| 亚洲欧美日韩国产精品| 欧美日韩一区二区免费在线观看 | 久久色在线观看| 国产亚洲精品激情久久| 亚洲视屏一区| 国产精品99久久不卡二区| 欧美精品在线观看91| 亚洲国产欧美一区| 91久久精品一区| 欧美+亚洲+精品+三区| 黄色成人精品网站| 久久精品国产2020观看福利| 久久九九精品99国产精品| 国产日韩欧美一区二区| 香蕉精品999视频一区二区| 亚欧成人精品| 国产日韩欧美日韩| 欧美亚洲系列| 久久人91精品久久久久久不卡| 国产日韩欧美一区二区三区四区| 亚洲欧美在线一区| 欧美在线中文字幕| 国产视频精品网| 久久精品99无色码中文字幕| 久久久亚洲午夜电影| 国产午夜精品全部视频播放| 欧美一区2区三区4区公司二百 | 国语精品中文字幕| 久久国产乱子精品免费女| 久久久国际精品| 在线播放日韩| 日韩网站在线观看| 欧美伦理a级免费电影| 日韩午夜剧场| 香蕉久久国产| 国内自拍一区| 亚洲人成在线观看| 欧美日本久久| 亚洲一区二区三区在线观看视频| 亚洲欧美一区二区三区极速播放| 国产伦理一区| 亚洲电影第三页| 欧美日韩高清不卡| 一区二区三区免费观看| 亚洲淫性视频| 国产香蕉久久精品综合网| 亚洲国产小视频| 欧美日韩免费高清一区色橹橹| 亚洲视频一区二区免费在线观看| 香蕉久久国产| 一区二区在线视频观看| 日韩一级大片| 国产精品综合久久久| 亚洲国产福利在线| 欧美视频在线观看免费| 亚洲免费在线观看视频| 久久只精品国产| 99亚洲精品| 久久久国产亚洲精品| 亚洲黄一区二区三区| 亚洲一区二区三区免费观看| 国产一区二区0| 一区二区日韩精品| 国产日韩欧美一区在线 | 欧美在线|欧美| 欧美日韩成人综合| 午夜久久久久久| 欧美成人精品在线视频| 亚洲视频自拍偷拍| 老司机一区二区三区| 中文av字幕一区| 久久夜色精品亚洲噜噜国产mv| 亚洲美女电影在线| 久久久久在线观看| 日韩图片一区| 久久亚洲图片| 亚洲一区二区3| 欧美黄色小视频| 欧美一级大片在线免费观看| 欧美精品97| 欧美在线观看视频一区二区三区| 欧美成人免费网站| 亚洲午夜在线观看| 欧美激情网友自拍| 午夜精品国产| 欧美天天综合网| 亚洲人久久久| 国产亚洲精品久| 亚洲免费人成在线视频观看| 亚洲福利视频网| 久久精品国产清高在天天线 | 亚洲人被黑人高潮完整版| 国产三级欧美三级| 亚洲一品av免费观看| 在线视频国内自拍亚洲视频| 欧美一区激情视频在线观看| 99伊人成综合| 欧美精品观看|