《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 清微智能可重構架構的進擊之路

清微智能可重構架構的進擊之路

2021-02-02
來源:半導體行業(yè)觀察

  在與清微智能CEO王博交流的過程中,他一再向筆者強調:“清微智能芯片的最大特點就在于其基于粗粒度可重構架構設計的芯片,這對于AI算法在當前和未來還將持續(xù)演進的現(xiàn)狀,是非常之有意義的。”

  王博進一步指出,所謂的粗粒度可重構計算(Coarse-grained Reconfigurable Architecture CGRA),是一種全新的芯片架構技術,可根據(jù)算法和應用的不同靈活配置硬件資源,執(zhí)行不同的任務,同時具備通用芯片的靈活性和專用集成電路的高效性。據(jù)2015年國際半導體技術發(fā)展路線圖(ITRS)的預測,CGRA是未來最有發(fā)展前途的新興計算架構之一。而成立于2018的清微智能也在短短幾年間發(fā)展成為這個領域扛大旗的企業(yè)之一的。

  之所以能達成這樣的成就,按照王博介紹,這主要得益于公司的初創(chuàng)團隊過去多年在這個領域的研究。

  源自清華大學,不同于FPGA的可重構

  其實可重構計算并不是什么新鮮事物。

  據(jù)維基百科,早在上世紀六十年代,就有專家提出。但受限于當時的技術水平,可重構在當時并不能實現(xiàn),但這種思路一直被行業(yè)所銘記,而上世紀八十年代面世的FPGA可算得上是“可重構”概念的產物。

  踏入最近十幾年,科學技術快速發(fā)展,新興應用層出不窮,算法也日新月異。與此同時,高性能芯片的研發(fā)成本與日俱增,這就讓產學研都加倍重視相對靈活的可重構架構,尤其是進入21世紀第二個十年,人工智能的快速興起,吸引了全球對可重構的高度關注。例如美國DARPA在2018年啟動的“電子復興計劃”(ERI)中就提到要研發(fā)具有軟件和硬件雙編程能力。

  作為對比,國內頂級學府清華大學也早在2006年就成立了可重構計算實驗室,在魏少軍教授和尹首一教授的帶領下開啟了中國可重構芯片的研發(fā)歷程,并在此過程中取得了耀眼的成績,這比美國足足早了十幾年。

  相關資料也顯示,該團隊先后在2016年和2017年分別推出了Thinker-I、Thinker-Ⅱ及Thinker-S等基于CGRA結構的加速器芯片。據(jù)筆者了解,清華大學團隊所使用的CGRA架構是一種無指令驅動的可重構計算架構,由數(shù)據(jù)流驅動,面向異構的空域計算,將軟件通過不同的管道輸送到硬件中來執(zhí)行功能,能實時地根據(jù)算法和產品的需求改變硬件資源,從而以更高的資源利用率和數(shù)據(jù)復用率去計算特殊需求,在合理分配和使用算力的同時,成倍節(jié)約數(shù)據(jù)存儲和傳輸帶寬。

  微信圖片_20210202100251.png

  微信公眾號mikesiroom的作者在其文章中也指出,傳統(tǒng)AI加速器通常面向如卷積和矩陣乘累加等深度學習算法的核心部分,但在諸如pooling,normalization,softmax等運算上,要么依賴CPU端進行運算,要么借助專門的硬件模塊。但在這兩種方案中,前者性能不高,后者面積較大。但清華大學團隊的Thinker的解決方案是通過對PE陣列的動態(tài)配置,以相同的硬件支持全部深度學習的的功能。這樣就能讓基于CGRA的芯片獲得更好的PPA,給端側設備帶來重要的價值。

  “在經(jīng)歷了十幾年的研究之后,他們決定把這個技術轉化,并在2018年成立了清微智能”。清華大學可重構計算實驗室的負責人之一、清微智能的首席科學家尹首一教授在一次采訪中告訴半導體行業(yè)觀察記者。他進一步指出,這種全新的芯片架構技術,可以根據(jù)不同的算法和應用需求靈活重構硬件資源,同時具備了通用計算芯片的靈活性和專用集成電路高效性的特點。

  雖然與上述的FPGA都屬于可重構技術,但從王博的介紹我們得知,CGRA與FPGA有三點主要的區(qū)別:

  第一、FPGA的運算過程其是通過查找表來完成的,需要大量的結果預存,對存儲器的要求要特別大,同時,在計算的過程中需要頻繁的訪存,會產生大量的功耗;CGRA是基于數(shù)據(jù)流運算,不需要大量的存儲器開銷,在寄存器直接傳導數(shù)據(jù),能量效率高;

  第二、FPGA基于查找表的執(zhí)行方式實現(xiàn)細粒度的運算,使得運算過程中內部電路關鍵路徑長,主頻沒法做高,同時,會耗費大量功耗;而CGRA是一種空域計算,數(shù)據(jù)計算過程中可以并行進行,關鍵路徑短,計算頻率可以很高。

  第三,F(xiàn)PGA是一種靜態(tài)重構,應用發(fā)生改變時,重構的過程是需要重新燒制,是一種離線的過程,需要較長時間,而CGRA是一種動態(tài)的重構過程,算法和應用發(fā)生改變時,在運算過程直接重構,時間開銷是微秒級,這過程甚至不會被察覺到。

  “CPU采用指令集方式,實現(xiàn)了通用計算,但是他們的計算過程,讓他們能效有損失,在與他們相比時,我們的架構擁有1000倍的能耗比優(yōu)勢;FPGA采用了查找表的方式工作,帶來資源的浪費,與他們相比,我們的能耗比也高了100倍;GPU采用單指令多數(shù)據(jù)的運行架構,但受限于指令集讀取的模式,我們相比他也有10倍左右的優(yōu)勢”,尹首一教授曾經(jīng)用形象的數(shù)字將可重構計算與其它幾種技術路線的性能做過對比。

  從語音到圖像,AI芯片初體驗

  在多年技術積累的助推下,清微智能在成立僅一年之后,就推出了全球首款可重構超低功耗語音人工智能芯片TX210。據(jù)介紹,這是一顆采用臺積電40nm ULP工藝制造的的芯片,能夠支持離線語音喚醒、5個喚醒詞、10個命令詞以及聲紋識別。此外,這顆芯片還能夠支持3到5米的原廠語音喚醒和識別。然而其芯片的工作頻率僅為50Mhz,延遲更是不到10ms。

  因為是一顆面向端側,甚至電池供電產品的芯片,TX210在功耗方面也有不錯的表現(xiàn),這主要得益于公司在設計該芯片時候引入的多級功耗喚醒模式。據(jù)介紹,這顆芯片只有在通過麥克風檢測到人聲時才會被激活,也僅有在準確監(jiān)聽到“喚醒詞”后,才會去喚醒處于休眠狀態(tài)的主控處理器芯片。這就幫助把芯片的工作功耗控制在2mw內,而語音語音活動檢測(Voice Activity Detection,VAD)功耗也降至100uW內。

  作為一款CGRA架構的芯片,TX210擁有極高的靈活性,不但能夠支持多比特DNN神經(jīng)網(wǎng)絡,還可以支持1到16bit位寬的神經(jīng)網(wǎng)絡運算以及FFT/MEL FILTER等。

  王博則表示,TX210的推出,符合他們作為一個初創(chuàng)公司的定位。在他看來,初創(chuàng)企業(yè)的發(fā)展,要遵循從小投入到大投入的原則,這也是清微智能選擇首先從做投入較少的語音芯片TX210開始的原因。“因為語音芯片要求沒那么高,外圍單元需求也相對少,頻率低,工藝節(jié)點也低”,王博補充說。

  他進一步指出,TX210無論是在算力,還是能效方面,都有比較大的優(yōu)勢,這讓他們有足夠的底氣與客戶一起,將這顆芯片推向了智能耳機、智能手表、智能家居和平板等行業(yè)。據(jù)透露,TX210目前的出貨量已經(jīng)達到了百萬級別。

  在語音芯片上旗開得勝之后,清微智能順勢帶來了全球首款可重構多模態(tài)智能計算芯片TX510。

微信圖片_20210202100322.jpg

  從相關資料可以看到,TX510 是一款面向 IoT 設備的超低功耗視覺處理芯片,以可重構架構設計,能實現(xiàn)高性能計算,低功率消耗的超強能效比,峰值算力達 2TOPS。正是基于這樣的設計,客戶如果想開發(fā)系列產品,或者在市場競爭中用差異化的的產品來獲得優(yōu)勢,就可以TX510上做便捷開發(fā),而不用做太多改變。

  來到算法模型支持方面,TX510支持 AlexNet、GoogleNet、ResNet、VGG、Faster-RCNN、Yolo、SSD、FCN 和 SegNet 等主流神經(jīng)網(wǎng)絡;同時還內置 3D 引擎,可實現(xiàn)人臉識別、物體識別、手勢識別、目標跟蹤等功能,可應用于智能安防監(jiān)控、智能家居、新零售等領域。

  在筆者與王博的交流中,他多次談到了TX510的可重構優(yōu)勢,同時因為公司在編譯工具鏈上的投入,那就意味著開發(fā)者不用理解CGRA硬件層面的工作原理,可以保持原有的開發(fā)習慣就好,讓開發(fā)者可以很快上手。他同時還指出,這個芯片因為集成了多種存儲、外設接口豐富,同時還提供豐富的開發(fā)資源,這就使得基于其開發(fā)產品擁有開發(fā)周期短和投入人力少的優(yōu)勢。

  “基于TX510運算特性,自動輸出包含剪枝參數(shù),低比特參數(shù)在內的最優(yōu)模型優(yōu)化策略,使開發(fā)者的算法模型最高效率的運行在TX510芯片上,并保持出色的低功耗性能。也提供包含人臉識別,ADAS,視頻監(jiān)控,智能家居等多種應用場景的完整解決方案,客戶可快速完成相應場景的產品開發(fā)。”王博強調。

  從當前的競爭格局來看,TX510基本上算是市面上能效比最高的視覺芯片(也可以稱為有效算力高),這主要是因為可重構計算架構能根據(jù)算法和應用改變硬件資源,所以可以集中硬件資源去計算特殊需求(MCU和其它的圖像AI芯片在計算時有很多不必要的數(shù)據(jù)搬運,消耗大量資源)。上述靈活性與低功耗正是TX510獲得客戶認可的兩個關鍵點。

  “TX510從2020年10月份正式量產,迄今為止累計出貨量50萬顆”,王博告訴記者。

  替代通用,可重構的未來目標

  毫無疑問,可重構架構是一個很有前景的技術。清微智微在語音和圖像AI芯片上的梅開二度也一再證明了可重構的潛力。但王博表示,無論是對于可重構,還是清微智能,現(xiàn)在離他們想要實現(xiàn)的目標還有一段距離。他首先以可重構架構在AI芯片市場應用為例,說明了可重構面臨的一些挑戰(zhàn)。

  “雖然我們在可重構芯片上的軟件、工具鏈上做了很大的努力,但作為一個初創(chuàng)企業(yè),我們目前能做的也只是滿足大部分用戶的需求,不得不承認,離真正發(fā)展成熟,還需要一段距離”,王博說道。他同時也指出:可重構架構的特性,讓其可以在多個領域發(fā)揮作用,其具有的天然的可擴展性,可通過算力擴展,將高能效,靈活性的特點更好的發(fā)揮出來,因此,也非常適合做數(shù)據(jù)量更大的訓練芯片。公司也在做積極布局云端市場,團隊早在數(shù)年前就開始做技術預研和芯片驗證,同樣功耗下更高算力等多個實驗指標保證公司可快速進入服務器和云計算市場。

  “我們認為,可重構架構正在就朝著更通用的方向前進,可以運行更多的算法,代替DSP和CPU等傳統(tǒng)架構去做更多的事。這里說的代替是高層次的代替,用更高的性能和更高的能效朝著這兩個方向前進”,王博表示。

  在與王博的交談中,他多次強調,清微智能從來沒有把自己定義為一家AI芯片公司,而是恰好AI市場的發(fā)展,讓公司的可重構架構找到了一個落地的場景。這正與他所說的“清微智能的發(fā)展方向以可重構架構為核心,在某些具體賽道上為客戶提供芯片及解決方案,”的觀點相契合,目前來看,這些賽道是指那些對語音或圖像等有持續(xù)大計算量需求的領域。

  回看芯片產業(yè)的發(fā)展,在摩爾定律的指導下,芯片的處理能力與以前相比有了指數(shù)級別的增長。但到了現(xiàn)在,受限于材料與制造水平,芯片不能再像以往那樣通過簡單的微縮來實現(xiàn)性能的提升。然而,人工智能等新興應用對芯片性能的增加依然有很高的需求。為此探索新的解決方案,成為了行業(yè)追逐的重點。

  可重構,正是這個問題的一個答案。

  


本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
久久亚洲私人国产精品va| 国产精品理论片| 亚洲一级高清| 久久精品视频网| 香蕉久久精品日日躁夜夜躁| 一区二区av| 亚洲精品综合精品自拍| 亚洲黄色av| 最新中文字幕亚洲| 亚洲区在线播放| 91久久午夜| 最新日韩精品| 亚洲精品一区二区三区福利| 亚洲激情六月丁香| 亚洲日本中文字幕| 亚洲片国产一区一级在线观看| 亚洲观看高清完整版在线观看| 黄色成人免费观看| 伊人精品成人久久综合软件| 一区视频在线| 亚洲国产经典视频| 亚洲精品久久久久久久久久久久久 | 国内精品美女在线观看| 国产在线日韩| 1024国产精品| 亚洲欧洲一区二区三区在线观看| 亚洲欧洲美洲综合色网| 亚洲精品一区在线观看| av不卡在线| 亚洲综合成人婷婷小说| 欧美一区二区三区久久精品茉莉花| 欧美一区二视频| 亚洲高清在线精品| 亚洲精选国产| 亚洲一级黄色av| 欧美一区二区在线免费播放| 久久久爽爽爽美女图片| 母乳一区在线观看| 欧美日韩极品在线观看一区| 国产精品伦理| 黄色成人精品网站| 亚洲精品在线一区二区| 亚洲一区二区三区免费视频| 久久xxxx| 日韩一区二区高清| 午夜精品成人在线| 六月丁香综合| 欧美三级黄美女| 国产啪精品视频| 亚洲国产三级在线| 99国产精品久久久久久久久久| 亚洲欧美电影院| 久久精品免视看| 一二三四社区欧美黄| 午夜精品福利电影| 欧美 日韩 国产一区二区在线视频 | 亚洲男女自偷自拍| 亚洲国产美女精品久久久久∴| 夜夜嗨一区二区三区| 欧美在线播放一区二区| 欧美~级网站不卡| 国产精品伦子伦免费视频| 激情伊人五月天久久综合| 日韩亚洲欧美一区二区三区| 欧美一区二区三区久久精品| 一本一本久久a久久精品综合麻豆| 欧美怡红院视频| 欧美精品在欧美一区二区少妇| 国产日产亚洲精品| 亚洲精品日日夜夜| 欧美中文字幕视频在线观看| 一区二区三区成人| 久久久一区二区| 国产精品成人免费| 亚洲成人在线观看视频| 亚洲一区视频| 亚洲视频每日更新| 欧美成人免费一级人片100| 国产精品入口日韩视频大尺度 | 亚洲欧洲日产国码二区| 午夜精品久久久久久99热| aa级大片欧美| 免费观看亚洲视频大全| 国产欧美日韩伦理| 亚洲精品一区二区三区99| 亚洲高清在线精品| 久久福利毛片| 国产精品久久91| 亚洲乱码日产精品bd| 91久久久久久国产精品| 久久九九免费| 国产九九精品视频| 一区二区激情视频| 一本综合精品| 欧美精品18+| 在线播放亚洲| 久久aⅴ国产欧美74aaa| 午夜老司机精品| 欧美午夜不卡在线观看免费 | 中文国产亚洲喷潮| 欧美精品一区在线发布| 亚洲国产另类久久精品| 久久精品国产精品| 久久久国产午夜精品| 国产精品永久免费观看| 中文精品在线| 亚洲视频精选| 欧美午夜免费影院| 亚洲另类视频| 国产精品99久久久久久久vr| 欧美高清在线视频| 亚洲第一级黄色片| 亚洲黄色成人久久久| 老妇喷水一区二区三区| 狠狠久久婷婷| 亚洲国产精品电影| 乱中年女人伦av一区二区| 韩日精品在线| 亚洲国产婷婷香蕉久久久久久99| 鲁大师成人一区二区三区 | 亚洲国产天堂久久综合| 亚洲人成高清| 欧美大片免费看| 亚洲三级色网| 亚洲色在线视频| 欧美香蕉视频| 亚洲欧美视频一区| 久久成人资源| 精品成人在线观看| 亚洲人成小说网站色在线| 欧美激情按摩| 一区二区三区高清在线| 亚洲欧美激情一区| 国产日韩欧美精品在线| 欧美一级成年大片在线观看| 久久婷婷国产综合尤物精品| 尤物网精品视频| 亚洲精品美女久久7777777| 欧美精品精品一区| 在线视频欧美一区| 欧美在线|欧美| 韩国免费一区| 亚洲精品国产拍免费91在线| 欧美精品一区二| 亚洲影视中文字幕| 久久免费视频一区| 亚洲国产影院| 亚洲欧美日韩精品久久久| 国产一区二区av| 亚洲精品一区二区三区av| 欧美日韩亚洲激情| 亚洲欧美日韩精品在线| 久久青草福利网站| 亚洲精品在线三区| 欧美与黑人午夜性猛交久久久| 精品动漫3d一区二区三区免费版| 亚洲免费成人av电影| 欧美午夜在线一二页| 欧美一区二区在线看| 欧美精品激情blacked18| 亚洲午夜久久久久久尤物| 久久久夜色精品亚洲| 亚洲精品国产精品乱码不99按摩| 亚洲免费视频在线观看| 黄色欧美日韩| 一区二区三区四区五区视频 | 亚洲欧美99| 黄色日韩网站| 亚洲已满18点击进入久久| 国产综合av| 一区二区三区www| 国内精品久久久久久影视8| 亚洲免费观看高清完整版在线观看熊 | 久久久久青草大香线综合精品| 亚洲精美视频| 久久国产精品99精品国产| 亚洲经典自拍| 久久国产主播精品| 亚洲人成7777| 久久精品三级| 日韩一级免费| 美女91精品| 亚洲欧洲av一区二区| 欧美精彩视频一区二区三区| 香蕉免费一区二区三区在线观看 | 亚洲小视频在线观看| 精品成人在线视频| 午夜一区二区三区不卡视频| 亚洲国产另类 国产精品国产免费| 欧美亚洲自偷自偷| 亚洲卡通欧美制服中文| 久久综合久久久久88| 亚洲性夜色噜噜噜7777| 欧美大片第1页| 久久精品国产99国产精品| 国产精品你懂得| 一本色道久久综合精品竹菊 | av成人免费在线| 一区二区在线视频| 欧美在线在线|