《電子技術應用》
您所在的位置:首頁 > 人工智能 > 解決方案 > 多級存儲器與模擬內存內計算完美融合,人工智能邊緣處理難題迎刃而解

多級存儲器與模擬內存內計算完美融合,人工智能邊緣處理難題迎刃而解

2020-07-13
作者:Vipin Tiwari ,Microchip嵌入式存儲器產品開發總監
來源:Microchip

機器學習和深度學習已成為我們生活中不可或缺的部分。利用自然語言處理(NLP)、圖像分類和物體檢測實現的人工智能(AI)應用已深度嵌入到我們使用的眾多設備中。大多數AI應用通過云引擎即可出色地滿足其用途,例如在Gmail中回復電子郵件時可以獲得詞匯預測。

雖然我們可以享受到這些AI應用帶來的益處,但這種方法導致隱私、功耗、延時和成本等諸多因素面臨挑戰。如果有一個能夠在數據來源處執行部分或全部計算(推斷)的本地處理引擎,那么這些問題即可迎刃而解。傳統數字神經網絡的存儲器功耗存在瓶頸,難以實現這一目標。為了解決這一問題,可以將多級存儲器模擬內存內計算方法結合使用,使處理引擎滿足更低的毫瓦級(mW)到微瓦級(μW)功率要求,從而在網絡邊緣執行AI推斷。

通過云引擎提供服務的

AI應用面臨的挑戰

如果通過云引擎為AI應用提供服務,用戶必須將一些數據以主動或被動方式上傳到云,計算引擎在云中處理數據并提供預測,然后將預測結果發送給下游用戶使用。下面概述了這一過程面臨的挑戰:

 

圖片1.png

圖1:從邊緣到云的數據傳輸

1. 隱私問題:對于始終在線始終感知的設備,個人數據和/或機密信息在上傳期間或在數據中心的保存期限內存在遭受濫用的風險。

2. 不必要的功耗:如果每個數據位都傳輸到云,則硬件、無線電、傳輸裝置以及云中不必要的計算都會消耗電能。

3. 小批量推斷的延時:如果數據來源于邊緣,有時至少需要一秒才能收到云系統的響應。當延時超過100毫秒時,人們便有明顯感知,造成反響不佳的用戶體驗。

4. 數據經濟需要創造價值:傳感器隨處可見,價格低廉;但它們會產生大量數據。將每個數據位都上傳到云進行處理并不劃算。

要使用本地處理引擎解決這些挑戰,必須首先針對目標用例利用指定數據集對執行推斷運算的神經網絡進行訓練。這通常需要高性能計算(和存儲器)資源以及浮點算數運算。因此,機器學習解決方案的訓練部分仍需在公共或私有云(或本地GPU、CPU和FPGA Farm)上實現,同時結合數據集來生成最佳神經網絡模型。神經網絡模型的推斷運算不需要反向傳播,因此在該模型準備就緒之后,可利用小型計算引擎針對本地硬件進行深度優化。推斷引擎通常需要大量乘-累加(MAC)引擎,隨后是激活層(例如修正線性單元(ReLU)、Sigmoid函數或雙曲正切函數,具體取決于神經網絡模型復雜度)以及各層之間的池化層。

大多數神經網絡模型需要大量MAC運算。例如,即使是相對較小的“1.0 MobileNet-224”模型,也有420萬個參數(權重),執行一次推斷需要多達5.69億次的MAC運算。此類模型中的大多數都由MAC運算主導,因此這里的重點是機器學習計算的運算部分,同時還要尋找機會來創建更好的解決方案。下面的圖2展示了一個簡單的完全連接型兩層網絡。輸入神經元(數據)通過第一層權重處理。第一層的輸出神經元通過第二層權重處理,并提供預測(例如,模型能否在指定圖像中找到貓臉)。這些神經網絡模型使用“點積”運算計算每層中的每個神經元,如下面的公式所示:

QQ圖片20200713153746.png(為簡單起見,公式中省略了“偏差”項)。

 

圖片2.png

QQ圖片20200713153301.png

圖2:完全連接的兩層神經網絡

 

在數字神經網絡中,權重和輸入數據存儲在DRAM/SRAM中。權重和輸入數據需要移至某個MAC引擎旁以進行推斷。根據下圖,采用這種方法后,大部分功耗都來源于獲取模型參數以及將數據輸入到實際發生MAC運算的ALU。從能量角度來看,使用數字邏輯門的典型MAC運算消耗約250 fJ的能量,但在數據傳輸期間消耗的能量超過計算本身兩個數量級,達到50皮焦(pJ)到100 pJ的范圍。公平地說,很多設計技巧可以最大程度減少存儲器到ALU的數據傳輸,但整個數字方案仍受馮·諾依曼架構的限制。這就意味著,有大量的機會可以減少功率浪費。如果執行MAC運算的能耗可以從約100 pJ減少到若干分之幾pJ,將會怎樣呢? 

消除存儲器瓶頸

同時降低功耗

如果存儲器本身可用來消除之前的存儲器瓶頸,則在邊緣執行推斷相關的運算就成為可行方案。使用內存內計算方法可以最大程度地減少必須移動的數據量。這反過來也會消除數據傳輸期間浪費的能源。閃存單元運行時產生的有功功率消耗較低,在待機模式下幾乎不消耗能量,因此可以進一步降低能耗。

 

圖片3.png

QQ圖片20200713153318.png


圖3:機器學習計算中的存儲器瓶頸

 

來源:Y.-H. Chen、J. Emer和V. Sze于2016國際計算機體系結構研討會發表的“Eyeriss: A Spatial Architecture for Energy-Efficient Dataflow for Convolutional Neural Networks”。

該方法的一個示例是Microchip子公司Silicon Storage Technology(SST)的memBrain?技術。該解決方案依托于SST的SuperFlash?存儲器技術,這項技術已成為適用于單片機和智能卡應用的多級存儲器的公認標準。這種解決方案內置一個內存內計算架構,允許在存儲權重的位置完成計算。權重沒有數據移動,只有輸入數據需要從輸入傳感器(例如攝像頭和麥克風)移動到存儲器陣列中,因此消除了MAC計算中的存儲器瓶頸。 

這種存儲器概念基于兩大基本原理:(a)晶體管的模擬電流響應基于其閾值電壓(Vt)和輸入數據,(b)基爾霍夫電流定律,即在某個點交匯的多個導體網絡中,電流的代數和為零。了解這種多級存儲器架構中的基本非易失性存儲器(NVM)位單元也十分重要。下圖(圖4)是兩個ESF3(第3代嵌入式SuperFlash)位單元,帶有共用的擦除門(EG)和源線(SL)。每個位單元有五個終端:控制門(CG)、工作線(WL)、擦除門(EG)、源線(SL)和位線(BL)。通過向EG施加高電壓執行位單元的擦除操作。通過向WL、CG、BL和SL施加高/低電壓偏置信號執行編程操作。通過向WL、CG、BL和SL施加低電壓偏置信號執行讀操作。

 

圖片4.png

圖4:SuperFlash ESF3單元

 

利用這種存儲器架構,用戶可以通過微調編程操作,以不同Vt電壓對存儲器位單元進行編程。存儲器技術利用智能算法調整存儲器單元的浮柵(FG)電壓,以從輸入電壓獲得特定的電流響應。根據最終應用的要求,可以在線性區域或閾下區域對單元進行編程。 

圖5說明了在存儲器單元中存儲多個電壓的功能。例如,我們要在一個存儲器單元中存儲一個2位整數值。對于這種情況,我們需要使用4個2位整數值(00、01、10、11)中的一個對存儲器陣列中的每個單元進行編程,此時,我們需要使用四個具有足夠間隔的可能Vt值之一對每個單元進行編程。下面的四條IV曲線分別對應于四種可能的狀態,單元的電流響應取決于向CG施加的電壓。

圖片5.png

QQ圖片20200713153344.png

圖5:ESF3單元中的編程Vt電壓

 

受訓模型的權重通過編程設定為存儲器單元的浮柵Vt。因此,受訓模型每一層(例如完全連接的層)的所有權重都可以在類似矩陣的存儲器陣列上編程,如圖6所示。對于推斷運算,數字輸入(例如來自數字麥克風)首先利用數模轉換器(DAC)轉換為模擬信號,然后應用到存儲器陣列。隨后該陣列對指定輸入向量并行執行數千次MAC運算,產生的輸出隨即進入相應神經元的激活階段,隨后利用模數轉換器(ADC)將輸出轉換回數字信號。然后,這些數字信號在進入下一層之前進行池化處理。

 

圖片6.png

QQ圖片20200713153358.png

圖6:用于推斷的權重矩陣存儲器陣列

 

這類多級存儲器架構模塊化程度非常高,而且十分靈活。許多存儲器片可以結合到一起,形成一個混合了權重矩陣和神經元的大型模型,如圖7所示。在本例中,MxN片配置通過各片間的模擬和數字接口連接到一起。

圖片7.png

圖7:memBrain?的模塊化結構

 

截至目前,我們主要討論了該架構的芯片實施方案。提供軟件開發套件(SDK)可幫助開發解決方案。除了芯片外,SDK還有助于推斷引擎的開發。SDK流程與訓練框架無關。用戶可以在提供的所有框架(例如TensorFlow、PyTorch或其他框架)中根據需要使用浮點計算創建神經網絡模型。創建模型后,SDK可幫助量化受訓神經網絡模型,并將其映射到存儲器陣列。在該陣列中,可以利用來自傳感器或計算機的輸入向量執行向量矩陣乘法。

 

圖片8.png

QQ圖片20200713153419.png

圖8:memBrain? SDK流程

多級存儲器方法結合內存內計算功能的優點包括: 

1. 超低功耗:專為低功耗應用設計的技術。功耗方面的第一個優點是,這種解決方案采用內存內計算,因此在計算期間,從SRAM/DRAM傳輸數據和權重不會浪費能量。功耗方面的第二個優點是,閃存單元在閾下模式下以極低的電流運行,因此有功功率消耗非常低。第三個優點是待機模式下幾乎沒有能耗,原因是非易失性存儲器單元不需要任何電力即可保存始終開啟設備的數據。這種方法也非常適合對權重和輸入數據的稀疏性加以利用。如果輸入數據或權重為零,則存儲器位單元不會激活。

2. 減小封裝尺寸:該技術采用分離柵(1.5T)單元架構,而數字實施方案中的SRAM單元基于6T架構。此外,與6T SRAM單元相比,這種單元是小得多。另外,一個單元即可存儲完整的4位整數值,而不是像SRAM單元那樣需要4*6 = 24個晶體管才能實現此目的,從本質上減少了片上占用空間。

3. 降低開發成本:由于存儲器性能瓶頸和馮·諾依曼架構的限制,很多專用設備(例如Nvidia的Jetsen或Google的TPU)趨向于通過縮小幾何結構提高每瓦性能,但這種方法解決邊緣計算難題的成本卻很高。采用將模擬內存內計算與多級存儲器相結合的方法,可以在閃存單元中完成片上計算,這樣便可使用更大的幾何尺寸,同時降低掩膜成本和縮短開發周期。

 

邊緣計算應用的前景十分廣闊。然而,需要首先解決功耗和成本方面的挑戰,邊緣計算才能得到發展。使用能夠在閃存單元中執行片上計算的存儲器方法可以消除主要障礙。這種方法利用經過生產驗證的公認標準類型多級存儲器技術解決方案,而這種方案已針對機器學習應用進行過優化。

作者簡介

Vipin Tiwari在產品開發、產品營銷、業務開發、技術許可、工程管理以及存儲器設計方面擁有20多年的豐富經驗。目前,Tiwari先生在Microchip的子公司Silicon Storage Technology, Inc.擔任嵌入式存儲器產品開發總監。

 

 


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲电影在线| 欧美欧美天天天天操| 国产精品日产欧美久久久久| 亚洲自拍都市欧美小说| 久久亚洲欧洲| 亚洲欧洲日本专区| 亚洲欧美成人网| 1000部精品久久久久久久久| 亚洲欧美日韩精品久久奇米色影视| 国产午夜精品久久久久久久| 国产精品99久久久久久www| 国产主播精品在线| 亚洲色诱最新| 亚洲国产另类久久久精品极度| 亚洲欧美日韩精品久久久| 亚洲福利在线看| 久久精品国产精品亚洲综合 | 久久精品91久久久久久再现| 欧美日韩123| 亚洲欧洲精品一区二区三区不卡 | 在线电影国产精品| 久久久精品性| 欧美亚洲视频在线看网址| 国产精品av久久久久久麻豆网| 久久精品国产综合精品| 国产精品毛片一区二区三区| 夜夜嗨网站十八久久 | 国产一区清纯| 久久人人爽人人| 亚洲影音先锋| 国产精品久久77777| 久久成人18免费观看| 国产精品稀缺呦系列在线| 亚洲一二区在线| 一本色道久久综合| 欧美日韩高清在线观看| 亚洲欧美成人精品| 欧美一区二区在线看| 亚洲一区在线直播| 国产精品欧美在线| 欧美有码在线视频| 久久精品国产v日韩v亚洲 | 国产精品国内视频| 欧美一区二区三区啪啪| 香蕉国产精品偷在线观看不卡 | 亚洲婷婷综合久久一本伊一区| 欧美亚州韩日在线看免费版国语版| 亚洲伊人久久综合| 性色av一区二区三区红粉影视| 国产欧美一区二区精品仙草咪| 一区二区三区高清不卡| 一本色道久久综合亚洲精品不卡 | 欧美交受高潮1| 午夜精品视频网站| 久久精品亚洲精品国产欧美kt∨| 亚洲国产成人av好男人在线观看| 欧美日韩亚洲91| 久久久综合精品| 亚洲无毛电影| 亚洲成人在线视频播放 | 久久午夜羞羞影院免费观看| 99国产精品久久久久久久久久| 亚洲自拍16p| 亚洲国产清纯| 国产一二三精品| 欧美亚州在线观看| 欧美激情在线观看| 久久免费精品视频| 欧美亚洲专区| 亚洲视频大全| 日韩午夜三级在线| 亚洲综合999| 先锋影音国产精品| 国产精品v欧美精品v日韩精品| 欧美一级一区| 亚洲欧美日本精品| 国产亚洲精品一区二555| 欧美成人在线免费视频| 久久精品一区二区三区四区 | 欧美一级视频| 亚洲欧美另类久久久精品2019| 99国产精品视频免费观看| 亚洲国产成人在线播放| 国内精品久久久久影院薰衣草| 国产精品男gay被猛男狂揉视频| 欧美精品在线看| 欧美一区二区三区在线视频| 国产精自产拍久久久久久| 欧美大片第1页| 欧美精品免费观看二区| 麻豆精品精华液| 免费成人av在线| 欧美1区视频| 欧美高潮视频| 国产精品成人va在线观看| 欧美视频在线观看 亚洲欧| 欧美韩日一区| 欧美日韩久久精品| 国产精品大片wwwwww| 国产精品综合网站| 国产在线不卡| 怡红院av一区二区三区| 91久久精品日日躁夜夜躁国产| 亚洲黄色视屏| 亚洲伊人伊色伊影伊综合网| 亚洲一区二区三区免费视频| 欧美一区二区视频在线观看| 亚洲国产欧美不卡在线观看 | 亚洲伊人伊色伊影伊综合网| 欧美在线免费视频| 夜夜嗨av一区二区三区中文字幕| 亚洲性视频网址| 久久夜色精品亚洲噜噜国产mv| 欧美精品在欧美一区二区少妇| 国产乱码精品一区二区三区忘忧草| 影音先锋亚洲精品| 亚洲一区三区电影在线观看| 亚洲国产合集| 午夜电影亚洲| 欧美日韩精品| 樱桃国产成人精品视频| 正在播放欧美视频| 日韩午夜剧场| 免费日韩视频| 国产亚洲福利社区一区| 国产日韩欧美夫妻视频在线观看| 欧美 日韩 国产一区二区在线视频 | 久久国产福利| 欧美一区二区在线免费观看| 欧美日韩精品欧美日韩精品| 黑人巨大精品欧美黑白配亚洲| 亚洲视频久久| 亚洲免费在线观看| 欧美精品一区二区三区在线看午夜| 国产专区综合网| 欧美一区二区精品久久911| 正在播放欧美一区| 欧美区国产区| 日韩视频中文字幕| 亚洲视频一区二区| 欧美日韩dvd在线观看| 亚洲精品国产视频| 在线视频精品一| 欧美午夜性色大片在线观看| 亚洲精品在线二区| 一本大道久久a久久精品综合| 欧美激情综合在线| 9人人澡人人爽人人精品| 一本色道久久| 国产精品麻豆成人av电影艾秋| 亚洲天堂视频在线观看| 午夜在线一区二区| 国产亚洲在线| 亚洲精品极品| 国产精品国产精品| 午夜一区二区三区不卡视频| 欧美综合国产| 在线播放亚洲| 亚洲视频福利| 国产一二精品视频| 亚洲日本中文| 国产精品国产馆在线真实露脸 | 亚洲视频在线播放| 欧美在线视频一区二区三区| 国产亚洲欧美日韩美女| 日韩视频在线一区二区三区| 国产精品初高中精品久久| 午夜在线观看免费一区| 免费视频一区| 亚洲欧美成人| 欧美精品久久久久久久免费观看 | 欧美一级视频| 欧美理论电影网| 亚洲黄色成人| 欧美一区二区三区在线观看视频| 韩国女主播一区| 亚洲自拍偷拍一区| 亚洲二区在线| 久久精品亚洲| 99视频在线观看一区三区| 亚洲欧美日韩另类| 91久久精品国产91久久性色| 欧美一级成年大片在线观看| 最新亚洲视频| 老色批av在线精品| 午夜精品久久久久| 欧美亚一区二区| 99ri日韩精品视频| 尤物九九久久国产精品的分类| 亚洲欧美日韩网| 日韩视频在线一区二区三区| 狂野欧美激情性xxxx| 欧美一区二区三区在线观看| 国产精品你懂得| 亚洲欧美日韩国产成人精品影院| 亚洲精品一区在线观看| 欧美金8天国| 日韩视频精品在线| 激情久久婷婷| 蜜桃久久av一区|