《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 多核系統(tǒng)中提升啟動速度之策略
多核系統(tǒng)中提升啟動速度之策略
來源:電子技術應用2014年第3期
王 江
(上海貝爾股份有限公司N&P,上海201206)
摘要: 快速啟動能力是衡量產品性能的一個重要指標。針對應用越來越廣泛的多內核處理器,從優(yōu)化啟動流程、改進模塊的加載和初始化、設計內核間通信機制等方面,介紹了縮短啟動時間的一些經驗,特別是啟動任務的分配、串行執(zhí)行到并行執(zhí)行的轉變、內存的分階段初始化、PCIe總線的快速初始化等技巧。實際測試表明,新策略不僅有效地縮短了啟動時間,而且具有易移植、可擴展等優(yōu)點。
中圖分類號: TP338.2
文獻標識碼: A
文章編號: 0258-7998(2014)03-0025-04
Strategy of accelerating booting process in multi-core systems
Wang Jiang
Alcatel-Lucent Shanghai Bell Co.,Ltd.N&P,Shanghai 201206,China
Abstract: The ability of fast boot is one of the key metrics of product performance. As multi-core microprocessors are being employed widely in more and more applications, the paper introduces some experiences to shorten the boot time, including optimizing boot process, improving the loading and initialization method of modules, designing communicating mechanism between cores, etc. It also elaborates some techniques, such as boot tasks assignment and parallelization, memory division and initialization, fast-initialization of PCIe bus. Experiments verify that the new strategy can not only shorten the boot time, but also be transplantable and scalable.
Key words : boot;PCIe;multi-core microprocessor

    快速啟動能力是衡量產品性能的一個重要指標。無論是消費類電子產品(例如手機、電腦、電視機),還是專業(yè)的通信電子設備(例如示波器、網關、服務器),啟動速度快無疑能給用戶留下美好的第一印象。雖然電子設備的“心臟”越來越多地選用了多核處理器,但是目前大部分啟動代碼還停留在單內核處理器的思維框架中,沒有能夠充分利用多內核處理器的長處,而越來越多的外部器件卻在另一方面悄悄地延長了啟動時間。
    為了彌補這一不足,突破傳統(tǒng)單核啟動的思維框架,本文以一個典型的嵌入式系統(tǒng)為例,對加快系統(tǒng)啟動速度進行了研究。
1 典型的系統(tǒng)架構和啟動過程
1.1 系統(tǒng)架構

    智能通信電子產品的典型架構是以CPU(中央處理器)為核心,根據產品需求輔以內存、硬盤、網卡、USB、串口等各種外設,如圖1所示。

    系統(tǒng)的核心是飛思卡爾(FreeScale)公司開發(fā)的32位PowerPC架構處理器MPC8572E[1],主頻最高可達1.333 GHz。芯片集成了2個完全相同的高性能e500內核,每個內核各包含32 KB一級指令緩存和32 KB一級數據緩存。芯片還集成了豐多彩富的內部功能模塊和外設接口,包括:2個內核共享的1 MB容量的二級緩存、2個64位DDR2/DDR3內存控制器、1個可編程的中斷控制器、1個安全引擎、2個I2C總線控制器、2個異步串口控制器、1個增強型本地總線控制器、4個支持10/100/1 000 MB/s的以太網接口、3個符合PCIe 1.0a標準的PCIe接口等。
    CPU、內存、閃存、串口和網口組成了一個常見的最小系統(tǒng),其他模塊則是錦上添花。處理器通過PCIe接口連接SATA/SAS控制器(例如LSI公司的SAS2008芯片),再外接SATA/SAS硬盤。實時時鐘芯片(RTC)和溫度感應器通過I2C總線與處理器相連。FPGA用于輔助CPU工作。這個系統(tǒng)具有強大的處理能力和靈活的可擴展性,適合于路由器、網關等多種應用場合。其他智能電子設備的控制系統(tǒng)的架構也大致如此,只是CPU可能替換成ARM、MIPS或x86等體現結構的處理器,外圍器件有所增減,但是總體框架和啟動過程大同小異。
1.2 啟動過程
    該系統(tǒng)由業(yè)界常用的U-BOOT[2]引導啟動。圖2顯示了多內核處理器系統(tǒng)中啟動代碼的工作流程。上電或重啟后,內核0根據配置引腳的設定,選擇從閃存中讀取啟動代碼。其他內核保持Reset狀態(tài)。內核0依次初始化了e500內核、第一個串口、一級數據緩存和指令緩存、二級緩存、I2C總線設備、內存。因為初始化內存時CPU需要訪問內存條上的SPD(SPD是存儲內存條規(guī)格參數的EEPROM芯片),所以I2C總線的初始化必須在內存初始化之前完成。之所以較早地初始化串口,是為了盡早建立人機交互的環(huán)境,以方便用戶判斷系統(tǒng)啟動到各個階段的狀態(tài)。然后,內核從閃存中讀取FPGA配置文件并且下載到FPGA芯片中,再初始化PCIe設備、網口、SAS/SATA控制器、硬盤和文件系統(tǒng)。接著,內核0釋放其他內核的Reset信號。

    其他內核也從閃存中讀取啟動代碼,依次初始化e500內核、一級數據緩存和指令緩存,然后通過共享內存的方式(也可以通過內部寄存器或者內核間中斷等方式)通知內核0“我準備就緒了。”一旦內核0發(fā)現其他內核準備就緒后,就從硬盤中讀取操作系統(tǒng)的鏡像文件,校驗正確后加載執(zhí)行。如果內核0發(fā)現其他內核啟動失敗,則重新發(fā)出Reset信號,要求其他內核重復初始化的過程。
    經過測試,整個系統(tǒng)的啟動時間約9 s。表1列舉了耗時超過0.1 s的模塊,其他模塊的耗時微乎其微,可以忽略不計。從啟動過程可以看出,所有的初始化任務基本上都由內核0承擔,總的啟動時間是各模塊初始化時間的總和。顯然,這種傳統(tǒng)的多核啟動方式沒有利用多內核的優(yōu)勢,還停留在單核啟動的框架中。
2 啟動過程的改進
    在多核系統(tǒng)中,為了高效地利用多個核的并行工作,啟動代碼的設計需要從傳統(tǒng)意義上的任務串行機制轉換到任務并行機制,并且要注重多內核間的協(xié)作。改進后的啟動方案不僅充分利用了多內核的優(yōu)勢,將一些模塊的初始化任務分配給了其他內核,而且優(yōu)化了一些模塊的初始化方法,建立了內核間有效的通信機制。
    如何將模塊分配給其他內核初始化,分配原則之一是獨立性。如果該模塊和其他模塊沒有相互依賴關系,則可以將該模塊分配給其他內核加載。原則之二是耗時的模塊盡量分配給不同的內核加載,即每個核承擔模塊的總耗時盡量平均,盡可能減少等待時間。據此優(yōu)化為圖3所示的啟動流程。

    啟動過程中,內核0仍然扮演主力隊員的角色,首先初始化e500、串口、一級緩存和二級緩存,然后只初始化一部分內存,而不是全部內存。這一部分內存姑且稱為基本內存,即啟動代碼所要用到的內存,本系統(tǒng)中是32 MB。因為內存的初始化比較費時,主要時耗不在內存控制器的初始化上,而在于將所有的4 GB內存清零,所以把內存劃分為一大一小兩部分初始化,將容量大的那部分內存分配給其他內核初始化,有利于提升整體的啟動速度。
    完成內核、串口1和基本內存的初始化之后,內核0先把啟動代碼從閃存復制到內存中,再釋放其他內核的Reset信號。其他內核立刻初始化e500內核和內嵌的一級緩存,然后通知內核0“我已經準備好了。”內核0得知其他內核準備就緒了,就開始分配其余的初始化任務。其他內核依次初始化剩余的大部分內存,下載FPGA的配置文件,初始化網口,最后等待操作系統(tǒng)。與此同時,內核0初始化PCIe設備、SAS/SATA控制器及磁盤,加載文件系統(tǒng),最后從磁盤中讀入操作系統(tǒng)文件,計算校驗和,引導操作系統(tǒng)的啟動。
    除了改進啟動流程之外,充分利用硬件特性,優(yōu)化一些模塊的初始化方法和工作機制,設計高效的內核間通信機制,也可以提升啟動速度。
    (1)內存初始化。內存初始化的主要耗時動作是清零。目前主流的處理器都集成了DMA(直接存儲器訪問)引擎,DMA引擎就是為了降低CPU負載而設計的。測試發(fā)現,與處理器直接清零內存操作比較,采用DMA方式,速度可以提升一倍。并且,在DMA引擎清零的同時,CPU還可以承擔其他工作,例如下載FPGA配置文件。此外,如果內存設置為交織模式,其吞吐量可以翻番,從而減少耗時,進一步提升啟動速度。
    (2)PCIe初始化。PCIe[3]總線在軟件上兼容PCI、PCI-x總線,PCI或者PCI-x器件可以通過PCIe橋設備連接到PCIe的總線拓撲中。PCIe總線的拓撲結構像一顆樹,最多允許擁有256條總線,每條總線上最多允許32個設備,每個設備上最多可集成8個功能模塊。一般采用深度遞歸算法,從根節(jié)點出發(fā),遍歷整棵樹,找到存在的有效設備并初始化。初始化的操作就是分配總線號、設備號、中斷號和地址空間等。其中,PCIe拓撲結構的遍歷過程是比較耗時的一個操作。
    實際上,對于電子產品而言,一旦電路板裝配好了,除了PCIe插槽上的設備未定之外,其他PCIe設備都固定了,是已知數,所以對于已知設備可以省略掃描這個步驟。它的相關信息可以存儲在閃存的指定區(qū)域,啟動代碼直接從這個區(qū)域讀取。如果電路板上沒有PCIe插槽,則整個PCIe拓撲結構的信息都可以保存在閃存中,徹底省略了遍歷過程,耗時微乎其微。對于插槽上的未定設備,深度遍歷的出發(fā)點可以從根節(jié)點出發(fā)改為從各個PCIe插槽出發(fā),大幅縮小遍歷范圍,從而節(jié)省了大量時間。
    (3)簡單高效的基于共享內存的內核間通信機制。內核之間為了緊密配合,相互間需要傳遞一些命令和數據,雖然有些處理器擁有特別的內核間的通信方式,例如博通公司XLR系統(tǒng)處理器的消息環(huán)機制[4](Message Ring),但是共享內存是一個比較通用的方法,不僅適合于內核之間,也適合于處理器之間以及處理器與外設之間的通信,可移植性較強。基于共享內存,設計一個簡單高效的通信機制,有助于內核0與其他內核之間命令的上行下達。
    因為啟動過程中內核0起主導作用,所以在內核0和其他每個內核之間都創(chuàng)建了一條通信通道,組成一個星形結構:內核0在中間,其他內核在四周,如圖4所示。每條通道由收、發(fā)2個隊列組成:內核0只能寫發(fā)送隊列,其他內核只能讀發(fā)送隊列;接收隊列的操作相反,內核0只能讀接收隊列,其他內核只能寫接收隊列。
    讀寫隊列的基本單位是數據塊,即每次從隊列中讀取一個或多個數據塊,或者往隊列中寫入一個或多個數據塊。數據塊由序列號、命令、數據長度、數據等域組成。發(fā)送隊列數據塊中的序列號是偶數,而接收隊列數據塊的序列號是奇數,每一個發(fā)送數據塊都對應一個響應的接收數據塊,它們的序列號相差1。發(fā)送隊列數據塊中的數據域是與命令相關的參數,接收隊列數據塊中的數據域是命令的執(zhí)行結果。

 

 

    借助這個收發(fā)隊列通信機制,內核0可以便捷地把初始化等任務分派給其他內核并得到反饋,有利于系統(tǒng)的可擴展性。例如系統(tǒng)中增加了一個新器件,內核0可以把新器件的初始化工作分配給一個比較空閑的內核,從而最大限度地減少對整個啟動時間的影響。
    經過啟動流程的改進、模塊加載和初始化方式的優(yōu)化、內核間高效通信機制的設計等工作,系統(tǒng)的啟動時間大約縮短了50%,達到了比較滿意的結果。目前多處理器的發(fā)展和應用如火如荼,希望本文所介紹的經驗對各種體系結構的多內核處理器的啟動代碼設計都有所幫助。
參考文獻
[1] FreeScale Semiconductor.MPC8572E PowerQUICC III  integrated processor hardware specifications,Rev.5[Z].2011.
[2] DENK W.The universal boot loader[EB/OL].[2013-07]. http://www.denx.de/wiki/DULG/WebHome.
[3] PCISIG.PCI Express base specification,revision 3.0[Z]. 2008.
[4] Broadcom Inc..XLR processor family data sheet,revision 2.00[Z].2008.

此內容為AET網站原創(chuàng),未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲一区免费看| 久久免费视频在线| 久久国产精品亚洲77777| 妖精成人www高清在线观看| 在线日本欧美| 国内精品久久久久久久果冻传媒 | 国产精品免费小视频| 欧美日韩国产成人在线| 欧美激情一区二区三区四区| 免费国产一区二区| 卡通动漫国产精品| 久久中文字幕一区二区三区| 欧美在线视频二区| 亚洲一卡久久| 亚洲图片欧洲图片av| 夜夜嗨av一区二区三区| 亚洲免费成人av| 一道本一区二区| 一区二区精品在线观看| 一区二区三区精品久久久| 亚洲乱码国产乱码精品精天堂 | 亚洲国产另类久久久精品极度| 欧美在线你懂的| 久久国产主播精品| 亚洲国产精品小视频| 亚洲激情啪啪| 亚洲日本久久| 一本综合久久| 午夜精品一区二区三区四区| 香蕉av777xxx色综合一区| 久久经典综合| 麻豆成人在线播放| 欧美日韩高清在线| 国产精品久久久久久福利一牛影视| 国产精品久久久久久久久免费 | 午夜精品一区二区三区电影天堂| 亚洲欧美成人一区二区在线电影| 亚洲女同在线| 欧美一区二区精品| 亚洲国产日韩美| 亚洲卡通欧美制服中文| 一区二区三区欧美视频| 亚洲欧美国产视频| 国产精品丝袜白浆摸在线| 亚洲福利久久| 欧美日韩一区二区三区高清| 久久精品成人一区二区三区| 欧美日韩一区二区三区在线看| 久久精品噜噜噜成人av农村| 韩国成人福利片在线播放| 中国女人久久久| 亚洲国产女人aaa毛片在线| 亚洲一区精彩视频| 国产精品一区二区视频| 亚洲精品国精品久久99热一| 欧美成va人片在线观看| 一区二区三区精品在线| 久久精品观看| 日韩午夜电影av| 亚洲私拍自拍| 亚洲国产裸拍裸体视频在线观看乱了 | 亚洲视频在线观看视频| 亚洲网站在线看| 韩国欧美一区| 美日韩精品免费观看视频| 亚洲福利视频网| 亚洲国产综合在线看不卡| 久久综合给合| 一本久道久久综合狠狠爱| 午夜日韩在线观看| 国产精品美女久久久久久2018| 免费91麻豆精品国产自产在线观看| 欧美日韩视频| 国内精品久久久久久久影视蜜臀 | 性娇小13――14欧美| 欧美a级片网| 国产麻豆日韩欧美久久| 亚洲激情欧美激情| 久久精品99久久香蕉国产色戒| 亚洲片在线观看| 亚洲欧美日本国产有色| 欧美jizz19性欧美| 国产日韩欧美中文| 夜夜爽www精品| 亚洲精品国精品久久99热一| 久久精品视频va| 国产精品观看| 亚洲精品国产精品乱码不99| 狂野欧美一区| 欧美伊久线香蕉线新在线| 久久国产精品99精品国产| 亚洲精品免费网站| 国产精品一区二区三区久久| 久久亚洲精选| 午夜精品视频在线观看| 亚洲精品一区二区三区不| 亚洲高清资源| 午夜日韩激情| 亚洲精品黄色| 欧美日韩和欧美的一区二区| 亚洲性色视频| 99国产精品久久| 欧美在线观看一区| 亚洲性夜色噜噜噜7777| 亚洲精品一区二| 最近中文字幕mv在线一区二区三区四区 | 亚洲性夜色噜噜噜7777| 欧美在线亚洲| 欧美一区二区三区在线看| 亚洲欧美欧美一区二区三区| 日韩亚洲欧美中文三级| 一区二区三区 在线观看视频 | 午夜日韩电影| 亚洲美女中文字幕| 久久精品国产欧美亚洲人人爽| 亚洲一区二区三区精品动漫| 欧美电影免费观看| 午夜精品亚洲| 久久精品国产免费观看| 久久av一区二区三区亚洲| 国产精品蜜臀在线观看| 中文国产成人精品| 亚洲私人影院| 欧美性猛交xxxx乱大交退制版| 亚洲精品免费在线观看| 日韩一区二区电影网| 国产精品女人网站| 日韩一本二本av| 亚洲少妇自拍| 国产精品久久77777| 国产精品99久久久久久白浆小说| 亚洲一区二区三区乱码aⅴ蜜桃女| 欧美日韩1区2区| 在线亚洲欧美| 欧美一区二区在线| 国产亚洲精品bt天堂精选| 香蕉精品999视频一区二区| 午夜在线精品偷拍| 国产午夜精品久久久久久久| 新狼窝色av性久久久久久| 久久偷窥视频| 一区在线电影| 亚洲精品国偷自产在线99热| 欧美人与性动交α欧美精品济南到| 日韩午夜在线观看视频| 亚洲一区二区日本| 国产精品丝袜白浆摸在线| 久久av资源网| 欧美激情久久久| 在线亚洲高清视频| 久久精品在线视频| 亚洲国产另类久久精品| 在线视频亚洲| 国产午夜精品久久久久久免费视| 亚洲高清自拍| 欧美日韩极品在线观看一区| 亚洲女ⅴideoshd黑人| 久久久久这里只有精品| 亚洲国产色一区| 亚洲欧美综合一区| 激情视频一区二区| 一区二区三区欧美在线观看| 国产精品视区| 欧美一区二区精品久久911| 欧美大片91| 亚洲男人天堂2024| 欧美成人性生活| 亚洲一区二区高清| 免费日韩视频| 亚洲午夜三级在线| 女仆av观看一区| 中文欧美字幕免费| 免费毛片一区二区三区久久久| 一区二区高清在线观看| 久久久噜噜噜久噜久久 | 亚洲欧洲另类| 在线视频免费在线观看一区二区| 国产精品素人视频| 亚洲一区二区三区视频| 国产乱码精品| 亚洲精品影视| 国产午夜精品久久久| 这里是久久伊人| 精品69视频一区二区三区| 亚洲性感美女99在线| 精品999日本| 新片速递亚洲合集欧美合集| 亚洲国产综合视频在线观看| 久久大逼视频| 在线亚洲自拍| 欧美激情在线狂野欧美精品| 午夜视频在线观看一区| 欧美日韩久久精品| 久久精品一区二区| 国产精品美女久久久久久免费| 亚洲精品影视在线观看| 黑丝一区二区三区| 午夜精品视频在线| 日韩午夜免费| 欧美激情精品久久久久久|