《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業界動態 > 在DSP處理器上并行實現ATR算法

在DSP處理器上并行實現ATR算法

2008-08-29
作者:馬君國 王遠模 常華俊 付 強

  摘? 要: 介紹了由DSP芯片構成的多處理器" title="多處理器">多處理器并行系統的結構和性能以及在多處理器并行系統上并行實現ATR算法需要考慮的主要問題,著重研究了在指令級并行DSP處理器上實現ATR算法的并行化軟件開發方法,對ATR算法的實用化和工程化具有重要的參考價值。

  關鍵詞: DSP? 自動目標識別(ATR)? 并行算法" title="并行算法">并行算法? 處理器? 軟件設計

?

  自動目標識別(ATR)算法通常包括自動地對目標進行檢測、跟蹤、識別和選擇攻擊點等算法。戰場環境的復雜性和目標類型的不斷增長使ATR算法的運算量越來越大,因此ATR算法對微處理器的處理能力提出了更高的要求。由于通用數字信號處理芯片能夠通過編程實現各種復雜的運算,處理精度高,具有較大的靈活性,而且尺寸小、功耗低、速度快,所以一般選擇DSP芯片作為微處理器來實現ATR算法的工程化和實用化。

  為了保證在DSP處理器上實時地實現ATR算法,通常采用算法并行化技術。算法并行化處理的三要素是:①并行體系結構;②并行軟件系統;③并行算法。并行體系結構是算法并行化的硬件基礎,并行算法都是針對特定的并行體系結構開發的并行程序。根據DSP處理器的數目,ATR算法的并行實現可以分為處理器間并行和處理器內并行。處理器間并行是指多個DSP處理器以某種方式連接起來的多處理器并行系統,ATR算法在多個處理器上并行執行。根據處理器使用存儲器的情況,多處理器并行系統又可分為共享存儲器多處理器并行系統和分布式多處理器并行系統。處理器內并行是指在單個DSP處理器內通過多個功能單元的指令級并行(ILP)來實現ATR算法的并行化。本文分別對在共享存儲器多處理器并行系統、分布式多處理器并行系統和指令級并行DSP處理器上并行實現ATR算法進行了探討。

1 在共享存儲器多處理器并行系統上實現ATR算法

  在共享存儲器多處理器并行系統中,各個處理器通過共享總線對所有的存儲器進行操作,實現各個處理器之間的數據通信。而在任一時刻,只允許一個處理器對共享總線進行操作。所以處理器對存儲器進行讀/寫操作時就必須先獲得對共享總線的控制權,這通過總線仲裁電路實現。然而,由于所有的處理器只能通過一條共享總線對存儲器進行訪問,這在處理器數目比較多或者處理器之間頻繁交換數據的情況下容易引起總線沖突和等待而降低整個并行系統的運行速度。共享存儲器多處理器并行系統的優點是結構簡單,當處理器的數目較少時,可以達到較高的加速比。參考文獻?眼2?演由6片ADSP2106x芯片構成了共享存儲器多處理器并行系統,并用該系統并行實現了移位傅立葉變換算法。

  ADSP2106x處理器支持最為常用的共享存儲器多處理器并行系統,組成多處理器系統的每一片ADSP2106x的片內存儲器統一編址,任一ADSP2106x可以訪問其它任何一片ADSP2106x的片內存儲器。由于片內SRAM為雙口存儲器,因而這種訪問并不中斷被訪問處理器的正常工作。每個處理器的片內SRAM既是該處理器的局部存儲器,又是共享存儲器的一部分。在不增加輔助電路的情況下,通過外部總線接口直接相連的處理器數量最多為6個。由于每個處理器的工作程序放在其片內的雙口SRAM中,因此各個處理器可以實現并行處理,這是ADSP2106x的存儲器結構所決定的。

  ATR算法在共享存儲器多處理器并行系統中實現時,在編寫并行算法程序方面應當重點考慮的問題包括:

  (1)均衡地把任務分配給各個處理器

  ATR算法在共享存儲器多處理器并行系統中實現任務級并行,因此必須把ATR算法劃分為計算量均衡的多個任務,把各個任務分配給多個處理器,才能發揮多處理器并行系統的最大并行效率。

  (2)盡量減少多處理器之間數據通信

  由于多處理器只能通過一條共享總線對存儲器進行訪問,這在多處理器之間頻繁交換數據的情況下容易引起總線競爭而降低整個并行系統的運行速度。

  (3)利用單個處理器的并行編程特性

充分應用單個處理器的并行編程特性,有利于縮短各個處理器上任務的運行時間。例如,ADSP2106x的32位浮點運算單元包含一個乘法器、一個加法器和移位邏輯電路,它們并行工作;比特倒轉尋址在傅立葉變換運算時非常有用;循環尋址在作卷積、數字濾波運算時經常用到等。

2 在分布式多處理器并行系統上實現ATR算法

  在分布式多處理器并行系統中,多處理器有各自獨立的存儲器,多個處理器通過通信口相連構成分布式多處理器并行系統。分布式多處理器并行系統的加速比和處理器的數目呈線性關系,所以只要增加處理器的數目,分布式多處理器并行系統的處理能力就能夠成比例地增加。分布式多處理器比較適合于構成大規模并行系統。

  目前,計算量過大仍然是制約許多有效的ATR算法實時實現的一個主要因素。ATR算法在分布式多處理器并行系統上實時實現是一個很有潛力的研究領域,特別在地基和天基雷達信號處理系統中有廣闊的應用前景。分布式多處理器并行系統的連接方式有線形、樹形、星形、網孔和超立方體結構等?眼3?演。樹形和星形網絡的優點是網絡管理容易、數據通信時尋徑簡單;缺點是樹形網絡的根節點處理器和星形網絡的中央節點處理器的輸入/輸出吞吐量大,易造成通信瓶頸。所以樹形和星形網絡不適合ATR算法各個任務數據通信量較大的應用場合。

  在分布式多處理器并行系統中并行實現ATR算法目前還處于研究的初級階段,在編寫并行算法程序應當重點考慮兩個方面:

  (1)各處理器任務的均衡分配

  在分布式多處理器并行系統中處理器的數目通常較多,只有合理地對眾多的處理器均衡地分配任務,才能最大地發揮并行系統的總體性能,提高并行系統的加速比。

  (2)處理器節點間的高效通信

  在分布式多處理器并行系統中數據通信都是點對點通信,即兩個相鄰的處理器之間通過通信口通信。因此需要合理安排各個處理器節點在網絡結構中的位置,盡可能地縮短處理器節點間的通信路徑長度,從而實現處理器節點間的高效數據通信。

3 在指令級并行DSP處理器上實現ATR算法

  在單片DSP處理器內通過多個功能單元的指令級并行(ILP)實現ATR算法的并行化處理,目前適合ATR算法實時處理的指令級并行芯片是TI公司的TMS320C6x系列DSP。TMS320C6x系列DSP處理器是第一個使用超長指令字(VLIW)體系結構的數字信號處理芯片。下面以TMS320C62x定點系列DSP為例說明指令級并行的原理和ATR并行算法軟件開發方法。

3.1 VLIW體系結構

  TMS320C62x的內核結構如圖1所示。內核中的8個功能單元可以完全并行運行,功能單元執行邏輯、位移、乘法、加法和數據尋址等操作。內核采用VLIW體系結構,單指令字長為32位,取指令、指令分配和指令譯碼單元每周期可以從程序存儲器傳遞8條指令到功能單元。這8條指令組成一個指令包,總字長為256位。芯片內部設置了專門的指令分配模塊,可以將每個256位的指令分配到8個功能單元中,并由8個功能單元并行運行。TMS320C62x芯片的最高時鐘頻率可以達到200MHz。當8個功能單元同時運行時,該芯片的處理能力高達1600MIPS。

?

?

3.2 基于TMS320C62x的并行算法軟件開發方法

  基于TMS320C62x的并行編譯系統支持C語言和匯編語言開發并行程序代碼。通常,開發ATR并行算法按照代碼開發流程的三個階段進行并行程序設計:第一階段是開發C代碼;第二階段是優化C代碼;第三階段是編寫線性匯編代碼" title="匯編代碼">匯編代碼。以上三個階段不是必須的,如果在某一階段已經實現了ATR算法的功能和性能要求,就不必進入下一階段。

  (1)開發C代碼

  開發C代碼需要考慮的要點包括:

  ①數據結構

  TMS320C62x編譯器定義了各種數據結構的長度:字符型(char)為8位,短整型" title="整型">整型(short)為16位,整型(int)為32位,長整型(long)為40位,浮點型(float)為32位,雙精度浮點型(double)為64位。在編寫C代碼時應當遵循的規則是:避免在代碼中將int和long型作為同樣長度處理;對于定點乘法,應當盡可能使用short型數據;對循環計數器使用int或者無符號int類型,避免不必要的符號擴展。

  ②提高C代碼性能

  應用調試器的Profile工具可以得到一個關于C代碼中各特定代碼段執行情況的統計表,也可以得到特定代碼段執行所用的CPU時鐘周期數。因此可以找出影響軟件程序總體性能的C代碼段加以改進,通常是循環代碼段影響軟件程序總體性能。

  ③數據的定標

  由于TMS320C62x是定點系列芯片,不支持浮點操作。在程序編寫過程中,應當盡量采用定點的數據結構。而實際處理的數據通常都是浮點的,所以需要把浮點數據通過定標轉化為整型數據處理,提高程序的處理速度。數據的定標是十分關鍵的步驟,既要使數據處理精度滿足性能要求,又要防止在數據處理過程中出現溢出。

  (2)優化C代碼

  優化C代碼包括向編譯器指明不相關的指令、循環展開、循環合并、使用內聯函數" title="內聯函數">內聯函數、使用字訪問短整型數據和軟件流水等方法。

  ①向編譯器指明不相關的指令

  為使指令并行操作,編譯器必須確定指令間的相關性,只有不相關的指令才可以并行執行。如果編譯器不能確定兩條指令是不相關的,則認為是相關的,安排它們串行執行。用戶可以通過如下方法指明相關的指令:

  ·關鍵字const可以指定一個目標,const表示一個變量或者一個變量的存儲單元保持不變,使用const可以提高代碼的性能和適應性。

  ·一起使用-pm選項和-o3選項可以確定程序優先級。在程序優先級中,所有源文件都被編譯成一個模塊,從而使編譯器更有效地消除相關性。

  ·使用-mt選項向編譯器說明在代碼中不存在存儲器相關性,即允許編譯器在無存儲器相關性的假設下進行優化。

????②循環展開

  循環展開就是把循環計數小的循環展開,成為非循環形式的串行程序,或者把循環計數大的循環部分展開,減少循環迭代次數,增加單個循環內的代碼,使得循環內的操作可以均勻分布在各個功能單元上,保持DSP處理器的各個功能單元滿負荷運行。

  ③循環合并

  如果兩個循環計數差不多、循環執行互不相同的操作,可以把它們合并在一起組成一個循環。當兩個循環的負荷都不滿時,這是非常有用的。

  ④使用內聯函數

  TMS320C62x編譯器提供的內聯函數是直接映射為內聯指令的特殊函數,內聯函數的代碼高效、代碼長度短。用戶可以使用內聯函數并行優化C代碼。

  ⑤使用字訪問短整型數據

  內聯函數中有些指令是對存儲在32位寄存器的高16位和低16位字段進行操作的。當有大量短整型數據進行操作時,可以使用字(整型數)一次訪問兩個短整型數據。然后使用內聯函數對這些數據進行操作,從而減少對內存的訪問。

  ⑥軟件流水

  軟件流水是用來安排循環指令,使這個循環多次迭代并行執行的一種技術。在編譯時使用-o2和-o3選項,編譯器可對循環代碼實現軟件流水;使用-o3和-pm選項,使優化器訪問整個程序,了解循環次數;使用_nassert內聯函數,防止冗余循環產生;使用投機執行(_mh選項)消除軟件流水循環的排空,從而減少代碼尺寸。

  在嵌套循環中,編譯器僅對最里面的循環執行軟件流水,因此對執行周期很少的內循環作循環展開,外循環進行軟件流水,這樣可以改進C代碼并行執行的性能。使用軟件流水還應當注意:盡管軟件流水循環可以包含內聯函數,但是不能包含函數調用;在循環中不可以有條件終止指令;在循環體中不可以修改循環控制變量。

  (3)編寫線性匯編代碼

  編寫線性匯編代碼是并行算法軟件開發流程的第三個階段。為了提高并行算法軟件代碼的性能,對影響并行程序速度的關鍵C代碼可以用線性匯編重新編寫。編寫線性匯編代碼不需要指明使用的寄存器、指令的并行與否、指令的延遲周期和指令使用的功能單元,匯編優化器會根據情況確定這些信息。優化線性匯編代碼的方法包括:為線性匯編指令指定功能單元,使得最后的匯編指令并行執行;使用字訪問短整型數據;使用軟件流水對循環進行優化。編寫線性匯編代碼的工作量非常大,需要很長的開發周期,而且開發后的匯編代碼不能像C代碼那樣移植在其它的DSP平臺上。

  應用上述并行程序開發方法,在TMS320C6201 EVM板上實現了寬帶毫米波雷達目標時延神經網絡識別算法。經過實際測試,并行算法程序執行時間為0.850ms,滿足了目標識別算法的實時性需求。參考文獻?眼4?演應用TMS320C6701并行實現了數字脈沖壓縮算法。

?

參考文獻

1 張 量,馬 莉.波信息處理中的DSP技術.微處理機,2000;(1)

2 潘海明,劉永坦,趙淑清,于恒富. ADSP2106x在高速并行信號處理系統中的應用.電子器件,1999;(4)

3 廖曉群,藺麗華. DSP并行系統設計中的幾個關鍵問題.西安科技學院學報,2001;(3)

4 李淑萍. 基于TMS320C6701的數字脈沖壓縮器的設計.艦船電子對抗,2002;(1)

5 李小紅.TMS320C62x DSP的軟件開發與優化編程.計算機工程,2002;(1)

6 章立生,韓承德.VLIW DSP體系結構及其性能優化的軟件方法. 計算機工程與應用,2001;(5)

7 TI公司. TMS320C62x用戶手冊

8 AD公司. ADSP2106x用戶手冊
本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
国产亚洲视频在线| 亚洲欧洲精品天堂一级| 久色成人在线| 欧美在线一级va免费观看| 亚洲欧洲99久久| 亚洲欧美视频在线| 亚洲欧美日韩综合aⅴ视频| 亚洲午夜精品久久| 一本色道久久综合精品竹菊 | 国产精品一区二区三区四区| 欧美亚州在线观看| 国产精品成人在线| 国产精品国产亚洲精品看不卡15| 欧美日韩精品一二三区| 欧美日韩精品一区二区在线播放| 欧美日韩精品二区| 国产精品成人一区| 国产精品性做久久久久久| 国产目拍亚洲精品99久久精品 | 亚洲激情一区二区| 亚洲美女啪啪| 99av国产精品欲麻豆| 日韩视频在线观看免费| 亚洲免费精品| 亚洲午夜电影网| 亚洲综合好骚| 欧美一区成人| 亚洲欧洲精品一区| 一本高清dvd不卡在线观看| 在线视频你懂得一区| 亚洲综合色在线| 久久激情久久| 欧美成人xxx| 欧美日韩三级一区二区| 国产精品美女主播| 国产情侣一区| 在线观看中文字幕不卡| 亚洲精品黄网在线观看| 中文网丁香综合网| 午夜精品www| 亚洲精品1区2区| 亚洲特级毛片| 久久久999国产| 欧美激情bt| 国产精品一级在线| 在线成人激情| 一本色道久久88精品综合| 亚洲在线不卡| 最新国产成人在线观看| 亚洲性色视频| 久久久综合精品| 欧美日韩国产高清| 国产欧美日韩在线播放| 亚洲国产精品嫩草影院| 亚洲小说欧美另类社区| 亚洲国产精品www| 在线亚洲免费视频| 久久久久久91香蕉国产| 欧美激情综合五月色丁香| 国产精品日日做人人爱| 在线观看国产成人av片| 亚洲视频精选| 亚洲国产成人久久综合| 亚洲一区二区三区久久| 久久午夜视频| 欧美性生交xxxxx久久久| 国内精品久久国产| 一本色道久久综合亚洲精品不卡| 亚洲女ⅴideoshd黑人| 亚洲片区在线| 欧美在线|欧美| 欧美日韩美女| 一区二区在线视频| 亚洲一级二级在线| 亚洲精品自在久久| 欧美影院一区| 亚洲免费高清| 久久精品国语| 欧美亚洲免费高清在线观看| 欧美成人一区二区三区在线观看| 国产精品视频免费一区| 亚洲国产综合91精品麻豆| 小黄鸭精品aⅴ导航网站入口| 日韩一级欧洲| 美女久久网站| 国产欧美精品一区aⅴ影院| 亚洲精品偷拍| 亚洲国产中文字幕在线观看| 午夜伦欧美伦电影理论片| 欧美精品在线一区| 影院欧美亚洲| 久久国产99| 久久riav二区三区| 国产精品久久77777| 亚洲精品久久久一区二区三区| 久久激情网站| 久久精品免费观看| 国产精品夜夜夜| 一区二区高清视频在线观看| 亚洲免费av观看| 欧美1区3d| 欲香欲色天天天综合和网| 小黄鸭精品密入口导航| 亚洲欧美国产高清| 欧美性猛交xxxx乱大交蜜桃| 亚洲美女性视频| 亚洲激情另类| 美国十次成人| 亚洲福利在线观看| 亚洲国产三级| 牛夜精品久久久久久久99黑人| 一区二区三区在线视频观看| 欧美主播一区二区三区| 久久久精品动漫| 国产一区二区无遮挡| 欧美在线播放视频| 久久久久久久综合狠狠综合| 国产亚洲福利社区一区| 亚洲欧美影音先锋| 久久久久国产精品厨房| 国产综合网站| 亚洲激情成人网| 麻豆精品视频在线| 亚洲国产高清一区| 99热在这里有精品免费| 欧美日精品一区视频| 国产精品99久久久久久久久久久久| 亚洲午夜在线视频| 国产精品久久久久久av下载红粉| 亚洲视频视频在线| 欧美在线亚洲| 国产一区二区三区无遮挡| 久久精品观看| 欧美阿v一级看视频| 亚洲精品久久久蜜桃| 亚洲五月婷婷| 国产精品一区免费视频| 久久精品国产综合| 免费91麻豆精品国产自产在线观看| 在线成人激情黄色| 一本一本久久a久久精品综合妖精| 欧美日韩中文字幕精品| 亚洲欧美另类中文字幕| 久久se精品一区精品二区| 国外成人在线| 亚洲精品在线免费观看视频| 欧美日韩国产首页| 亚洲一区亚洲| 久久裸体艺术| 亚洲精品乱码久久久久久蜜桃麻豆 | 久久av一区二区三区漫画| 久久久久久69| 亚洲国产美女精品久久久久∴| 久久精品首页| 欧美精品一区三区| 亚洲一级黄色av| 久久深夜福利免费观看| 亚洲国产精品久久91精品| 一区二区三区四区在线| 国产精品区二区三区日本| 欧美影院在线| 欧美国产1区2区| 中文av一区特黄| 久久久噜噜噜久久狠狠50岁| 亚洲欧洲日本国产| 午夜精品一区二区三区在线播放 | 韩曰欧美视频免费观看| 亚洲麻豆视频| 国产美女一区二区| 亚洲精品乱码久久久久久| 国产精品r级在线| 久久精品色图| 欧美性事在线| 亚洲激情啪啪| 国产精品日韩精品欧美精品| 亚洲国产mv| 国产精品毛片va一区二区三区| 久久精品夜色噜噜亚洲aⅴ| 欧美午夜视频一区二区| 亚洲激情成人网| 国产精品一页| 9久草视频在线视频精品| 国产欧美精品va在线观看| 日韩视频专区| 国产一在线精品一区在线观看| 一本大道久久a久久精二百| 国产一区二区看久久| 在线一区日本视频| 伊人成年综合电影网| 午夜精品免费在线| 亚洲精品一区二区三区av| 久久青草久久| 亚洲一区二区三区视频| 欧美精品一区二| 久久精品一区二区三区不卡| 国产精品免费小视频| 日韩一区二区精品葵司在线| 一区二区三区在线看| 欧美影视一区| 中国av一区|