《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > CUDA和OpenGL互操作的實現及分析
CUDA和OpenGL互操作的實現及分析
來源:微型機與應用2011年第23期
劉進鋒,郭 雷
(西北工業大學 自動化學院,陜西 西安 710129)
摘要: CUDA和OpenGL互操作的基本方式是使用CUDA生成數據,再利用OpenGL在屏幕上繪制出數據所表示的圖形。兩者的結合可以通過使用OpenGL的PBO(像素緩沖區對象)或VBO(頂點緩沖區對象)兩種方式來實現。描述了CUDA和OpenGL互操作的步驟并展示了一個使用PBO的實例。該實例運行結果表明,互操作的方式比單純使用OpenGL方式快了7~8倍。
Abstract:
Key words :

摘  要: CUDAOpenGL互操作的基本方式是使用CUDA生成數據,再利用OpenGL在屏幕上繪制出數據所表示的圖形。兩者的結合可以通過使用OpenGL的PBO(像素緩沖區對象)或VBO(頂點緩沖區對象)兩種方式來實現。描述了CUDA和OpenGL互操作的步驟并展示了一個使用PBO的實例。該實例運行結果表明,互操作的方式比單純使用OpenGL方式快了7~8倍。
關鍵詞: CUDA;OpenGL;像素緩沖區對象;頂點緩沖區對象

1 CUDA與OpenGL概述
 OpenGL是圖形硬件的軟件接口,它是在SGI等多家世界著名的計算機公司的倡導下,以SGI的GL三維圖形庫為基礎制定的一個通用、共享的、開放式的、性能卓越的三維圖形標準。OpenGL在醫學成像、地理信息、石油勘探、氣候模擬以及娛樂動畫上有著廣泛應用,它已經成為高性能圖形和交互式視景處理的工業標準。
 OpenGL不是一種編程語言,而是一種API(應用程序編程接口)。程序員可以使用某種編程語言(如C或C++)編寫繪圖軟件,其中調用了一個或多個OpenGL庫函數。作為一種API,OpenGL遵循C語言的調用約定。OpenGL開發資料可參考文獻[1]和參考文獻[2]。
 圖形處理器(GPU)原本是處理計算機圖形的專用設備,近十年來,由于高清晰度復雜圖形實時處理的需求,GPU發展成為高并行度、多線程、多核的處理器。目前,主流GPU的運算能力已超過主流通用CPU,從發展趨勢上來看將來差距會越拉越大。為了合理地利用GPU 資源,CUDA(統一計算設備架構)應運而生。CUDA是一種由NVIDIA推出的通用并行計算架構[3],該架構使GPU能夠解決復雜的計算問題,并且由于CUDA編程語言基于標準的C語言,從而大大提高了可編程性。
CUDA和OpenGL互操作的基本方式是使用CUDA生成數據,然后使用OpenGL在屏幕上繪制出數據所表示的圖形。兩者的結合可以通過兩種方式來實現:
 (1)使用OpenGL的PBO(像素緩沖區對象)。在該方式下,CUDA直接生成像素數據,OpenGL顯示這些像素;
 (2)使用OpenGL的VBO(頂點緩沖區對象)。在該方式下,CUDA生成頂點網格數據,OpenGL可以根據需要繪制出平滑的表面圖或線框圖或一系列頂點。
這兩種方式的核心都是利用cudaGLMapBufferObject函數將OpenGL的緩沖區映射到CUDA的內存空間上,這樣,程序員就可以充分利用CUDA的優點寫出性能高的程序在該內存空間上生成數據,這些數據不需要傳送,OpenGL可以直接使用。如果不使用CUDA,這些數據需要由CPU來計算產生。一方面,CPU的計算速度通常比GPU慢;另一方面,這些數據需要傳送到GPU上以供OpenGL顯示使用。鑒于此,當數據量很大時,CUDA和OpenGL的混合使用效果明顯。
2 CUDA和OpenGL互操作的過程[4]
 CUDA和OpenGL互操作具體步驟如下:
 (1)創建窗口及OpenGL運行環境。
 (2)設置OpenGL視口和坐標系。要根據繪制的圖形是2D還是3D等具體情況設置。(1)和(2)是所有OpenGL程序必需的,這里也沒什么特殊之處,需要注意的是,后面的一些功能需要OpenGL 2.0及以上版本支持,所以在這里需要進行版本檢查。
 (3)創建CUDA環境。可以使用cuGLCtxCreate或cudaGLSetGLDevice來設置CUDA環境。該設置一定要放在其他CUDA的API調用之前。
 (4)產生一個或多個OpenGL緩沖區用以和CUDA共享。使用PBO和使用VBO差不多,只是有些函數調用參數不同。以下是具體過程。
 GLuint bufferID;
 glGenBuffers(1,&bufferID);//產生一個buffer ID
 glBindBuffer(parameter1,bufferID);
 //將其設置為當前非壓縮緩沖區,如果是PBO方式,parameter1設置為GL_PIXEL_UNPACK_BUFFER,如果
 是VBO方式,parameter1設置為GL_ARRAY_BUFFER
 glBufferData(parameter1,parameter2,NULL,GL_DYNAMIC _COPY);
 //給該緩沖區分配數據,PBO方式下,parameter1設置為GL_PIXEL_UNPACK_BUFFER,parameter1設置為圖像的長度*寬度*4。VBO方式下,parameter1設置為GL_ARRAY_BUFFER,parameter2設置為頂點數*16,因為每個頂點包含3個浮點坐標(x,y,z)和4個顏色字節(RGBA),這樣一個頂點包含16 B
 (5)用CUDA登記緩沖區。登記可以使用cuGLRegisterBufferObject或cudaGLRegisterBufferObject,該命令告訴OpenGL和CUDA 驅動程序該緩沖區為二者共同使用。
 (6)將OpenGL緩沖區映射到CUDA內存。可以使用cuGLMapBufferObject或cudaGLMapBufferObject,它實際是將CUDA內存的指針指向OpenGL的緩沖區,這樣如果只有一個GPU,就不需要數據傳遞。當映射完成后,OpenGL不能再使用該緩沖區。
 (7)使用CUDA往該映射的內存寫圖像數據。前面的準備工作在這里真正發揮作用了,此時可以調用CUDA的kernel,像使用全局內存一樣使用映射了的緩沖區,向其中寫數據。
 (8)取消OpenGL緩沖區映射。要等前面CUDA的活動完成以后,使用cuGLUnmapBufferObject或cudaGLUnmapBufferObject函數取消映射。
 (9)前面的步驟完成以后就可以真正開始繪圖了, OpenGL的PBO和VBO的繪圖方式不同,分別為以下兩個過程。
 ①如果只是繪制平面圖形,需要使用OpenGL的PBO及紋理。
 glEnable(GL_TEXTURE_2D); //使紋理可用
 glGenTextures(1,&textureID); //生成一個textureID
 glBindTexture(GL_TEXTURE_2D,textureID);
 //使該紋理成為當前可用紋理
 glTexImage2D(GL_TEXTURE_2D,0,GL_RGBA8,Width, Height,0,GL_BGRA,GL_UNSIGNED_BYTE,NULL);
 //分配紋理內存。最后的參數設置數據來源,這里設置為NULL,表示數據來自PBO,不是來自主機內存
 glTexParameteri(GL_TEXTURE_2D,GL_TEXTURE_MIN _FILTER,GL_LINEAR);
 glTexParameteri(GL_TEXTURE_2D,GL_TEXTURE_MAG_ FILTER,GL_LINEAR);//必須設置濾波模式,GL_LINEAR允許圖形伸縮時線性差值。如果不需要線性差值,可以用GL_TEXTURE_RECTANGLE_ARB代替GL_TEXTURE_2D以提高性能,同時在glTexParameteri()調用里使用GL_NEAREST替換GL_LINEAR
 然后就可以指定4個角的紋理坐標,繪制長方形了。
 ②繪制3D場景,需要使用VBO。
glEnableClientState(GL_VERTEX_ARRAY);
//使頂點和顏色數組可用
glEnableClientState(GL_COLOR_ARRAY);
glVertexPointer(3,GL_FLOAT,16,0);
//設置頂點和顏色指針
glColorPointer(4,GL_UNSIGNED_BYTE,16,12);
glDrawArrays(GL_POINTS,0,numVerticies);
//根據頂點數據繪圖,參數可以使用GL_LINES, GL_LINE_STRIP, GL_LINE_LOOP, GL_TRIANGLES,GL_TRIANGLE_STRIP, GL_TRIANGLE_FAN, GL_QUADS,GL_QUAD_STRIP,GL_POLYGON
(10)前后緩存區來回切換,實現動畫顯示效果。調用SwapBuffers(),緩沖區切換通常會在垂直刷新間隙來處理,因此,可以在控制面板上關掉垂直同步,使得緩沖區切換立刻進行。
3 CUDA和OpenGL互操作性能實例分析
3.1 測試實例

 


 這是一個相對簡單的實例,其主要功能是不斷地動態改變一個紋理圖案中每個像素的顏色并顯示。該實例使用了OpenGL的PBO并利用了OpenGL與CUDA互操作方式,紋理圖案數據的生成主要由CUDA的kernel函數完成,完整程序及CUDA的kernel函數請參看參考文獻[5]。
如果不使用CUDA,整個程序結構變化不大,主要差別是生成該紋理圖案的函數在CPU上運行,因而該函數及其調用方式要重寫,具體函數如下:
void kernel(uchar4*pos,unsigned int width,unsigned int height,float time)
{ unsigned int index,x,y;
  for(x=0;x<width;x++)
    for(y=0;y<height;y++)
    {   unsigned char r=(x+(int)time)&0xff;
    unsigned char g=(y+(int)time)&0xff;
    unsigned char b=((x+y)+(int)time)&0xff;
    index=x*width+y;
    pos[index].w=0;
    pos[index].x=r;
    pos[index].y=g;
    pos[index].z=b;
     }
}
    其中,參數pos表示像素數組,width為圖像寬度,height為圖像高度,time是每次調用該函數時固定遞增的一個值。
3.2 測試結果
 上述實例在兩種環境中做了實驗,CUDA版本都是3.2。測試環境1的主要配置如下:CPU為Intel Core i3-M380,主頻為2.53 GHz,GPU為 NVIDIA NVS 3100M,內存為2 GB。測試環境2的主要配置如下:CPU是Intel Core2 duo E7400,主頻為2.8 GHz,GPU使用GeForce 9800 GTX+,內存為2 GB。測試時,顯示設置的垂直同步要關閉。
 測試時設置紋理圖像的長和寬都是512,CUDA的線程塊為1 024,每個線程塊內的線程數為256,在OpenGL的顯示回調函數里統計f/s(刷新率),結果如表1所示。

 從實驗結果可以看出,CUDA與OpenGL結合的方式效果顯著,顯示速度比不使用CUDA提高了7~8倍。
CUDA是一種較新的方便使用GPU進行通用計算的架構,OpenGL是圖形處理的工業標準。兩者的互操作充分利用了GPU的特點,因而顯得非常自然和合理,實驗驗證了兩者配合使用的效果。該方式為高性能圖形圖像顯示及科學計算可視化提供了良好的模式架構。
參考文獻
[1] WRIGHT R S, LIPCHAK B, HAEMEL N. OpenGL superbible (Fourth Edition)[M]. Addison-Wesley, 2007.
[2] AHN S H. The OpenGL tutorials[OL]. [2011-09-01].http://songho.ca/opengl/.
[3] NVIDIA Corporation. NVIDIA CUDA  programming Guide Version 3.2[OL]. Mar. 2011,http://developer.nvidia.com/cuda.
[4] STAM J. What every CUDA programmer needs to know about OpenGL[OL]. [2011-09-01].http://nvidia.fullviewmedia.com/GPU2009/1001-valley-1055.html.
[5] FARBER R. CUDA, supercomputing for the masses: Part 15[OL]. [2011-09-01].http://www.drdobbs.com/architecture-and-design/222600097.

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
国产精品久久久久久久久久尿| 国产精品私拍pans大尺度在线 | 国产日韩精品视频一区| 欧美日韩一区二区三区在线看 | 国产一区二区三区在线观看免费视频 | 欧美连裤袜在线视频| 久久精品国产一区二区三| 午夜久久久久久| 亚洲女同在线| 亚洲欧洲av一区二区| 亚洲欧美精品suv| 亚洲综合欧美日韩| 亚洲欧美日韩在线播放| 亚洲欧美经典视频| 欧美一区二区在线看| 久久av红桃一区二区小说| 久久爱www| 久久精品在这里| 久久伊人免费视频| 欧美搞黄网站| 欧美日韩精品| 国产精品福利网站| 国产亚洲午夜| 亚洲福利av| 亚洲精品资源美女情侣酒店| 日韩亚洲欧美高清| 中文av一区二区| 亚洲欧美日韩国产一区二区| 亚洲神马久久| 午夜精品三级视频福利| 篠田优中文在线播放第一区| 欧美在线一二三四区| 亚洲欧洲另类| 一区二区三区四区五区精品视频| 亚洲免费婷婷| 久久精品国产精品亚洲精品| 免费亚洲电影| 欧美视频四区| 国产亚洲aⅴaaaaaa毛片| 雨宫琴音一区二区在线| 亚洲日本久久| 亚洲女人天堂成人av在线| 欧美在线观看视频| 亚洲精品人人| 午夜精品在线观看| 久久婷婷av| 欧美日本在线视频| 国产欧美一区二区三区在线老狼| 一区精品久久| 一本色道久久综合亚洲精品高清| 亚洲欧美日韩一区二区三区在线| 亚洲高清视频在线观看| 中国亚洲黄色| 久久婷婷综合激情| 欧美日韩一区二区在线播放| 国产农村妇女精品| 亚洲黄色在线看| 亚洲欧美欧美一区二区三区| 亚洲激情婷婷| 亚洲综合国产激情另类一区| 六月婷婷一区| 国产精品theporn| 国产真实乱偷精品视频免| 亚洲伦理在线观看| 欧美一区二区私人影院日本| 99精品视频免费观看视频| 午夜精品在线| 欧美精品一级| 国产一区二区中文| 一区二区三区国产在线观看| 亚洲电影免费观看高清完整版| 亚洲一本视频| 欧美大片在线影院| 国产美女一区二区| 日韩视频在线播放| 亚洲国产高清一区| 欧美一区二区日韩一区二区| 欧美激情aaaa| 狠狠久久五月精品中文字幕| 亚洲视频免费看| 日韩视频精品在线| 久久亚洲免费| 国产精品一区二区男女羞羞无遮挡| 亚洲欧洲一区二区天堂久久| 久久精品免费| 欧美综合国产| 国产精品美女久久久久aⅴ国产馆| 亚洲欧洲精品一区二区| 亚洲第一精品福利| 羞羞漫画18久久大片| 欧美日韩国产一区| 亚洲第一精品夜夜躁人人爽| 性色av一区二区三区| 亚洲欧美日韩在线高清直播| 欧美另类视频| 亚洲二区免费| 亚洲国产色一区| 久久一区二区视频| 国产一区二区精品| 午夜国产精品视频免费体验区| 亚洲一区二区欧美日韩| 欧美人与性动交a欧美精品| 亚洲电影天堂av| 久久精品女人的天堂av| 久久国产一二区| 国产美女扒开尿口久久久| 亚洲视频在线观看一区| 一区二区三区欧美日韩| 欧美精品一区视频| 亚洲国产精品久久| 亚洲国产精品成人| 久久视频国产精品免费视频在线| 国产亚洲综合性久久久影院| 午夜免费日韩视频| 久久激情视频| 国产亚洲一区二区三区在线播放| 午夜欧美精品| 久久国产欧美| 国产一区二区看久久| 欧美中文在线视频| 久久人人97超碰人人澡爱香蕉| 国自产拍偷拍福利精品免费一| 欧美在线一级视频| 久久人人看视频| 精品动漫3d一区二区三区| 亚洲国产91精品在线观看| 免费成人高清在线视频| 亚洲国产精品ⅴa在线观看| 亚洲人体1000| 欧美精品久久久久久久| 亚洲毛片av| 亚洲欧美三级伦理| 国产区日韩欧美| 亚洲电影在线播放| 欧美二区乱c少妇| 亚洲免费观看高清完整版在线观看熊| 一区二区三区四区精品| 国产精品v欧美精品v日韩精品 | 亚洲欧美国产精品专区久久| 国产精品裸体一区二区三区| 亚洲在线网站| 久久久99精品免费观看不卡| 伊人色综合久久天天五月婷| 亚洲毛片av在线| 欧美午夜一区二区福利视频| 亚洲欧美日韩精品久久奇米色影视| 久久精品综合| 亚洲欧洲一区二区三区久久| 亚洲深夜激情| 国产欧美日韩一区| 亚洲激情另类| 欧美午夜不卡在线观看免费| 亚洲男女自偷自拍图片另类| 久久久视频精品| 最近看过的日韩成人| 亚洲欧美激情诱惑| 国内精品久久久久久久影视麻豆| 亚洲激情一区二区| 国产精品国产成人国产三级| 欧美一二三区在线观看| 欧美大片第1页| 亚洲视频在线观看一区| 久久网站热最新地址| 亚洲精品一级| 欧美在线观看日本一区| 伊人久久大香线| 国产精品99久久不卡二区| 国产欧美一区二区三区沐欲| 亚洲精品视频在线| 国产乱肥老妇国产一区二 | 一区二区三区欧美激情| 国产精品一区一区| 亚洲三级影院| 国产免费一区二区三区香蕉精| 91久久精品国产91久久性色| 国产精品成人在线观看| 久久精品官网| 欧美色另类天堂2015| 亚洲国产日韩一区二区| 国产精品毛片大码女人| 亚洲黄页视频免费观看| 国产精品日韩欧美一区二区| 亚洲精品日韩在线| 国产欧美韩日| 亚洲色在线视频| 影音先锋久久精品| 香蕉视频成人在线观看| 亚洲品质自拍| 久久久久亚洲综合| 亚洲一区二区三区中文字幕| 欧美激情视频一区二区三区在线播放 | 亚洲视频1区| 国产亚洲成av人片在线观看桃| 亚洲人成在线观看| 国产视频亚洲精品| 亚洲欧美成人一区二区三区| 亚洲国产日日夜夜| 久久精品在线| 亚洲欧美日本国产专区一区| 欧美日韩天天操|