• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于GPU并行運算的高效雷達成像譜估計算法

      2014-05-25 00:34:37賈偉偉張啟梅許小劍
      制導(dǎo)與引信 2014年4期
      關(guān)鍵詞:譜估計線程內(nèi)存

      賈偉偉, 張啟梅, 許小劍

      (北京航空航天大學(xué),北京 100191)

      基于GPU并行運算的高效雷達成像譜估計算法

      賈偉偉, 張啟梅, 許小劍

      (北京航空航天大學(xué),北京 100191)

      Apes和Capon等譜估計算法在SAR成像方面有著廣泛的應(yīng)用。同基于快速傅里葉變換的成像算法相比,譜估計成像算法能夠獲得更窄的譜峰和更低的旁瓣,但是計算量龐大。本算法基于圖形處理器(Graphic Processing Unit,簡稱GPU)并行計算原理,在Jacket平臺上實現(xiàn)了以上兩種算法在雷達超分辨成像上的加速。在NVIDIA Tesla C2050和Intel (R)Xeon(R)CPU X5680上的測試表明,與傳統(tǒng)基于CPU的SAR成像算法相比,本算法能夠使計算速度得到數(shù)倍的提升。

      合成孔徑雷達;譜估計;超分辨;圖形處理器

      0 引言

      現(xiàn)代譜估計算法在合成孔徑雷達(SAR)成像中的應(yīng)用越來越廣泛[1]。非參數(shù)譜估計Apes和Capon算法是兩種經(jīng)典的譜估計算法[2,3],Capon算法只能用來估計信號中具有復(fù)正弦信號的譜線,而Apes算法可以同時用于估計復(fù)正弦信號的譜線、幅度和相位[3]。Apes及Capon算法在抑制旁瓣的同時進一步提高了圖像的分辨率,但其龐大的運算量消耗較長的時間。雖然已有學(xué)者提出快速Apes及快速Capon算法[4-6],大大縮短了計算時間,但仍存在很大的加速空間。

      近年來,GPU并行計算以其高性能、低價格受到科研人員的廣泛關(guān)注。GPU在處理能力和存儲器帶寬上相對于CPU有明顯優(yōu)勢,在成本上無需太大代價。CPU負責串行計算,處理邏輯性強的事務(wù);GPU則專注執(zhí)行高度線程化的并行任務(wù)。因此,GPU在執(zhí)行以浮點運算為主,高度并行化的計算任務(wù)時更具優(yōu)勢[7-9]。

      本文在Jacket平臺上,使用GPU并行運算實現(xiàn)了SAR超分辨成像的Apes及Capon算法的加速。

      1 Jacket平臺介紹

      2007年NVIDIA公司發(fā)布的計算統(tǒng)一設(shè)備架構(gòu)(Compute Unified Device Architecture,簡稱CUDA)是一種將GPU作為數(shù)據(jù)并行計算設(shè)備的軟硬件體系。CUDA C/C++,CUDA Fortran代碼效率高,但算法實現(xiàn)較復(fù)雜。基于CUDA的Jacket平臺,是專門用于MATLAB實現(xiàn)GPU加速的計算引擎,方便靈活、易于掌握。作為一個完全對用戶透明的系統(tǒng),Jacket平臺能夠自動地進行內(nèi)存轉(zhuǎn)移和計算優(yōu)化,使數(shù)據(jù)移植到GPU上進行運算。一旦GPU的數(shù)據(jù)結(jié)構(gòu)建立,該數(shù)據(jù)的任何操作只能在GPU上進行,要返回CPU端進行操作,必須先轉(zhuǎn)換回CPU類型。

      所有給定的CPU線程在某一時刻只能與一塊GPU通信,所以Jacket平臺要使用多個GPU,必須開啟多個CPU線程。每個CPU線程都可以調(diào)用GPU完成數(shù)據(jù)的并行計算,從而實現(xiàn)算法的多GPU加速。但通常內(nèi)核間通信以及內(nèi)存轉(zhuǎn)移帶來的延時,會導(dǎo)致加速效果變差[9]。

      2 Apes及Capon算法加速

      2.1 加速原理

      本文基于GPU對Apes、Capon算法及快速Apes、快速Capon算法進行改進[4-6],以實現(xiàn)計算的加速。以Apes算法為例,假設(shè)二維正弦采樣信號為

      式中:a為兩個維度上頻率為(ω1,ω2)時的信號幅度;en1,n2為零均值高斯白噪聲。令N1、N2分別為行向和列向的采樣點數(shù),n1=0,1,…,N1―1; n2=0,1,…,N2―1。H(ω1,ω2)是長度為M1× M2的二維濾波器沖擊響應(yīng),h(ω1,ω2)為由H(ω1, ω2)構(gòu)成的列矢量。

      其中:

      令二維頻率搜索矢量a(ω1,ω2)=a1(ω1)a2(ω2),其中為Kronecker乘積,且

      最后可以得到Apes算法二維譜的估計值為

      其中脈沖響應(yīng)為

      2.2 基于Jacket平臺的算法流程

      首先,運用gdouble函數(shù)將CPU數(shù)據(jù)類型轉(zhuǎn)換成GPU數(shù)據(jù)類型。Jacket的內(nèi)存管理系統(tǒng)將對GPU數(shù)據(jù)進行自動分配和管理,GPU數(shù)據(jù)調(diào)用的任何函數(shù)將自動執(zhí)行,實現(xiàn)動態(tài)編譯,無需額外編程。

      其次,進行程序優(yōu)化,調(diào)整數(shù)據(jù)的運算結(jié)構(gòu)。GPU內(nèi)核之間的數(shù)據(jù)通信以及內(nèi)存與顯存之間的數(shù)據(jù)傳輸將帶來延時,致使GPU整體加速效果減弱,甚至可能導(dǎo)致比GPU更長的運算時間。

      第三,多GPU運算時,Jacket需要使用開啟多個CPU線程,從而使每個CPU線程都可以調(diào)用GPU完成并行操作,實現(xiàn)多GPU加速計算。

      文中算法的耗時區(qū)間主要集中在自相關(guān)矩陣的計算及每一個頻率點的譜值估計運算。圖1為Apes算法的GPU并行運算程序流程圖。

      3 仿真結(jié)果及分析

      圖1 Apes算法加速程序流程圖

      實驗配置:Intel(R)Xeon(R)CPU X5680@ 3.33GHz處理器;64位Windows操作系統(tǒng);64位MATLAB2013a;Jacket v2.3;4片NVIDIA Tesla C2050。所有計算結(jié)果均為5次計算時間平均值。Jacket程序執(zhí)行時間中包含了數(shù)據(jù)在內(nèi)存與顯存之間的通信時間。

      在實驗中,選擇B52H飛機縮比模型的實測數(shù)據(jù)進行加速效果驗證。其中二維數(shù)據(jù)的頻率采樣點數(shù)N1=101,方位向采樣點數(shù)N2=41。通過采用單CPU、4CPU、單GPU、4GPU四種方式進行對比,獲得計算時間及加速比。首先設(shè)定二維濾波器的大小M1=31,M2=21,成像像素點數(shù)L1=150,L2=120。運行結(jié)果如表1所示。以單CPU的運行時間為參考基準,定義單GPU運行時間與其他三種方式運行時間的比值為加速比,對比驗證其余三種運算方法的加速性能。

      表1 各計算方法的運行時間及加速比

      對比超分辨算法加速前后消耗的時間,可以發(fā)現(xiàn)GPU并行計算使程序運行時間大大減少。例如Apes算法使用單CPU計算的總時間為361.61 s,而經(jīng)過4 GPU加速后時間縮短為61.30 s。

      實驗表明,將GPU并行計算應(yīng)用于SAR超分辨成像中,獲得了良好的加速效果。Apes算法使用4GPU獲得5.89倍的加速;Capon算法使用單GPU獲得3.74倍的加速;高效Apes算法使用單GPU獲得14.60倍的加速;高效Capon算法使用單GPU獲得6.82倍的加速。因為四種算法的運算量不同,內(nèi)存與顯存之間的通信在整個流程中的比重也不同,所以單GPU和4 GPU對四種算法的加速性能略有差異。而4 CPU沒有達到加速效果,主要原因是CPU之間的數(shù)據(jù)分配及傳輸時間占較大比重,CPU多核加速的優(yōu)勢沒有得到發(fā)揮。

      表2給出了不同像素點數(shù)時Capon算法的耗時及加速比,其中二維濾波器的大小仍為M1= 31,M2=21。隨著運算量的增大,運算加速比基本保持穩(wěn)定。

      表2 Capon算法在不同數(shù)據(jù)大小下的耗時及加速比

      內(nèi)核之間的通信以及內(nèi)存轉(zhuǎn)移會帶來延時,甚至會造成GPU計算比CPU計算耗時更長。同時,GPU計算的高度并行性,要求數(shù)據(jù)之間相互獨立。此外,在使用多GPU時,內(nèi)存分配也會消耗時間。只有數(shù)據(jù)的結(jié)構(gòu)及運算的具體要求滿足并行條件,方可采用GPU并行運算。

      4 結(jié)論

      本文在Jacket平臺下針對SAR超分辨成像算法(Apes及Capon算法)的加速問題進行了深入研究,詳細闡述了一種基于GPU并行運算的SAR成像算法實現(xiàn)方案。文中針對成像算法的結(jié)構(gòu)特性以及Jacket平臺的運算特點,合理設(shè)計內(nèi)存分配、數(shù)據(jù)傳輸及并行化執(zhí)行流程,實現(xiàn)了Apes和Capon算法在GPU上的高效運行。在NVIDIA Tesla C2050上的測試結(jié)果表明,與傳統(tǒng)基于CPU的方法相比,基于GPU并行運算的SAR成像算法運算速度大大提升。

      [1]Cumming I.G.,Wing F.H..Digital Processing of Synthetic Aperture Radar Data:Algorithms and Implementation[M].Artech House,2004:140-141.

      [2]Li J.,Stoica P..An Adaptive Filtering Approach to Spectral Estimation and SAR Imaging[J]. IEEE Transactions on Signal Processing,1996,44 (6):1469-1484.

      [3]趙曉暉.譜估計與自適應(yīng)信號處理教程[M].北京:電子工業(yè)出版社,2013:107-113.

      [4]Liu Zheng-she,Li Hong-bin,Jian Li.Efficient Implementation of Capon and APES for Spectral Estimation[J].IEEE Transactions on Aerospace and Electronic Systems,1998,34(4):1314-1319.

      [5]Glentis G.O..Efficient Algorithms for Adaptive Capon and APES Spectral Estimation[J].IEEE Transactions on Signal Processing,2010,58(1): 84-96.

      [6]Angelopoulos K.,Glentis G.O.,Jakobsson A.. Computationally Efficient Capon-and APES-Based Coherence Spectrum Estimation[J].IEEE Transactions on Signal Processing,2012,60(12):6674-6681.

      [7]張舒,褚艷利.GPU高性能運算之CUDA[M].北京:中國水利水電出版社,2009:15-20.

      [8]孟大地,胡玉新,石濤,等.基于NVIDIA GPU的機載SAR實時成像處理算法CUDA設(shè)計與實現(xiàn)[J].雷達學(xué)報,2013,2(4):481-491.

      [9]Cook S..CUDA Programming-A Developer's Guide to Parallel Computing with GPUs[M]. Morgan Kaufmann Publishers,2012.

      [10]任璐.關(guān)于提高SAR圖像質(zhì)量的研究[D].西安:西安電子科技大學(xué),2005.

      Spectral Estimation Acceleration for SAR Imaging Based on the GPU Parallel Computing

      JIA Wei-wei, ZH ANG Qi-mei, XU Xiao-jian
      (Beihang University,Beijing 100091,China)

      Spectral estimation algorithms such as Apes and Capon have been widely used in SAR imaging,which can obtain complex spectral estimation with more narrow spectral peaks and lower sidelobes compared with FFT methods.The major disadvantage is the huge amount of computing which takes too long time.Based on the principle of GPU parallel computing,this paper proposes a technique to achieve the acceleration of the above two algorithms of radar imaging on the platform of Jacket.Tests on NVIDIA Tesla C2050 and Intel (R)Xeon(R)CPU X5680 showed that the GPU-based program can reach several times speed than the traditional algorithms of SAR imaging.

      synthetic aperture radar;spectral estimation;super resolution;graphic processing unit(GPU)

      TN011

      A

      1671-0576(2014)04-0037-04

      2014-08-25

      賈偉偉(1989―),女,碩士在讀;張啟梅(1988―),女,博士,均從事信號與信息處理技術(shù)研究;許小劍(1963―),男,博士,教授,主要從事智能化信息處理、遙感特征分析與建模、雷達目標識別等研究。

      猜你喜歡
      譜估計線程內(nèi)存
      “春夏秋冬”的內(nèi)存
      當代陜西(2019年13期)2019-08-20 03:54:22
      基于MATLAB實現(xiàn)的AR模型功率譜估計
      淺談linux多線程協(xié)作
      經(jīng)典功率譜估計方法的研究
      Welch譜估計的隨機誤差與置信度
      基于內(nèi)存的地理信息訪問技術(shù)
      Linux線程實現(xiàn)技術(shù)研究
      脈沖噪聲環(huán)境下的改進MUSIC譜估計方法
      么移動中間件線程池并發(fā)機制優(yōu)化改進
      上網(wǎng)本為什么只有1GB?
      镇安县| 贵阳市| 凯里市| 定兴县| 北流市| 兰坪| 宁安市| 深圳市| 祁连县| 上饶市| 广德县| 武强县| 阜新| 繁峙县| 清镇市| 彰武县| 金堂县| 瑞昌市| 静安区| 新闻| 隆德县| 铁岭县| 奉贤区| 博兴县| 沾化县| 久治县| 阿荣旗| 兴安县| 鄂伦春自治旗| 遵化市| 美姑县| 台东县| 龙游县| 仙居县| 江川县| 双桥区| 延寿县| 涪陵区| 永善县| 榆林市| 宜兴市|