• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      利用GPU實(shí)現(xiàn)SAR圖像的并行處理

      2011-09-30 01:37:50張曉東孔祥輝張歡陽
      火控雷達(dá)技術(shù) 2011年4期
      關(guān)鍵詞:方位校正處理器

      張曉東 孔祥輝 張歡陽

      (西安電子工程研究所 西安 710100)

      1 引言

      合成孔徑雷達(dá)因具有全天候、全天時(shí)、遠(yuǎn)距離成像等特點(diǎn),可以大大提高雷達(dá)的捕獲信息能力,因而成為雷達(dá)技術(shù)的熱門研究領(lǐng)域,在戰(zhàn)場(chǎng)感知和災(zāi)情監(jiān)測(cè)等方面有著不可替代的作用[1]。隨著SAR成像技術(shù)的發(fā)展,對(duì)回波數(shù)據(jù)實(shí)現(xiàn)實(shí)時(shí)處理的要求也越來越迫切。這就意味著信號(hào)處理器能夠滿足SAR信號(hào)處理過程中大運(yùn)算量的快速運(yùn)算等處理能力的要求,由于SAR成像算法本身的復(fù)雜度和雷達(dá)數(shù)據(jù)的高速率,實(shí)時(shí)處理面對(duì)很大的挑戰(zhàn)性,使用單處理器或處理芯片幾乎難以實(shí)現(xiàn),為了在不影響成像精度的前提下獲得更好的實(shí)時(shí)性,并行處理成為解決這一問題的關(guān)鍵技術(shù)。

      2 GPU 技術(shù)簡(jiǎn)介[2]

      受到游戲市場(chǎng)和軍事實(shí)景仿真的要求,圖形處理器(Graphics Processing Unit)性能提高速度很快,大大超過了摩爾定律,支持越來越復(fù)雜的運(yùn)算,其編程性和功能都大大擴(kuò)展了。GPU通用計(jì)算性能的提高為高效SAR成像算法提供了具有發(fā)展前景的新型運(yùn)算平臺(tái)。GPU在處理能力和存儲(chǔ)帶寬上相對(duì)CPU有明顯的優(yōu)勢(shì),在成本和功耗上也不需要付出太大代價(jià),從而為SAR實(shí)時(shí)成像提供了新的解決方案。

      當(dāng)前的NIVIDA GPU中有1~60個(gè)包含完整前端的流多處理器(SM),每個(gè)流多處理器可以看作一個(gè)包含8個(gè)1D流處理器的SIMD處理器。顯卡就是利用多個(gè)流多處理器間的粗粒度任務(wù)級(jí)或數(shù)據(jù)級(jí)并行,以及流多處理器內(nèi)的細(xì)粒度數(shù)據(jù)并行。盡管GPU的運(yùn)行頻率比一般的CPU低,但是更多的執(zhí)行單元數(shù)量還是使GPU能夠在浮點(diǎn)處理能力上獲得優(yōu)勢(shì)。DUDA(Compute Unified Device Architecture)是NIVIDA公司推出的一種不需借助圖形學(xué)API就可以使用類C語言進(jìn)行通用計(jì)算的開發(fā)環(huán)境和軟件體系。采用C語言作為編程語言,進(jìn)行了適度的擴(kuò)展,提供大量的高性能計(jì)算指令開發(fā)能力,使開發(fā)者能夠在GPU強(qiáng)大計(jì)算能力的基礎(chǔ)上建立起一種效率更高的密集數(shù)據(jù)計(jì)算解決方案。CUDA對(duì)圖形硬件和API進(jìn)行封裝,讓開發(fā)人員把GPU看成一個(gè)具有多核多線程的處理器,并在類似于CPU的編程環(huán)境下對(duì)GPU進(jìn)行編程,開發(fā)GPU通用程序,降低了軟件開發(fā)時(shí)間和成本。

      3 RD算法簡(jiǎn)介及其在GPU上的實(shí)現(xiàn)

      本文采用最常用的RD算法。RD算法首先對(duì)距離進(jìn)行脈沖壓縮,然后進(jìn)行距離徙動(dòng)校正,運(yùn)動(dòng)補(bǔ)償,然后進(jìn)行方位向壓縮,具體算法參考文獻(xiàn)[1]。RD算法的本質(zhì)是將SAR成像的二維處理分解為兩個(gè)一維處理過程,分別為距離向處理和方位向處理。RD算法的并行化程度成為獲取高加速比的關(guān)鍵。距離脈壓和方位脈壓通常使用頻域匹配濾波的實(shí)現(xiàn)方式,主要涉及的算法是FFT、點(diǎn)乘和IFFT。GPU開發(fā)軟件CUDA有自身的FFT庫可以實(shí)現(xiàn)快速的并行FFT變換,對(duì)于點(diǎn)乘運(yùn)算,由于距離向和方位向壓縮和距離徙動(dòng)校正和運(yùn)動(dòng)補(bǔ)償都是點(diǎn)乘,所以可以將其中的部分運(yùn)算合并以減少運(yùn)算次數(shù)提高計(jì)算速度。

      利用GPU實(shí)現(xiàn)的基于RD算法的SAR成像算法實(shí)現(xiàn)的流程如下:

      第一、把原始數(shù)據(jù)從通過CPU傳輸?shù)紾PU,計(jì)算徙動(dòng)補(bǔ)償所要的參數(shù)。

      第二、距離向的壓縮和走動(dòng)校正。具體描述為:首先將原始數(shù)據(jù)沿距離向做FFT,然后乘以通過內(nèi)核函數(shù)生成的距離向匹配函數(shù)和走動(dòng)校正函數(shù)完成距離向包絡(luò)移動(dòng),再利用距離向IFFT完成距離向壓縮。然后再進(jìn)行一次相位校正。

      第三、將做完走動(dòng)校正的數(shù)據(jù)進(jìn)行轉(zhuǎn)置。

      第四、利用慣性導(dǎo)航系統(tǒng)數(shù)據(jù)通過內(nèi)核函數(shù)生成運(yùn)動(dòng)補(bǔ)償函數(shù),對(duì)數(shù)據(jù)進(jìn)行運(yùn)動(dòng)補(bǔ)償。

      第五、通過內(nèi)核函數(shù)生成方位向匹配函數(shù)并進(jìn)行FFT,對(duì)數(shù)據(jù)進(jìn)行FFT然后點(diǎn)乘,在進(jìn)行IFFT,完成方位向的脈沖壓縮

      第六、將方位向脈壓完的數(shù)據(jù)即圖像傳回主機(jī)。

      圖1 GPU SAR成像算法流程

      4 實(shí)驗(yàn)與結(jié)果

      為了測(cè)試本文所提出的SAR成像方法的有效性,本部分介紹實(shí)驗(yàn)及其結(jié)果。本試驗(yàn)采用的計(jì)算機(jī)為普通商用計(jì)算機(jī)CPU為E8400,顯卡為NIVIDA公司的9500GT,板載顯存為1G字節(jié),運(yùn)算能力為1.1,其SM數(shù)量只有4個(gè),運(yùn)算精度為單精度;軟件使用的是Windows XP下的CUDA3.0。數(shù)據(jù)來源為某機(jī)載雷達(dá)的真實(shí)回波,PRF為1KHz,采用慣性導(dǎo)航單元進(jìn)行運(yùn)動(dòng)補(bǔ)償,圖像分辨率為1m,一次成像所需的數(shù)據(jù)長(zhǎng)度為8192×8192復(fù)數(shù)。由于顯卡上的存儲(chǔ)器容量有限,所以在處理的數(shù)據(jù)較大時(shí)不能完全將數(shù)據(jù)一次性放入顯卡上的存儲(chǔ)器,要將數(shù)據(jù)分成幾部分處理,本文在進(jìn)行距離壓縮時(shí)分成4個(gè)部分,在進(jìn)行方位壓縮時(shí)分成8個(gè)部分進(jìn)行。成像所需時(shí)間為4.21s,成像各個(gè)部分的運(yùn)算時(shí)間分布如表1所示,這其中還包含了由于顯卡現(xiàn)存不足,轉(zhuǎn)置的過程中在內(nèi)存和顯存之間緩沖數(shù)據(jù)的時(shí)間0.35s,在PRF=1KHz時(shí),采集一幅圖像數(shù)據(jù)時(shí)間為8s,所以本系統(tǒng)可以達(dá)到實(shí)時(shí)成像的要求,成像結(jié)果如圖2所示。

      表1 SAR成像時(shí)間統(tǒng)計(jì)(單位:s)

      圖2 利用GPU實(shí)現(xiàn)的RD成像結(jié)果

      由測(cè)試結(jié)果可知,本文提出的利用CUDA實(shí)現(xiàn)的基于GPU的RD成像算法具有極高的效率,相比傳統(tǒng)的基于CPU的SAR成像算法,效率得了顯著的提升,達(dá)到了實(shí)時(shí)處理的速度。并且成像效果并未受到多大的影響,完全可以滿足下一步處理的需求。

      5 結(jié)束語

      本文提出了利用GPU實(shí)現(xiàn)RD成像算法。該成像算法利用GPU通用計(jì)算的編程模型,極大地發(fā)揮出了GPU并行計(jì)算的優(yōu)勢(shì)。通過實(shí)驗(yàn)表明:本文提出的基于GPU的SAR成像方案實(shí)現(xiàn)了實(shí)時(shí)RD成像的要求,具有較好的成像效果。為了使當(dāng)前的研究結(jié)果更加完善,在將來可以利用CPU和GPU進(jìn)行協(xié)同合作,并開發(fā)更加完善的并行算法,提高并行度,進(jìn)一步提高運(yùn)算速度。

      [1]保錚,邢孟道,王彤.雷達(dá)成像技術(shù)[M].北京:電子工業(yè)出版社,2005.

      [2]張舒,褚艷利.CPU高性能運(yùn)算之CUDA[M].中國(guó)水利水電出版社,2009.

      [3]NVIDIA.NVIDIA CUDA Programming Guide Version 3.0[Z].2010.

      [4]肖江,胡柯良,鄧元勇.基于CUDA的矩陣乘法和FFT性能測(cè)試[J].計(jì)算機(jī)工程,2009.

      猜你喜歡
      方位校正處理器
      認(rèn)方位
      幼兒園(2021年12期)2021-11-06 05:10:20
      劉光第《南旋記》校正
      一類具有校正隔離率隨機(jī)SIQS模型的絕滅性與分布
      機(jī)內(nèi)校正
      借助方位法的拆字
      說方位
      幼兒100(2016年28期)2016-02-28 21:26:17
      基于TMS320C6678的SAR方位向預(yù)濾波器的并行實(shí)現(xiàn)
      Imagination的ClearCallTM VoIP應(yīng)用現(xiàn)可支持Cavium的OCTEON? Ⅲ多核處理器
      ADI推出新一代SigmaDSP處理器
      汽車零部件(2014年1期)2014-09-21 11:41:11
      呼嚕處理器
      中山市| 海伦市| 康定县| 伊通| 荣成市| 资兴市| 任丘市| 潍坊市| 察雅县| 邵阳市| 徐水县| 米林县| 砀山县| 思茅市| 永登县| 德兴市| 峨山| 祁门县| 茌平县| 丹阳市| 崇阳县| 江北区| 霍林郭勒市| 大安市| 同心县| 郴州市| 新蔡县| 西盟| 城固县| 兴隆县| 磐石市| 乌海市| 株洲市| 三门县| 丰宁| 托克逊县| 安溪县| 滕州市| 长治市| 延庆县| 长垣县|