• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種基于DSPSR和GPU的脈沖星相干消色散基帶數(shù)據(jù)處理技術(shù)

      2021-10-30 02:17:20李浩羅近濤潘之辰孫鵬飛姜金辰
      時間頻率學(xué)報 2021年3期
      關(guān)鍵詞:共享內(nèi)存脈沖星色散

      李浩,羅近濤,潘之辰,孫鵬飛,姜金辰,5

      一種基于DSPSR和GPU的脈沖星相干消色散基帶數(shù)據(jù)處理技術(shù)

      李浩1,2,羅近濤1,3,潘之辰4,孫鵬飛1,姜金辰4,5

      (1. 中國科學(xué)院 國家授時中心,西安 710600;2. 中國科學(xué)院大學(xué),北京 100049; 3. 中國科學(xué)院 精密導(dǎo)航定位與定時技術(shù)重點實驗室,西安 710600;4. 中國科學(xué)院 國家天文臺,北京 100101;5. 北京大學(xué),北京 100871)

      相比于非相干消色散,相干消色散具有色散消除更徹底、可保留原始數(shù)據(jù)相位、時間分辨率信息等優(yōu)勢,但同時具有運算量大、數(shù)據(jù)處理耗時長等問題。為實現(xiàn)脈沖星基帶數(shù)據(jù)相干消色散處理,對數(shù)據(jù)處理流程進行加速,開發(fā)一種以DSPSR(digital signal processing software for pulsar)和GPU(graphics processing unit)為數(shù)據(jù)處理核心的脈沖星數(shù)據(jù)處理技術(shù)。利用高速共享內(nèi)存實現(xiàn)對環(huán)形緩存區(qū)兩路極化基帶數(shù)據(jù)的讀取,結(jié)合圖形處理器高性能計算技術(shù),使用DSPSR對基帶數(shù)據(jù)進行相干消色散處理。數(shù)據(jù)處理結(jié)果表明,相比于多線程非相干消色散系統(tǒng),此數(shù)據(jù)處理技術(shù)在數(shù)據(jù)處理速度方面具有更好的優(yōu)越性,并可獲得更精細的脈沖輪廓。

      脈沖星;相干消色散;脈沖星數(shù)字信號處理程序包;圖形處理器;脈沖星分布式采集和數(shù)據(jù)分析處理軟件

      0 引言

      脈沖星信號在傳播過程中由于受到星際介質(zhì)(interstellar medium,ISM)影響產(chǎn)生色散現(xiàn)象,導(dǎo)致觀測到的脈沖輪廓展寬,需采用消色散技術(shù)對脈沖星數(shù)據(jù)進行處理。脈沖星消色散方法主要分為非相干消色散和相干消色散兩種。非相干消色散在時域進行,多通道濾波器將脈沖星信號等分為若干通道的窄帶信號,再將每個通道的信號經(jīng)過平方檢波后在時域上對齊相加,補償因色散而產(chǎn)生的時間延遲,但是同一通道內(nèi)色散無法消除[1]。相干消色散核心算法為快速傅里葉變換,將時域數(shù)字信號變換到頻域,再使用星際介質(zhì)傳輸函數(shù)進行處理,消除整個通帶內(nèi)的色散。相比于非相干消色散,相干消色散可消除帶內(nèi)色散,效果更徹底,并能夠保留原始數(shù)據(jù)的相位關(guān)系、時間分辨率。已有學(xué)者研究表明,在一定的觀測頻率之內(nèi),相干消色散的效果優(yōu)于非相干消色散[2]。

      目前主流脈沖星數(shù)字終端系統(tǒng)由現(xiàn)場可編程門陣列(field programmable gate array,F(xiàn)PGA)、圖形處理器(graphics processing unit,GPU)、中央處理器(central processing unit,CPU)三部分組成,F(xiàn)PGA平臺主要用于ADC(analog to digital converter)控制、數(shù)據(jù)流控制和信號預(yù)處理,GPU負(fù)責(zé)消色散等核心算法的完成,CPU用于數(shù)據(jù)傳輸、邏輯控制和文件讀寫[3]。FPGA端輸出的基帶數(shù)據(jù)可保留脈沖星信號原始信息,結(jié)合相干消色散技術(shù)可開展超高時間分辨率脈沖星輻射特性研究,對于持續(xù)時間極短的快速射電暴(fast radio burst,F(xiàn)RB)搜尋以及脈沖星超短時標(biāo)脈沖等研究有著重要意義。以中國FAST 500 m望遠鏡①http://www.cas.cn/zt/kjzt/fast/、澳大利亞Parkes 64 m望遠鏡[4]、德國100 m口徑Effelsberg望遠鏡[5]等為代表的大口徑射電望遠鏡以脈沖星觀測為主要科學(xué)目標(biāo),寬帶寬、超高時間分辨率和高頻率分辨率數(shù)字終端技術(shù)成為發(fā)展趨勢。

      國內(nèi)脈沖星數(shù)字化終端系統(tǒng)的研制已取得一系列進展。中國科學(xué)院新疆天文臺依托25 m射電望遠鏡和VLBI記錄終端MK5A系統(tǒng),開展脈沖星相干消色散觀測系統(tǒng)研究[6]。中國科學(xué)院云南天文臺以ROACH2平臺和脈沖星數(shù)字信號處理程序包(digital pulsar signal processing for pulsars,DSPSR)為數(shù)據(jù)處理核心構(gòu)建相干消色散觀測系統(tǒng)[7]。中國科學(xué)院上海天文臺65 m射電望遠鏡配備脈沖星數(shù)字化終端(digital backend system,DIBAS),同時具備相干與非相干消色散功能[3]。中國科學(xué)院國家天文臺面向FAST開發(fā)了基于ROACH2平臺的非相干數(shù)字化脈沖星終端[8]。中國科學(xué)院國家授時中心40 m射電望遠鏡HRT脈沖星觀測系統(tǒng)使用FPGA+GPU架構(gòu),可實現(xiàn)非相干消色散與相干消色散兩種觀測模式[9]。國際上,美國NRAO(National Radio Astronomy Observatory)在GUPPI(green bank ultimate pulsar processing instrument)系統(tǒng)的基礎(chǔ)上,研制硬件平臺和性能指標(biāo)更為先進的VEGAS(versatile GBT astronomical spectrometer),基本系統(tǒng)由ADC,ROACH系列FPGA平臺與GPU處理集群組成②http://www.cas.cn/zt/kjzt/fast/。德國Effelsberg射電望遠鏡PSRIX后端采用ROACH系列平臺實現(xiàn),GPU集群進行數(shù)據(jù)處理[10]。澳大利亞Parkes射電望遠鏡的BPSR(Berkeley Parkes Swinburne Recorder)脈沖星數(shù)字終端系統(tǒng)采用FPGA平臺和CPU+GPU架構(gòu),數(shù)據(jù)處理后端采用開源軟件PSRDADA(processing software for pulsar distributed acquisition and data analysis)實現(xiàn)數(shù)據(jù)緩沖區(qū)、DSPSR實現(xiàn)實時相干消色散和RFI處理[11]。

      結(jié)合相干消色散脈沖星觀測系統(tǒng)發(fā)展趨勢,本文基于CPU+GPU架構(gòu),開發(fā)一種以GPU和DSPSR為數(shù)據(jù)處理核心的相干消色散基帶數(shù)據(jù)處理技術(shù)。利用高速共享內(nèi)存原理實現(xiàn)最高兩路極化基帶數(shù)據(jù)輸入,后續(xù)解碼、消色散、折疊等數(shù)據(jù)處理流程采用脈沖星數(shù)字信號處理程序包DSPSR結(jié)合GPU加速技術(shù)進行處理。數(shù)據(jù)處理結(jié)果以PSRFITS格式存儲。面向FAST脈沖星觀測系統(tǒng)海量數(shù)據(jù)相干消色散處理需求,將此數(shù)據(jù)處理流程在FAST基帶數(shù)據(jù)服務(wù)器集群上進行部署測試,驗證流程的正確性與可行性,為后續(xù)寬帶實時相干消色散脈沖星觀測系統(tǒng)的開發(fā)提供技術(shù)儲備。

      1 相干消色散原理

      2 DSPSR+GPU數(shù)據(jù)處理技術(shù)

      脈沖星數(shù)據(jù)進行相干消色散處理需進行大量的浮點運算,相比于非相干消色散算法,對計算機的性能和運算能力要求更高,隨著圖形處理器高性能計算的發(fā)展,數(shù)字化相干消色散脈沖星終端技術(shù)研究成為新的趨勢。本文構(gòu)建的相干消色散數(shù)據(jù)處理流程如圖1所示,利用高速共享內(nèi)存,即環(huán)形緩存區(qū)(ringbuffer)實現(xiàn)基帶數(shù)據(jù)的讀寫,包括數(shù)據(jù)輸入、數(shù)據(jù)處理、數(shù)據(jù)輸出3個部分。

      圖1 數(shù)據(jù)處理流程

      首先從磁盤中讀取基帶數(shù)據(jù)、header文件并寫入環(huán)形緩存區(qū),環(huán)形緩存區(qū)由兩部分組成:Data buffer和Header buffer,Data buffer用于存放基帶數(shù)據(jù),Header buffer用于存放觀測信息以及基帶數(shù)據(jù)基本信息。然后DSPSR從環(huán)形緩存區(qū)讀取基帶數(shù)據(jù)和對應(yīng)的信息,進行相干消色散、折疊等后續(xù)處理,并將處理結(jié)果存入磁盤。

      2.1 共享內(nèi)存技術(shù)

      共享內(nèi)存是Unix系統(tǒng)下一種高效的多進程間通信(inter-process communication,IPC)方式,多用于同一程序不同進程間的數(shù)據(jù)傳輸。進程可直接對內(nèi)存進行訪問、讀寫,不需要進行數(shù)據(jù)拷貝,是連接到共享內(nèi)存的多個進程間共享和傳遞數(shù)據(jù)的有效方式。

      共享內(nèi)存中的數(shù)據(jù)可被連接到此共享內(nèi)存的所有進程讀取,此時進程間數(shù)據(jù)傳輸不再通過內(nèi)核,可有效減少系統(tǒng)調(diào)用時間,提高數(shù)據(jù)傳輸效率。主流的共享內(nèi)存實現(xiàn)方式有跨進程間通訊的基于SYS V的共享內(nèi)存、基于POSIX mmap文件映射共享內(nèi)存和基于DMABUF框架,可跨設(shè)備間通訊的共享內(nèi)存兩大類[14]。

      脈沖星終端更寬帶寬、更高時間分辨率的發(fā)展趨勢,面臨海量數(shù)據(jù)高速傳輸技術(shù)難題。FAST 19波束接收機在8 bits采樣下基帶數(shù)據(jù)數(shù)據(jù)量為38 Gbit/s,PSRFITS格式數(shù)據(jù)量為3 040 Mbit/s(4 k通道, 50 μs,8 bits)[3],海量數(shù)據(jù)快速處理成為基帶數(shù)據(jù)處理難題,共享內(nèi)存高效數(shù)據(jù)傳輸?shù)膬?yōu)勢,是解決海量基帶數(shù)據(jù)處理的途徑。

      2.2 PSRDADA簡介

      PSRDADA是用于脈沖星基帶記錄的開源軟件項目,提供靈活且易于管理的環(huán)形緩存區(qū)(ringbuffer)實現(xiàn)數(shù)據(jù)讀寫。可通過基于文本的套接字接口來控制讀、寫程序,以實現(xiàn)從ringbuffer中將數(shù)據(jù)寫入磁盤陣列、將數(shù)據(jù)發(fā)送到節(jié)點陣列以及直接在ringbuffer中處理數(shù)據(jù)③http://psrdada.sourceforge.net/。

      在PSRDADA的邏輯中,環(huán)形緩沖區(qū)通常有一個指向ringbuffer中可讀數(shù)據(jù)的讀指針和一個指向可寫緩存區(qū)的寫指針,通過控制讀、寫指針實現(xiàn)緩沖區(qū)數(shù)據(jù)的輸入和輸出。在PSRDADA的具體實現(xiàn)中,寫程序創(chuàng)建并鎖定環(huán)形緩存區(qū)后,未被程序讀取的數(shù)據(jù)區(qū)域定義為使用區(qū)域,通過將已讀取數(shù)據(jù)區(qū)域標(biāo)記為已清除,成為新的未使用區(qū)域且可被寫程序識別,來構(gòu)成邏輯上的循環(huán)。

      2.3 脈沖星數(shù)字信號處理程序包

      DSPSR是一款開源、面向?qū)ο蟮臄?shù)字信號處理軟件包,可以選擇性地利用多核處理器和通用圖形處理單元進行射電脈沖星數(shù)字信號處理,旨在提高算法和數(shù)據(jù)的可移植性[13],支持CPSR,F(xiàn)ITS,Mark5等多種數(shù)據(jù)格式。DSPSR還可實現(xiàn)多種模塊化算法:如相干消色散、生成濾波器組、全極化檢測、格式轉(zhuǎn)換等。數(shù)據(jù)結(jié)果以PSRFITS格式輸出,可用于PSRCHIVE等軟件進行后續(xù)數(shù)據(jù)處理。

      DSPSR通過共享內(nèi)存區(qū),可直接從RAM中讀取脈沖星數(shù)據(jù)。并可結(jié)合GPU加速特性進行并行運算,提升消色散等數(shù)據(jù)處理效率。

      2.4 GPU加速技術(shù)

      GPU即圖形處理器,配備有高速內(nèi)存以及大量算術(shù)邏輯單元(arithmetic and logic unit,ALU),是專為執(zhí)行大量幾何計算而設(shè)計的一種高度并行化多核處理器。相比于CPU采用串行架構(gòu),功能模塊較多,能適應(yīng)復(fù)雜運算環(huán)境的特點,GPU可執(zhí)行大規(guī)模并發(fā)計算,擁有更強大的浮點運算能力。

      CUDA(compute unified device architecture)是NVIDIA公司推出的軟硬件通用計算設(shè)備架構(gòu)[15],采用標(biāo)準(zhǔn)C語言的拓展作為編程語言,提供大量高性能計算指令。利用CUDA進行編程可采用新的計算架構(gòu)來使用GPU提供的硬件資源,使線程的創(chuàng)建和調(diào)度所占用的開銷大大減少,從而提升程序的運算效率。

      GPU的邏輯架構(gòu)包括thread,block和grid三個部分,如圖2所示,GPU執(zhí)行計算可調(diào)用的最小單位為thread,數(shù)個thread共同組成一個block,一個block中的thread共用同一塊共享內(nèi)存,并可快速實現(xiàn)數(shù)據(jù)同步。在物理層,GPU硬件的核心組件為流式多處理器(streaming multiprocessor,SM)。SM資源主要包括CUDA核、共享內(nèi)存、寄存器、乘加器等,可以并行執(zhí)行數(shù)百個線程,資源數(shù)量越多則GPU的并行計算能力越高。

      圖2 GPU線程結(jié)構(gòu)

      脈沖星數(shù)據(jù)處理流程中,消色散所需時間占比最大,是影響數(shù)據(jù)處理效率最主要的因素[16]。隨著GPU的可編程能力及并行處理能力不斷提高,應(yīng)用范圍迅速擴展,可利用GPU高性能并行計算特性來滿足海量基帶數(shù)據(jù)的實時處理需求。本文利用DSPSR結(jié)合GPU加速技術(shù)對相干消色散算法進行加速,提高數(shù)據(jù)處理效率。

      3 數(shù)據(jù)處理

      本流程對基帶數(shù)據(jù)的處理可分為基帶數(shù)據(jù)的讀取與寫入、調(diào)用DSPSR讀取數(shù)據(jù)、相干消色散處理、折疊、PSRFITS格式輸出等5個步驟。基帶數(shù)據(jù)的讀寫通過編寫程序?qū)崿F(xiàn),通過在編譯時添加相應(yīng)的數(shù)據(jù)格式來實現(xiàn)DSPSR對ringbuffer中數(shù)據(jù)的讀取,相干消色散、折疊等處理通過調(diào)用DSPSR實現(xiàn),數(shù)據(jù)處理結(jié)果由DSPSR以PSRFITS格式保存。為提高數(shù)據(jù)處理速度,使用GPU對DSPSR的數(shù)據(jù)處理進行加速。

      3.1 數(shù)據(jù)處理原理

      在本數(shù)據(jù)處理流程中,環(huán)形緩存區(qū)為基帶數(shù)據(jù)讀寫的接口,包含指針、唯一標(biāo)識符(KEY)、內(nèi)存塊大小、內(nèi)存塊數(shù)量4個參數(shù)。這4個參數(shù)中,指針指向未使用的環(huán)形緩沖區(qū)句柄,通過此指針來實現(xiàn)對共享內(nèi)存的訪問,ringbuffer的大小由內(nèi)存塊大小和內(nèi)存塊數(shù)量共同決定。程序通過指定命令及以上參數(shù)來對ringbuffer進行創(chuàng)建、連接、鎖定、讀取、重置等操作。如圖3所示,對ringbuffer的使用以及數(shù)據(jù)處理流程步驟如下:

      ① 創(chuàng)建ringbuffer,通過設(shè)置內(nèi)存塊大小以及內(nèi)存塊數(shù)量來控制ringbuffer大小,并為其指定唯一標(biāo)識符‘KEY’。

      ② 寫程序通過唯一標(biāo)識符‘KEY’連接并鎖定ringbuffer,此時ringbuffer僅允許當(dāng)前寫程序進行訪問。

      ③ 寫程序通過命令行參數(shù)所指定的路徑與文件名,讀取header文件與基帶數(shù)據(jù)文件,并對ringbuffer進行寫操作。

      ④ 寫程序通過判斷是否讀取到文件末尾以保證文件的連續(xù)讀取,直至所有文件讀取完畢。

      ⑤ DSPSR通過唯一標(biāo)識符‘KEY’連接并鎖定到ringbuffer,對基帶數(shù)據(jù)進行讀取并進行后續(xù)相干消色散、折疊等處理,并輸出結(jié)果文件。此時ringbuffer僅允許當(dāng)前讀程序(DSPSR)進行訪問。

      ⑥ 全部數(shù)據(jù)處理完成后,寫程序會返回寫入ringbuffer中基帶數(shù)據(jù)文件總數(shù)、總大小以及平均傳輸速度到屏幕,然后通過對ringbuffer進行刷新,以釋放內(nèi)存。

      圖3 數(shù)據(jù)讀取原理

      處理兩路基帶數(shù)據(jù)時,需保證兩路數(shù)據(jù)文件的數(shù)量、每個文件大小分別對應(yīng)相等,目前實現(xiàn)兩路極化各2 048個文件輸入,根據(jù)服務(wù)器內(nèi)存配置,可調(diào)整文件輸入數(shù)量上限。在數(shù)據(jù)處理服務(wù)器內(nèi)存容量允許的情況下,可通過指定不同的標(biāo)識符‘KEY’創(chuàng)建多個ringbuffer來同時進行不同數(shù)據(jù)的讀寫操作。

      2001-2012年海南省國際旅游外匯收入除2003年和2009年下降外,總體呈波動上升趨勢。期間,2003年受亞洲“非典”公共危機事件影響,2008-2009年受全球金融危機影響出現(xiàn)下滑。其國際旅游外匯收入從2001年的1.06億美元上升到2012年的3.48億美元。12年間的平均國際旅游外匯收入為2.21億美元,約占全國的0.65%,排名在二十一位名上下波動。2001-2012年海南省國際旅游外匯收入一直低于全國平均值,差距越來越大。

      3.2 數(shù)據(jù)處理方式

      根據(jù)pipeline處理數(shù)據(jù)要求,使用ringbuffer前,需創(chuàng)建脈沖星觀測信息文本文件,文件中包括觀測頻率、射電源名稱、觀測模式、極化、通道、帶寬、中心頻率、采樣比特數(shù)、臺站信息、數(shù)據(jù)大小等參數(shù)信息,并對參數(shù)信息根據(jù)實際觀測情況進行修改,再將基帶數(shù)據(jù)文件名按照指定格式保存到文本文件中。

      依據(jù)3.1節(jié)數(shù)據(jù)處理原理,首先創(chuàng)建指定大小的ringbuffer,寫程序根據(jù)‘KEY’值使用指定命令連接到ringbuffer,將header文件及數(shù)據(jù)分別寫入header buffer和data buffer中,并輸出header文件內(nèi)容到屏幕。然后使用DSPSR相關(guān)命令讀取ringbuffer中數(shù)據(jù),進行相干消色散、分通道、折疊以及PSRFITS格式輸出等處理。通過修改DSPSR命令參數(shù)調(diào)整圖形處理器以及中央處理器線程數(shù)的使用,并對通道數(shù)、輸出文件名及路徑、積分時間等數(shù)據(jù)處理信息進行調(diào)整。所使用的脈沖星歷文件由Psrcat軟件生成,采用Tempo2生成預(yù)報多項式進行折疊。最后刷新ringbuffer,清空共享內(nèi)存區(qū)中數(shù)據(jù)。

      為測試、驗證數(shù)據(jù)處理流程的可行性與準(zhǔn)確性,在FAST基帶數(shù)據(jù)服務(wù)器集群上安裝配置此流程,并使用FAST對脈沖星PSR J0534+2200、PSR J1939+2134觀測所得的基帶數(shù)據(jù)進行測試處理。

      4 結(jié)果分析

      本文所處理的基帶數(shù)據(jù)觀測信息為:中心頻率1 250 MHz、帶寬500 MHz、雙極化、8比特采樣。首先,分別采用3.2節(jié)的數(shù)據(jù)處理方式和DSPSR CPU多線程方式對數(shù)據(jù)進行處理,記錄處理1 s觀測時長的數(shù)據(jù)量所需時間,結(jié)果如表1所示。根據(jù)FAST基帶數(shù)據(jù)服務(wù)器集群配置信息,本文介紹的數(shù)據(jù)處理流程處理8比特采樣、觀測時長1 s的雙極化基帶數(shù)據(jù),所需時間大約為0.8 s,與CPU模式下調(diào)用32線程處理時間5 s相比,速度提升約6.25倍。FAST基帶數(shù)據(jù)服務(wù)器配置信息如表2所示。

      表1 數(shù)據(jù)處理信息和所需時間

      表2 FAST基帶數(shù)據(jù)GPU配置信息

      其次,使用3.2節(jié)的數(shù)據(jù)處理方式對PSR J0534+2200和PSR J1939+2134的總觀測時長基帶數(shù)據(jù)進行相干消色散處理,處理結(jié)果如圖4至圖7所示。同時對PSR J1939+2134基帶數(shù)據(jù)進行非相干消色散處理,結(jié)果如圖8所示。PSR J0534+2200和PSR J1939+2134經(jīng)過相干消色散處理后的數(shù)據(jù)信噪比分別為16.677和1 270.176,可以利用Tempo2和PSRCHIVE對數(shù)據(jù)進行計時等研究工作。

      圖4 PSR J0534+2200相干消色散脈沖輪廓圖(中心頻率1 250 MHz,帶寬500 MHz,雙極化)

      從圖4中可清晰看到PSR J0534+2200脈沖輪廓的兩個主成分:分別位于相位0.3和0.7附近的主脈沖和中間脈沖。從圖5的頻率—相位圖中可以看到經(jīng)過相干消色散處理不同的通道已經(jīng)對齊,消除了色散效應(yīng)的影響。圖6為PSR J1939+2134經(jīng)過相干消色散處理后得到的脈沖輪廓圖,可看到位于相位0.2附近主脈沖的精細結(jié)構(gòu),在頻域圖中也可看到該結(jié)構(gòu)。圖7顯示各頻率通道也已經(jīng)對齊。

      圖6 PSR J1939+2134相干消色散脈沖輪廓圖(中心頻率1 250 MHz,帶寬500 MHz,雙極化)

      圖7 PSR J1939+2134頻率—相位圖

      圖8 PSR J1939+2134非相干消色散脈沖輪廓圖(中心頻率1 250 MHz,帶寬500 MHz,雙極化)

      最后,為驗證本文所論述的數(shù)據(jù)處理流程的數(shù)據(jù)處理質(zhì)量,根據(jù)Australia Telescope National Facility④https://data.csiro.au/dap/public/atnf/pulsarSearch.zul的資料,與Parkes 對PSR J1939+2134在L波段觀測所得到的輪廓進行比較,結(jié)果如圖9所示。圖9所示為Parkes的PDFB終端系統(tǒng)對PSR J1939+2134在1378 MHz觀測數(shù)據(jù)的相干消色散處理結(jié)果,可清晰看到位于相位0.2附近的主脈沖、相位0.7附近的中間脈沖以及主脈沖的精細結(jié)構(gòu),與圖6中FAST觀測數(shù)據(jù)處理結(jié)果一致,證明本數(shù)據(jù)處理流程的數(shù)據(jù)處理結(jié)果是符合要求的。

      圖9 Parkes觀測得到的PSR J1939+2134相干消色散脈沖輪廓圖

      5 結(jié)論

      本文提出的基于DSPSR和GPU的脈沖星數(shù)據(jù)處理流程,可實現(xiàn)最高兩路極化基帶數(shù)據(jù)相干消色散處理。數(shù)據(jù)讀取及處理方面結(jié)合高速共享內(nèi)存技術(shù)和GPU加速技術(shù),實現(xiàn)基于CPU+GPU異構(gòu)系統(tǒng)的相干消色散基帶數(shù)據(jù)處理技術(shù),相比于非相干消色散,色散消除更徹底,可以獲得更精確的脈沖輪廓。數(shù)據(jù)處理效率方面:在TITAN XP圖形處理器配置下,對8 bit采樣、觀測時長1 s的雙極化PSR J0534+2200基帶數(shù)據(jù)進行處理,所需時間約為0.8 s,與CPU模式下,DSPSR采用32線程處理同樣數(shù)據(jù)量的基帶數(shù)據(jù)所需時間約5 s相比,本數(shù)據(jù)處理流程速度提升約6.25倍。在觀測頻率、帶寬相近的條件下,將PSR J1939+2134數(shù)據(jù)處理結(jié)果與Parkes在L波段觀測所得的輪廓圖進行對比,本流程處理所得結(jié)果與Parkes處理結(jié)果相同,驗證了此數(shù)據(jù)處理流程在脈沖星數(shù)據(jù)處理方面的可行性與準(zhǔn)確性。本數(shù)據(jù)處理技術(shù)的開發(fā),在實現(xiàn)相干消色散基帶數(shù)據(jù)處理的基礎(chǔ)上,提升了數(shù)據(jù)處理效率,為海量脈沖星基帶數(shù)據(jù)實時處理以及國內(nèi)開發(fā)相干消色散脈沖星終端提供數(shù)據(jù)處理方面的技術(shù)儲備和技術(shù)參考。

      在今后的工作中將繼續(xù)研究DSPSR在GPU并行計算場景下的應(yīng)用,進一步優(yōu)化其數(shù)據(jù)處理速度,為實時寬帶相干消色散的接收機做技術(shù)儲備。并拓展基于PSRDADA共享內(nèi)存技術(shù)的數(shù)據(jù)讀寫功能,如增加支撐更多數(shù)據(jù)格式,實現(xiàn)特定格式文件輸出等。

      致謝:感謝中國科學(xué)院國家天文臺FAST現(xiàn)場工作人員對數(shù)據(jù)處理流程部署的大力支持和熱情幫 助,在此深表謝意。

      [1] 劉建偉, 金乘進. 基于計算機集群的脈沖星相干消色散系統(tǒng)研究[J]. 科學(xué)技術(shù)與工程, 2009, 9(13): 3612-3615+3620.

      [2] 黃玉祥, 汪敏, 郝龍飛, 等. 脈沖星信號相干消色散與非相干消色散的比較研究[J]. 天文研究與技術(shù), 2019, 16(1): 16-24.

      [3] 張海龍, 張萌, 聶俊, 等. 脈沖星數(shù)字終端技術(shù)綜述[J].中國科學(xué)(物理學(xué) 力學(xué) 天文學(xué)), 2019, 49(9): 15-28.

      [4] BAILES M. Precision timing at the Parkes 64-m radio telescope[J]. Radio Pulsars, ASP Conference Proceedings, San Francisco: Astronomical Society of the Pacific, 2003: 57-60.

      [5] HACHENBERG O, GRAHL B, WIELEBINSKI R. The 100-meter radio telescope at Effelsberg[J]. Proceedings of the IEEE, 1973, 61(9): 1288-1295.

      [6] 劉立勇, 艾力·伊沙木丁, 張晉. 烏魯木齊天文站建立脈沖星相干消色散觀測系統(tǒng)[J]. 天文研究與技術(shù), 2007, 4(1): 72-78.

      [7] 徐永華, 李紀(jì)云, 張穎倩, 等. 相干消色散脈沖星觀測系統(tǒng)的研究[J]. 天文研究與技術(shù), 2015, 12(4): 480-486.

      [8] 南仁東, 李會賢.FAST的進展—科學(xué)、技術(shù)與設(shè)備[J]. 中國科學(xué)(物理學(xué) 力學(xué) 天文學(xué)), 2014, 44(10): 1063-1074.

      [9] LUO J T, GGAO Y P, YANG T G, et al.Pulsar timing observations with Haoping radio telescope[J]. Research in Astronomy and Astrophysics, 2020, 20(7): 187-192.

      [10] LAZARUS P, KARUPPUSAMY R, GRAIKOU E, et al.Prospects for high-precision pulsar timing with the new Effelsberg PSRIX backend[J]. Monthly Notices of the Royal Astronomical Society, 2016, 458(1): 868-880.

      [11] SARKISSIAN J M, CARRETTI E, STRATEN W V.The Parkes pulsar backends[J]. AIP Conference Proceedings, 2011, 1357(1): 351-352.

      [12] LORMER D R, KRAMER M.Handbook of pulsar astronomy[K]. 2012.

      [13] STRATEN W V, BAILES M.DSPSR: digital signal processing software for pulsar astronomy[J]. Publications of the Astronomical Society of Australia, 201l, 28(1): 1-14.

      [14] Microsystems S.Shared Memory[C] // System Interface Guide, [S.l.]: Iuniverse Inc, 2001: 106-107.

      [15] CHENG J, GROSSMAN M, MCKERCHER T.Professional CUDA C programming[M]. John Wiley & Sons, [S.l.]: Wrox, 2014.

      [16] 李佳功, 徐永華, 李志玄, 等. 基于Mark5B+GPU脈沖星觀測系統(tǒng)[J]. 天文研究與技術(shù), 2014, 11(4): 335-342.

      A coherent de-dispersion processing technology on pulsar baseband data based on DSPSR and GPU

      LI Hao1,2, LUO Jin-tao1,3, PAN Zhi-chen4, SUN Peng-fei1, JIANG Jin-chen4,5

      (1. National Time Service Center, Chinese Academy of Sciences, Xi’an 710600, China;2.University of Chinese Academy of Sciences, Beijing 101048, China; 3. Key Laboratory of Precise Navigation and Timing Technology, Chinese Academy of Sciences, Xi’an 710600, China;4. National Astronomical Observatory, Chinese Academy of Sciences, Beijing 100101, China; 5. Peking University, Beijing 100871, China)

      Compared with incoherent de-dispersion, coherent de-dispersion has the advantages of more thorough dispersion elimination, and retaining the original phase information and the time resolution of the original data. However, it comes with challenges such as the massive computations and the longer data processing time. In order to realize a coherent de-dispersion processing of baseband data and accelerate the data processing, a pulsar data processing pipeline using DSPSR (the digital signal processing for pulsars) and GPU (graphics processing unit) as the data processing core is developed. Firstly, through the high-speed shared memory, the circular buffer is used to read the two-polarization baseband data. Combined with the high-performance computing technologies based on the graphics processor, the DSPSR is used to perform coherent de-dispersion, and folding process on the baseband data. Results from this pipeline show that compared with the multi-threaded incoherent de-dispersion system, this data processing technology has advantages in data processing speed and obtaining finer pulse profiles.

      pulsar; coherent achromatic dispersion; digital signal processing for pulsars (DSPSR); graphics processing unit (GPU); processing software for pulsar distributed acquisition and data analysis (PSRDADA)

      10.13875/j.issn.1674-0637.2021-03-0204-11

      李浩, 羅近濤, 潘之辰, 等. 一種基于DSPSR和GPU的脈沖星相干消色散基帶數(shù)據(jù)處理技術(shù)[J]. 時間頻率學(xué)報, 2021, 44(3): 204-214.

      2021-04-21;

      2021-05-22

      國家自然科學(xué)基金資助項目(U1931128;11973046;91736207;42030105);國家重點研發(fā)計劃資助項目(2017YFA0402602)

      猜你喜歡
      共享內(nèi)存脈沖星色散
      “光的折射”“光的色散”知識鞏固
      “中國天眼”已發(fā)現(xiàn)740余顆新脈沖星
      軍事文摘(2023年12期)2023-06-12 07:51:00
      “光的折射”“光的色散”知識鞏固
      發(fā)現(xiàn)脈沖星的女天文學(xué)家——貝爾
      科學(xué)(2022年4期)2022-10-25 02:43:42
      “光的折射”“光的色散”知識鞏固
      『光的折射』『光的色散』隨堂練
      通過QT實現(xiàn)進程間的通信
      基于PCI總線的多處理器協(xié)同機制研究
      基于虛擬觀測值的X射線單脈沖星星光組合導(dǎo)航
      QNX下PEX8311多路實時數(shù)據(jù)采集的驅(qū)動設(shè)計
      電子世界(2014年21期)2014-04-29 06:41:36
      土默特左旗| 马鞍山市| 南开区| 马龙县| 淮南市| 嘉义县| 清水河县| 万年县| 垦利县| 廊坊市| 凤山县| 万宁市| 霸州市| 凤翔县| 寿光市| 海淀区| 石狮市| 宁南县| 永和县| 全椒县| 弥渡县| 大石桥市| 嫩江县| 英德市| 澄城县| 龙井市| 惠来县| 宜章县| 济阳县| 台山市| 日照市| 洞头县| 仙桃市| 贵溪市| 汝阳县| 凌源市| 永定县| 德安县| 新昌县| 肥东县| 辽源市|