牛京玉,胡 堅,賀文靜,孟凡榮,李傳榮
?
基于C6678的主被動三維影像生成算法并行設(shè)計
牛京玉1,2,胡 堅2,賀文靜2,孟凡榮2,李傳榮2
(1. 中國科學(xué)院大學(xué),北京 100049;2. 中國科學(xué)院光電研究院 中國科學(xué)院定量遙感信息技術(shù)重點實驗室,北京 100094)
當(dāng)前,如何實現(xiàn)高效的主被動三維影像生成技術(shù)是遙感應(yīng)用中的一個研究熱點。由于激光雷達-光學(xué)CCD的三維影像生成算法具有數(shù)據(jù)量大、處理復(fù)雜的特點,為實現(xiàn)其高效實時的應(yīng)用需求,本文利用TMS320C6678多核DSP開展了并行處理技術(shù)方面的研究。并針對兩種主流并行模型(主從模型和數(shù)據(jù)流模型),分別進行了三維影像生成算法的并行設(shè)計。最后,依托開發(fā)平臺進行測試分析,總結(jié)論證了兩種主流模型的設(shè)計要點與適用情況,為多核DSP在實際應(yīng)用中的資源高效利用提供了思路。
多核DSP;三維影像生成;主從模型;數(shù)據(jù)流模型
近年來,遙感技術(shù)已廣泛用于資源調(diào)查、城市規(guī)劃、土地利用、環(huán)境監(jiān)測、災(zāi)害評估等多領(lǐng)域,利用該技術(shù)對觀測目標(biāo)的空間、紋理、光譜、材質(zhì)等多維屬性信息快速精準(zhǔn)獲取[1]的需求也達到了新的高度,如何實現(xiàn)多維信息的高效精煉獲取已成為當(dāng)前研究的熱點問題之一。
隨著激光測距技術(shù)的發(fā)展與應(yīng)用推廣,融合激光高精度測距信息和CCD影像高分辨率、豐富紋理信息的三維影像生成技術(shù)應(yīng)運而生。三維影像生成技術(shù)的主要步驟在于激光點云與光學(xué)影像的配準(zhǔn)[2]。由于LiDAR點云與影像來自于性質(zhì)完全不同的傳感器,兩類數(shù)據(jù)所反映的地物屬性特征完全不同,這無疑給數(shù)據(jù)的空間配準(zhǔn)帶來了更大的挑戰(zhàn)。國內(nèi)外的研究學(xué)者就此已展開了廣泛研究,目前多采用同平臺搭載、分別利用各自光路系統(tǒng)成像的方式,但其還存在自動化程度不高、處理速度受限、引入偏移誤差等方面的問題。而基于主被動一體化思想的迅捷成像技術(shù)可以解決上述問題,利用兩類傳感器共用光路、采用相同的掃描方式來保證高效匹配,中國科學(xué)院光電研究院在國家863計劃的支持下聯(lián)合技物所等開展激光-光學(xué)共光路相關(guān)技術(shù)研究及工程樣機研制,從而使高時效、高準(zhǔn)度的激光點云與影像匹配成為可能。在此基礎(chǔ)上,迫切需要對處理大數(shù)據(jù)量及復(fù)雜算法的三維影像生成處理平臺進行研究,以滿足高效實時的技術(shù)要求。因此,如何實現(xiàn)處理的實時性要求將是研究及實際應(yīng)用中的一個重要問題。
激光-光學(xué)CCD的三維實時成像必須依托于高性能的處理平臺。目前,實時處理平臺多采用專用集成電路芯片(ASIC)、數(shù)字信號處理器(DSP)、現(xiàn)場可編程門陣列(FPGA)等開展設(shè)計。相對于AISC,F(xiàn)PGA和DSP兼具處理能力強、運算資源豐富、功耗低、靈活性強等特點。而DSP更是憑借其強大運算處理能力[3],可實現(xiàn)復(fù)雜結(jié)構(gòu)的各種算法,兼顧速度、實時性等優(yōu)勢,愈發(fā)突顯出其在數(shù)據(jù)實時處理技術(shù)上的優(yōu)勢,受到研究者們的青睞。
而DSP平臺又可細分為單核DSP、多片單核DSP及多核DSP。其中,單核DSP易受到芯片物理極限、制作成本、處理能力以及功耗、散熱等各方面的制約,采用多片單核DSP又會導(dǎo)致尺寸過大、成本高、I/O數(shù)據(jù)有限、硬件設(shè)計復(fù)雜、處理能力不足等問題[7-8],可見,無論是單片DSP頻率提升還是板上多DSP方案都具有一定的局限性和不利因素的引進[9-10],從而促使DSP逐步向多核、兼容定點和浮點、高內(nèi)核頻率、多位寬等方向發(fā)展。目前,多核DSP正在不斷地應(yīng)用于各種面向高速處理需求的復(fù)雜算法中,如波前復(fù)原、SAR成像、ISAR(Inverse Synthetic Aperture Radar,逆合成孔徑雷達)成像、圖像壓縮編碼等技術(shù)中[4-6]。因此,基于多核DSP的并行方案為實現(xiàn)實際應(yīng)用中的高效實時要求提供了一種有效的解決思路。
本文首先介紹了主被動三維影像生成算法的原理;其次,描述了多核DSP的兩種主流并行模型框架;接著,具體設(shè)計了兩種基于TI C6678多核DSP的三維影像生成并行處理方案,最后,利用構(gòu)建的對比實驗總結(jié)分析兩種主流模型的特性和適應(yīng)情況。
機載環(huán)境下的實時三維成像處理流程圖,如圖1所示。三維成像載荷包含LiDAR與CCD相機兩類傳感器,采用線陣推掃的方式對目標(biāo)進行掃描成像。載荷通過時間同步控制兩者按照固定的頻率比例工作,使得激光掃描行和CCD掃描行在飛行方向上正確對應(yīng)。同時,利用光軸對準(zhǔn)確保激光探元與CCD像元在垂直飛行方向上的正確對應(yīng)。
基于上述成像原理,三維影像生成算法的具體實現(xiàn)流程是:首先將通過采集裝置獲取三類數(shù)據(jù):光學(xué)影像、激光測距數(shù)據(jù)、實時GPS/IMU(Inertial Measurement Unit,慣性測量單元)數(shù)據(jù),通過時間同步處理得到激光雷達以及光學(xué)相機采集時刻的GPS/IMU數(shù)據(jù)。接著,利用靜態(tài)檢校參數(shù)對激光測距誤差進行改正,基于激光雷達成像模型解算激光點三維坐標(biāo)。最后將激光點云與光學(xué)影像融合生成多維影像。其中,主要包含兩大算法模塊:激光點云三維坐標(biāo)解算和快速融合三維成像。
圖1 在軌環(huán)境下的實時多維成像處理流程圖示
采用陣列推掃式機載激光雷達系統(tǒng)建立三維點云解算模塊[1]。該系統(tǒng)的激光陣列排布垂直于飛行方向,發(fā)出的激光脈沖先經(jīng)衍射分光后分為多束射向地面,再通過探測器回收地面反射的回波信號,獲得收發(fā)的時間差,進而求取具有一定幅寬的激光點信息。其中,點云解算指的就是從激光點數(shù)據(jù)到三維空間信息所經(jīng)歷的一系列處理過程的總和。如圖2所示,其具體過程為:將激光掃描坐標(biāo)系下的測距值經(jīng)激光掃描坐標(biāo)系→IMU坐標(biāo)系→導(dǎo)航投影坐標(biāo)系→地心坐標(biāo)系,求出每個激光腳點精確的三維空間坐標(biāo)(,,)。為提高激光點云的精度,在解算的過程中需將聯(lián)合檢校得到的檢校參數(shù)帶入,進行校正處理。
另外,由于掃描過程中會出現(xiàn)誤將低空飛行物當(dāng)作被測目標(biāo)記錄,或受到多路徑誤差或激光測距儀誤差影響等情況,可能導(dǎo)致數(shù)據(jù)中出現(xiàn)粗差,需要在解算中剔除。為保證機上處理速度,在算法中加入基于掃描距離值的快速粗差濾除處理:根據(jù)載荷平臺飛行的相對高度以及掃描視場角,得出測區(qū)內(nèi)可能出現(xiàn)的最大及最小掃描距離值,以此作為閾值,測量值在閾值范圍外的認(rèn)為是粗差,予以濾除。
圖2 點云解算模塊流程圖
利用上述點云解算操作可求得激光點云數(shù)據(jù)。在此基礎(chǔ)上,算法將根據(jù)數(shù)據(jù)攜帶的時間碼信息和像元間對應(yīng)關(guān)系對激光點云和CCD影像進行拼接融合。
其具體實現(xiàn)流程為:先依據(jù)光學(xué)影像采集頻率以及激光雷達系統(tǒng)采集頻率之間的固定關(guān)系,將影像行與激光點云行對應(yīng)上;再依據(jù)影像像點與激光點間的對應(yīng)關(guān)系,得到每個激光三維點所對應(yīng)的影像像點位置,從而完成光學(xué)影像、激光三維點云以及位置姿態(tài)數(shù)據(jù)時間同步。經(jīng)同步對應(yīng)后,部分光學(xué)影像像點具有對應(yīng)的三維坐標(biāo),其他的像點通過已知高程的像元點線性插值得到未知高程的像元點高程;在像方進行融合后,再使用影像的位置姿態(tài)信息及內(nèi)參數(shù),按照共線條件方程解算出其坐標(biāo),從而求得各像點對應(yīng)的大地三維坐標(biāo),并配合對應(yīng)的光譜信息[11],即可生成三維影像??焖偃诤咸幚砹鞒倘鐖D3所示。
相比于單核DSP,多核DSP具有更強的并行處理能力和更優(yōu)化的功耗管理能力[12],因而得到了越來越多的關(guān)注。各主要數(shù)字信號處理器廠商,如Cradle、TI、ADI以及Freescale公司,都相繼推出多核DSP。其中,TI公司的TMS320C6678在內(nèi)核數(shù)、主頻、功耗、運算能力等方面均具有較為突出的優(yōu)勢。
TI公司的C66x系列DSP是定點和浮點混合多核DSP,兼容C64x+和C67x+、C674x系列DSP,其內(nèi)核具有8個功能單元,采用8級流水[13]。其中TMS320C6678是基于Keystone架構(gòu)的多核DSP[14],內(nèi)置8個C66x DSP核,最高工作頻率可達1.4GHz,具有320GMACS的定點處理能力和160GFLOPS的浮點運算能力。它還擁有豐富的片內(nèi)資源,4MB的共享內(nèi)存MSMCSRAM和2GB的DDR3,以及每個核各有32kB的L1P和32kB的L1D,512kB的L2SRAM。整個系統(tǒng)通過TeraNet片內(nèi)互聯(lián),且還擁有SRIO、Hyperlink、千兆網(wǎng)口等多種高速互聯(lián)接口,從而可支持核到核、芯片到芯片和板卡之間的自由通信,便于多片擴展。此外,TI公司還提供了具有任務(wù)調(diào)度、資源管理等功能的SYS/BIOS實時操作系統(tǒng),可大大縮短開發(fā)周期??梢?,C6678能很好地適應(yīng)對低功耗、高性能、可編程性等多方面有嚴(yán)格要求的應(yīng)用環(huán)境,是實現(xiàn)實時處理復(fù)雜算法的最佳選擇。
圖3 快速融合模塊流程圖
主從模型是通過從DSP的多個內(nèi)核中選定一個作為主核負(fù)責(zé)總體控制,再由主核觸發(fā)、控制所有從核的處理計算任務(wù)的工作方式[15],如圖4。主核與從核間的數(shù)據(jù)交換可以由EDMA3、多核導(dǎo)航器等實現(xiàn),主核與從核的內(nèi)核間消息通信可以由內(nèi)核間中斷、IPC消息隊列等方式實現(xiàn)。該模型的特點是從核間相互獨立,不涉及從核間通信,一個內(nèi)核的失敗并不影響其他核的運行,配置靈活,存在負(fù)載均衡、共享資源競爭的問題,控制邏輯設(shè)計復(fù)雜。因此,該模型更適于處理流程算法復(fù)雜、內(nèi)核間數(shù)據(jù)關(guān)聯(lián)少的應(yīng)用情景。
圖4 主從模型的工作方式
數(shù)據(jù)流模型描述了DSP的多個內(nèi)核串行的工作方式,代表著分布式控制與執(zhí)行,如圖5。第一個內(nèi)核連接著系統(tǒng)的輸入部分,內(nèi)核之間的數(shù)據(jù)傳輸可以通過共享內(nèi)存直接存取、EDMA3通道或多核導(dǎo)航器等不同方式來實現(xiàn),核間的同步通信可由內(nèi)核間中斷或IPC消息隊列實現(xiàn)。該模型的特點是無總控概念、所有內(nèi)核承擔(dān)各自處理任務(wù)、核間聯(lián)系緊密,一個核的失敗會導(dǎo)致整體的失敗、采用數(shù)據(jù)觸發(fā)調(diào)度。因此,該模型更適于處理流程算法單一、內(nèi)核間數(shù)據(jù)相關(guān)性大的應(yīng)用情景[16]。
1)整體設(shè)計思路
根據(jù)上述的研究內(nèi)容,三維影像生成主從處理模型的設(shè)計思路是:核0作為主控核,擔(dān)任輸入輸出接口、數(shù)據(jù)分發(fā)、創(chuàng)建共享緩沖區(qū)、系統(tǒng)初始化、創(chuàng)建核間通信的消息隊列空間、同步監(jiān)控從核執(zhí)行任務(wù)的角色;核1~核7作為從核,負(fù)責(zé)接收主核命令并向其反饋當(dāng)前狀態(tài)、執(zhí)行三維影像生成算法的工作。如圖6所示。
2)核間通信策略
核間通信策略包括兩部分的內(nèi)容:消息通信和數(shù)據(jù)搬移。
設(shè)計中采用IPC消息隊列方式來實現(xiàn)消息通信,主要任務(wù)包括主核向從核發(fā)同步消息、執(zhí)行消息、輸出開啟消息、選通從核輸入消息,從核向主核發(fā)送當(dāng)前狀態(tài)消息、處理結(jié)束消息、輸出結(jié)束消息;利用EDMA3方式來實現(xiàn)數(shù)據(jù)搬移,主要任務(wù)包括主核向從核發(fā)送輸入數(shù)據(jù)包、從核向主核發(fā)送輸入數(shù)據(jù)行。
圖5 數(shù)據(jù)流模型的工作方式
圖6 三維影像生成主從模型
這樣的通信組合一方面滿足了復(fù)雜算法模型中對消息負(fù)載定義高靈活性和強適應(yīng)性的要求,另一方面也達到了大量數(shù)據(jù)傳輸?shù)母咝阅繕?biāo)。此外,由于EDMA3采用獨立數(shù)據(jù)通道,則保證了數(shù)據(jù)傳輸過程可幾乎不占用CPU運行時鐘,從而增強了算法處理模型的并行性。后續(xù)的模型核間通信策略中,會繼續(xù)利用這兩個基礎(chǔ)模塊,但各自邏輯通信會根據(jù)模型集中或分散控制特點而采取相對應(yīng)的設(shè)計。
該模型的邏輯設(shè)計重點是設(shè)置從核選通邏輯,利用從核反饋的完成信號選通主控核對該空閑從核的輸入數(shù)據(jù)傳輸,充分利用7個從核處理和輸出耗時的差異錯開不同從核對相同資源的利用時刻,降低輸入時從核對數(shù)據(jù)通道的競爭。
1)整體設(shè)計思路
三維影像生成數(shù)據(jù)流處理模型的設(shè)計思路是:根據(jù)三維影像生成算法特點,將算法劃分為點云解算和快速融合兩大處理模塊。根據(jù)兩個模塊的運算耗時比例情況(3:1),設(shè)置核0~5作為點云解算處理核,承擔(dān)輸入數(shù)據(jù)接口、點云解算處理、中間結(jié)果傳輸給后續(xù)快速融合處理核的任務(wù);核6~核7作為快速融合處理核,負(fù)責(zé)接收點云解算結(jié)果并觸發(fā)后續(xù)快速融合處理、輸出三維影像數(shù)據(jù)接口、并觸發(fā)下次點云解算執(zhí)行的工作。如圖7所示。
2)核間通信策略
不同于主從模型,數(shù)據(jù)流模型中沒有總控的概念,每個內(nèi)核都有其特定的處理任務(wù),是一種通過數(shù)據(jù)觸發(fā)后續(xù)運行的方式,即一旦輸入數(shù)據(jù)量達到該內(nèi)核執(zhí)行運算的要求,就觸發(fā)執(zhí)行該核的處理任務(wù)。可見,數(shù)據(jù)流模型完全發(fā)揮了多核處理器所有的處理能力,但其通信邏輯會分布在各個內(nèi)核中,從而使得整體模型系統(tǒng)邏輯清晰性下降。
該設(shè)計中同樣采用IPC消息隊列方式來實現(xiàn)消息通信任務(wù);利用EDMA3方式來實現(xiàn)數(shù)據(jù)搬移任務(wù)。本模型邏輯設(shè)計的重點在于如何在執(zhí)行并行數(shù)據(jù)操作的同時避免覆蓋已有的有效數(shù)據(jù)。其中,由于快速融合模塊中存在內(nèi)插操作引入了數(shù)據(jù)重復(fù)計算開銷,為避免不必要的資源浪費,2和5內(nèi)核的任務(wù)每次需對應(yīng)完成兩次輸出傳遞。為降低核間相互通信的邏輯復(fù)雜度并減少通信次數(shù),在6和7核之間加入一條通信鏈路:通過兩者的一個通知,簡化2、5核分別通知6、7核產(chǎn)生的四次通信過程,同時也可一定程度上的錯開了6、7核對輸出通道的資源競爭操作。
圖7 三維影像生成數(shù)據(jù)流模型
測試實驗選取10幅影像數(shù)據(jù),具體的采集設(shè)備及輸入數(shù)據(jù)量信息,如表1所示。其實時性檢測標(biāo)準(zhǔn)為低于采集設(shè)備采集周期,即至少低于25ms。
圖8展示了基于多核DSP的機載三維影像生成算法處理結(jié)果。將該結(jié)果與中國科學(xué)院定量遙感信息技術(shù)重點實驗室的地面處理系統(tǒng)標(biāo)準(zhǔn)處理結(jié)果進行對比,可知兩者的誤差不超過小數(shù)點后4位,即不超過毫米級,從而驗證了所開發(fā)并行模型的正確性。
表2展示了相同算法下的單核處理及兩種不同并行模型處理耗時對比情況。由表2中的總耗時對比可知,單核處理耗時較長無法達到實時要求,而兩種并行處理模型均能達到實時性要求,從而說明了針對機載三維影像生成技術(shù)并行處理技術(shù)研究的必要性。其中,主從模型比數(shù)據(jù)流模型表現(xiàn)出了更優(yōu)秀的總體處理性能;但從單純通信消耗的角度來看,則是數(shù)據(jù)流模型消耗更低。
表1 采集設(shè)備參數(shù)及輸入數(shù)據(jù)量列表
圖8 三維影像生成模型的處理結(jié)果展示
表2 相同算法下的不同模型處理耗時對比
下面將結(jié)合兩種并行模型的特點,具體分析上述對比結(jié)果的原因。
主從模型的優(yōu)勢主要在于從核間相互獨立、整體設(shè)計結(jié)構(gòu)明確,運算并行度較高。相比于數(shù)據(jù)流模型具有分布式結(jié)構(gòu)不易管理調(diào)試、對任務(wù)劃分及邏輯設(shè)計的要求高、核間延遲較大的不足之處,主從模型獲得了更優(yōu)越的處理效率。
同時,主從模型也存在著如下缺點:由于采用集中控制方式導(dǎo)致其輸入輸出都存在大量的資源競爭問題;程序設(shè)計中包含大量控制代碼用于實現(xiàn)主控核對從核間的監(jiān)視和管理調(diào)度,從而導(dǎo)致邏輯通信的次數(shù)增加產(chǎn)生冗余。而數(shù)據(jù)流模型具有分散控制,核間的數(shù)據(jù)傳輸直接觸發(fā)后續(xù)任務(wù)執(zhí)行,降低了核間通信的邏輯復(fù)雜度的特點。因此,相比于主從模型中“當(dāng)前核à主控核à目的核”的冗余通信,數(shù)據(jù)流模型中“當(dāng)前核à目的核”的通信方式具有更為簡潔有效的通信邏輯。
此外,從資源利用率的角度分析:三維影像生成主從模型為保證從核間的獨立運行,單個從核內(nèi)包含了具有數(shù)據(jù)相關(guān)性的整體算法,造成單核處理復(fù)雜度增加,從而允許的運算數(shù)據(jù)量減少。而數(shù)據(jù)流模型則充分利用了所有處理核的運算能力,從而擴大了單核運算數(shù)據(jù)量的承載力。因此,數(shù)據(jù)流模型又比主從模型具有更高的資源利用率。
本文采用TMS320C6678多核DSP平臺,分別設(shè)計搭建了三維影像生成算法的主從模型和數(shù)據(jù)流模型。通過對兩者的性能對比,分析總結(jié)了兩種模型的特點,為如何在實際應(yīng)用中合理地利用多核DSP的處理資源提供一種解決思路,也為基于激光雷達-光學(xué)CCD的主被動三維影像實時生成技術(shù)的應(yīng)用發(fā)展奠定了一定的基礎(chǔ)。
[1] 黎荊梅, 周梅, 李傳榮. 陣列推掃式機載激光雷達三維點云解算方法研究[J]. 遙感技術(shù)應(yīng)用, 2013, 28(6): 1033-1038.
LI Jingmei, ZHOU Mei, LI Chuanrong. Research on points position cloud calculation method of airborne linear array push-broom LiDAR[J]., 2013, 28(6): 1033-1038.
[2] 徐勇. 機載激光點云與CCD影像數(shù)據(jù)的融合技術(shù)研究及實現(xiàn)[D]. 廣州: 華南理工大學(xué), 2014.
XU Yong. Research and implementation on fusion of airborne laser point cloud and CCD images[D]. Guangzhou: South China University of Technology, 2014.
[3] 翟小晶, 馬大為, 樂貴高, 等. 基于DSP的火箭炮神經(jīng)網(wǎng)絡(luò)PID位置控制器的設(shè)計[J]. 彈箭與制導(dǎo)學(xué)報, 2013, 33(1): 125-128.
ZHAI Xiaojing, MA Dawei, LE Guigao, et al. The design of Neural PID Position Controller of Rocket Launcher Servo System based on DSP[J]., 2013, 33(1): 125-128.
[4] 王追. 基于多核DSP的實時波前復(fù)原研究[D]. 北京: 中國科學(xué)院大學(xué), 2014.
WANG Zhui. Research of Real-time Wavefront Processing Algorithms based on Multi-core DSP[D]. Beijing: University of Chinese Academy of Sciences, 2014.
[5] 錢宏博. 基于多核DSP的雷達實時成像及JPEG壓縮實現(xiàn)[D]. 西安: 西安電子科技大學(xué), 2014.
QIAN Hongbo. The Realization of Real-time Radar Imaging and JPEG Compression based on Multicore DSP[D]. Xi’an: XiDian University, 2014.
[6] 郭瑞, 張月, 孫剛, 等. 多核DSP上的ISAR實時成像技術(shù)研究[J]. 信號處理, 2013, 9(29): 1238-1243.
GUO Rui, ZHANG Yue, SUN Gang, et al. Research on ISAR Real-time Imaging Technology multicore DSP[J]., 2013, 29(9): 1238-1243.
[7] 李鑫, 姜明. 多核DSP高速實時信號處理系統(tǒng)設(shè)計[J]. 光學(xué)設(shè)計, 2012, 38(1): 116-120.
LI Xin, JIANG Ming. Realization of a real time signal processing system based on multi-core DSP[J]., 2012, 38(1): 116-120.
[8] 孫科林. 基于多核DSP的實時圖像處理平臺研究[D]. 成都: 電子科技大學(xué), 2013.
SUN Kelin. Research on Real-time Image Processing Platform based on multi-core DSP[D]. Chengdu: University of Electronic Science and Technology of China, 2013.
[9] 趙振華, 鄭紅. 嵌入式可重構(gòu)的多DSP圖像并行處理系統(tǒng)[J]. 單片機與嵌入式系統(tǒng)應(yīng)用, 2009(2): 12-15.
ZHAO Zhenhua, ZHENG Hong. Embedded Reconfigurable multi-DSP Image parallel Processing System[J]., 2009(2): 12-15.
[10] Luxin Yan, Tianxu Zhang, Sheng Zhong. A DSP/FPGA -Based Parallel Architecture for Real-time Image Processing[C]//, 2006: 21-23.
[11] 黎荊梅, 周梅, 張正, 等. 三維成像載荷地面快速融合處理方法研究[J]. 科學(xué)技術(shù)與工程, 2015, 15(13): 114-117.
LI Jingmei, ZHOU Mei, ZHANG Zheng, et al. Research on fast fusion of laser point cloud and CCD image acquired by the 3D imaging payload[J]., 2015, 15(13): 114-117.
[12] 繩偉光, 蔣建飛, 何衛(wèi)鋒. 高性能DSP的發(fā)展現(xiàn)狀與未來趨勢[J]. 中國集成電路, 2011(4): 20-25.
SHENG Weiguang, JIANG Jianfei, HE Weifeng. State of the Art and Future Trends of High Performance DSPs[J]., 2011(4): 20-25.
[13] Texas Instruments. TMS320C66x DSP CPU and Instruction Set Reference Guide (Literature Number:SPRUGH7)[EB/OL]. [2017-03-10]. www.ti.com.
[14] Texas Instruments. TMS320C6678 Multicore Fixed and Floating-Point Digital Signal Processor Data Manual[EB/OL]. [2017-03-09]. www.ti.com.
[15] 丁有源, 汪安民. 基于多核任務(wù)并行處理的DSP軟硬件設(shè)計[J]. 單片機與嵌入式系統(tǒng)應(yīng)用, 2012(5): 43-45.
DING Youyuan, WANG Anmin. Software and hardware designs of DSP based on multi-core task parallel processing[J]., 2012(5): 43-45.
[16] 朱才高. 紅外圖像增強算法研究及其DSP實現(xiàn)[D]. 南京: 南京理工大學(xué), 2014.
ZHU Caigao. Research on Infrared Image Enhancement Algorithm and its DSP Implementation[D].Nanjing: Nanjing University of Science & Technology, 2014.
The Parallel Design of Active-passive 3D Image Generation Algorithm Based on C6678
NIU Jingyu1,2,HU Jian2,HE Wenjing2,MENG Fanrong2,LI Chuanrong2
(1. University of Chinese Academy of Sciences, Beijing 100049, China;2. Laboratory of Quantitative Remote Sensing Information Technology, Academy of Opto-Electronics,Chinese Academy of Sciences, Beijing 100094, China)
At present, the question of how to achieve efficient active-passive three-dimensional (3D) image generation technology is a research hotspot in remote sensing applications. The technology involves a large quantityof data and complex processing. In order to fulfillthe high efficiency and real-time requirements of practical applications, this studydevelopedparallel processing technology based on the TMS320C6678 multicoreDSP. The parallel design of the 3D image generation algorithm was carried out based on the two main parallel models(the Master–Slave and Data Flow models). Finally, relying on the measurement and analysis of the development platform, the characteristics and applied scene of those two main models were summarized. These results can provide ideas for the efficient utilization of multicoreDSP in practical applications.
multicore DSP,three-dimensional image generation technology,Master/Slave model,Data Flow model
TP452.1
A
1001-8891(2017)11-0983-07
2017-03-10;
2017-07-05.
牛京玉(1992-),女,河南洛陽,碩士研究生,主要研究方向為嵌入式信號處理。
李傳榮(1972-),男,研究員,博士,主要研究方向為定量遙感。
國家高技術(shù)研究發(fā)展計劃(863計劃)資助項目(2015AA123801);中國科學(xué)院光電研究院創(chuàng)新項目(Y50B12A14Y)。