杜躍飛 陳博偉 劉新杰 張 清 張 麗
(1. 中國科學院 空天信息創(chuàng)新研究院 數(shù)字地球重點實驗室, 北京 100094;2. 海南省地球觀測重點實驗室, 海南 三亞 572000)
采用地物光譜信息實現(xiàn)地物識別與分類是遙感科學的一個重要研究領(lǐng)域[1]。光譜數(shù)據(jù)對遙感物種識別和地表信息具有重大作用,是當前遙感科學與技術(shù)發(fā)展中的重要學科前沿之一[2]。20世紀70年代初期,美國國家航空航天局(National Aeronautics and Space Administration,NASA)建立的地球資源信息系統(tǒng),初步包括了植被、土壤、巖石和水體等波譜數(shù)據(jù)[3]。美國地質(zhì)調(diào)查局建立的SpecLab波譜庫記錄了400多種礦物和17種植被的波譜。還有廣泛應用在商業(yè)軟件中的噴氣推進實驗室(jet propulsion laboratory,JPL)和aster衛(wèi)星傳感器(ASTER)波譜數(shù)據(jù)庫波譜數(shù)據(jù)庫。我國于20世紀60年代就開展了一系列的波譜實地測量和數(shù)據(jù)應用,如出版的《中國地球資源光譜信息匯編》[4]和《中國典型地物波譜及其特征分析》[5]等。目前基于Web的光譜庫采集范圍廣,應用價值較高的有美國地質(zhì)勘探局(United States Geological Survey,USGS)、ASTER、JPL和由NASA贊助構(gòu)建的生態(tài)波譜信息系統(tǒng)、約翰斯·霍普金斯大學(Johns Hopkins University,JHU)波譜庫和聯(lián)合國開發(fā)的用于土地分類的波譜庫。國內(nèi)尚沒有良好規(guī)范的Web波譜庫。
光譜庫對地理信息提取和定量遙感都具有重要作用。梁順林等[6]認為在多源遙感數(shù)據(jù)應用中,先驗地面植被光譜信息的獲取對提高反演精度和穩(wěn)定性都有很好的輔助;劉潔等[7]在全球典型植被光譜對葉面積指數(shù)提取研究中,采用三種通用植被光譜庫和地面實測光譜數(shù)據(jù),探討了不同物種、不同氣候生長狀態(tài)下植被光譜對冠層和葉片反射率對葉面積指數(shù)的影響,在僅考慮植被類型而忽略葉片光譜情況下,會帶來大于3%的誤差。專業(yè)植被波譜庫是基于局部典型地區(qū)植被不同光譜特征構(gòu)建而成,面向特定地區(qū)典型植被群落遙感數(shù)據(jù)的應用[8]。針對新疆荒漠地區(qū),李少鵬等[9]以客戶端/服務(wù)器(client-server,C/S)、系統(tǒng)架構(gòu)和結(jié)構(gòu)化查詢語言(structured query language,SQL)數(shù)據(jù)庫,建立了吐魯番荒漠地區(qū)20余種荒漠植被光譜特征庫,并集成了光譜去噪功能;繆東升[10]用Access數(shù)據(jù)庫,實現(xiàn)了鹽沼地區(qū)典型植被光譜的共享、查詢和分析;針對濕地植被,王兆媛[11]在鄱陽湖濕地植被的監(jiān)測研究中,采用C/S架構(gòu),構(gòu)建鄱陽湖濕地植被光譜數(shù)據(jù)管理系統(tǒng),并通過對植被光譜特征分析、比較和一階導數(shù)處理,證實了系統(tǒng)的可靠性;李金釗等[12]選擇洞庭湖5種濕地植被,對比了不同波段不同植被的光譜差異,通過對光譜做倒數(shù)對數(shù)分析,有效區(qū)分不同植被的生長態(tài)勢;茶葉品種識別主要是通過葉片光譜特征,陳輝煌[13]用實地采集的茶葉冠層和葉片光譜數(shù)據(jù),基于PostgreSQL建立了高光譜數(shù)據(jù)庫應用系統(tǒng),該系統(tǒng)具備數(shù)據(jù)管理、預處理、分析和數(shù)據(jù)共享等優(yōu)點;針對西北特色農(nóng)作物和典型植被反射光譜,張凱等[14]基于瀏覽器/服務(wù)器(browser/server,B/S)結(jié)構(gòu),構(gòu)建了Web版的植被光譜庫,但是不能做光譜數(shù)據(jù)的處理和分析,且植被物種相對較少;HUENI等[15]將單機版波普庫改為通用Web光譜庫收集了15萬余條光譜,完善了設(shè)備采集信息、數(shù)據(jù)配套參數(shù)和植被常見指數(shù)等信息;蘇理宏等[16]探討了網(wǎng)絡(luò)光譜共享中的實地數(shù)據(jù)采集規(guī)范、光譜元數(shù)據(jù)管理、地表參數(shù)的定量轉(zhuǎn)換和定量模型等問題;張瑩彤等[17]探討了國內(nèi)外目前光譜庫波譜覆蓋以光學波段較多,微波波段不足,礦石和農(nóng)作物較多,配套參數(shù)較少,質(zhì)量控制不規(guī)范、數(shù)據(jù)利用率低。
目前專門針對熱帶地區(qū)植被光譜庫的建立和應用研究還相對欠缺,導致高精度的植被分類和反演模型構(gòu)建出現(xiàn)較大誤差。傳統(tǒng)波譜數(shù)據(jù)庫共享力度弱,數(shù)據(jù)管理分散,更新緩慢,波譜配套參數(shù)不規(guī)范,采集數(shù)據(jù)質(zhì)量控制不完善等問題,限制了熱帶植被的研究進展。因此,構(gòu)建熱帶地區(qū)光譜特征成為急需解決的問題。本文通過實地勘查和測量熱帶地區(qū)典型植被冠層和葉片的光譜特征,設(shè)計和研發(fā)基于Web的熱帶植被波譜數(shù)據(jù)庫(tropical vegetation spectral library,TrVSPEL),在一定程度上填補了熱帶Web植被光譜特征庫的空白,對后續(xù)開展熱帶植被特征研究具有重要意義。
文昌市位于海南島東北部,熱帶北緣沿海地帶,地處東經(jīng)108°21′至111°03′,北緯19°20′至20°10′之間,具有熱帶和亞熱帶氣候特點,屬熱帶季風島嶼型氣候,雨量豐富,干、濕季明顯,春旱突出。植被生長茂盛,物種多樣,以椰林為主,各種熱帶植被叢生,包含了絕大多數(shù)熱帶植被。
便攜式地物光譜儀(ASD)FieldSpec 4高分辨率光譜儀可用于非常精確的接觸反射率測量,具備3 nm 可見光近紅外(visible near infrared,VNIR)和8 nm 短波紅外(short-wave infrared,SWIR)光譜分辨率,可在太陽輻照光譜波段(350~2 500 nm)上提供有效的光譜性能。SWIR范圍(1 000~2 500 nm)中增強的光譜分辨率,對于檢測和識別較長波長中具有窄光譜特征的化合物(例如改變礦物學和用于大氣分析的氣體)特別有用。此外,8 nm分辨率可達到或超過大多數(shù)高光譜傳感器的光譜分辨率,這使ASD FieldSpec 4高分辨率光譜輻射儀成為傳感器驗證和校準以及地面校正和建立光譜庫的絕佳選擇。ASD采集參數(shù)如表1所示。
表1 ASD FieldSpec4設(shè)備參數(shù)
數(shù)據(jù)規(guī)范采集是保證光譜庫質(zhì)量的前提。光譜測量對天氣條件要求苛刻,要選擇無云或少云、風力小于3級、測試時間在正午,太陽高度角較大時?,F(xiàn)場采集需要在采集植被前后分別做白板校正,降低傳感器響應系統(tǒng)的漂移和太陽入射角的變化影響。同時記錄采集地點輔助數(shù)據(jù),包括實驗室標定后的白板值、全球衛(wèi)星導航系統(tǒng)(global navigation satellite system,GNSS)接收機坐標值、植被覆蓋度、植被類別、探頭高度和野外相片等信息,保證采集時間元數(shù)據(jù)的完整性。本次實地采集中,每個采樣點對植物冠層不同位置測量5次,每次ASD光譜儀重復觀測次數(shù)為10,每個采樣點能獲得50條數(shù)據(jù),求出平均值,以便去除異常值獲得較精確的實驗數(shù)據(jù)。葉片光譜測量用葉片夾測定植物葉片光譜,每個采樣點的植物測量5次,每次重復觀測次數(shù)為10,每次測量總計50條記錄。實地測量熱帶植被冠層和葉片光譜總計52種采集數(shù)據(jù),記錄方式為遙感影像像元亮度值(digital number,DN值),以保證數(shù)據(jù)的精準和有效性,反射率計算公式為
(1)
式中,ρ為反射率;DN為實際采集值;b為實地白板值;B為實驗室標定白板值。一般反射率ρ在98%以上。
以大葉欖仁為例采集的冠層和葉片光譜反射率曲線如圖1所示,其中由于冠層測量中容易采集到地面導致異常值問題,已被去除。植被反射率在400~700 nm植被吸收強,反射率較低;700~780 nm近紅外波段葉綠素散射強形成高反射率平臺曲線;780~1 350 nm葉片內(nèi)部多次散射形成,在970和1 200 nm有微弱的含水量吸收;1 350~2 500 nm波段葉片水分吸收導致的光譜反射率特征。
圖1 大葉欖仁植被光譜曲線
熱帶植被光譜庫系統(tǒng)采用B/S架構(gòu),架構(gòu)如圖2所示。系統(tǒng)架構(gòu)主要包括:基本的運行時環(huán)境、PostgreSQL數(shù)據(jù)庫、實用分析工具和可視化界面。采用模型-視圖-演示器(model-view-presenter,MVP)模式,實現(xiàn)系統(tǒng)的可擴展性和低耦合,對每個不同用戶級別顯示不同視圖。對遙感數(shù)據(jù)和實地測量數(shù)據(jù),以及模型參數(shù)等,實現(xiàn)可視化檢索和編輯。提供系統(tǒng)二次開發(fā)接口,方便用戶自定義數(shù)據(jù)集和指數(shù)模型,以統(tǒng)一的任務(wù)執(zhí)行界面,顯示當前用戶的執(zhí)行任務(wù),系統(tǒng)滿足可靠性、高擴展性、兼容性和界面友好性。
圖2 系統(tǒng)架構(gòu)
光譜數(shù)據(jù)庫系統(tǒng)需要滿足表格簡單化,可以通過手動輸入和刪除冗余數(shù)據(jù)以及提供自動元數(shù)據(jù)更新。數(shù)據(jù)庫模型滿足第三范式,不包含任何數(shù)據(jù)冗余,支持通過提供用戶輸入光譜數(shù)據(jù)文件和元數(shù)據(jù)文件自動更新表格。采用PostgreSQL數(shù)據(jù)庫,建立項目、波譜文件、測量信息、時空信息、植被科目和環(huán)境狀況等。并在插入光譜數(shù)據(jù)下自動為每個表格中默認建立身份標識號(identity document,ID)作為主鍵和外鍵,如圖3所示表格屬性字段關(guān)系圖。
圖3 數(shù)據(jù)庫結(jié)構(gòu)表
熱帶植被實地高光譜數(shù)據(jù)具有高光譜分辨率和光譜連續(xù)性,能夠提供豐富的植被光譜細節(jié)特征,可為遙感數(shù)據(jù)應用提供更好的細節(jié)。實測光譜數(shù)據(jù)極容易受天氣、光照、白板標定和儀器自身等多種因素的影響,在測量光譜中往往夾帶有噪聲。通過一種植被多次測量,可以提高光譜信噪比,但也需要對數(shù)據(jù)做進一步的校正。因此,可使用分析工具對實地采集光譜數(shù)據(jù)進行預處理,消除光譜噪聲,分離不同植被的光譜差異,提高光譜精度,應用不同光譜曲線的細微差異分離不同植被。分析工具模塊集成了對實地采樣光譜數(shù)據(jù)的平滑處理、去包絡(luò)線、光譜微分和光譜匹配等工具,可對光譜數(shù)據(jù)進行增、刪、改、查,并可在線查看和分析光譜曲線。可根據(jù)需求自定義添加和修改光譜元數(shù)據(jù),元數(shù)據(jù)的更新按照數(shù)據(jù)庫元數(shù)據(jù)規(guī)范要求,實現(xiàn)導入數(shù)據(jù)自動更新。提供為其他采集數(shù)據(jù)者在Web端中對TrVSPEL波譜做驗證分析,保證數(shù)據(jù)完整可靠。
遙感模型是植被光譜庫發(fā)揮價值的具體體現(xiàn)。遙感影像經(jīng)過輻射定標和大氣校正后,通過經(jīng)驗模型或者數(shù)學模型對影像信息分割提取、影像分類、影像增強和區(qū)域生物參數(shù)反演等。模型的構(gòu)建可以大大減少人工對數(shù)據(jù)信息的誤判。而模型的構(gòu)建往往需要提供真實地物光譜數(shù)據(jù)作為高精度模型參數(shù),可以有效提高數(shù)據(jù)信息提取效果。對于植被特征的分析,在影像端選擇光譜并做端元光譜提取,分析工具中集成植被光譜分析模型,提供遙感數(shù)據(jù)與實地光譜數(shù)據(jù)的對比分析和精度驗證。如表2所示,根據(jù)前期研究者得出經(jīng)驗公式和數(shù)據(jù)公式,用于檢驗影像植被指數(shù)和光譜指數(shù)的差異,從而對端元做出改進,提升影像實用價值。
表2 植被指數(shù)
表2中,IGC表示綠色葉綠色指數(shù)(green chlorophyll index, GCI);ρnir表示近紅外波段反射率;ρgreen表示上綠波段反射率;INDV表示歸一化植被指數(shù)(normalized difference vegetation index, NDVI);ρnir、ρred表示近紅外、紅波段反射率;INDI表示歸一化紅外指數(shù)(normalized difference infrared index, NDII);ρ819和ρ1694表示 819和1 694 nm波段反射率;ICRI1表示類胡蘿卜素反射指數(shù)1(carotenoid reflex index 1, CRI1);ρ510和ρ550表示510和550 nm波段反射率;RMRES表示修正的紅邊簡單比率(modified red edge simple ratio, MRESR);ρ445、ρ705和ρ750表示445、705和750 nm波段的反射率;ILA表示葉面積指數(shù)(leaf area index, LAI);REVI表示增強植被指數(shù)(enhanced vegetation index, EVI);RNI表示近紅外波段(nera infrared, NIR);Nred和Nblue表示紅波段和藍波段。
提供光譜和相關(guān)元數(shù)據(jù)的交互式操作,通過指定元數(shù)據(jù)約束來構(gòu)建交互式查詢。光譜冠層數(shù)據(jù)與實地植被顯示效果如圖4所示。植被的光譜曲線可以分為冠層和葉片,與相應的植被同步可視化。相應的也增加光譜元數(shù)據(jù)的統(tǒng)計信息可視化,以及可視化的數(shù)據(jù)選擇功能,可根據(jù)需要選擇不同時間的光譜曲線。
(a)實物
(b)光譜曲線
為驗證實測光譜數(shù)據(jù)對遙感影像的應用價值,以植被精分類為例,以海南文昌市植被種植區(qū)為驗證區(qū)(圖5),中心點位于19.51°N、110.76°E。該種植區(qū)植被種類多樣,有實地人工植被分類數(shù)據(jù),可有效驗證多波段和實地光譜數(shù)據(jù)精分類的有效性。衛(wèi)星數(shù)據(jù)選用WorldView-3數(shù)據(jù),具備8個波段:海岸帶、紅、綠、藍、紅邊和黃等波段,以及兩個近紅外波段,空間分辨率為1.24 m,波長范圍為400~1 040 nm,可以用于驗證TrVSPEL在精分類的實用性。
對WorldView-3影像數(shù)據(jù)做預處理,包括輻射定標、大氣校正,利用全球30 m的數(shù)字高程模型(digital elevation model,DEM)數(shù)據(jù),生成正射影像圖。在eCognition中對數(shù)據(jù)做多尺度閾值分割,以實測光譜數(shù)據(jù)作為參考提取影像端元波譜數(shù)據(jù),最后根據(jù)影像植被光譜差異做分類。
圖5 研究區(qū)WorldView-3影像圖
首先,通過NDVI將研究區(qū)分為植被和非植被,依據(jù)不同波段的波譜曲線差異,再將植被精分類為:大葉相思、抗風桐、欖仁、油欖仁、海芒果、黃瑾和草海桐等植被物種,并將其他地物按照光譜差異性分為人工建筑、水體、草地和其他植被等,分類結(jié)果如圖6所示。對分類結(jié)果采用混淆矩陣做精度檢驗,以地面實測植被類型為準,分類精度達86.5%,Kappa指數(shù)為0.93。相對于商業(yè)軟件中提供的USGS、JPL和ASTER等波譜庫,具有極大的精分類優(yōu)勢。商業(yè)軟件波譜庫對熱帶地區(qū)植被光譜采集,沒有針對性,且其波譜分辨率和波譜連續(xù)性都不能很好滿足精分類要求。經(jīng)過對比實驗,PCI、ENVI等提供的商業(yè)軟件波譜庫僅能將植被和非植被進行分離提取,對植被物種不能做出有效的分類,無法達到預期效果。
圖6 植被精分類
熱帶地區(qū)典型植被光譜庫的構(gòu)建,對植被物種精細分類、葉面積指數(shù)估算、植被覆蓋度等模型建立具有支撐作用,對遙感多波段數(shù)據(jù)的深度信息挖掘具有重大意義。本文建立了Web架構(gòu)的熱帶植被波譜數(shù)據(jù)庫TrVSPEL,其包含了52種熱帶植被冠層和葉片光譜,具有友好的用戶界面和二次開發(fā)接口,可以無縫對接商業(yè)軟件的波譜數(shù)據(jù)交換,提供了植被指數(shù)驗證遙感影像與實地光譜植被分析指數(shù),并且系統(tǒng)平臺可以依靠云計算開展數(shù)據(jù)處理和分析,節(jié)約計算資源和存儲空間。熱帶地區(qū)植被復雜多樣,錯落無序,通用光譜特征庫無法對植被物種做出精細分類,熱帶典型植被光譜庫與高分辨率多波段衛(wèi)星數(shù)據(jù)的結(jié)合,可有效區(qū)分不同植被物種。在后期熱帶光譜庫的更新完善中,將重點發(fā)展基于波譜的知識庫平臺,增加植被光譜種類,完善應用模型,加入人工智能方法,加快遙感大數(shù)據(jù)的挖掘和應用。