郭 歌,祝善友*,陳麒合,劉子軒,李濤哲
(1.南京信息工程大學 遙感與測繪工程學院,江蘇 南京 210044)
近幾十年來,許多學者致力于地表溫度[1]降尺度算法的研究,提出了精度高且應用范圍[2-5]廣的方法。Zhan[6-7]等通過遙感地表溫度分解領域的文獻進行整理總結,對地表溫度分解的概念、范式、理論、方法和應用等方面進行了深入探索,并構建了地表溫度降尺度的框架。隨著地表溫度降尺度方法研究與應用的深入,有必要對近些年來地表溫度降尺度領域的發(fā)展進行梳理。文獻計量法把文獻的特征和體系作為研究對象,采用計量方法,研究文獻的變化規(guī)律、分布結構和數(shù)量關系[8]。此方法具有客觀、定量和易于比較的優(yōu)勢,并對科研產(chǎn)出能力等重要指標有著較為直觀的評價,對引導未來地表溫度降尺度相關概念和方法的應用起到了重要作用[9]。本文旨在利用文獻計量法對2005-01~2020-07期間的地表溫度降尺度相關研究進行統(tǒng)計總結。
本次研究使用Web of Science網(wǎng)站與中國期刊全文數(shù)據(jù)庫,檢索發(fā)表日期在2005-01~2020-07期間的地表溫度降尺度領域的中英文論文。在Web of Science網(wǎng)站中,主要對英文論文進行檢索,選擇“所有數(shù)據(jù)庫”,選用LST、downscaling、sharpening、disaggrega?tion等在地表溫度降尺度領域中具有代表性的詞匯,以主題檢索與關鍵詞檢索方式分別各進行了一次檢索。利用中國期刊全文數(shù)據(jù)庫,主要進行中文論文的檢索,選用“地表溫度”、“降尺度”、“銳化”等關鍵詞進行檢索。將上述檢索的結果導出匯總、閱讀所有論文進行第二次篩選,最終得到185篇符合要求的論文,其中包括36篇中文論文和149篇英文論文。
2.1.1 關鍵詞統(tǒng)計與分析
在185篇相關文獻中共出現(xiàn)了613個關鍵詞,圖1給出了其中出現(xiàn)次數(shù)大于3次的關鍵詞。其中,“remote sensing”作為學科關鍵詞出現(xiàn)最多,高達97次,“Disaggregation”和“downscaling”作為與降尺度相關的關鍵詞分別出現(xiàn)了42次與38次,是地表溫度降尺度領域的常用術語,“MODIS”和“ASTER”等傳感器作為關鍵詞也出現(xiàn)了較多次數(shù)?!暗乇頊囟取眲t是中文文獻中出現(xiàn)最多的關鍵詞,出現(xiàn)次數(shù)為30次,“降尺度”則是中文文獻中與降尺度相關的關鍵詞。值得注意的是,“urban heat island”、“heat island”出現(xiàn)次數(shù)分別為22、11次,這說明城市熱島效應是地表溫度降尺度的重要應用領域[10-12],引起了眾多熱紅外遙感領域?qū)W者的關注。
圖1 關鍵詞詞頻統(tǒng)計
圖2是地表溫度降尺度常用術語在文獻中的使用次數(shù),通過統(tǒng)計可以發(fā)現(xiàn),在地表溫度降尺度領域,分解(disaggregation)、降尺度(downscaling)、銳化(sharpening)、融合(fusion)和空間增強(spatial en?hancement)等都可以作為關鍵詞來檢索相關文獻。
圖2 不同降尺度術語的使用次數(shù)
2.1.2 文獻數(shù)量變化
2005-01~2020-07期間共發(fā)表了相關中文和英文文獻共185篇,其中中文文獻36篇,英文文獻149篇。每年文獻發(fā)表數(shù)量保持波動上升趨勢,2005—2019年中,共有173篇文獻發(fā)表,年平均文獻發(fā)表數(shù)量為11.53,其中文獻發(fā)表數(shù)量最多的年份為2019年,共有23篇論文發(fā)表。
從被引次數(shù)上看(如圖3),在2005—2019年中,173篇文獻總被引次數(shù)為4 119,每年平均被引次數(shù)為274.6,篇均被引次數(shù)為23.81。每年論文被引次數(shù)波動較大,2005—2013年的被引次數(shù)呈波動上升趨勢,2013年被引次數(shù)最多,為603次,年篇平均被引次數(shù)為30.15。2013年之后,每年被引次數(shù)呈下降趨勢。截至2020年7月底,2020年共有12篇論文發(fā)表,被引次數(shù)為4次。
圖3 相關論文發(fā)文數(shù)量與被引次數(shù)
2.1.3 論文發(fā)表的主要期刊
在本次統(tǒng)計中,論文分別發(fā)表在73個期刊(或會議)上,包括56個英文期刊以及17個中文期刊(表1)。絕大多數(shù)文章都發(fā)表在遙感專業(yè)的期刊上,國外期刊如《Remote Sensing of Environment》、《Remote Sensing》、《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》等,國內(nèi)期刊如《遙感技術與應用》、《國土資源遙感》、《遙感信息》等。從發(fā)表數(shù)量來看,發(fā)文量排名前十的期刊共發(fā)表論文95篇,占總發(fā)表數(shù)量的51.35%,其中《Re?mote Sensing of Environment》發(fā)表相關論文數(shù)量最多,共22篇,占總論文數(shù)量的11.89%。從被引次數(shù)來看,發(fā)文量排名前十的期刊共被引3 273次,占2005—2020年總被引次數(shù)的79.38%,其中《Remote Sensing of Environment》上發(fā)表的論文被引次數(shù)最多,為1 158篇,占總被引次數(shù)的44.12%。
表1 不同期刊發(fā)表相關論文數(shù)量排名
在中文期刊中,發(fā)文量最多的是《遙感技術與應用》,共發(fā)表4篇論文,占總發(fā)表總數(shù)量的2.16%,被引次數(shù)為21次,占總被引次數(shù)的0.51%;被引次數(shù)最多的是《遙感學報》,共發(fā)表2篇論文,占總發(fā)表數(shù)量的1.08%,被引次數(shù)為45,占總被引次數(shù)的1.09%。從統(tǒng)計結果來看,發(fā)文量排在前十名的期刊均為英文期刊,其中有8個期刊為遙感領域的專業(yè)期刊,而中文期刊發(fā)文數(shù)量相對較少。
2.1.4 發(fā)表論文的主要研究機構
由于世界范圍內(nèi)在本領域發(fā)表論文的研究機構數(shù)量龐大,本文僅統(tǒng)計國內(nèi)的研究機構(表2)。發(fā)表論文數(shù)量排名前10的單位均至少發(fā)表了5篇論文,其中發(fā)表論文數(shù)量最多的是中國科學院,共發(fā)表32篇論文,占論文總數(shù)的16.76%,32篇論文共被引338次,占全部被引次數(shù)的8.20%。
表2 國內(nèi)相關論文高產(chǎn)機構
表3 被引次數(shù)最多的10篇論文
2.1.5 高影響力論文
表3給出了被引次數(shù)最多的10篇論文,全部為英文文獻,共被引1 420次,占所有論文總被引次數(shù)的34.44%,其中被引次數(shù)最多的是Agam等,于2007年在《Remote Sensing of Environment》上發(fā)表的《Aveg?etation index based technique for spatial sharpening of thermal imagery》,被引226次,其采用的降尺度方法是TsHARP。
被引次數(shù)排名前十的論文全部于2014年及以前發(fā)表,涵蓋了地表溫度降尺度主要流行的幾種研究方法,其中也不乏我國學者的參與。在中文文獻中,被引次數(shù)最多的是聶建亮等于2011年在《生態(tài)學報》上發(fā)表的《基于地表溫度-植被指數(shù)關系的地表溫度降尺度方法研究》,被引次數(shù)為34。
2.2.1 研究區(qū)域
本次統(tǒng)計的文獻所選用的研究區(qū)域的地表類型大致可分為三類:①非均一地表:如發(fā)達城市及其周邊郊區(qū),例如中國北京、南京、上海在文獻中多次被選作研究區(qū)域,這是因為這些發(fā)達城市經(jīng)濟繁榮,人口眾多,城市熱島效應問題較為突出、地表類型豐富且具有高度的異質(zhì)性,這對驗證研究方法的適用性有很大的幫助;②均一地表:如農(nóng)田、荒漠、水體等,其中有10余篇文獻選擇我國黑河中游的張掖地區(qū)作為研究區(qū)域,這是因為該區(qū)域有很多種植地,建筑物較少且該區(qū)域包含較多研究測試站點;③同時包含非均一地表和均一地表的研究區(qū)。
2.2.2 研究常用的傳感器
在本次統(tǒng)計的186篇地表溫度降尺度相關的中英文文獻中,共出現(xiàn)了39種不同的傳感器(圖4)。研究中MODIS的使用次數(shù)最多,有95篇文獻使用了MO?DIS傳感器數(shù)據(jù),有許多文獻選擇對MODIS數(shù)據(jù)進行降尺度,主要是因為MODIS數(shù)據(jù)可免費獲取、更新頻率相對高且有可直接使用的地表溫度、植被指數(shù)等產(chǎn)品。ASTER以51篇文獻的采用量排第二,ASTER數(shù)據(jù)的特點之一是可以根據(jù)用戶的需求來隨時隨地地獲取數(shù)據(jù)、空間分辨率較高(90 m)且也有地表溫度產(chǎn)品,多被用于驗證降尺度方法的精度。TIRS、TM、ETM+作為Landsat衛(wèi)星系列搭載的傳感器,為遙感用戶提供了可供長期、連續(xù)觀測的熱紅外遙感圖像,其空間分辨率較高、可免費獲取且其地表溫度反演算法相對較為成熟[13-15],也經(jīng)常被用于地表溫度降尺度研究中。
圖4 地表溫度降尺度研究常用的傳感器
在地表溫度降尺度發(fā)展的10 a來,涌現(xiàn)出了許多不同的研究方法,這些方法大致可分為兩類:基于尺度因子的降尺度方法和基于圖像融合的降尺度方法[16]。其中基于尺度因子的方法又可分為三類:統(tǒng)計回歸方法、基于調(diào)制分配方法以及基于線性光譜混合方法。近年來,隨著機器學習算法及其應用領域擴展,基于機器學習的地表溫度降尺度研究越來越多[17]。各類方法所占比如圖5所示。
圖5 地表溫度降尺度領域文獻研究方法統(tǒng)計
基于尺度因子研究地表溫度降尺度方法的文獻占比55%(圖5),其中統(tǒng)計回歸降尺度方法占比43%,是使用最多的方法。統(tǒng)計回歸方法,假定“關系尺度不變”,將低分辨率地表溫度與回歸核的統(tǒng)計關系應用到高分辨率上。Kustas[18]等根據(jù)地表溫度與歸一化差異植被指數(shù)(normalized difference vegetation index)在不同尺度之間存在統(tǒng)計回歸關系一致的前提,提出了Dis?Trad(disaggregation procedure for radiometric surface temperature)降尺度方法,該方法首次以植被指數(shù)作為回歸核,應用于地表溫度降尺度領域。LST-NDVI關系對于各種土地覆蓋情況并非唯一,因此,要進行精確度更高的降尺度,需要增加其他信息,如土地覆蓋類型、綠色植被比例、發(fā)射率或地表反照率等。2007年Agam[19]在Distrad算法的基礎上提出了改進的TsHARP(An algorithm for sharpening thermal imagery)模型,該方法以植被覆蓋率為回歸核,并被證明有最優(yōu)的降尺度效果,之后被廣泛應用于地表溫度降尺度領域。文獻被引頻次在一定程度上可以反映文獻的影響力與同行的認可度,在基于尺度因子的研究中被引量最高的分別是文獻[17]和[19],被引次數(shù)分別為352和226次(表4)。由于地表類型的多元化,多種地表參數(shù)被用于降尺度的研究,回歸核也由一個變?yōu)?個甚至多個。在DisTrad和TsHARP算法的基礎上,Dominguesz[20]等提出了能更好適用于城市地區(qū)的HUTS算法,利用地表溫度與NDVI和地表反照率二元四次多項式關系的尺度不變性對地表溫度進行降尺度;Duan[21]等提出了一種基于地理加權回歸(GWR)的全新降尺度算法,將MODIS地表溫度從990 m降至90 m,統(tǒng)計結果表明這種基于GWR的算法優(yōu)于TsHARP算法。
表4 基于統(tǒng)計回歸降尺度方法的文獻被引量排名
基于調(diào)制分配的方法以及基于線性光譜混合的方法的文章占比分別為2%、10%?;谡{(diào)制分配的地表溫度降尺度方法的核心思想是依據(jù)可見光波段的影像和其他高分辨率參數(shù),將大尺度上的地表溫度按照某種權重分配至像元內(nèi)部。該方法概念直接、應用便捷,但在地表溫度降尺度應用較少?;诠庾V混合模型的方法是根據(jù)線性光譜混合模型,建立低空間分辨率和高空間分辨率LST之間的直接關系,從而實現(xiàn)溫度降尺度,該方法是對圖像機理的描述,具有明顯的物理意義[22]。此類方法被引量最高的三篇文獻分別是文獻[23]、[24]、[25],被引次數(shù)分別為109、98、66次。值得注意的是,研究此類方法的學者提出了一些適用于城市異質(zhì)性較高區(qū)域的方法,這對城市熱島研究具有重要作用。Deng[23]等考慮不同土地覆被成分的熱特性不同,提出了光譜分解模型和熱混合(SUTM)模型,研究典型土地覆被成分對城市熱格局的影響。Liu[25]等利用光譜混合分析法(SMA)獲取到了城市土地成分豐度,并通過對高光譜影像中各個組分的線性解混結果得到了高空間分辨率的城市地表溫度。Zhu[26]等采用逐步回歸分析方法對上海市地表溫度進行了降尺度實驗,并對比了DisTrad、TsHARP和PCA分解方法,驗證了此方法在城市區(qū)域的優(yōu)越性。
一部分學者從圖像融合的角度進行地表溫度降尺度,此類方法的占比為17%。學者們分別提出了GS(gram-Schmidt)方法、GLP(generalized laplacian pyr?amid)方法[27]、貝葉斯[28]方法、協(xié)-克里金差值[29-30]方法。特別是Gao[31]等首次提出了一種新的空間和時間序列自適應反射融合模型(STARFM)算法后,許多學者致力于此方法的改進,如提出了時空自適應數(shù)據(jù)融合算法(SADFAT)[32]、時空自適應映射反射率變化算法(STAARCH)[33]、增強的時空自適應反射融合模型(ESTARFM)[34]等,并將其用于地表溫度降尺度研究領域。
基于機器學習的地表溫度降尺度方法的研究所占比例位列第二,并且近年來相關研究呈現(xiàn)上升趨勢。機器學習是人工智能的核心研究領域之一,其研究主旨是使用計算機模擬人類的學習活動,它是研究計算機識別現(xiàn)有知識、獲取新知識、不斷改善性能和實現(xiàn)自身完善的方法。統(tǒng)計回歸方法中的簡單因子、多因子回歸關系并不能完全描述不同尺度因子與LST之間的非線性復雜關系。在物理機制尚不完全清楚的前提下,使用機器學習方法構建降尺度模型是較好的選擇。經(jīng)典的算法包括決策樹算法、隨機森林算法、人工神經(jīng)網(wǎng)絡算法、支持向量機(SVM,support vector machine)法、EM算法等。被引量最高的文獻分別是文獻[35]、[36]、[37],被引次數(shù)分別為93、82、64次。文獻[38]、[39]分別采用GA-SOFM神經(jīng)網(wǎng)絡、遺傳算法和自組織特征映射人工神經(jīng)網(wǎng)絡(GA-SOFM-ANN),并利用多種地表參量進行地表溫度降尺度。Gao[40]等提出了一種數(shù)據(jù)挖掘銳化方法(DMS,data mining sharpener),通過回歸樹方法將熱紅外溫度與一組短波光譜反射直接關聯(lián)起來,實現(xiàn)地表溫度降尺度目的[36]。值得注意的是,Vohland[35]等首次將隨機森林(random forest)模型利用在地表溫度降尺度研究上,并得到了許多學者的關注。
通過對近15 a的文獻進行統(tǒng)計,降尺度結果精度評估與驗證的方法大致分為4類:①交叉驗證:與其他高分辨率熱紅外傳感器反演的地表溫度對比或與已被驗證可靠性的降尺度方法結果進行對比驗證;②地面點驗證:利用熱紅外遙感基礎理論,將地表實測氣溫數(shù)據(jù)或紅外輻射溫度觀測數(shù)據(jù)等轉(zhuǎn)化為地表溫度數(shù)據(jù)作為真實地表溫度,或者直接采用站點實測地表溫度數(shù)據(jù),將其與降尺度后圖像進行對比;③采用聚合-銳化思路:先將原圖像聚合成低分辨率圖像,再將其進行降尺度,并與原始空間分辨率的地表溫度圖像進行對比;④模擬數(shù)據(jù)驗證:模擬一組高分辨率地表溫度數(shù)據(jù),并假定溫度、地物、反射率等,再將其聚合為低分辨率圖像,然后將其進行降尺度并與原模擬數(shù)據(jù)進行對比。這4種不同的驗證方法各有利弊。交叉驗證方法并未考慮不同傳感器之間響應的差異,直接用高分辨率傳感器反演的溫度作為真實數(shù)據(jù)來驗證降尺度方法的精度會帶來一定的誤差;利用地面點數(shù)據(jù)驗證精度的方法,在區(qū)域的選擇上依賴于觀測站的分布;先聚合后銳化的方法在聚合過程中會帶來誤差;模擬數(shù)據(jù)驗證是理想化的情況,而實際上地表溫度受多種因素的影響。由此可見,如何選擇驗證方法,有待進一步開展深入研究。
在精度評估指標方面,本次統(tǒng)計的中英文文獻中共使用了57種精度評定指標,典型評定指標的使用頻次見圖6。
圖6 降尺度結果評估指標
本次研究基于文獻計量法對近15 a的遙感地表溫度降尺度領域的論文進行了梳理,可以清晰直觀地看到這個領域的發(fā)展狀況。自2005年以來,該領域的發(fā)文數(shù)量呈逐年波動上升趨勢,地表溫度降尺度研究在不斷發(fā)展,吸引了越來越多學者的注意。但自2013年起,每年的論文被引次數(shù)呈逐年下降趨勢,其原因可能是近年來大多數(shù)研究都著眼于對原有方法的改進與融合,突破原有方法框架的地表溫度降尺度原創(chuàng)性方法較少。
在地表溫度降尺度領域,統(tǒng)計回歸方法占據(jù)主流地位,其中包括應用最廣的DisTrad和TsHARP算法。隨著計算機技術的不斷發(fā)展,基于機器學習的降尺度方法發(fā)展較快,在未來幾年里可能會成為遙感地表溫度降尺度的新發(fā)展方向。
地表溫度降尺度領域的術語較多,本文在選擇相關關鍵詞時具有一定的主觀性,因而在檢索文獻的時候可能存在遺漏的現(xiàn)象。其次,被引次數(shù)可能不夠精確,在被引頻次的統(tǒng)計過程中,中文文獻被引次數(shù)主要參考了中國知網(wǎng)和萬方數(shù)據(jù)的被引頻次,英文文獻參考web of science的被引頻次,這使得被引次數(shù)的統(tǒng)計存在一定的誤差。