李慶波、吳科江,高琦碩
北京航空航天大學(xué)儀器科學(xué)與光電工程學(xué)院、精密光機電一體化技術(shù)教育部重點實驗室、北京 100191
基于光譜信息的空間目標模式識別算法研究
李慶波、吳科江,高琦碩
北京航空航天大學(xué)儀器科學(xué)與光電工程學(xué)院、精密光機電一體化技術(shù)教育部重點實驗室、北京 100191
在觀測空間目標時、往往會受到地基觀測儀器等因素的制約、導(dǎo)致無法利用目標圖像信息從外形上進行識別。根據(jù)不同空間目標表面組成材料不同、其產(chǎn)生的反射光譜會存在差異這一特性、可利用空間目標特有的光譜信息進行識別分類?;诖恕墓庾V學(xué)角度對空間目標識別算法進行研究、在K最近鄰算法(KNN)的基礎(chǔ)上、采用了一種自適應(yīng)權(quán)重局部超平面方法(AWKH)、算法主要在計算預(yù)測樣本與超平面距離時加入對特征權(quán)重的考慮、構(gòu)建了以樣本特征組間差與組內(nèi)差的比值作為特征權(quán)重值的超平面模型、從而提高了分類效果和分類效率。為驗證算法的分類效果、本文進行了四組驗證實驗、第一組實驗將美國地質(zhì)勘探局數(shù)據(jù)庫中提取出的九種常用材料光譜隨機選出三種混合成多類進行識別; 第二、三組實驗將四種常用空間目標材料的光譜作為純物質(zhì)光譜、分別從可見光和近紅外波段對其混合物質(zhì)進行分類; 第四組實驗通過實測四個方形模型樣本六個面的光譜對其進行識別分類。實驗過程中將實驗結(jié)果與目前常用的支持向量機(SVM)進行對比、對比結(jié)果表明改進后的AWKH算法在識別精度和樣本適用范圍上具有更高的優(yōu)越性。
空間目標; 模式識別; 光譜信息; AWKH算法
空間目標在航天領(lǐng)域通常是指在大氣層外繞地球飛行的各種人造飛行器和空間碎片[1]。自從1957年蘇聯(lián)發(fā)射了世界上第1顆人造地球衛(wèi)星以來、發(fā)射進入外層空間的飛行器不斷增加、也制造了大量的空間碎片[2]、成為太空垃圾。這些空間碎片會對在軌飛行器構(gòu)成嚴重的威脅、故而有效識別空間目標對防止碰撞、保證飛行器安全具有重要意義。
對空間目標的觀測主要分為成像觀測和非成像觀測、目前通常采用地基光學(xué)望遠鏡獲取空間目標圖像數(shù)據(jù)、從外形尺寸上進行識別。但是由于受到地基觀測儀器空間分辨率、衍射極限、大氣湍流等因素的限制、空間目標在觀測時往往會成點目標或者占據(jù)極少像元。在這種情況下無法利用圖像從外形上進行目標識別。光譜特征是空間目標的重要光學(xué)特性之一[3-4]。由于不同空間目標表面組成材料不同、其反射光譜曲線存在差異、所以可以根據(jù)空間目標的光譜信息進行模式識別。目標的光譜特性包括其可見光、紅外和紫外特性等、隨著光譜波段的增加、其目標信息越多、目標探測與識別越準確。首先通過模式識別方法對不同空間目標不同角度獲取的光譜數(shù)據(jù)進行模型訓(xùn)練、然后再對實測的未知空間目標光譜進行識別[5-6]。
目前模式識別算法通常包括支持向量機(SVM)[7]、K最近鄰算法、神經(jīng)網(wǎng)絡(luò)方法等機器學(xué)習(xí)方法、支持向量機算法主要是求解存在約束條件的二次規(guī)劃 (quadraticprogramming、QP)問題,對于小規(guī)模的二次優(yōu)化問題、SVM能夠很好的解決、但是隨著樣本復(fù)雜程度增大、就會出現(xiàn)精度下降、效率低下等問題[9]。而KNN算法和支持向量機SVM算法一樣、相較于其他的如貝葉斯、決策樹等分類方法有更好的分類精度、但當(dāng)樣本類別數(shù)增加、復(fù)雜程度增大時、也會出現(xiàn)準確率下降的情況。神經(jīng)網(wǎng)絡(luò)算法[10]特別適用于多因素、不精確的信息處理問題、但也存在著學(xué)習(xí)過程收斂速度慢、訓(xùn)練易陷入癱瘓、訓(xùn)練過程中易陷入局部極小值等問題。因此、針對KNN算法中存在的分類效果以及分類效率不足的問題、本文采用了一種自適應(yīng)權(quán)重局部超平面算法[8](adaptive weight k-local hyperplane,AWKH)、使改進后的AWKH算法在識別精度以及效率上能有顯著提高。
AWKH算法是在K最近鄰算法(K-nearest neighbor algorithm,KNN)上進行改進、在計算預(yù)測樣本與超平面距離時加入對特征權(quán)重的考慮、構(gòu)建了以樣本特征組間差與組內(nèi)差的比值作為特征權(quán)重值的超平面模型、這種特征權(quán)重值的添加克服了KNN算法的不足、提高了分類精度。
AWKH算法的過程如下:首先通過自適應(yīng)最近鄰搜索從訓(xùn)練集中篩選出K個最近鄰樣本。與最近鄰搜索不同、自適應(yīng)最近鄰搜索主要考慮了特征權(quán)重并利用了權(quán)重歐式距離來篩選最近鄰、將最具區(qū)分度的樣本屬性作為篩選的參考主特征。得到最近鄰后、通過這些最近鄰建立一個局部超平面。最后通過樣本與超平面的權(quán)重歐式距離來確定樣本的類別。
假設(shè)一個訓(xùn)練集、包含L個樣本、J個類別。每個樣本包含d個特征、記為:xi(xi1,…,xid)T、其所屬類別為yi=c(i=1,…,L;c=1,…,J)。預(yù)測樣本為向量q=(q1,…,qd)T。(1)計算訓(xùn)練樣本的特征權(quán)重w
計算公式為
(1)
(2)計算預(yù)測樣本q與訓(xùn)練樣本的權(quán)重歐氏距離D
(2)
(3)根據(jù)歐氏距離D、尋找類c樣本中與q最近的nc個訓(xùn)練樣本pc=(pc1,…,pcnc)、根據(jù)訓(xùn)練樣本pc構(gòu)造超平面
(3)
V·i=pci-mc
α=(α1,…,αnc)T
(4) 計算預(yù)測樣本q到類c超平面的最小距離
(4)
W=diag(w1、…、wd)
其中λ是一個用于控制α值可能過大的參數(shù)。
α=(UTV+λInc)/(UT(q-mc))
(5)
其中UT=VTW。
(5) 分類判別:計算預(yù)測樣本q到不同類別的超平面距離、將樣本q判別為距離最小的類別中、即
label(q)=argmincJc(q)
(6)
本文對改進后的AWKH算法共進行了四組仿真實驗、并將每組實驗結(jié)果與目前較為流行的支持向量機(Lib-SVM)進行比對、具體實驗過程如下所述:
第一組仿真實驗:
從美國地質(zhì)勘探局(UnitedStateGeologicalSurvey、簡稱USGS)數(shù)據(jù)庫中選取出9種常用材料的光譜作為純物質(zhì)光譜、其中包括鋁合金、鋁粉漆、有機白漆、二氧化硅等材料的光譜曲線、光譜波段范圍為400~2 000nm、在這9種材料中隨機選擇3種材料線性混合成一組仿真混合光譜、共混合成84類樣本、樣本均疊加信噪比為30db的高斯白噪聲、再將84類樣本抽樣選出3類、4類、7類、10類和15類進行模式識別分類。
第二組仿真實驗:
第二組仿真實驗中、將實驗室測得的四種常用空間目標材料的光譜曲線作為純物質(zhì)光譜、常用材料分別為:有機黃底漆、環(huán)氧鋁粉漆、有機灰漆與有機白漆。將這4種材料中隨機選出2種材料線性混合成一組仿真混合光譜共6類、隨機選出3種材料線性混合成4類、并疊加信噪比為40db的高斯白噪聲、將4和6類混合光譜分別進行模式識別分類、實驗采用美國海洋QE65000科研級光譜儀、光譜儀波段范圍400~900nm、使用LS-1型鹵鎢燈以及QR400-7-VIS-BX型光纖探頭進行實驗。
第三組仿真實驗:
為了驗證AWKH算法多波段的廣泛適用性、第三組實驗將對空間目標材料的近紅外光譜信號進行模式識別。實驗樣本依次為實驗室測得的有機白漆、黃底漆、有機灰漆和鋁粉漆的光譜信號。實驗仍將這4種材料隨機選出3種或2種材料線性混合成一組仿真混合光譜、并疊加信噪比為40db的高斯白噪聲、光譜儀采用瑞典Perten公司的DA7200光譜儀。光譜儀波段范圍950~1 650nm、光譜分辨率2nm。
第四組仿真實驗:
在實驗室制作四個長方體樣品、每個樣品的6個面分別由三種材料按照不同比例混合而成、為了增加分類難度、每兩個樣品中有一種材料相同。使用美國HeadwallPhotonics公司的成像光譜儀HyperspcVNIR-Nseries、波段范圍為400~1 000nm、光譜分辨率為2~3nm、單像素色散值為0.89nm。實驗平臺如圖1所示。
實驗平臺是在一個標準光學(xué)平臺上搭建、在光學(xué)平臺一端設(shè)置標準白板、在標準白板前方設(shè)計一個可以帶動目標模型做三維位移和二維旋轉(zhuǎn)的移動框架。在平臺另一端放置成像光譜儀、在成像光譜儀的下方增設(shè)一個轉(zhuǎn)臺、使成像光譜儀可以對目標進行掃描成像、以便同時獲得目標的光譜信息和圖像信息。放置兩個照明光源用于為目標提供足夠光強的照明??刂乒裼捎嬎銠C和實時控制系統(tǒng)組成、控制系統(tǒng)控制目標模型做相應(yīng)的運動、計算機用于采集成像光譜儀的圖像和光譜數(shù)據(jù)。
圖1 第四組模式識別實驗仿真平臺示意圖
分別采用AWKH算法和Lib-SVM算法對上述仿真實驗數(shù)據(jù)進行模式識別、各組實驗結(jié)果如下:
第一組仿真實驗:
由USGS數(shù)據(jù)庫中的9種常用材料光譜合成仿真數(shù)據(jù)、每條仿真光譜分別由三種材料光譜線性混合而成、將混合的84種類別隨機選出3類、4類、7類、10類和15類進行模式識別分類。每一類建模樣本為100個、預(yù)測樣本50個、對每組進行分類、分別采用課題組提出的AWKH算法和目前較為流行的Lib-SVM算法對其進行識別、將識別正確的樣本個數(shù)除以樣本總數(shù)、得到識別精度。識別結(jié)果如表1所示。
表1 第一組實驗?zāi)J阶R別精度
第二組仿真實驗:
選擇響應(yīng)波長范圍為400~900 nm的光譜信號。共混合成4類、6類進行模式識別、模式識別過程與第一組仿真實驗相同。其中每一類建模樣本為200個、預(yù)測樣本為100個、識別結(jié)果如表2所示。
表2 第二組實驗?zāi)J阶R別精度
第三組仿真實驗:
選擇響應(yīng)波長范圍為900~1 600 nm的近紅外光譜信號、共混合成4類、6類進行模式識別、實驗過程同上。其中每一類建模樣本為200個、預(yù)測樣本為100個、識別結(jié)果如表3所示。
表3 第三組實驗?zāi)J阶R別精度
第四組仿真實驗:
將每個樣品每一個面測得的成像光譜數(shù)據(jù)進行光譜加和平均、獲得一條光譜、圖2所示為第四組實驗中四個樣品6個面的光譜。
由圖2可知、四種樣品的光譜在400~1 000 nm波段范圍光譜形狀相近、肉眼難以分辨、由于樣品個數(shù)限制、實驗只能通過AWKH采用交互驗證方法進行識別。正確率如表4所示。
圖2 四類樣品不同角度的光譜曲線
表4 第四組實驗?zāi)J阶R別精度
通過上述四組實驗可以看出:當(dāng)類別數(shù)較少時、兩種方法模式識別精度均較高、當(dāng)類別數(shù)上升時、Lib-SVM識別精度下降、而AWKH方法仍然保持較高精度、當(dāng)類別數(shù)上升較多超過10類時、兩種方法精度均下降、但是AWKH精度相對較高。
實驗結(jié)果表明、與目前常用的支持向量機(SVM)算法相比、AWKH算法具有更大的優(yōu)越性:
(1)隨著樣本類別數(shù)的增加、SVM表現(xiàn)出其局限性、這是因為隨著類別數(shù)的增多、混合樣本中重復(fù)光譜的比例會增大、使得SVM在建模過程中選擇的“支持向量”代表性降低、模型精度下降。
(2)AWKH在分類過程中、每個樣本都與所有訓(xùn)練樣本進行權(quán)重歐式距離的計算、選擇出與之距離最近的樣本構(gòu)建權(quán)重超平面、通過距離樣本超平面的距離來判定其所屬類別、考慮到了樣本之間的相似度大小、突出了不同類別樣本之間的特征、使得結(jié)果更具有合理性、達到較高的分類精度。
(3)在近紅外波段范圍內(nèi)、模式識別精度大于可見光波段、說明近紅外波段更能反映材料結(jié)構(gòu)信息、材料的光譜特征差異更大、可以進而指導(dǎo)地基觀測儀器的設(shè)計。
綜上所述、AWKH在樣本類別數(shù)少的情況下相較SVM具有更高的精度、在樣本類別較多時也能保持較高的穩(wěn)定性。
采用了一種AWKH算法、對空間目標進行了光譜模式識別仿真實驗研究、通過四組仿真實驗的比對、AWKH算法相比SVM算法具有更高的識別精度和更好的多類別樣本適用性??梢?、用AWKH算法進行空間目標光譜信息的模式識別具有一定可靠性和實用性、而且算法并不局限于空間目標光譜模式識別、對于一般情況下的模式識別也具有適用性。因此、AWKH算法能夠極大提高空間目標光譜模式識別的可行性和精度、算法在模式識別領(lǐng)域具有廣闊的前景。
致謝:感謝中國農(nóng)業(yè)科學(xué)院飼料研究所石冬冬博士和北京航空航天大學(xué)儀器科學(xué)與光電工程學(xué)院屈玉福副教授在實驗環(huán)節(jié)上為本研究提供的支持與幫助。
[1] LI Shao-min,NIU Wei,MA Xin,et al(李少敏,牛 威,馬 鑫,等). National Defense Science & Technology(國防科技),2009,30(3): 6.
[2] SUN Cheng-ming,YUAN Yan,HUANG Feng-zhen,et al(孫成明,袁 艷,黃鋒振,等). Infrared and Laser Engineering(紅外與激光工程),2012,41(3): 563.
[3] Chang C I,Wang S. IEEE Transactions on Geosicence and Remote Sensing,2006,44(6): 1575.
[4] Zong Yingwei,Kevin W Kelly. Proc. of SPIE,2004,5542: 311.
[5] JIN Xiao-long,TANG Yi-jun,SUI Cheng-hua(金小龍,唐軼峻,隋成華). Chinese Journal of Space Science(空間科學(xué)學(xué)報),2014,34(1): 95.
[6] Oz C,Leu M C. Engineering Applications of Artificial Intelligence,2011,24(7): 1204.
[7] DENG Nai-yang,TIAN Ying-jie(鄧乃揚,田英杰). Data Mining: A New Method of Support Vector Machine(數(shù)據(jù)挖掘中的新方法:支持向量機). Beijing: Tsinghua University Press(北京:清華大學(xué)出版社),2006. 58.
[8] Li Qingbo,Gao Qishuo,Zhang Guangjun. Biomedical Optics Express,2014,5(7): 2435.
[9] XU Lu,SHAO Xue-guang(許 祿,邵學(xué)廣). Methods of Chemometrics(化學(xué)計量學(xué)方法). Beijing: Science Press(北京: 科學(xué)出版社),2004. 279.
[10] ZHANG Guo-liang,YANG Chun-ling,WANG Jian-lai(張國亮,楊春玲,王暕來). Journal of Electronics & Information Technology(電子與信息學(xué)報),2014,36(4): 896.
[11] Wei Z,Kelly K W. Optical Science and Technology,the SPIE 49th Annual Meeting. International Society for Optics and Photonics,2004. 311.
Research on Space Target Recognition Algorithm Based on Spectral Information
LI Qing-bo,WU Ke-jiang、GAO Qi-shuo
Key Laboratory of Precision Opto-Mechatronics Technology,Ministry of Education,School of Instrument Science and Opto-Electronics Engineering,Beihang University,Beijing 100191,China
Because of ground observation instruments and other factors,we can not recognize the space target only from the external shape in the image. Since the reflection spectrum of the space target is determined by the surface material of space object,spectral analysis technique can be used for classifying the space objects. Based on the K-nearest neighbor algorithm (KNN),a method called adaptive weight k-local hyperplane (AWKH) is proposed in this paper. The main improvement of the algorithm is that weight discrimination is added in the processes of calculating the hyperplane distance between predicted samples. The algorithm constructs a hyperplane model by using the difference between the groups and within group ratio for the weights of features. In order to verify the classification effectiveness and efficiency of the algorithm,this paper carried out four sets of verification experiments. In the first set of experiments,9 kinds of common materials were extracted from the database of United State Geological Survey. Then 3 kinds of these materials were mixed into multi-class objections. In the second and third sets of experiments,the spectra of four normal space target materials were mixed in different classes. Then these classes were identified from the visible and near-infrared wave bands. In the fourth set of experiments、four square models of hexahedron were classified by the spectra of their surface material. The experimental results indicate that the AWKH algorithm has more advantages in identification accuracy and effectiveness of the complex samples by comparing with the support vector machine (SVM) method.
Space target; Pattern recognition; Spectral information; AWKH algorithm
Jul. 3,2015; accepted Nov. 12,2015)
2015-07-03、
2015-11-12
國家自然科學(xué)基金項目(61575015)資助
李慶波、女、1975年生、北京航空航天大學(xué)儀器科學(xué)與光電工程學(xué)院副教授 e-mail:qbleebuaa@buaa.edu.cn
O657.3
A
10.3964/j.issn.1000-0593(2016)12-4067-05