劉 坤,畢 楊
(西安航空學(xué)院,陜西 西安 710077)
隱式信息場是自然界中普遍存在的一種信息源,其場特征的參數(shù)分布與地理坐標(biāo)之間具有顯著的非線性映射關(guān)系,同時受觀測能力的限制,無法獲得未到達(dá)鄰域的場特征[1-2]。這就為隱式信息場的開發(fā)和利用帶來困難,如地磁導(dǎo)航、氣味尋源等[3-5]。在現(xiàn)代工業(yè)環(huán)境中也存在類似的場景,如在核泄露環(huán)境中開展對核泄露源的尋找;指紋定位應(yīng)用中對故障指紋源的反向定位等。
目前對于隱式信息場的尋源問題,主要以基于路徑規(guī)劃的搜索方法和基于數(shù)據(jù)驅(qū)動的搜索方法為代表。
基于路徑規(guī)劃的搜索方法[6-7]是指載體通過執(zhí)行特定路線,開展對目標(biāo)源的搜索,典型方式有遍歷搜索、Z 字型搜索等。該方法不區(qū)分信息源的類型,具有一定的普適性。這一類算法可以通過對路徑的優(yōu)化,以及探測能力的拓展,在一定程度內(nèi)提升搜索效率。然而,該方法的缺陷在于尋源耗時與搜索空間呈指數(shù)關(guān)系,在大場景應(yīng)用背景下,尋源耗時將是難以被接受的。
基于數(shù)據(jù)驅(qū)動的搜索方法[8-10]是指從獲得數(shù)據(jù)和利用數(shù)據(jù)角度開展尋源方法的研究。在獲得數(shù)據(jù)方面,以多個體編隊協(xié)同搜索為代表,增強(qiáng)了對隱式信息場環(huán)境特征的測量能力,可獲得更多的數(shù)據(jù),然而該方法容易因信息冗余或沖突導(dǎo)致尋源失敗。在利用數(shù)據(jù)方面,以概率預(yù)測搜索為代表,以歷史實(shí)測數(shù)據(jù)為基礎(chǔ),采用一定的概率模型預(yù)測目標(biāo)點(diǎn)所在方位,在隨后的搜索中不斷調(diào)整預(yù)測的結(jié)果,進(jìn)而引導(dǎo)載體實(shí)現(xiàn)尋源,然而該方法容易陷入局部極小。
本文受生物尋源行為的啟發(fā),從自主搜索的角度提出了一種基于動態(tài)均衡策略的尋源方法。首先,借助多目標(biāo)優(yōu)化理論,將載體運(yùn)動與尋源搜索相結(jié)合,建立隱式信息場尋源模型;然后,從搜索行為的偏向性角度出發(fā),設(shè)計了一種動態(tài)均衡的搜索策略,并給出搜索算法;最后,以地磁場為隱式信息場的代表,開展尋源仿真驗(yàn)證,其仿真結(jié)果證實(shí)了算法的有效性和合理性。
不失一般性,記E為隱式信息場特征集,由n個參量e1,e2,…,en組成;P代表空間位置,P與E之間具有一一對應(yīng)的映射關(guān)系。而在隱式信息場中,這一映射關(guān)系不明確,且難以利用有限的已歷信息準(zhǔn)確地建立映射模型。
從仿生學(xué)角度看,尋源過程表現(xiàn)為個體對在任意位置出發(fā),用實(shí)測數(shù)據(jù)結(jié)合自主搜索向目標(biāo)信息源特征ET搜索收斂的過程。
考慮在二維平面內(nèi),視移動載體為質(zhì)點(diǎn),則載體的運(yùn)動學(xué)方程可描述如下:
式中:Pk= (xk,yk)表示k時刻載體所處位置;u為運(yùn)動參數(shù),由步長L和運(yùn)動方向θ組成。
借助多目標(biāo)優(yōu)化理論,可將隱式信息尋源問題歸結(jié)為在無先驗(yàn)數(shù)據(jù)庫的條件下,多種環(huán)境參量向目標(biāo)環(huán)境參量搜索收斂的過程,如下所示:
式中:k表示時刻信息;目標(biāo)函數(shù)F為k時刻實(shí)測環(huán)境特征Ek與目標(biāo)環(huán)境特征ET的差異;G為搜索行為約束函數(shù),由環(huán)境參量E、搜索行為u以及時刻信息k構(gòu)成。
因此,隱式信息場尋源問題歸結(jié)為在函數(shù)F未知條件下,通過對載體搜索行為u的求解,使載體到達(dá)源目標(biāo)點(diǎn)的問題。需要強(qiáng)調(diào),本文中不開展函數(shù)F具體形式如何建立的研究,假定函數(shù)F為未知的。
探索與開發(fā)是搜索優(yōu)化過程中的兩種基本策略,其中,探索是指在搜索過程中從廣度層面上以獲取目標(biāo)函數(shù)信息為目的的搜索策略;開發(fā)則是指以探索獲得的函數(shù)信息為基礎(chǔ),在深度層面上以尋找最優(yōu)解為目的的搜索策略。
探索與開發(fā)在搜索中的偏向如圖1 所示。
圖1 探索與開發(fā)在搜索中的偏向
以自然界中動物尋源為例,動物通過對未知環(huán)境的探索和歷史信息的開發(fā),搜索尋源路徑,并引導(dǎo)個體完成尋源任務(wù)。其尋源過程可以描述如下:起始階段,動物通過自身運(yùn)動探索環(huán)境,獲取特征的分布信息,以彌補(bǔ)對環(huán)境認(rèn)知的不足;而后,利用已獲取的信息搜索尋源路徑,并響應(yīng)環(huán)境特征分布情況的變化,搜索行為的偏向維持在探索與開發(fā)間的均衡狀態(tài),以期獲取最大化收益(此處,收益包括對環(huán)境認(rèn)知的信息收益和對目標(biāo)點(diǎn)收斂的優(yōu)化收益),進(jìn)而引導(dǎo)個體到達(dá)目標(biāo)點(diǎn)。
從仿生學(xué)角度看,在隱式信息場內(nèi),由于缺少先驗(yàn)數(shù)據(jù)庫的參照,尋源行為表現(xiàn)出對環(huán)境的探索和對已歷信息的利用,并以目標(biāo)處信息源的特征參量為收斂目標(biāo)開展的自主搜索行為?;诖?,本文提出一種動態(tài)均衡策略(Dynamic Balancing Strategy, DBS),以對環(huán)境信息的探索與開發(fā)為核心,圍繞信息收益和優(yōu)化收益的動態(tài)平衡,結(jié)合搜索的不同階段開展均衡搜索。搜索初期,通過隨機(jī)性漫游探索環(huán)境信息,逐漸形成趨勢性運(yùn)動;尋源階段,以收益最大化為目的,搜索偏向在探索與開發(fā)之間的動態(tài)調(diào)整。
依據(jù)2.1 節(jié)內(nèi)容,本小節(jié)給出具體的尋源算法。首先,以進(jìn)化算法為原型,設(shè)計尋源搜索行為;而后,引入行為熵的概念,度量搜索偏向性;最后,給出DBS 尋源算法。
1)基于進(jìn)化算法的搜索行為設(shè)計
進(jìn)化算法是模擬自然進(jìn)化規(guī)律而產(chǎn)生的一種隨機(jī)性搜索方法,以試錯為檢驗(yàn)方法,將得到的環(huán)境信息轉(zhuǎn)化為種群中樣本的分布概率。這種搜索方法具有明顯的后驗(yàn)特征,符合隱式信息場尋源的搜索特點(diǎn)。然而,進(jìn)化算法屬于并行搜索算法,在單個體進(jìn)行尋源任務(wù)中難以直接使用,為此本文結(jié)合載體的移動搜索對進(jìn)化算法進(jìn)行了改進(jìn)。
尋源過程依賴于載體移動,其搜索行為可由運(yùn)動參數(shù)u表征。進(jìn)化算法的思想是以可行性搜索行為為進(jìn)化種群的樣本構(gòu)建進(jìn)化種群。其中,第j個樣本個體可表示為:
式中:R∈[ 1,…,2πDθ]為隨機(jī)數(shù),Dθ為搜索空間壓縮比;Npop表示種群規(guī)模,通常取Npop>2πDθ。
載體對目標(biāo)環(huán)境特征的尋源依賴于空間的移動,多目標(biāo)搜索與尋源空間移動具有如圖2 所示的時序特征。
圖2 尋源搜索原理示意圖
結(jié)合圖2,可將尋源過程描述為:k時刻從進(jìn)化種群pop:Qk中等概率選取某一樣本作為載體的運(yùn)動參數(shù),通過執(zhí)行載體將獲得Lk的運(yùn)動位移。
將實(shí)測位移前后隱式信息場特征參量集合Ek和Ek+1代入式(2)中進(jìn)行多目標(biāo)解算,得到多目標(biāo)函數(shù)F。
依據(jù)多目標(biāo)函數(shù)F的收斂狀態(tài)對被執(zhí)行樣本進(jìn)行尋源性能評估,采用繁殖或淘汰操作,增加或降低該類樣本的存在比例。通過變異操作提升種群多樣性,得到新的種群pop:Qk+1,重新進(jìn)入下輪搜索過程。通過反復(fù)迭代,最終使得多目標(biāo)函數(shù)收斂至最小,實(shí)現(xiàn)尋源任務(wù)。
2)搜索偏向度量
在尋源過程中,搜索行為的偏向可由進(jìn)化種群的多樣性度量。種群的多樣性越高,意味著種群中樣本分布越分散,導(dǎo)致搜索行為的隨機(jī)性越大,此刻搜索行為偏向于探索;種群的多樣性越低,意味著種群中樣本分布越集中,導(dǎo)致搜索行為的隨機(jī)性越小,此刻搜索行為偏向于開發(fā)。為了度量種群的多樣性,此處引入分布熵的概念。
定義1分布熵:樣本種類為N類,樣本個體可表示為C1,C2,…,CN。群體進(jìn)化的某時刻,樣本個體在群體中的比例分別為p1,p2,…,pN,滿足=1,則 分 布熵為:
分布熵在分布空間內(nèi)具有非負(fù)性、對稱性和可加性,是一個嚴(yán)格凹函數(shù)。當(dāng)各類樣本均勻分布p1=p2=… =pN=1/N時,H具有唯一最大值;當(dāng)某一類個體占據(jù)了群體絕大部分時,即p1→1,pi→0(?i>1),有:
此時分布熵最低。
分布熵量化了種群的多樣性,反映了種群的搜索偏向。熵值越大,種群的全局探索行為越強(qiáng);熵值越小,種群的局部開發(fā)能力越強(qiáng)。
3)動態(tài)均衡搜索算法設(shè)計
在搜索過程中,進(jìn)化種群的分布熵過大或過小,均不利于對尋源路徑的跟蹤。為此,結(jié)合進(jìn)化算法的結(jié)構(gòu)特點(diǎn)與尋源路徑的分布特征,給出均衡搜索策略的具體算法。
將尋源過程分為三個階段,如圖3 所示。
圖3 動態(tài)均衡搜索策略時序圖
第一階段:尋源初始階段,搜索行為以探索為主,在時刻k大于2 倍的種群樣本種類后,將進(jìn)入尋源階段;
第二階段:尋源搜索階段,搜索行為在探索與開發(fā)間動態(tài)變化,當(dāng)分布熵H小于等于最高門限熵Hhigh-th時,尋源進(jìn)入以開發(fā)為主的搜索過程,避免過多的隨機(jī)運(yùn)動導(dǎo)致尋源失敗;當(dāng)分布熵H大于等于最低門限熵Hlow-th時,尋源進(jìn)入以探索為主的搜索過程,避免種群多樣性過低,而導(dǎo)致的種群早熟問題出現(xiàn);其余時間內(nèi),載體依據(jù)種群進(jìn)化的結(jié)果執(zhí)行搜索任務(wù);
第三階段:尋源任務(wù)結(jié)束,當(dāng)參量收斂至目標(biāo)值,即可結(jié)束尋源任務(wù)。
至此,給出基于均衡搜索策略的尋源方法,后面將結(jié)合實(shí)驗(yàn)仿真驗(yàn)證算法的有效性和合理性。
地磁場是地球固有資源,擁有豐富的特征參量,是自然界中天然的導(dǎo)航信息源,其參量分布與地理位置具有非常復(fù)雜的非線性映射關(guān)系,是典型的隱式信息場。以動物利用地磁場開展洄游、歸巢、遷徙等尋源行為為原型,開展尋源方法驗(yàn)證。
選取E={Bx,By,Bz},其中,Bx,By,Bz分別為磁場水平分量、磁北分量和磁場垂直分量,已在文獻(xiàn)[11]中證明,此三個分量具備可尋性。選取目標(biāo)位置地磁場環(huán)境特征為(27 016 nT,-2 821.3 nT,58 480 nT)。
采用全球地磁模型WMM2020,在Matlab 中構(gòu)建尋源環(huán)境。考慮到實(shí)際地磁場傳感器的精確性,設(shè)置運(yùn)動步長L=500 m,每步運(yùn)動引起約1~2 nT 總場強(qiáng)的變化。
設(shè)采樣間隔Dθ=30°、種群規(guī)模Npop=36、繁殖算子Pb=2、變異算子Pmut=0.02,取Hth=1.5,Hhigh-th=1.8,Hlow-th=1.2。
為了對比算法的合理性和搜索性能,此處引入兩種參考算法。
參考算法1:梯度下降法(GDA)。假定移動載體能夠獲取相鄰單元的磁場分布,則式(2)所描述的尋源問題轉(zhuǎn)化為動態(tài)多目標(biāo)優(yōu)化問題,采用梯度下降法可求解出尋源路徑。顯然,隱式信息場是無法獲知相鄰單元的磁場分布,故此處將該方法得到的結(jié)果作為理想結(jié)果,僅用于對比。
參考算法2:以時序進(jìn)化算法(Timing Evolution Searching Strategy, TES)為參考算法。
對本文所提出的DBS 算法以及上述兩種算法,依據(jù)3.1 節(jié)所設(shè)置的參數(shù)進(jìn)行實(shí)驗(yàn)仿真,其尋源路徑如圖4所示。
圖4 不同算法仿真結(jié)果對比
圖4 中,“O”為載體出發(fā)點(diǎn),“T”為目標(biāo)源點(diǎn)位置。圖4 展示了三種不同算法得到的尋源路徑,其中黑色曲線為GDA 算法得到的理想尋源路徑,灰色曲線為參考算法TES 得到的尋源路徑,點(diǎn)線為本文提出的DBS 算法得到的尋源路徑??梢钥吹饺N算法均能夠引導(dǎo)載體到達(dá)目標(biāo)源位置T處。由于TES 算法在尋源過程中僅依靠算法自身調(diào)整搜索偏向,容易在路徑偏轉(zhuǎn)處出現(xiàn)較為嚴(yán)重的偏離;而基于DBS 算法的尋源方法在尋源過程中由于引入了動態(tài)均衡策略,能夠及時地調(diào)整自身搜索偏向,當(dāng)路徑發(fā)生偏轉(zhuǎn),在較短時間內(nèi)即可跟蹤上理想軌跡。
為了進(jìn)一步對比TES 算法與DBS 算法的不同,采用TES 與DBS 算法選取4 個不同的尋源任務(wù),分別進(jìn)行100 次尋源實(shí)驗(yàn),其尋源耗時的平均值如表1 所示。
表1 三種不同算法的尋源耗時均值統(tǒng)計
通過表1 可以看到,整體上采用TES 的尋源耗時大體是GDA 的1.98 倍,而DBS 尋源耗時大體是GDA 的1.78 倍。顯然,DBS 的尋源效果優(yōu)于TES 的尋源效果。
本文從搜索行為的偏向角度,開展了對隱式信息場尋源方法的研究,提出了一種動態(tài)均衡搜索策略,將搜索路徑引入尋源問題求解中,構(gòu)建了以可行性搜索行為為個體的進(jìn)化種群,引入分布熵的度量搜索偏向,結(jié)合進(jìn)化尋優(yōu)和尋源進(jìn)程,設(shè)計了一種均衡搜索策略。通過算法性能分析和仿真實(shí)驗(yàn)驗(yàn)證,證實(shí)了本文方法的有效性和合理性。下一步的工作重點(diǎn)是考慮具有局部極小值情況下的隱式信息場尋源方法。