汪金花, 張 博, 吳 兵, 郭云飛
(1.華北理工大學 礦業(yè)工程學院,河北 唐山 063210; 2.中煤航測遙感集團有限公司,陜西 西安 710199)
地磁定位具有全天時、全天候、無源、無福射等優(yōu)點,近幾年地磁高精度的定位技術在室內、地下工程等領域的基礎研究發(fā)展迅速,成為多學科交叉研究的熱點之一。地下工程地磁精確定位是依據通行路線的實測地磁序列與地磁基準數(shù)據的匹配計算來實現(xiàn)的,其定位精度受到區(qū)域地磁基準圖、載體實時測量地磁序列、地磁匹配算法及區(qū)域適配性等因素影響。地磁適配性評價是對區(qū)域地磁空間分布特征強弱的綜合分析,是地磁定位導航的基礎和前提。關于地磁定位適配性研究,國內外已有一些基礎研究成果。文獻[1]結合地磁紋理特征提出基于地磁共生矩陣的算法用于水下地磁適配區(qū)的選擇,得出水下匹配區(qū)域適配性與地磁共生矩陣反演的地磁角二階矩、熵、對比度及相關性這些指標吻合度較高;文獻[2]提出一種基于基因表達式編程的算法用于水下地磁進化合成特征的構建,得到了穩(wěn)健性更好的綜合適配特征;文獻[3]提出基于地磁特征參數(shù)信息熵的適配區(qū)選擇方法用于海域地磁適配區(qū)的選擇,得出基于地磁特征參數(shù)信息熵的適配區(qū)選擇方法更有效,更適合作為適配區(qū)的選擇標準;文獻[4]針對空域地磁場的特點利用主成分分析(principal component analysis,PCA)結合后向傳播(back propagation,BP)神經網絡的方法對基本地磁特征參數(shù)進行分析,得到了更好的分類精度;文獻[5]提出基于BP神經網絡的地形適配/誤配區(qū)劃分方法用于分析水域地磁場統(tǒng)計參量與匹配精度間的關系,得出該方法的分類精度高出傳統(tǒng)分類方法分類結果正確率10%以上;文獻[6]將改進的信息熵作為特征指標對航拍圖片進行適配性分析與選擇,在景象匹配制導中得到了較高的自匹配概率和較小的匹配誤差;文獻[7]采用矢量分析的方法構建地磁綜合評價值輔助慣導系統(tǒng)進行水下定位導航,結果表明綜合評價值可作為選擇合適地磁輔助導航匹配區(qū)適宜性的定量指標;文獻[8]采用免疫粒子群優(yōu)化算法在水下地磁基準圖中智能選擇最優(yōu)匹配區(qū)域,結果表明,匹配概率與匹配區(qū)域選擇策略具有良好的一致性。這些適配性評價的研究大部分是構建新型的特征指標、引入BP算法或人工智能分析來改進適配性評價方法,評價精度提升明顯,主要是應用于水下地磁定位區(qū)域適配性評價,關于地下工程小范圍適配評價方法的研究很少。
前期大量試驗結果表明,雖然地下工程空間小,巷道之間主要是線性連接方式,但是環(huán)境附加磁場的空間分布變化復雜,有些區(qū)域磁場變化大,空間分布特征明顯,有些區(qū)域磁場變化平緩,空間分布差異不明顯。由于不同地段地磁空間分布得不規(guī)律,需要一種有效快捷的適配性評價模型來綜合評價。本文針對于地下工程地磁空間分布的特點,利用回歸分析方法確定特征參數(shù)的貢獻因子,改進BP神經網絡的輸入權值,建立了基于貢獻因子BP神經網絡的適配性評價模型,可為地磁輔助定位適配性評價提供參考。
地下工程實際測量的地磁場數(shù)值中包含地磁穩(wěn)定場與異常場及環(huán)境磁場的綜合疊加影響。實測地磁數(shù)據通常是地球基本磁場和周圍環(huán)境附加磁場疊加作用的結果,即除了實際地理位置基礎地磁場外,還疊加了周圍鐵軌、通風管道、排污管道、通信設施等產生的附加磁場,井下地磁數(shù)據具有分布特點不一致、空間分布復雜的特點。例如,有些區(qū)域地磁緩變,幾十米巷道的磁異常只圍繞著幾百至幾千nT變動;有些區(qū)域擾動較大,兩點相距僅僅幾米,地磁值陡增到104nT。因此,需要量化計算巷道的地磁空間分布特征具體數(shù)值,進行適配性評定。
從已有研究文獻[9-12]來看,表征地磁特征的參數(shù)較多,如地磁場均值、標準差、粗糙度、粗糙方差比、地磁熵、相關系數(shù)、分形維數(shù)、累加梯度、相關距離、地磁費歇信息量、地磁編碼失真量、坡度標準差等,多達十幾種。根據地下工程的地磁空間分布特點,本文選取地磁標準差δ(相應的地磁空間特征因子用F1表示,下同)、峰態(tài)系數(shù)Ce(F2)、偏態(tài)系數(shù)Cf(F3)、地磁粗糙度r(F4)、粗糙方差比o(F5)、地磁信息熵G(F6)及相關系數(shù)t(F7)7個地磁空間分布特征參數(shù),其表達式和意義見表1所列。
表1 區(qū)域磁場基本適配特征因子
這7個參數(shù)分別從地磁分布的宏觀特征、微觀特征以及相似特征3個層次反映地磁空間分布特征,但是對于井下小區(qū)域,每個參數(shù)貢獻率不同。由表1公式可知,F2反映數(shù)值的集中程度,數(shù)值越大,數(shù)據在均值附近集中程度越高,特征性不強,不利于地磁匹配定位;F6反映區(qū)域信息量大小,數(shù)值越小,表明地磁變化越獨特,有利于地磁匹配定位。分別選取F2、F62類試驗數(shù)據進行特征統(tǒng)計,每類數(shù)據各有8個測區(qū),F2、F6與匹配概率的相關性如圖1所示。
圖1 F2、F6與匹配概率的相關性
從圖1可以看出,隨著F2、F6增大,其地磁匹配概率逐漸降低,說明地磁空間匹配概率與F2、F6的統(tǒng)計特征關聯(lián)性較強。每個測區(qū)地磁空間特征各異,統(tǒng)計的特征參數(shù)也大小不一,每個特征因子對匹配概率的影響也是不同的,因此需要在適配性評價之前,確定7個特征因子在適配性評價過程中的貢獻因子大小,從而加強模型自動收斂的速度以及避免陷入局部最優(yōu)。
為了研究地磁空間分布特征因子與匹配概率之間關系,可以先進行其相關性回歸分析[13],確定其關聯(lián)程度。7個特征因子與匹配概率的回歸方程模型為:
P(F)=B0+B1F1+B2F2+…+B7F7
(1)
其中,P(F)為區(qū)域地磁匹配概率;FI(I=1,2,3,…,7)為地磁特征因子;BI(I=1,2,3,…,7)為回歸系數(shù);B0為常數(shù)。
一般情況下,回歸系數(shù)大小可以間接反映該因子在適配性評價中的影響程度。當F2、F6較大時,說明該區(qū)域特征相似區(qū)段較多,地磁匹配時易出現(xiàn)模糊匹配,表明其適配性差;當F1、F3、F4、F7的數(shù)值較大時,說明空間分布獨特性較強,適配性也較好。
地磁適配性的評價是對井下所有巷道進行地磁空間特征的豐富度評價,可以分為定性和定量2種評價方式。定性評價是評價該區(qū)域地磁定位的適配程度,分為不適配、弱適配、適配及強適配4個等級,采用基于多屬性決策判別方法,如線性距離判別、貝葉斯判別、決策樹判別、BP神經網絡等[14-16];定量評價是對待匹配區(qū)進行匹配概率的量化評價,從匹配實用性和準確率上進行評價,采用的算法有互相關算法、均方差算法、歸一化積相關算法及平均絕對差(mean absolute devition,MAD)[17-19]算法等。
結合7個特征因子,以BP神經網絡數(shù)學模型為基礎,設計BP神經網絡的地磁適配性評價模型為7-h-1的網絡結構,如圖2所示。
圖2 地磁適配性評價的BP神經網絡模型
圖2中,輸入層為表1中7個地磁空間分布特征因子,輸入層初始權為F1~F7的貢獻因子wI;隱藏層主要包含更新權值wIJ、偏置b′以及激活函數(shù)f;輸出層為適配性評價等級y。從圖2可以看出,BP神經網絡精度和實際匹配效率受到多種因素影響,主要因素有神經元的數(shù)目、激活函數(shù)類型以及貢獻因子wI。其中,神經元的數(shù)目、激活函數(shù)類型可以通過反復訓練對比得出最佳結果,而貢獻因子wI需要根據輸入層結構和相關性來設定。
(1) 歸一化處理模型。由于采集的地磁空間分布特征參數(shù)量綱不統(tǒng)一,需將采集的樣本數(shù)據進行歸一化處理。將7個輸入向量歸一化處理為0~1之間的數(shù)值;設x=(x1,x2,…,xm),建立一個映射f′:
(2)
其中,k=1,2,…,m;xk為需要歸一化處理的樣本原始數(shù)值;xmin為樣本數(shù)據中最小值;xmax為樣本數(shù)據中最大值。
(2) 貢獻因子wI。對于(1)式,一般情況下,模型識別精度主要受到與匹配概率相關性較強的特征因子的影響較大,如F3、F4等。由于地磁適配性評價的樣本較少,且在隱藏層中各個特征因子分別給予了等價權,因而可能引起網絡無法收斂或陷入局部最優(yōu)。為了提高模型的收斂性和達到全局最優(yōu),需要對樣本特征因子的初始權進行預處理,即設定貢獻因子wI。預處理過程采用最小二乘線性回歸的方法進行參數(shù)估計,得出每個樣本特征因子的貢獻權w。預處理數(shù)學模型為:
(3)
(4) 激活函數(shù)f。3種常見激活函數(shù)的對比見表2所列。通過反復試驗確定最佳的激活函數(shù)。
表2 3種激活函數(shù)的對比
(5) 輸出層定義。通過前向傳播輸出模型的計算結果,反向傳播中通過設置對應的期望值y進行迭代訓練。本文根據MAD算法,計算各個樣本區(qū)域的磁場匹配概率,并根據不同的匹配概率劃分適配性的期望值,不同期望值對應的磁場區(qū)域匹配概率見表3所列,期望值數(shù)值為適配標簽。
表3 不同期望值對應的匹配概率
(1) 試驗數(shù)據。選取45個3 m左右的人防工程小區(qū)域,每個區(qū)域內布設3條控制線,控制線間隔為1 m,每條線上采樣點間隔為1 m。使用FVM400磁通門計進行磁場數(shù)據采集,該磁通門計的參數(shù)見表4所列。
表4 FVM400磁通門計參數(shù)
每個點位采集5次數(shù)據,取其平均值作為最終的磁場數(shù)據,并根據MAD算法計算各個區(qū)域的匹配概率,剔除可能存在誤差的4個區(qū)域,將余下的41個區(qū)域磁場特征因子與對應的匹配適配標簽制作成訓練數(shù)據集和測試數(shù)據集,分別見表5、表6所列。
表5 磁場特征訓練數(shù)據集
續(xù)表
表6 磁場特征測試數(shù)據集
(2) 數(shù)據處理。在獲得歸一化地磁特征的7個參數(shù)后,將7個特征因子與對應的匹配概率進行基于最小二乘回歸分析,根據回歸結果確定7個地磁特征因子的貢獻因子,將貢獻因子設置為BP神經網絡的初始權進行網絡訓練。數(shù)據處理的流程如圖3所示。
圖3 數(shù)據處理流程
BP神經網絡試驗采用目前最先進的TensorFlow平臺進行編程和優(yōu)化。TensorFlow是谷歌基于DistBelief進行研發(fā)的第2代人工智能學習系統(tǒng),為開源機器學習框架,具有快速、靈活并適合大規(guī)模應用等特點,能夠解決各種機器學習任務。傳統(tǒng)的判別方法采用基于Matlab的編程實現(xiàn),最終將兩者進行對比。
根據(2)式歸一化地磁特征因子得到:
(4)
將F1~F7的取值代入(1)式計算可得:
P(F)=1.260-0.427F1-0.273F2-0.559F3+0.819F4-0.187F5-0.109F6-0.128F7
(5)
則有:
由(3)式可得:
(6)
由(6)式可得7個特征因子的wI,見表7所列。
表7 7個地磁特征因子對應的wI
從表7可以看出,在描述井下地磁特征的7個特征因子中,F3、F4對匹配概率的影響較大,其wI分別為22.3%、32.7%;F5、F6、F7對匹配概率的影響較小,wI均不到10.0%;F1、F2的wI分別為17.1%、10.9%。
設置激活函數(shù)為relu函數(shù),將隱藏層個數(shù)h分別設定為10、12、14、16、18進行對比試驗,試驗結果見表8所列。
表8 不同h下網絡的準確率 %
由表8可知,隨著h增加,模型在測試數(shù)據集上的準確率逐漸提高,在h=14、h=16時網絡的準確率一樣,而在h=16時出現(xiàn)拐點,因此初步確定h為14或16;在訓練數(shù)據集上,隨著h增加,模型的準確率逐漸提高,h=16時網絡的準確率高于h=14時的網絡。綜合分析以上結果,設置h=16。
設定h=16,對比sigmoid、tanh、relu 3種激活函數(shù)下網絡訓練的準確率,結果見表9所列。從表9可以看出,3種激活函數(shù)對訓練集和測試集數(shù)據的識別準確率是不同的。采用sigmoid函數(shù)的網絡幾乎不具備識別能力;采用tanh函數(shù)的網絡識別能力一般;而采用relu函數(shù)的網絡性能最好,其在訓練數(shù)據集上的準確率高達95.0%,在測試數(shù)據集上的準確率達到了72.7%,試驗結果充分證明了relu函數(shù)在該模型中的優(yōu)勢。
表9 3種激活函數(shù)下網絡的準確率 %
對試驗數(shù)據分別采用傳統(tǒng)貝葉斯判別、線性距離判別、二次函數(shù)判別以及普通BP神經網絡和基于貢獻因子BP神經網絡進行適配性評價,將2種BP神經網絡均隨機訓練5次,計算其平均準確率以減小網絡陷入局部最優(yōu)對識別準確率的影響,訓練樣本和測試樣本的評價結果對比見表10所列。
表10 5種方法的適配性評價結果
由表10可知,在對地磁適配性評價中,二次函數(shù)判別法的識別準確率最低,訓練數(shù)據準確率不到80%,測試數(shù)據準確率僅為45%左右;基于傳統(tǒng)貝葉斯判別、線性距離判別的準確率較為接近,訓練數(shù)據準確率均為80%左右,測試數(shù)據準確率僅為50%左右;基于貢獻因子BP神經網絡的準確率最高,訓練數(shù)據準確率達到了95%,測試數(shù)據準確率接近73%,優(yōu)勢明顯。相比于普通BP神經網絡,改進后的網絡能一定程度上避免陷入局部最優(yōu)從而達到較高的識別精度,網絡的收斂速度也有明顯提升,但是基于貢獻因子BP神經網絡分析時,訓練前期工作較多,工作量較大。
(1) 圍繞地下工程地磁定位的區(qū)域適配性評價問題,綜合分析了區(qū)域磁場空間特征因子與匹配概率相關性。根據地下工程的地磁空間分布特點,確立了地磁標準差、峰態(tài)系數(shù)、偏態(tài)系數(shù)、地磁粗糙度、粗糙方差比、地磁信息熵及相關系數(shù)7個地磁空間分布特征參數(shù)。
(2) 在BP神經網絡基礎上,設計了基于貢獻因子BP神經網絡適配性評價流程,建立7-h-1結構的地磁適配性BP神經網絡,提出了貢獻因子的計算方法?;谪暙I因子BP神經網絡的輸入層為7個地磁空間分布特征因子,其初始權為回歸分析后的貢獻因子;輸出層為按照匹配概率劃分的適配等級,即強適配、適配、弱適配、不適配。
(3) 將貢獻因子賦值為BP神經網絡的初始權進行訓練,使網絡能夠快速收斂并具有較高的識別精度。但是在實際應用中,樣本數(shù)量和貢獻因子計算需要進一步優(yōu)化,模型的泛化能力也需要進一步提高。