張廣成 何 桃 鄭曉磊 陳春花 汪 進 陶龍龍
1(中國科學(xué)院核能安全技術(shù)研究所 中子輸運理論與輻射安全重點實驗室 合肥230031)
2(中國科學(xué)技術(shù)大學(xué) 合肥230027)
3(安徽省核應(yīng)急專業(yè)技術(shù)支持中心 合肥230031)
4(安徽省國土資源信息中心 合肥230601)
核應(yīng)急是核安全縱深防御的最后一道屏障,是核能持續(xù)健康發(fā)展的重要保證[1-2]。放射性核素在大氣中擴散遷移形成的輻射場對合理規(guī)劃救援路徑和科學(xué)制定應(yīng)急決策產(chǎn)生重要的影響[3]。
近年來,隨著核輻射監(jiān)測手段的不斷提高,針對輻射環(huán)境中的路徑規(guī)劃問題,已有不少人做了相關(guān)研究[4-5]。國內(nèi)魏強[6]等采用基本蟻群算法(ACO),規(guī)劃工作人員在輻射環(huán)境中的活動路徑;唐邵華等[7]基于核電站輻射分區(qū)圖創(chuàng)建了核電站控制區(qū)內(nèi)人員行進路線圖,并在此基礎(chǔ)上基于ACO 建立了核電站控制區(qū)內(nèi)路徑優(yōu)化方法;陶龍龍等[8]綜合考慮輻射場劑量率、障礙物和最短路徑等約束條件提出一種改進型A 星算法引導(dǎo)的核輻射環(huán)境路徑規(guī)劃方法,采用累積劑量作為實際代價,用預(yù)估劑量作為估計代價來引導(dǎo)最優(yōu)路徑。Alzalloum[9]研究了放射性污染區(qū)域的最小代價路徑問題,并利用Dijkstra 算法確定了最小輻射受照路徑;Khasawneh 等[10-11]提出了一種局部導(dǎo)航算法,用于輻射環(huán)境中的撤離行動;Mól 等[12]采用神經(jīng)網(wǎng)絡(luò)和虛擬現(xiàn)實技術(shù)評估核電站工作人員所受到的輻射劑量。
輻射環(huán)境中的路徑規(guī)劃是應(yīng)急救援行動的關(guān)鍵,目前大多數(shù)研究主要側(cè)重于兩點之間的最小劑量優(yōu)化,而針對不同任務(wù)需求,進行時間和劑量多目標約束條件的路徑規(guī)劃問題研究較少,相關(guān)的仿真程序不多,實驗數(shù)據(jù)難以獲取和比較分析。因此,本文提出了一種劑量權(quán)重因子與ACO耦合的路徑規(guī)劃方法,實現(xiàn)了核應(yīng)急輻射場景下救援路徑多目標規(guī)劃,并選取了某核電廠典型輻射區(qū)域進行仿真驗證。
核事故發(fā)生后,如何根據(jù)不同任務(wù)需求進行多目標約束條件下的路徑規(guī)劃是救援行動中的關(guān)鍵問題。由于放射性環(huán)境的特殊性,核事故場景下的救援路徑規(guī)劃與其它一般的路徑規(guī)劃問題存在本質(zhì)的不同,除路徑外,還需要考慮劑量等因素,目標函數(shù)復(fù)雜,約束變量多,需要啟發(fā)式算法進行求解。本文首先根據(jù)輻射環(huán)境巡檢任務(wù)需求構(gòu)建路徑規(guī)劃數(shù)學(xué)模型,然后將其轉(zhuǎn)化為多目標旅行商(TSP)問題,運用一種改進的ACO 進行求解。
ACO 由意大利學(xué)者Dorigo 等[13]首先提出。ACO 的關(guān)鍵要素包括螞蟻移動規(guī)則、信息素更新規(guī)則和迭代終止準則等[14-15]。
輻射環(huán)境中的N個巡檢救援節(jié)點,任意兩點間的劑量值通過環(huán)境中的探測值和歷史記錄數(shù)據(jù),借助數(shù)據(jù)重構(gòu)軟件,構(gòu)造出整個放射性空間中的劑量場[16-17]。本文根據(jù)ACO 規(guī)則,對問題進行了轉(zhuǎn)化,將兩個節(jié)點之間的劑量值轉(zhuǎn)化為等效路徑長度,設(shè)置劑量權(quán)重因子,進而表征劑量大小對螞蟻路徑選擇的影響。
等效路徑長度計算見式(1)。
式中:Aab表示巡檢救援人員從起點a到終點b所受總劑量,單位:mSv,即等效路徑長度;Akl表示巡檢救援人員從k 點到l 點整個路程中所受劑量,單位:mSv。
劑量權(quán)重因子計算見式(2)。
式中:αkl表示劑量權(quán)重因子,是劑量影響螞蟻選擇路徑非常重要的參數(shù),其數(shù)值為k 點到l 點之間劑量和總劑量的比值,無量綱。
一個多目標優(yōu)化(MOP)[18]可表示為式(3)。
式中:Ω 為決策變量空間,F(xiàn):Ω →Rm由m 個實數(shù)函數(shù)組成,Rm稱為目標空間,可行解目標集合定義 為{F(x)|x ∈Ω}, 令 u,v ∈Rm, 對 于 每 個i ∈{1,…,m},當且僅當ui≤vi時,稱u 支配v;若不存在x ∈Ω,使得F(x)支配F(x*),則稱x*∈Ω是帕累托最優(yōu)解(Pareto optimal),F(xiàn)(x*)稱作帕累托最優(yōu)目標向量(Pareto-optimal objective vector),也就是說,在帕累托最優(yōu)點的一個目標上的任何改進都必導(dǎo)致至少另一個目標的惡化。所有帕累托最優(yōu)解的集合稱為帕累托集(Pareto set),帕累托集對應(yīng)的目標向量集合稱為帕累托前沿(Pareto front)。
通過將上述問題轉(zhuǎn)化為TSP 問題進行求解,給定了N 個巡檢救援點之間的距離矩陣和劑量矩陣,這個問題可以描述為式(4)。
本文采用劑量權(quán)重因子與基于分解的多目標ACO(MOEA/D-ACO)[19]耦合進行求解,通過選擇N 個權(quán)重向量λ1,λ2,…,λN將一個多目標優(yōu)化問題分解轉(zhuǎn)化為N個單目標子問題,每個子問題i對應(yīng)的權(quán)重向量為λi,其對應(yīng)的子問題記為g(x|λi)。相應(yīng)地,MOEA/D-ACO 用N 個螞蟻求解這些子問題,每個螞蟻分別負責一個子問題,即螞蟻i負責子問題g(x|λi)。螞蟻i 的鄰域B(i)包含T 個最相鄰的螞蟻,即這些螞蟻的權(quán)重向量與螞蟻i的權(quán)重向量距離比其他螞蟻對應(yīng)的權(quán)重向量到螞蟻i的距離都小。N個螞蟻依據(jù)其權(quán)重向量聚類被劃分為K個子群,每個子群負責逼近帕累托面一部分。如圖1,給出的算例中,目標數(shù)m為2,螞蟻數(shù)N為14,子群數(shù)K 為2,鄰域大小T 為5。該多目標優(yōu)化問題被分解成14個單目標子問題。螞蟻i負責優(yōu)化子問題i。第一個子群由螞蟻1到7組成,其他螞蟻構(gòu)成第二個子群。每個螞蟻有5個鄰居,如螞蟻6的鄰居為螞蟻4、5、6、7和8。算法相關(guān)參數(shù)含義如表1所示。
表1 算法中主要參數(shù)的含義Table 1 Implication of main parameters of algorithm
2.2.1 信息素更新策略
若Π 為當前代中被子群j 構(gòu)造出的經(jīng)過節(jié)點k到l,且被加入精英檔案(EP)中解。子群j 中所有螞蟻經(jīng)過節(jié)點k 到l 之間路徑對應(yīng)的信息素濃度計算見式(5)。
2.2.2 狀態(tài)轉(zhuǎn)移規(guī)則
2.2.3 啟發(fā)式因子
為了使得螞蟻盡量往終點方向移動,引入了啟發(fā)式因子概念,表征移動到相連節(jié)點的期望程度。在不考慮輻射劑量的情況下,啟發(fā)式因子一般取節(jié)點與目標點之間直線距離的倒數(shù)。在輻射場中,考慮到輻射劑量率的影響,在沒有障礙的情況下起點與終點之間的直線不一定是最優(yōu)路徑。出于劑量最優(yōu)的考慮,螞蟻應(yīng)盡量遠離高輻射區(qū)域,其排斥程度應(yīng)與輻射劑量率成正比。因此,對啟發(fā)式因子進行修正,可得到式(8)。
基于FDS 鳳麟核能團隊自主研發(fā)的仿真平臺實現(xiàn)算法并進行仿真模擬[20-24],選取國內(nèi)某一壓水堆核電廠典型輻射區(qū)域作為研究對象,選擇場景中12 個可連通的巡檢救援任務(wù)點(表2),規(guī)劃在一次巡檢救援中的行動路徑。
首先根據(jù)實際應(yīng)用場景將20 m×10 m的輻射區(qū)域劃分為800×400 的網(wǎng)格,并定義各個網(wǎng)格為實體,取1.6 m標高下水平切面上離散的網(wǎng)格點代表該平面內(nèi)二維劑量場分布[25],如圖2(a)所示,利用實際監(jiān)測數(shù)據(jù)和高斯平滑方法可視化劑量場。然后利用改進的ACO,分別選取不同的時間、劑量約束重要度參數(shù),在同一輻射環(huán)境下進行路徑規(guī)劃,顯示路徑并計算全程行進距離和總劑量代價。
表2 輻射場巡檢點坐標Table 2 Coordinate of check points in radiation field
圖2 所示,以a 節(jié)點為巡檢任務(wù)起點,b 節(jié)點為終點,考慮行程時間與輻射劑量多目標約束條件,來仿真驗證距離最優(yōu)(圖2(b))、劑量最優(yōu)(圖2(c))以及折衷最優(yōu)(圖2(d))任務(wù)環(huán)境下巡檢路徑規(guī)劃方案。表3為仿真數(shù)據(jù)對比表,通過對比不同任務(wù)環(huán)境下仿真模擬結(jié)果可知:當λ1=1、λ2= 0,基于巡檢時間最短考慮,路徑長度雖短,卻使巡檢人員所受輻射劑量偏大;
當λ1= 0、λ2= 1,基于巡檢人員所受輻射劑量最優(yōu)考慮,路徑長度增加了,但是所受劑量明顯下降;λ1= 0.5、λ2= 0.5,綜合考慮輻射劑量和路徑長度,得到折衷方案。
利用本案例驗證本文算法與文獻算法[6]優(yōu)劣,結(jié)果見圖3。
表3 仿真數(shù)據(jù)對比Table 3 Data comparison of simulation
圖3(a)所示,如果只考慮巡檢距離最優(yōu),通過兩種算法對比分析,文獻算法在第19代收斂,最優(yōu)解為159 m;本文算法在第9 代收斂,最優(yōu)解為133 m,方案優(yōu)于前者。圖3(b)所示,如果僅考慮巡檢人員所受劑量最優(yōu),通過兩種算法對比分析,文獻算法在第13代收斂,最優(yōu)解為39 mSv;本文算法在第8 代收斂,最優(yōu)解為22 mSv,方案優(yōu)于前者。
表4所示,同時考慮時間和劑量因素,尋找最優(yōu)折衷方案,文獻算法在第19 代趨于收斂,最優(yōu)解為(140 m,34 mSv),本文算法在第9 代收斂,最優(yōu)解為(139 m,30 mSv)。
表4 本文算法與文獻算法仿真模擬數(shù)據(jù)對比Table 4 Data comparison of paper algorithm and literature algorithm simulation
本文以ACO 為基礎(chǔ),考慮劑量權(quán)重因子,提出了輻射劑量、行動時間約束的多目標路徑優(yōu)化方法。仿真驗證結(jié)果表明,采用劑量權(quán)重因子與ACO 耦合的方法充分考慮了輻射環(huán)境特點,能夠在不同核事故狀態(tài)下,基于時間和劑量的重要度進行不同的輻射權(quán)重分配,可實現(xiàn)路徑的合理規(guī)劃。通過與文獻中算法對比,本文算法在收斂速度和求解精度上均優(yōu)于文獻算法。本文方法可為核輻射環(huán)境下工作人員的維修與巡檢安全、事故情況下的快速應(yīng)急救援決策提供技術(shù)支持。