黎忠凱,齊向偉,王 鑫,霍程程
(1.新疆師范大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,新疆 烏魯木齊 830054;2.新疆大學(xué) 信息科學(xué)與工程學(xué)院,新疆 烏魯木齊 830054)
一個(gè)城市內(nèi)如何優(yōu)化有限的防守資源來(lái)抵御潛在的攻擊對(duì)公共安全部門來(lái)說(shuō)是一個(gè)巨大的挑戰(zhàn)。一些研究學(xué)者已經(jīng)使用貝葉斯博弈模型來(lái)解決攻擊者的問題。文獻(xiàn)[2]提出了一系列貝葉斯斯坦伯格博弈模型,并將其應(yīng)用于洛杉磯國(guó)際機(jī)場(chǎng)和聯(lián)邦空管局,優(yōu)化了其安全資源配置;文獻(xiàn)[3]構(gòu)造了一個(gè)靜態(tài)貝葉斯博弈模型來(lái)模擬網(wǎng)絡(luò)信息系統(tǒng)的主動(dòng)防守策略,但是該方法僅考慮了靜態(tài)環(huán)境下的博弈,忽略了現(xiàn)實(shí)情況下可能存在的狀況;文獻(xiàn)[4]提出了一種基于完整信息博弈論的有限防御資源分配優(yōu)化方法。該方法充分考慮了防御者和攻擊者之間的戰(zhàn)略互動(dòng),可以確定防御資源的最佳全局分配。但是,此方法僅考慮游戲模型中的一種攻擊者。借鑒相關(guān)研究的經(jīng)驗(yàn),本文在原有的貝葉斯博弈模型的基礎(chǔ)上進(jìn)行改進(jìn),將一種攻擊者類型的研究擴(kuò)展為針對(duì)多種攻擊者類型的研究,保護(hù)加油站免受多種類型攻擊。據(jù)了解,在一個(gè)城市范圍內(nèi),研究使用博弈論優(yōu)化加油站防御資源配置的報(bào)道比較少。
綜上所述,本文基于貝葉斯博弈模型提出了一種考慮多種類型攻擊者的優(yōu)化有限防御資源調(diào)配的博弈論方法,該方法引進(jìn)先驗(yàn)概率,通過(guò)優(yōu)化防御資源調(diào)配最小化預(yù)期損失。以4 個(gè)貯存汽油、柴油的加油站為例,本文驗(yàn)證了該方法的可靠性以及適用性,比較了不同防守策略的效果,并說(shuō)明了該方法的優(yōu)越性。
為了方便分析,本文出現(xiàn)的數(shù)學(xué)符號(hào)定義見表1。
表1 有關(guān)符號(hào)及定義
針對(duì)潛在攻擊的情況,本文為保護(hù)多個(gè)加油站設(shè)施研究了防御資源的分配方法,并將其作為博弈的雙方參與者:攻擊者和防守者。攻擊者通過(guò)選擇一個(gè)合適的目標(biāo)最大化他的預(yù)期收益,而防守者的目標(biāo)就是通過(guò)優(yōu)化防守資源配置最小化預(yù)期損失。
一般來(lái)說(shuō),攻擊者假定認(rèn)為在一個(gè)時(shí)間段只能攻擊一個(gè)目標(biāo)。對(duì)于個(gè)加油站,攻擊者的策略可以用一個(gè)概率集描述:
對(duì)于防守者來(lái)說(shuō),這個(gè)策略可以表示為可用資源的調(diào)配模式:
防守者的策略集描述如下:
防守者的預(yù)期損失和收益可以表示為:
目前的貝葉斯博弈模型中,攻擊者通過(guò)選擇一個(gè)合適的攻擊目標(biāo)來(lái)最大化自己的預(yù)期收益,本文將攻擊者A的優(yōu)化問題表示為:
與此相反,防守者的目標(biāo)就是通過(guò)優(yōu)化有限的防御資源配置來(lái)抵御各種類型的攻擊者,從而最小化他們的預(yù)期損失:
目前的貝葉斯博弈模型是指參與者們彼此都無(wú)法觀察到對(duì)方的策略,從而根據(jù)觀察到的信息決定自己的策略。將這種靜態(tài)貝葉斯博弈模型用海薩尼將其轉(zhuǎn)換為一個(gè)完全信息博弈求解,可以表示為(,,,…,a)。當(dāng)納什均衡實(shí)現(xiàn)時(shí),防守者是無(wú)法通過(guò)改變自己的防守策略從而進(jìn)一步減少自己的預(yù)期損失,攻擊者也無(wú)法通過(guò)改變自己的攻擊策略從而進(jìn)一步擴(kuò)大自己的預(yù)期收益。因此,此時(shí)貝葉斯納什均衡需要滿足下面兩個(gè)公式:
本文根據(jù)上述已有的貝葉斯博弈方法,考慮多種攻擊類型情況,通過(guò)引進(jìn)先驗(yàn)概率以及脆弱性函數(shù)對(duì)其進(jìn)行優(yōu)化,構(gòu)建博弈方法如圖1 所示。
圖1 博弈論方法
該方法最顯著的特點(diǎn)就是它考慮了現(xiàn)實(shí)中多種類型攻擊者的存在,主要步驟如下:
1)結(jié)果估算:基于收集好的加油站和潛在攻擊者的信息。
2)確定攻擊者的類型和先驗(yàn)概率:隨著信息的收集,防守者能夠確定攻擊者的類型并且推測(cè)出他們的先驗(yàn)概率。
3)評(píng)估攻擊者眼中每個(gè)加油站的價(jià)值收益:防守者從攻擊者的角度出發(fā),評(píng)估每個(gè)加油站在不同攻擊者眼中的價(jià)值。
4)建立防守者策略集:隨著信息的收集,防守者們可以構(gòu)建一個(gè)策略集(見式(7)),另外通過(guò)分析防御投入對(duì)脆弱性的影響,防守者可以確定各個(gè)加油站防御資源的脆弱性函數(shù)。
5)建立攻擊者策略集:防守者推測(cè)每個(gè)加油站受到不同類型攻擊者發(fā)動(dòng)攻擊的概率并且進(jìn)一步為不同類型攻擊者構(gòu)造一個(gè)策略集(見式(4)和式(13))。
6)開發(fā)一個(gè)貝葉斯博弈模型:貝葉斯博弈模型的輸入(見式(11)和式(12))包括攻防雙方的策略集、結(jié)果、脆弱性、攻擊者眼中加油站的價(jià)值以及不同類型攻擊者的先驗(yàn)概率。
7)獲取防御資源的最優(yōu)配置:通過(guò)求解貝葉斯博弈模型,防守者可以得到一個(gè)貝葉斯納什均衡解,也就是一個(gè)最優(yōu)策略集。根據(jù)均衡解,防守者最后可以得到有限防御資源的最優(yōu)配置。
為了證明提出方法的可靠性和適用性,本文以4 個(gè)貯存汽油、柴油的加油站作為仿真案例進(jìn)行研究。基本信息如表2 所示。
表2 加油站基本信息
與其他加油站相比,仿真場(chǎng)景中加油站擁有其獨(dú)特之處。在進(jìn)入加油站之前設(shè)有攔卡,車上人員需要下車接受檢查后才能進(jìn)站加油,這個(gè)過(guò)程中需要一定時(shí)間;根據(jù)加油站的大小不同,檢查人員數(shù)量也不盡相同,工作效率也是相互不一的。但本文研究的主要目的是分析多種類型攻擊者對(duì)防御資源分配的影響,因此假定加油站安檢人員不具備抵御攻擊者的防御能力,4 個(gè)加油站特點(diǎn)和安保措施大致相同,認(rèn)為保護(hù)4 個(gè)加油站的困難水平是相同的;也就是意味著在給任何一個(gè)加油站增加防御資源時(shí),加油站的脆弱性變化無(wú)異。根據(jù)上面的假設(shè),可以引進(jìn)脆弱性函數(shù),將其描述為:
假設(shè)無(wú)論攻擊者存在一種類型還是多種類型,防守者都知道每個(gè)加油站對(duì)于不同類型攻擊者的價(jià)值,但是防守者不清楚哪種類型攻擊者將會(huì)發(fā)動(dòng)攻擊,因此通過(guò)設(shè)置不同類型攻擊者的先驗(yàn)概率確定每種類型攻擊者將會(huì)發(fā)動(dòng)攻擊的可能性。在本文案例研究中,設(shè)置了三種類型攻擊者、和,不同加油站在不同類型攻擊者眼中的價(jià)值如圖2 所示。
圖2 攻擊者眼中加油站的價(jià)值
圖2 中:攻擊者對(duì)4 個(gè)加油站的估值存在很大差異,相比攻擊者和,他更傾向于對(duì)貯存油量更多的加油站發(fā)起進(jìn)攻;而攻擊者與攻擊者恰恰相反,攻擊者傾向于周邊人口密度大的加油站,他的目的在于盡可能造成大的人員傷亡、人群恐慌和財(cái)產(chǎn)損失;相比之下,攻擊者與攻擊者對(duì)4 個(gè)加油站的估值基本相似,但是其行為難以猜測(cè)。
根據(jù)上述提到的多種類型攻擊者,設(shè)置了3 個(gè)完整信息博弈和4 個(gè)貝葉斯博弈場(chǎng)景,對(duì)比兩種博弈在優(yōu)化前后防御資源配置上的差異,如表3 所示。在本文案例研究中,出于對(duì)安全的考慮,虛構(gòu)了攻擊者目標(biāo)的價(jià)值和先驗(yàn)概率,雖然這些數(shù)據(jù)不滿足實(shí)際應(yīng)用的情況,但是已經(jīng)滿足了貝葉斯博弈模型的要求。
表3 兩種博弈場(chǎng)景和最優(yōu)策略集
潛在攻擊的結(jié)果可以從下面兩個(gè)方面來(lái)考慮:人員傷亡和財(cái)產(chǎn)損失。簡(jiǎn)單來(lái)講就是可以用人民幣將人員傷亡轉(zhuǎn)換為財(cái)產(chǎn)損失進(jìn)行評(píng)估,因此其結(jié)果可以表示為:
式中:L是指第個(gè)加油站被成功攻擊后的財(cái)產(chǎn)損失;L是指第個(gè)加油站被成功攻擊后的人員傷亡,可以將其轉(zhuǎn)換為財(cái)產(chǎn)損失。
綜合當(dāng)?shù)卣踩块T和專家意見,本實(shí)驗(yàn)的計(jì)算方法中死亡、重傷和輕傷人員分別一一對(duì)應(yīng)300 萬(wàn)元、100 萬(wàn)元和4 萬(wàn)元,這些價(jià)值與當(dāng)?shù)氐慕?jīng)濟(jì)條件、風(fēng)俗有關(guān),每個(gè)地方都不相同并且隨著時(shí)間而變化。
式中:N,N和N分別表示死亡、重傷和輕傷人員的數(shù)量。
模擬4 個(gè)加油站場(chǎng)景,平均人口密度和財(cái)產(chǎn)密度如表1 所示,任意一個(gè)加油站被成功襲擊后的損失根據(jù)式(16)和式(17)計(jì)算,如圖3 所示。
圖3 加油站被成功攻擊后的損失
圖4 完全信息博弈模型獲取的最優(yōu)策略集
從圖4a)可以看出,第4個(gè)加油站擁有最大的損失卻沒有防御資源,而第2 個(gè)加油站擁有最小的損失卻幾乎擁有所有防御資源。這就表明在完全信息博弈場(chǎng)景下,防守者不一定會(huì)向產(chǎn)生巨大后果的加油站調(diào)配額外的防御資源。另外,從攻擊者角度考慮目標(biāo)加油站的價(jià)值見圖4,從攻擊者類型為(圖2)的角度來(lái)看,第1個(gè)加油站和第2 個(gè)加油站擁有更高的價(jià)值,因此分配了更多的防御資源;從攻擊者角度來(lái)看,具有很低價(jià)值的第3 個(gè)和第4 個(gè)加油站分配一點(diǎn)防御資源、不分配防御資源。這就表明,在完全信息博弈場(chǎng)景下,從攻擊者的角度來(lái)看,通常具有較高價(jià)值的加油站優(yōu)先獲得更多的防御資源。
通過(guò)圖4 和圖5 的對(duì)比,實(shí)驗(yàn)表明處于貝葉斯博弈場(chǎng)景下的最優(yōu)安全資源配置與在完全信息博弈場(chǎng)景下的最優(yōu)安全資源配置有著極大的不同。以第4 個(gè)加油站為例,完全信息博弈場(chǎng)景下只有一種攻擊類型的防御資源為0 單位,而貝葉斯博弈場(chǎng)景下有三種攻擊者類型、和(0.2,0.4,0.4)的防御資源為42 單位。進(jìn)一步對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析,當(dāng)某一種類型攻擊者的先驗(yàn)概率增加時(shí),目前的方法能夠幫助防守者修改防御資源配置來(lái)抵御該類型攻擊者的攻擊。
圖5 貝葉斯博弈模型獲取的最優(yōu)策略集
如圖6 所示,當(dāng)存在多種類型的攻擊者時(shí),處于貝葉斯均衡下防守者的預(yù)期損失隨著攻擊者A的先驗(yàn)概率的增加而接近于納什均衡(僅攻擊者A),其中=100 單位,=0.015。
圖6 納什均衡(#)和貝葉斯均衡(*)下的預(yù)期損失
隨著關(guān)鍵參數(shù)防御系數(shù)從0.005 增加到0.025,可用的防御資源被重新分配給更多的加油站,同時(shí)這也進(jìn)一步降低了防守者的預(yù)期損失,如圖7 所示。圖7 中,=100 單位。在防御資源總量不變的情況下,通過(guò)增加貝葉斯博弈模型中的防御系數(shù),防守者可以重新分配可用的防御資源,進(jìn)一步降低預(yù)期損失。
圖7 不同防御系數(shù)下的預(yù)期損失
本文提出了一種基于貝葉斯博弈論方法的防御資源的分配策略,以保護(hù)加油站設(shè)施免受多種類型的攻擊。通常情況下,對(duì)防守者而言,攻擊者的類型無(wú)法確定,這使得防守資源的優(yōu)化配置更加復(fù)雜和困難。為此本文引入了“先驗(yàn)概率”來(lái)量化特定類型的攻擊者發(fā)起攻擊的概率,使用先驗(yàn)概率分布來(lái)描述每種類型的攻擊者發(fā)起攻擊的可能性,并假設(shè)防守者知道每個(gè)加油站對(duì)不同類型攻擊者的價(jià)值。對(duì)比分析實(shí)驗(yàn)結(jié)果得出,與完全信息博弈相比,貝葉斯博弈模型場(chǎng)景不僅能夠更加合理地調(diào)配有限的防御資源,最大化減小預(yù)期損失,同時(shí)當(dāng)某一種類型攻擊者的先驗(yàn)概率增加時(shí),目前的方法也能夠幫助防守者修改防御資源配置來(lái)抵御該類型攻擊者的攻擊。當(dāng)前本市公共安全部門十分重視基礎(chǔ)公共安全設(shè)施的安保防護(hù)措施,投入了大量的人力、物力和財(cái)力,本文提供的模型以及方法可以在一定程度上更好地保護(hù)公共基礎(chǔ)設(shè)施,為安全部門提供一些新的技術(shù)和策略參考。