基于貝葉斯博弈的防御資源調(diào)配模型研究

2022-06-14 10:25黎忠凱齊向偉霍程程

現(xiàn)代電子技術(shù) 2022年11期

黎忠凱，齊向偉，王鑫，霍程程

（1.新疆師范大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院，新疆烏魯木齊 830054；2.新疆大學(xué) 信息科學(xué)與工程學(xué)院，新疆烏魯木齊 830054）

0 引言

一個(gè)城市內(nèi)如何優(yōu)化有限的防守資源來(lái)抵御潛在的攻擊對(duì)公共安全部門來(lái)說(shuō)是一個(gè)巨大的挑戰(zhàn)。一些研究學(xué)者已經(jīng)使用貝葉斯博弈模型來(lái)解決攻擊者的問題。文獻(xiàn)[2]提出了一系列貝葉斯斯坦伯格博弈模型，并將其應(yīng)用于洛杉磯國(guó)際機(jī)場(chǎng)和聯(lián)邦空管局，優(yōu)化了其安全資源配置；文獻(xiàn)[3]構(gòu)造了一個(gè)靜態(tài)貝葉斯博弈模型來(lái)模擬網(wǎng)絡(luò)信息系統(tǒng)的主動(dòng)防守策略，但是該方法僅考慮了靜態(tài)環(huán)境下的博弈，忽略了現(xiàn)實(shí)情況下可能存在的狀況；文獻(xiàn)[4]提出了一種基于完整信息博弈論的有限防御資源分配優(yōu)化方法。該方法充分考慮了防御者和攻擊者之間的戰(zhàn)略互動(dòng)，可以確定防御資源的最佳全局分配。但是，此方法僅考慮游戲模型中的一種攻擊者。借鑒相關(guān)研究的經(jīng)驗(yàn)，本文在原有的貝葉斯博弈模型的基礎(chǔ)上進(jìn)行改進(jìn)，將一種攻擊者類型的研究擴(kuò)展為針對(duì)多種攻擊者類型的研究，保護(hù)加油站免受多種類型攻擊。據(jù)了解，在一個(gè)城市范圍內(nèi)，研究使用博弈論優(yōu)化加油站防御資源配置的報(bào)道比較少。

綜上所述，本文基于貝葉斯博弈模型提出了一種考慮多種類型攻擊者的優(yōu)化有限防御資源調(diào)配的博弈論方法，該方法引進(jìn)先驗(yàn)概率，通過(guò)優(yōu)化防御資源調(diào)配最小化預(yù)期損失。以4 個(gè)貯存汽油、柴油的加油站為例，本文驗(yàn)證了該方法的可靠性以及適用性，比較了不同防守策略的效果，并說(shuō)明了該方法的優(yōu)越性。

1 模型構(gòu)建與分析

1.1 符號(hào)及定義

為了方便分析，本文出現(xiàn)的數(shù)學(xué)符號(hào)定義見表1。

表1 有關(guān)符號(hào)及定義

1.2 參與者的策略集與收益

針對(duì)潛在攻擊的情況，本文為保護(hù)多個(gè)加油站設(shè)施研究了防御資源的分配方法，并將其作為博弈的雙方參與者：攻擊者和防守者。攻擊者通過(guò)選擇一個(gè)合適的目標(biāo)最大化他的預(yù)期收益，而防守者的目標(biāo)就是通過(guò)優(yōu)化防守資源配置最小化預(yù)期損失。

一般來(lái)說(shuō)，攻擊者假定認(rèn)為在一個(gè)時(shí)間段只能攻擊一個(gè)目標(biāo)。對(duì)于個(gè)加油站，攻擊者的策略可以用一個(gè)概率集描述：

對(duì)于防守者來(lái)說(shuō)，這個(gè)策略可以表示為可用資源的調(diào)配模式：

防守者的策略集描述如下：

防守者的預(yù)期損失和收益可以表示為：

1.3 模型構(gòu)建

目前的貝葉斯博弈模型中，攻擊者通過(guò)選擇一個(gè)合適的攻擊目標(biāo)來(lái)最大化自己的預(yù)期收益，本文將攻擊者A的優(yōu)化問題表示為：

與此相反，防守者的目標(biāo)就是通過(guò)優(yōu)化有限的防御資源配置來(lái)抵御各種類型的攻擊者，從而最小化他們的預(yù)期損失：

目前的貝葉斯博弈模型是指參與者們彼此都無(wú)法觀察到對(duì)方的策略，從而根據(jù)觀察到的信息決定自己的策略。將這種靜態(tài)貝葉斯博弈模型用海薩尼將其轉(zhuǎn)換為一個(gè)完全信息博弈求解，可以表示為(,,,…,a)。當(dāng)納什均衡實(shí)現(xiàn)時(shí)，防守者是無(wú)法通過(guò)改變自己的防守策略從而進(jìn)一步減少自己的預(yù)期損失，攻擊者也無(wú)法通過(guò)改變自己的攻擊策略從而進(jìn)一步擴(kuò)大自己的預(yù)期收益。因此，此時(shí)貝葉斯納什均衡需要滿足下面兩個(gè)公式：

本文根據(jù)上述已有的貝葉斯博弈方法，考慮多種攻擊類型情況，通過(guò)引進(jìn)先驗(yàn)概率以及脆弱性函數(shù)對(duì)其進(jìn)行優(yōu)化，構(gòu)建博弈方法如圖1 所示。

圖1 博弈論方法

該方法最顯著的特點(diǎn)就是它考慮了現(xiàn)實(shí)中多種類型攻擊者的存在，主要步驟如下：

1）結(jié)果估算：基于收集好的加油站和潛在攻擊者的信息。

2）確定攻擊者的類型和先驗(yàn)概率：隨著信息的收集，防守者能夠確定攻擊者的類型并且推測(cè)出他們的先驗(yàn)概率。

3）評(píng)估攻擊者眼中每個(gè)加油站的價(jià)值收益：防守者從攻擊者的角度出發(fā)，評(píng)估每個(gè)加油站在不同攻擊者眼中的價(jià)值。

4）建立防守者策略集：隨著信息的收集，防守者們可以構(gòu)建一個(gè)策略集（見式（7）），另外通過(guò)分析防御投入對(duì)脆弱性的影響，防守者可以確定各個(gè)加油站防御資源的脆弱性函數(shù)。

5）建立攻擊者策略集：防守者推測(cè)每個(gè)加油站受到不同類型攻擊者發(fā)動(dòng)攻擊的概率并且進(jìn)一步為不同類型攻擊者構(gòu)造一個(gè)策略集（見式（4）和式（13））。

6）開發(fā)一個(gè)貝葉斯博弈模型：貝葉斯博弈模型的輸入（見式（11）和式（12））包括攻防雙方的策略集、結(jié)果、脆弱性、攻擊者眼中加油站的價(jià)值以及不同類型攻擊者的先驗(yàn)概率。

7）獲取防御資源的最優(yōu)配置：通過(guò)求解貝葉斯博弈模型，防守者可以得到一個(gè)貝葉斯納什均衡解，也就是一個(gè)最優(yōu)策略集。根據(jù)均衡解，防守者最后可以得到有限防御資源的最優(yōu)配置。

2 實(shí)驗(yàn)設(shè)計(jì)

2.1 場(chǎng)景仿真

為了證明提出方法的可靠性和適用性，本文以4 個(gè)貯存汽油、柴油的加油站作為仿真案例進(jìn)行研究。基本信息如表2 所示。

表2 加油站基本信息

與其他加油站相比，仿真場(chǎng)景中加油站擁有其獨(dú)特之處。在進(jìn)入加油站之前設(shè)有攔卡，車上人員需要下車接受檢查后才能進(jìn)站加油，這個(gè)過(guò)程中需要一定時(shí)間；根據(jù)加油站的大小不同，檢查人員數(shù)量也不盡相同，工作效率也是相互不一的。但本文研究的主要目的是分析多種類型攻擊者對(duì)防御資源分配的影響，因此假定加油站安檢人員不具備抵御攻擊者的防御能力，4 個(gè)加油站特點(diǎn)和安保措施大致相同，認(rèn)為保護(hù)4 個(gè)加油站的困難水平是相同的；也就是意味著在給任何一個(gè)加油站增加防御資源時(shí)，加油站的脆弱性變化無(wú)異。根據(jù)上面的假設(shè)，可以引進(jìn)脆弱性函數(shù)，將其描述為：

假設(shè)無(wú)論攻擊者存在一種類型還是多種類型，防守者都知道每個(gè)加油站對(duì)于不同類型攻擊者的價(jià)值，但是防守者不清楚哪種類型攻擊者將會(huì)發(fā)動(dòng)攻擊，因此通過(guò)設(shè)置不同類型攻擊者的先驗(yàn)概率確定每種類型攻擊者將會(huì)發(fā)動(dòng)攻擊的可能性。在本文案例研究中，設(shè)置了三種類型攻擊者、和，不同加油站在不同類型攻擊者眼中的價(jià)值如圖2 所示。

圖2 攻擊者眼中加油站的價(jià)值

圖2 中：攻擊者對(duì)4 個(gè)加油站的估值存在很大差異，相比攻擊者和，他更傾向于對(duì)貯存油量更多的加油站發(fā)起進(jìn)攻；而攻擊者與攻擊者恰恰相反，攻擊者傾向于周邊人口密度大的加油站，他的目的在于盡可能造成大的人員傷亡、人群恐慌和財(cái)產(chǎn)損失；相比之下，攻擊者與攻擊者對(duì)4 個(gè)加油站的估值基本相似，但是其行為難以猜測(cè)。

根據(jù)上述提到的多種類型攻擊者，設(shè)置了3 個(gè)完整信息博弈和4 個(gè)貝葉斯博弈場(chǎng)景，對(duì)比兩種博弈在優(yōu)化前后防御資源配置上的差異，如表3 所示。在本文案例研究中，出于對(duì)安全的考慮，虛構(gòu)了攻擊者目標(biāo)的價(jià)值和先驗(yàn)概率，雖然這些數(shù)據(jù)不滿足實(shí)際應(yīng)用的情況，但是已經(jīng)滿足了貝葉斯博弈模型的要求。

表3 兩種博弈場(chǎng)景和最優(yōu)策略集

2.2 損失評(píng)估

潛在攻擊的結(jié)果可以從下面兩個(gè)方面來(lái)考慮：人員傷亡和財(cái)產(chǎn)損失。簡(jiǎn)單來(lái)講就是可以用人民幣將人員傷亡轉(zhuǎn)換為財(cái)產(chǎn)損失進(jìn)行評(píng)估，因此其結(jié)果可以表示為：

式中：L是指第個(gè)加油站被成功攻擊后的財(cái)產(chǎn)損失；L是指第個(gè)加油站被成功攻擊后的人員傷亡，可以將其轉(zhuǎn)換為財(cái)產(chǎn)損失。

綜合當(dāng)?shù)卣踩块T和專家意見，本實(shí)驗(yàn)的計(jì)算方法中死亡、重傷和輕傷人員分別一一對(duì)應(yīng)300 萬(wàn)元、100 萬(wàn)元和4 萬(wàn)元，這些價(jià)值與當(dāng)?shù)氐慕?jīng)濟(jì)條件、風(fēng)俗有關(guān)，每個(gè)地方都不相同并且隨著時(shí)間而變化。

式中：N，N和N分別表示死亡、重傷和輕傷人員的數(shù)量。

模擬4 個(gè)加油站場(chǎng)景，平均人口密度和財(cái)產(chǎn)密度如表1 所示，任意一個(gè)加油站被成功襲擊后的損失根據(jù)式（16）和式（17）計(jì)算，如圖3 所示。

圖3 加油站被成功攻擊后的損失

3 實(shí)驗(yàn)結(jié)果及分析

3.1 完全信息博弈場(chǎng)景

圖4 完全信息博弈模型獲取的最優(yōu)策略集

從圖4a）可以看出，第4個(gè)加油站擁有最大的損失卻沒有防御資源，而第2 個(gè)加油站擁有最小的損失卻幾乎擁有所有防御資源。這就表明在完全信息博弈場(chǎng)景下，防守者不一定會(huì)向產(chǎn)生巨大后果的加油站調(diào)配額外的防御資源。另外，從攻擊者角度考慮目標(biāo)加油站的價(jià)值見圖4，從攻擊者類型為（圖2）的角度來(lái)看，第1個(gè)加油站和第2 個(gè)加油站擁有更高的價(jià)值，因此分配了更多的防御資源；從攻擊者角度來(lái)看，具有很低價(jià)值的第3 個(gè)和第4 個(gè)加油站分配一點(diǎn)防御資源、不分配防御資源。這就表明，在完全信息博弈場(chǎng)景下，從攻擊者的角度來(lái)看，通常具有較高價(jià)值的加油站優(yōu)先獲得更多的防御資源。

3.2 貝葉斯博弈場(chǎng)景

3.3 兩種博弈場(chǎng)景對(duì)比分析

通過(guò)圖4 和圖5 的對(duì)比，實(shí)驗(yàn)表明處于貝葉斯博弈場(chǎng)景下的最優(yōu)安全資源配置與在完全信息博弈場(chǎng)景下的最優(yōu)安全資源配置有著極大的不同。以第4 個(gè)加油站為例，完全信息博弈場(chǎng)景下只有一種攻擊類型的防御資源為0 單位，而貝葉斯博弈場(chǎng)景下有三種攻擊者類型、和（0.2，0.4，0.4）的防御資源為42 單位。進(jìn)一步對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析，當(dāng)某一種類型攻擊者的先驗(yàn)概率增加時(shí)，目前的方法能夠幫助防守者修改防御資源配置來(lái)抵御該類型攻擊者的攻擊。

圖5 貝葉斯博弈模型獲取的最優(yōu)策略集

如圖6 所示，當(dāng)存在多種類型的攻擊者時(shí)，處于貝葉斯均衡下防守者的預(yù)期損失隨著攻擊者A的先驗(yàn)概率的增加而接近于納什均衡（僅攻擊者A），其中=100 單位，=0.015。

圖6 納什均衡（#）和貝葉斯均衡（*）下的預(yù)期損失

隨著關(guān)鍵參數(shù)防御系數(shù)從0.005 增加到0.025，可用的防御資源被重新分配給更多的加油站，同時(shí)這也進(jìn)一步降低了防守者的預(yù)期損失，如圖7 所示。圖7 中，=100 單位。在防御資源總量不變的情況下，通過(guò)增加貝葉斯博弈模型中的防御系數(shù)，防守者可以重新分配可用的防御資源，進(jìn)一步降低預(yù)期損失。

圖7 不同防御系數(shù)下的預(yù)期損失

4 結(jié) 語(yǔ)

本文提出了一種基于貝葉斯博弈論方法的防御資源的分配策略，以保護(hù)加油站設(shè)施免受多種類型的攻擊。通常情況下，對(duì)防守者而言，攻擊者的類型無(wú)法確定，這使得防守資源的優(yōu)化配置更加復(fù)雜和困難。為此本文引入了“先驗(yàn)概率”來(lái)量化特定類型的攻擊者發(fā)起攻擊的概率，使用先驗(yàn)概率分布來(lái)描述每種類型的攻擊者發(fā)起攻擊的可能性，并假設(shè)防守者知道每個(gè)加油站對(duì)不同類型攻擊者的價(jià)值。對(duì)比分析實(shí)驗(yàn)結(jié)果得出，與完全信息博弈相比，貝葉斯博弈模型場(chǎng)景不僅能夠更加合理地調(diào)配有限的防御資源，最大化減小預(yù)期損失，同時(shí)當(dāng)某一種類型攻擊者的先驗(yàn)概率增加時(shí)，目前的方法也能夠幫助防守者修改防御資源配置來(lái)抵御該類型攻擊者的攻擊。當(dāng)前本市公共安全部門十分重視基礎(chǔ)公共安全設(shè)施的安保防護(hù)措施，投入了大量的人力、物力和財(cái)力，本文提供的模型以及方法可以在一定程度上更好地保護(hù)公共基礎(chǔ)設(shè)施，為安全部門提供一些新的技術(shù)和策略參考。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看