基于有限理性理論的虛擬士兵感知行為建模研究

2012-04-24 08:09:38曹波偉姚義軍

指揮控制與仿真 2012年3期

曹波偉,薛青,姚義軍

(裝甲兵工程學院,北京 100072)

虛擬士兵能否高逼真度地模擬真實士兵的行為動作,關(guān)系到整個作戰(zhàn)仿真系統(tǒng)的真實性和有效性,這是一項具有挑戰(zhàn)性和前沿性的工作。當前的行為模型都只考慮了感知活動的某一方面,具有一定的片面性,因此虛擬士兵感知活動的逼真度較低。

有限理性最初是由諾貝爾經(jīng)濟學獎獲得者西蒙提出來的,主要用來區(qū)別“理性經(jīng)濟人”與“有限理性管理人”的本質(zhì)所在。在人工智能領(lǐng)域,完全智能人與真實人的差別在很大程度上與“理性經(jīng)濟人”與“有限理性管理人”的差別有很大的相似性。因此,本文首次在人工智能領(lǐng)域引入“有限理性”的概念,將人的有限理性特征與人工智能技術(shù)結(jié)合起來,將有限理性理論應用到虛擬士兵的感知模型中,構(gòu)建逼真的虛擬士兵感知行為模型,從而充分發(fā)揮有限理性的有限特性,使虛擬士兵不僅具有一般智能體的行為特征,而且具有真實人的有限理性特征,從而提高虛擬士兵與真實士兵行為的一致性,擺脫虛擬士兵“盲目”的智能化。

1 有限理性相關(guān)概念及特點

1.1 有限理性定義

定義 1 有限理性是指介于完全理性和非完全理性之間的在一定限制下的理性[1]。

定義 2 有限理性虛擬士兵由于受到環(huán)境和自身條件等主客觀因素的限制,從而所感知的信息具有不完全和不確定性的特點,且決策能力因此呈現(xiàn)出非完全理性的虛擬作戰(zhàn)智能體[2]。

1.2 有限理性虛擬士兵感知行為的特征

戰(zhàn)場環(huán)境中真實士兵的有限理性可以總結(jié)如下。

1)在感知活動階段[3],真實士兵的感知過程受客觀條件的影響(如距離、角度、天氣、噪音等),因此虛擬士兵不能超越真實人的觀察能力去感知戰(zhàn)場環(huán)境。另外,士兵的感知能力也受自身能力的制約,不可能窮盡所有的感知對象,也不可能獲取對象的所有信息和屬性[4]。

2)在尋求策略階段,真實士兵無法找出所有的備選方案,只是作兩手準備,總會反應式的生成一個快速反應方案以應對時間的緊迫。只有在時間允許下,真實士兵才能尋求萬全之策,找到可能滿意的決策方案集。這也體現(xiàn)了真實士兵的決策實時性的特點。

3)在決策活動階段,真實士兵不可能找出所有的備選行動方案,然后逐個評價,最終選擇最大收益的方案[5],而是會在有限資源和有限時間的條件下選擇近似最優(yōu)解。這體現(xiàn)了有限理性理論中的有限最優(yōu)準則,即真實士兵選擇的活動不總是最優(yōu)的,但總是在有限限制條件下最好的。

通過對真實士兵有限理性特征的分析總結(jié),得到基于有限理性虛擬士兵感知行為的特征。

1)實時性基于有限理性的虛擬士兵必須及時感知到戰(zhàn)場周圍的突發(fā)事件并能夠根據(jù)戰(zhàn)場態(tài)勢決定是否執(zhí)行當前任務(wù)。感知的實時性可以維持虛擬戰(zhàn)場環(huán)境中虛擬士兵活動的連貫性和逼真感。

2)局限性局限性是有限理性虛擬士兵感知活動的重要特點?，F(xiàn)實中沒有無所不知的士兵,更沒有無所不能的士兵。因此在獲取外界環(huán)境信息的能力方面,虛擬士兵受各方面因素影響,如距離、天氣、可見度、感知能力等。

3)不完全性不完全性主要表現(xiàn)在虛擬士兵生成的感知信念上。由于虛擬士兵的感知能力和客觀條件的影響,虛擬士兵不可能觀測到全部的戰(zhàn)場信息,只能獲取其能力范圍內(nèi)的部分戰(zhàn)場信息。這也是有限理性體現(xiàn)的重要方面。

4)客觀性虛擬士兵在獲取信息時不是憑空想象和主觀臆想的,虛擬士兵所感知到的信息來源于虛擬戰(zhàn)場環(huán)境,與虛擬戰(zhàn)場環(huán)境的變化一致。因此,虛擬士兵的感知行為具有客觀性。

5)主觀性感知行為不僅具有很強的客觀性,同時,它與感知主體也是息息相關(guān)的。相同的事物,不同的感知主體所獲取的信息可能是不相同的。例如,對待正北方偏西 30°有敵軍一坦克正以 30km/s的速度前進,不同的感知主體,由于其能力的有限性,得到的信念是不同的,帶有明顯的主觀意識,甚至會得到錯誤的信念。

2 虛擬士兵的有限感知行為建模

圖1 虛擬士兵感知模型的總體結(jié)構(gòu)

虛擬士兵的感知是其行為決策的基礎(chǔ),其逼真度直接影響虛擬士兵行為的可信性[6]。同真實士兵一樣,虛擬士兵在感知外界環(huán)境信息時,與自身因素和環(huán)境因素有較大關(guān)系。虛擬士兵的有限感知主要體現(xiàn)在有限的視覺、聽覺和記憶。圖1給出了虛擬士兵感知模型的總體結(jié)構(gòu)。

1)有限視覺視覺是最重要的感知渠道,虛擬士兵 80%以上的感知信息需要由視覺提供,其對戰(zhàn)場環(huán)境的視覺觀察主要有兩個特點:首先,其視覺范圍是受限的,虛擬士兵不可能觀察到其視覺范圍之外的物體;其次,虛擬士兵的觀察能力是有限的,其不可能獲取全部的觀察對象及其全部屬性信息。

2)有限聽覺聽覺是感知的重要內(nèi)容,虛擬士兵往往對聲音的變化非常敏感,尤其是在搜索敵人的過程中。虛擬士兵經(jīng)常能利用聽覺發(fā)現(xiàn)視力所不及的戰(zhàn)場信息,但無法聽見所有的聲音和分辨出所有的聲音。

3)有限記憶感知記憶存儲著虛擬士兵感知到的信息,能夠為虛擬士兵的感知提供輔助。虛擬士兵的記憶特點是有限的,具體表現(xiàn)在記憶信息會隨著時間的推移而慢慢被忘卻,只有重要的記憶信息可能長久保留,其余的信息會被忘卻。

為了高效地模擬感知效果,滿足作戰(zhàn)仿真系統(tǒng)對仿真可信度和計算量的要求,首先盡可能地簡化感知模型;其次在建模過程中合理應用限制條件,以體現(xiàn)出虛擬士兵感知的有限性。

2.1 有限視覺模型

視覺模塊的有限性主要體現(xiàn)在感知事物的不確定性和信息的不完全性兩方面。視覺模型的功能是仿真人眼的感知能力,視覺建模的目的是為了生成逼真的行為,所以在設(shè)計有限理性虛擬士兵視覺模型時,主要體現(xiàn)了視覺的有限性特征。視覺模型通過對感知對象的可見性分析得出視覺范圍內(nèi)能夠被士兵感知到概率分布,并從記憶模塊中讀出對象的以前信息,最終綜合生成視覺感知信念。建立逼真的有限視覺感知模型分為以下8個步驟:

①確定視覺范圍;

②判斷感知對象是否在虛擬士兵的視覺范圍之內(nèi);

③對感知對象進行可見性分析;

④判斷感知對象是否可見;

⑤確定視覺感知層次;

⑥綜合記憶信息;

⑦形成感知信念;

⑧確定視覺范圍并判斷。

首先判斷對象 Oi是否在虛擬士兵D的視覺范圍之內(nèi)。由于虛擬士兵的感知范圍不是一個簡單的球體,而是以D為半徑,以士兵當前的方向垂直的截面為底面的半球體。因此可以將判斷過程轉(zhuǎn)換為將虛擬士兵S與感知對象Oi的中心連線向虛擬士兵S橫切面做投影,然后判斷投影直線與方向向量的夾角ai,如果ai小于 90°,則此感知對象 Oi在視覺感知范圍之內(nèi),否則不在其視覺感知范圍內(nèi)。

1)基于有限感知因子的可見性分析

在虛擬士兵的視覺感知過程中,當獲取某感知對象的信息時,有很多主客觀因子會對觀察結(jié)果產(chǎn)生影響,如感知對象的距離、體積的大小、對象的運行速度等。為了提高模型的運行效率,這里選取幾個比較重要的因素對感知對象進行可見性分析:幾何因子δ1; 可見度因子δ2;機動速度因子δ3;對比度因子δ4。四個可見性因子后,感知對象的可見性按式(1)計算得出:

可見性δ的含義如下:基于有限理性的虛擬士兵不可能感知到所有在其視覺范圍內(nèi)的對象,只能選擇性地去感知。此時的δ值表示該對象在環(huán)境中能被虛擬士兵感知到的概率。

2)感知層次的確定

根據(jù)可見性能的不同,把感知對象劃分為三個層次Ld察覺層次,Li辨認層次,Lc理解層次。察覺層是感知的最低等級,虛擬士兵只能感知到此對象而得不到其具體屬性;在辨認層,虛擬士兵可以分辨對象的部分屬性;在理解層,虛擬士兵能感知到其感興趣的屬性。感知層次的確定由可見性δ確定:當00.3δ＜≤時,為察覺層次Ld ;當0.30.7δ＜≤時,為辨認層次Li;當0.71δ≤≤時,為理解層次Lc。

3)生成感知信念

確定感知層次后,虛擬士兵形成初步的的感知信念,生成的感知信念可以用五元組的形式來表示

Message1=＜ID,object,attribute,visibility,grade＞

其中,ID表示此信念編號,object表示該對象的名稱,attribute表示該對象的若干屬性,visibility則表示該對象的可見性,grade表示感知層次。

2.2 有限聽覺模型

虛擬士兵的有限聽覺主要體現(xiàn)在其有限的聽覺范圍和有限的聲音分辨能力上。虛擬士兵的聽覺是通過設(shè)置聲音觸發(fā)器實現(xiàn)的,當有聲音發(fā)生時觸發(fā)一個聲音觸發(fā)器,以觸發(fā)半徑為球體的范圍內(nèi)的虛擬士兵得到一個聲音消息,此消息包括聲音的ID號,聲源的位置和聲音的屬性,如強度、頻率等。士兵根據(jù)當前任務(wù)和聲音的距離和強弱判斷是否將此信息通知視覺感知器,改變視覺感知的方向,將視覺感知方向變換到發(fā)聲的區(qū)域。

在式(2)中,Si表示虛擬士兵感知到的聲音強度,sound表示聲音信息的強度,dsi表示聲音發(fā)生點與虛擬士兵的距離,ks為聽覺系數(shù)。

建立逼真的有限虛擬聽覺感知的判斷過程分為六個步驟:

①確定聲源傳播范圍D;

②判斷虛擬士兵得到的聲源強度是否超過域值S0;

③判斷虛擬士兵得到的聲源頻率f是否在聽覺范圍內(nèi);

④判斷是否有掩蔽效應;

⑤得到初步聽覺感知信念;

⑥綜合感知信念,結(jié)束。

計算得到的Si與虛擬士兵的聲音感知強度閾值Sf比較,若大于閾值就通過感知器接受此聽覺信息,若小于此常數(shù)則忽略此消息。

此模型較好地體現(xiàn)了虛擬士兵獲取聲音信息時的有限特征,而不是無限制地去接受所有的聲音信息,較真實地模擬了人的聽覺感知。

確定聽覺感知層次后,虛擬士兵形成初步的的聽覺感知信念,生成的聽覺感知信念可以用四元組的形式來表示 Message2=＜ID,object,attribute,grade＞

其中,ID表示此信念編號,是暫時的一個編號,object表示該聲音的名稱,attribute表示該聲音的若干屬性,如方位、強度等,grade表示感知層次。

初步產(chǎn)生的信念Message1和Message2根據(jù)其對象的名稱和屬性與其記憶庫進行比較,得到最終的信念,并可以由此確定產(chǎn)生信念的可信度和精度。最終的信念由一個六元組表示。Message=＜ID,sensor,object,attribute,precision,reliablity＞

其中,ID表示此信念編號,在仿真過程中是唯一的,sensor表示感知方式,object表示該對象的名稱,attribute表示該對象的若干屬性,precision表示此信念的精度,reliablity表示此信念的可信度。最終產(chǎn)生的信念Message一方面輸入決策模型作為虛擬士兵進一步行動的依據(jù),另一方面轉(zhuǎn)化為記憶信息存入記憶庫中。最終信念的產(chǎn)生可能來源于一種感知方式,也可能是多種感知方式的綜合。當虛擬士兵感知到聽覺信息后,生成了聽覺信念,根據(jù)此信念虛擬士兵可能會有意識的調(diào)用視覺模型,判斷聲源的可見性。類似這種情況時,感知模型產(chǎn)生的最終信念是綜合了視覺、聽覺甚至記憶等多種初步信念得到的綜合信念。

2.3 有限記憶模型

感知模型中的記憶模型起到了緩存器的作用,負責感知信息及其他記憶信息的存儲[7]。雖然士兵的記憶容量幾乎是無限的,但具體到某一個場景或事件而言,待記憶的信息量是有限的。另外,為了確保仿真系統(tǒng)的實時性,虛擬士兵的記憶信息存儲的內(nèi)存空間必須是有限連續(xù)的。參照人類記憶的遺忘現(xiàn)象,對內(nèi)存空間的維護采用淘汰機制,因為當記憶模型的存儲區(qū)滿時,必須采用一定的置換策略,從存儲區(qū)淘汰某些陳舊信息。記憶遺忘特性主要是:1)人類記憶中一些重要的信息是很難被遺忘的;2)隨著時間的推移,越早的記憶越容易被遺忘[8];3)人類記憶中一些不重要的信息會逐漸被遺忘。

針對以上記憶特點,本文提出用鏈表型隊列來存儲記憶模型中的信息。當戰(zhàn)場環(huán)境中的對象通過視覺和聽覺感知器過濾后,被認為是可感知對象時,記憶模型根據(jù)感知過濾過程實時生成一條對應的感知信息,存入到鏈表型隊列的當前有效空間。每一條感知信息可以用一下五元組的形式來表示。

Perception=＜ID,Sensor-type,Object,Precision,Term＞

其中,ID為該感知信息在記憶模型中的存儲標識,該標識具有唯一性。Object為所感知對象在戰(zhàn)場環(huán)境中的標識號,通過這一標識可以方便地獲取對象的大致信息,Sensor-type表示獲取該信息的感知器編號,Precision表示被感知對象的信息描述精度。Term 表示該記憶信息的存儲時限,該時限主要根據(jù)感知對象的穩(wěn)定性和重要性來決定。

為記憶模型維護一個大小為T的鏈表型隊列結(jié)構(gòu),當存儲區(qū)滿時,設(shè)當前存儲指針指向記錄 n,記憶模型將需存儲信息與記錄n的存儲時限值term進行比較。如果記錄n的term值更大,則繼續(xù)與記錄n+1比較,若存儲指針指向表尾還未找到合適位置時,再次從表頭開始,直到找到存儲時限相同或更小的記錄,并將其替換。由于存儲時限長的信息只占記憶模塊的小部分空間,并且可以設(shè)置存儲時限閾值,定期根據(jù)閾值淘汰一些過于陳舊的記憶信息。因此可避免最新的感知信息無法找到存儲空間情況的發(fā)生。由于環(huán)形隊列的存儲結(jié)構(gòu),在同等優(yōu)先級中總是將最早的記憶信息淘汰,即虛擬人觀察過的大部分對象只能在記憶中存儲有限的時間,經(jīng)過一段時間即會被刪除,從而實現(xiàn)了對記憶遺忘特征的模擬。

虛擬人通過感知方式得到的環(huán)境信息能夠在記憶模型中得以保存。而基于存儲優(yōu)先級的淘汰方式使得其中某些重要信息能夠堆積下來,但優(yōu)先級不高的則被淘汰,淘汰方式有兩種:一是被替代,二是被主動刪除。這種記憶淘汰的過程很好地體現(xiàn)了虛擬士兵的有限記憶能力,不是什么都遺忘,也不是什么都記住,而是有重點有選擇地記憶[9]。

3 結(jié)束語

隨著計算機技術(shù)和人工智能技術(shù)的飛速發(fā)展,作戰(zhàn)仿真系統(tǒng)對逼真度和可信度的要求越來越高。作為模擬參演兵力而加入的智能虛擬士兵,其行為的真實性和可信性將對整個系統(tǒng)的可信度產(chǎn)生重要影響,這也對虛擬士兵行為建模的真實性提出了更高的要求。有限理性理論主要用來解釋完全理性人與現(xiàn)實人在行為上的本質(zhì)差別,客觀地闡述了由于有限的信息和決策能力,現(xiàn)實人與完全理性人在選擇行為時的客觀差異性。并且目前的研究表明,基于有限理性的虛擬士兵,其有限的感知和決策行為能夠更好的模擬真實士兵的行為特征,在一定程度上提高了虛擬士兵行為的真實度和可信度。

[1]赫伯特·西蒙.管理行為:管理組織決策過的研究[M].北京:北京經(jīng)濟出版社,1991:36-37,45.

[2]許威威,等.智能虛擬環(huán)境中的決策模型及其應用[J].中國圖像圖形學報,2001,6(5):496-502.

[3]王清.一類有限理性的建模和決策分析方法的研究[D].武漢:華中科技大學博士學位論文,2009:12-15.

[4]李亮.影響有限理性實現(xiàn)程度的因素分析[D].南京南京理工大學碩士學位論文,2005:78-83.

[5]Andrew Ortony,Gerald L Clore,Allan Collins,The cognitive structure of emotions[J].Cambridge University Press,Cambrage,2008,34(11):77-79.

[6]A S Rao,M P Georgeff,Modeling rational Agents within a BDI-architecture[J].Proceedings of the International Conference on Principles of Knowledge Representation and Reasoning,San Mateo,CA,USA,2006:473-484.

[7]Olga Pacheco and Jose Carom.A Role Based Model for the Normative Specification of Organized Collective Agencyand Agents Interaction[J].Autonomous Agents and Multi-Agent Systems,2007,6(2):145-184.

[8]倪慧.自主虛擬人關(guān)鍵技術(shù)的研究[D].天津:天津大學計算機科學與技術(shù)博士學位論文,2007.

[9]魏陽.基于指令機制的作戰(zhàn) Agent建模與仿真研究[D].北京:裝甲兵工程學院博士學位論文,2010:30-41.

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看