曹波偉,薛 青,姚義軍
(裝甲兵工程學院,北京 100072)
虛擬士兵能否高逼真度地模擬真實士兵的行為動作,關(guān)系到整個作戰(zhàn)仿真系統(tǒng)的真實性和有效性,這是一項具有挑戰(zhàn)性和前沿性的工作。當前的行為模型都只考慮了感知活動的某一方面,具有一定的片面性,因此虛擬士兵感知活動的逼真度較低。
有限理性最初是由諾貝爾經(jīng)濟學獎獲得者西蒙提出來的,主要用來區(qū)別“理性經(jīng)濟人”與“有限理性管理人”的本質(zhì)所在。在人工智能領(lǐng)域,完全智能人與真實人的差別在很大程度上與“理性經(jīng)濟人”與“有限理性管理人”的差別有很大的相似性。因此,本文首次在人工智能領(lǐng)域引入“有限理性”的概念,將人的有限理性特征與人工智能技術(shù)結(jié)合起來,將有限理性理論應用到虛擬士兵的感知模型中,構(gòu)建逼真的虛擬士兵感知行為模型,從而充分發(fā)揮有限理性的有限特性,使虛擬士兵不僅具有一般智能體的行為特征,而且具有真實人的有限理性特征,從而提高虛擬士兵與真實士兵行為的一致性,擺脫虛擬士兵“盲目”的智能化。
定義 1 有限理性 是指介于完全理性和非完全理性之間的在一定限制下的理性[1]。
定義 2 有限理性虛擬士兵 由于受到環(huán)境和自身條件等主客觀因素的限制,從而所感知的信息具有不完全和不確定性的特點,且決策能力因此呈現(xiàn)出非完全理性的虛擬作戰(zhàn)智能體[2]。
戰(zhàn)場環(huán)境中真實士兵的有限理性可以總結(jié)如下。
1)在感知活動階段[3],真實士兵的感知過程受客觀條件的影響(如距離、角度、天氣、噪音等),因此虛擬士兵不能超越真實人的觀察能力去感知戰(zhàn)場環(huán)境。另外,士兵的感知能力也受自身能力的制約,不可能窮盡所有的感知對象,也不可能獲取對象的所有信息和屬性[4]。
2)在尋求策略階段,真實士兵無法找出所有的備選方案,只是作兩手準備,總會反應式的生成一個快速反應方案以應對時間的緊迫。只有在時間允許下,真實士兵才能尋求萬全之策,找到可能滿意的決策方案集。這也體現(xiàn)了真實士兵的決策實時性的特點。
3)在決策活動階段,真實士兵不可能找出所有的備選行動方案,然后逐個評價,最終選擇最大收益的方案[5],而是會在有限資源和有限時間的條件下選擇近似最優(yōu)解。這體現(xiàn)了有限理性理論中的有限最優(yōu)準則,即真實士兵選擇的活動不總是最優(yōu)的,但總是在有限限制條件下最好的。
通過對真實士兵有限理性特征的分析總結(jié),得到基于有限理性虛擬士兵感知行為的特征。
1)實時性 基于有限理性的虛擬士兵必須及時感知到戰(zhàn)場周圍的突發(fā)事件并能夠根據(jù)戰(zhàn)場態(tài)勢決定是否執(zhí)行當前任務(wù)。感知的實時性可以維持虛擬戰(zhàn)場環(huán)境中虛擬士兵活動的連貫性和逼真感。
2)局限性 局限性是有限理性虛擬士兵感知活動的重要特點?,F(xiàn)實中沒有無所不知的士兵,更沒有無所不能的士兵。因此在獲取外界環(huán)境信息的能力方面,虛擬士兵受各方面因素影響,如距離、天氣、可見度、感知能力等。
3)不完全性 不完全性主要表現(xiàn)在虛擬士兵生成的感知信念上。由于虛擬士兵的感知能力和客觀條件的影響,虛擬士兵不可能觀測到全部的戰(zhàn)場信息,只能獲取其能力范圍內(nèi)的部分戰(zhàn)場信息。這也是有限理性體現(xiàn)的重要方面。
4)客觀性 虛擬士兵在獲取信息時不是憑空想象和主觀臆想的,虛擬士兵所感知到的信息來源于虛擬戰(zhàn)場環(huán)境,與虛擬戰(zhàn)場環(huán)境的變化一致。因此,虛擬士兵的感知行為具有客觀性。
5)主觀性 感知行為不僅具有很強的客觀性,同時,它與感知主體也是息息相關(guān)的。相同的事物,不同的感知主體所獲取的信息可能是不相同的。例如,對待正北方偏西 30°有敵軍一坦克正以 30km/s的速度前進,不同的感知主體,由于其能力的有限性,得到的信念是不同的,帶有明顯的主觀意識,甚至會得到錯誤的信念。
圖1 虛擬士兵感知模型的總體結(jié)構(gòu)
虛擬士兵的感知是其行為決策的基礎(chǔ),其逼真度直接影響虛擬士兵行為的可信性[6]。同真實士兵一樣,虛擬士兵在感知外界環(huán)境信息時,與自身因素和環(huán)境因素有較大關(guān)系。虛擬士兵的有限感知主要體現(xiàn)在有限的視覺、聽覺和記憶。圖1給出了虛擬士兵感知模型的總體結(jié)構(gòu)。
1)有限視覺 視覺是最重要的感知渠道,虛擬士兵 80%以上的感知信息需要由視覺提供,其對戰(zhàn)場環(huán)境的視覺觀察主要有兩個特點:首先,其視覺范圍是受限的,虛擬士兵不可能觀察到其視覺范圍之外的物體;其次,虛擬士兵的觀察能力是有限的,其不可能獲取全部的觀察對象及其全部屬性信息。
2)有限聽覺 聽覺是感知的重要內(nèi)容,虛擬士兵往往對聲音的變化非常敏感,尤其是在搜索敵人的過程中。虛擬士兵經(jīng)常能利用聽覺發(fā)現(xiàn)視力所不及的戰(zhàn)場信息,但無法聽見所有的聲音和分辨出所有的聲音。
3)有限記憶 感知記憶存儲著虛擬士兵感知到的信息,能夠為虛擬士兵的感知提供輔助。虛擬士兵的記憶特點是有限的,具體表現(xiàn)在記憶信息會隨著時間的推移而慢慢被忘卻,只有重要的記憶信息可能長久保留,其余的信息會被忘卻。
為了高效地模擬感知效果,滿足作戰(zhàn)仿真系統(tǒng)對仿真可信度和計算量的要求,首先盡可能地簡化感知模型;其次在建模過程中合理應用限制條件,以體現(xiàn)出虛擬士兵感知的有限性。
視覺模塊的有限性主要體現(xiàn)在感知事物的不確定性和信息的不完全性兩方面。視覺模型的功能是仿真人眼的感知能力,視覺建模的目的是為了生成逼真的行為,所以在設(shè)計有限理性虛擬士兵視覺模型時,主要體現(xiàn)了視覺的有限性特征。視覺模型通過對感知對象的可見性分析得出視覺范圍內(nèi)能夠被士兵感知到概率分布,并從記憶模塊中讀出對象的以前信息,最終綜合生成視覺感知信念。建立逼真的有限視覺感知模型分為以下8個步驟:
①確定視覺范圍;
②判斷感知對象 是否在虛擬士兵 的視覺范圍之內(nèi);
③對感知對象進行可見性分析;
④判斷感知對象是否可見;
⑤確定視覺感知層次;
⑥綜合記憶信息;
⑦形成感知信念;
⑧確定視覺范圍并判斷。
首先判斷對象 Oi是否在虛擬士兵D的視覺范圍之內(nèi)。由于虛擬士兵的感知范圍不是一個簡單的球體,而是以D為半徑,以士兵當前的方向垂直的截面為底面的半球體。因此可以將判斷過程轉(zhuǎn)換為將虛擬士兵S與感知對象Oi的中心連線向虛擬士兵S橫切面做投影,然后判斷投影直線與方向向量的夾角ai,如果ai小于 90°,則此感知對象 Oi在視覺感知范圍之內(nèi),否則不在其視覺感知范圍內(nèi)。
1)基于有限感知因子的可見性分析
在虛擬士兵的視覺感知過程中,當獲取某感知對象的信息時,有很多主客觀因子會對觀察結(jié)果產(chǎn)生影響,如感知對象的距離、體積的大小、對象的運行速度等。為了提高模型的運行效率,這里選取幾個比較重要的因素對感知對象進行可見性分析:幾何因子δ1; 可見度因子δ2;機動速度因子δ3;對比度因子δ4。四個可見性因子后,感知對象的可見性按式(1)計算得出:
可見性δ的含義如下:基于有限理性的虛擬士兵不可能感知到所有在其視覺范圍內(nèi)的對象,只能選擇性地去感知。此時的δ值表示該對象在環(huán)境中能被虛擬士兵感知到的概率。
2)感知層次的確定
根據(jù)可見性能的不同,把感知對象劃分為三個層次Ld察覺層次,Li辨認層次,Lc理解層次。察覺層是感知的最低等級,虛擬士兵只能感知到此對象而得不到其具體屬性;在辨認層,虛擬士兵可以分辨對象的部分屬性;在理解層,虛擬士兵能感知到其感興趣的屬性。感知層次的確定由可見性δ確定:當00.3δ<≤時,為察覺層次Ld ;當0.30.7δ<≤時,為辨認層次Li;當0.71δ≤≤時,為理解層次Lc。
3)生成感知信念
確定感知層次后,虛擬士兵形成初步的的感知信念,生成的感知信念可以用五元組的形式來表示
Message1=<ID,object,attribute,visibility,grade>
其中,ID表示此信念編號,object表示該對象的名稱,attribute表示該對象的若干屬性,visibility則表示該對象的可見性,grade表示感知層次。
虛擬士兵的有限聽覺主要體現(xiàn)在其有限的聽覺范圍和有限的聲音分辨能力上。虛擬士兵的聽覺是通過設(shè)置聲音觸發(fā)器實現(xiàn)的,當有聲音發(fā)生時觸發(fā)一個聲音觸發(fā)器,以觸發(fā)半徑為球體的范圍內(nèi)的虛擬士兵得到一個聲音消息,此消息包括聲音的ID號,聲源的位置和聲音的屬性,如強度、頻率等。士兵根據(jù)當前任務(wù)和聲音的距離和強弱判斷是否將此信息通知視覺感知器,改變視覺感知的方向,將視覺感知方向變換到發(fā)聲的區(qū)域。
在式(2)中,Si表示虛擬士兵感知到的聲音強度,sound表示聲音信息的強度,dsi表示聲音發(fā)生點與虛擬士兵的距離,ks為聽覺系數(shù)。
建立逼真的有限虛擬聽覺感知的判斷過程分為六個步驟:
①確定聲源傳播范圍D;
②判斷虛擬士兵得到的聲源強度是否超過域值S0;
③判斷虛擬士兵得到的聲源頻率f是否在聽覺范圍內(nèi);
④判斷是否有掩蔽效應;
⑤得到初步聽覺感知信念;
⑥綜合感知信念,結(jié)束。
計算得到的Si與虛擬士兵的聲音感知強度閾值Sf比較,若大于閾值就通過感知器接受此聽覺信息,若小于此常數(shù)則忽略此消息。
此模型較好地體現(xiàn)了虛擬士兵獲取聲音信息時的有限特征,而不是無限制地去接受所有的聲音信息,較真實地模擬了人的聽覺感知。
確定聽覺感知層次后,虛擬士兵形成初步的的聽覺感知信念,生成的聽覺感知信念可以用四元組的形式來表示 Message2=<ID,object,attribute,grade>
其中,ID表示此信念編號,是暫時的一個編號,object表示該聲音的名稱,attribute表示該聲音的若干屬性,如方位、強度等,grade表示感知層次。
初步產(chǎn)生的信念Message1和Message2根據(jù)其對象的名稱和屬性與其記憶庫進行比較,得到最終的信念,并可以由此確定產(chǎn)生信念的可信度和精度。最終的信念由一個六元組表示。Message=<ID,sensor,object,attribute,precision,reliablity>
其中,ID表示此信念編號,在仿真過程中是唯一的,sensor表示感知方式,object表示該對象的名稱,attribute表示該對象的若干屬性,precision表示此信念的精度,reliablity表示此信念的可信度。最終產(chǎn)生的信念Message一方面輸入決策模型作為虛擬士兵進一步行動的依據(jù),另一方面轉(zhuǎn)化為記憶信息存入記憶庫中。最終信念的產(chǎn)生可能來源于一種感知方式,也可能是多種感知方式的綜合。當虛擬士兵感知到聽覺信息后,生成了聽覺信念,根據(jù)此信念虛擬士兵可能會有意識的調(diào)用視覺模型,判斷聲源的可見性。類似這種情況時,感知模型產(chǎn)生的最終信念是綜合了視覺、聽覺甚至記憶等多種初步信念得到的綜合信念。
感知模型中的記憶模型起到了緩存器的作用,負責感知信息及其他記憶信息的存儲[7]。雖然士兵的記憶容量幾乎是無限的,但具體到某一個場景或事件而言,待記憶的信息量是有限的。另外,為了確保仿真系統(tǒng)的實時性,虛擬士兵的記憶信息存儲的內(nèi)存空間必須是有限連續(xù)的。參照人類記憶的遺忘現(xiàn)象,對內(nèi)存空間的維護采用淘汰機制,因為當記憶模型的存儲區(qū)滿時,必須采用一定的置換策略,從存儲區(qū)淘汰某些陳舊信息。記憶遺忘特性主要是:1)人類記憶中一些重要的信息是很難被遺忘的;2)隨著時間的推移,越早的記憶越容易被遺忘[8];3)人類記憶中一些不重要的信息會逐漸被遺忘。
針對以上記憶特點,本文提出用鏈表型隊列來存儲記憶模型中的信息。當戰(zhàn)場環(huán)境中的對象通過視覺和聽覺感知器過濾后,被認為是可感知對象時,記憶模型根據(jù)感知過濾過程實時生成一條對應的感知信息,存入到鏈表型隊列的當前有效空間。每一條感知信息可以用一下五元組的形式來表示。
Perception=<ID,Sensor-type,Object,Precision,Term>
其中,ID為該感知信息在記憶模型中的存儲標識,該標識具有唯一性。Object為所感知對象在戰(zhàn)場環(huán)境中的標識號,通過這一標識可以方便地獲取對象的大致信息,Sensor-type表示獲取該信息的感知器編號,Precision表示被感知對象的信息描述精度。Term 表示該記憶信息的存儲時限,該時限主要根據(jù)感知對象的穩(wěn)定性和重要性來決定。
為記憶模型維護一個大小為T的鏈表型隊列結(jié)構(gòu),當存儲區(qū)滿時,設(shè)當前存儲指針指向記錄 n,記憶模型將需存儲信息與記錄n的存儲時限值term進行比較。如果記錄n的term值更大,則繼續(xù)與記錄n+1比較,若存儲指針指向表尾還未找到合適位置時,再次從表頭開始,直到找到存儲時限相同或更小的記錄,并將其替換。由于存儲時限長的信息只占記憶模塊的小部分空間,并且可以設(shè)置存儲時限閾值,定期根據(jù)閾值淘汰一些過于陳舊的記憶信息。因此可避免最新的感知信息無法找到存儲空間情況的發(fā)生。由于環(huán)形隊列的存儲結(jié)構(gòu),在同等優(yōu)先級中總是將最早的記憶信息淘汰,即虛擬人觀察過的大部分對象只能在記憶中存儲有限的時間,經(jīng)過一段時間即會被刪除,從而實現(xiàn)了對記憶遺忘特征的模擬。
虛擬人通過感知方式得到的環(huán)境信息能夠在記憶模型中得以保存。而基于存儲優(yōu)先級的淘汰方式使得其中某些重要信息能夠堆積下來,但優(yōu)先級不高的則被淘汰,淘汰方式有兩種:一是被替代,二是被主動刪除。這種記憶淘汰的過程很好地體現(xiàn)了虛擬士兵的有限記憶能力,不是什么都遺忘,也不是什么都記住,而是有重點有選擇地記憶[9]。
隨著計算機技術(shù)和人工智能技術(shù)的飛速發(fā)展,作戰(zhàn)仿真系統(tǒng)對逼真度和可信度的要求越來越高。作為模擬參演兵力而加入的智能虛擬士兵,其行為的真實性和可信性將對整個系統(tǒng)的可信度產(chǎn)生重要影響,這也對虛擬士兵行為建模的真實性提出了更高的要求。有限理性理論主要用來解釋完全理性人與現(xiàn)實人在行為上的本質(zhì)差別,客觀地闡述了由于有限的信息和決策能力,現(xiàn)實人與完全理性人在選擇行為時的客觀差異性。并且目前的研究表明,基于有限理性的虛擬士兵,其有限的感知和決策行為能夠更好的模擬真實士兵的行為特征,在一定程度上提高了虛擬士兵行為的真實度和可信度。
[1]赫伯特·西蒙.管理行為:管理組織決策過的研究[M].北京:北京經(jīng)濟出版社,1991:36-37,45.
[2]許威威,等.智能虛擬環(huán)境中的決策模型及其應用[J].中國圖像圖形學報,2001,6(5):496-502.
[3]王清.一類有限理性的建模和決策分析方法的研究[D].武漢:華中科技大學博士學位論文,2009:12-15.
[4]李亮.影響有限理性實現(xiàn)程度的因素分析[D].南京南京理工大學碩士學位論文,2005:78-83.
[5]Andrew Ortony,Gerald L Clore,Allan Collins,The cognitive structure of emotions[J].Cambridge University Press,Cambrage,2008,34(11):77-79.
[6]A S Rao,M P Georgeff,Modeling rational Agents within a BDI-architecture[J].Proceedings of the International Conference on Principles of Knowledge Representation and Reasoning,San Mateo,CA,USA,2006:473-484.
[7]Olga Pacheco and Jose Carom.A Role Based Model for the Normative Specification of Organized Collective Agencyand Agents Interaction[J].Autonomous Agents and Multi-Agent Systems,2007,6(2):145-184.
[8]倪慧.自主虛擬人關(guān)鍵技術(shù)的研究[D].天津:天津大學計算機科學與技術(shù)博士學位論文,2007.
[9]魏陽.基于指令機制的作戰(zhàn) Agent建模與仿真研究[D].北京:裝甲兵工程學院博士學位論文,2010:30-41.