張曉君,郝一江
(1.廈門大學(xué) 哲學(xué)系,福建廈門 361005;2.福建省仿腦智能系統(tǒng)重點實驗室,福建廈門 361005;3.華中科技大學(xué)哲學(xué)系,武漢 430074;4.中國社會科學(xué)院 哲學(xué)所,北京 100732)
“行動或行為(action)”是哲學(xué)、心理學(xué)、語言學(xué)、法學(xué)、經(jīng)濟學(xué)、歷史、文學(xué)等人文科學(xué)和社會科學(xué),以及計算機科學(xué)和人工智能的核心概念[1]1。就自主移動機器人而言:行為就是通過感知信息控制執(zhí)行過程的算法(algorithm);①算法實際上就是定義良好的計算過程,它取一個或一組值作為輸入,并產(chǎn)生出一個或一組值作為輸出。即,算法是將輸入數(shù)據(jù)轉(zhuǎn)換成輸出結(jié)果的一系列計算步驟。我們可以通過基于行為的方法為機器人設(shè)計一系列簡單行為,這些行為相互協(xié)調(diào)和協(xié)作,從而得到我們所需求的機器人整體行為;把比較簡單的行為進行組合就可以得到復(fù)雜行為[2]。行為是保證機器人安全運行并成功完成任務(wù)的功能模塊,每種行為通常都遵循“感知—決策—控制”的架構(gòu)。按照相關(guān)設(shè)計,機器人利用傳感器信息決定行為是否執(zhí)行,并結(jié)合行為子任務(wù)實時規(guī)劃和計算出運動控制量,并據(jù)此控制自身的運行[3]344。
人工智能中推理決策的有關(guān)理論和方法是實現(xiàn)行為決策的常用方法。如何綜合各種因素,高效地進行行為決策是行為決策層研究的重點。行為決策邏輯是行為決策層的核心,它綜合各類信息,最后向行為規(guī)劃層發(fā)出行為指令。一個好的行為決策邏輯是提高系統(tǒng)自主性的必然要求[4]33。本文研究的動態(tài)認知行動邏輯和BDI邏輯(即信念(belief)、愿望(desire)和意向(intension)邏輯)是行動邏輯和行為決策邏輯的兩個最為重要的分支,其研究成果將直接為行為決策邏輯所運用。動態(tài)認知行動邏輯和BDI邏輯的研究屬于國內(nèi)外研究前沿和重點領(lǐng)域,其成果對邏輯學(xué)、經(jīng)濟、軍事、法律、計算機科學(xué)和人工智能等領(lǐng)域都有著重要的理論意義和實踐價值,尤其對人工智能領(lǐng)域?qū)<蚁到y(tǒng)中的推理機的開發(fā)、多傳感器信息融合技術(shù)(其實質(zhì)就是對多源不穩(wěn)定性信息的分析與綜合)的研發(fā)、移動機器人目標識別與路徑規(guī)劃,以及機器人行為的自學(xué)習(xí)研究都有著極其重要的參考價值。這是因為行動(一個程序的執(zhí)行和調(diào)用就是一個行動)在這些領(lǐng)域中無處不在。比如,對機器人而言,“行為”是它所具有的表達能力和行動能力,比如對話、描寫、刻畫、移動、行走、碰撞保護、避障、操作以及抓取物體等。對機器的擬人行為的研究是人工智能的高難度課題[5]18。
計算機通過執(zhí)行以某種程序設(shè)計語言編寫的程序語句的形式來完成行動,并以此改變計算機的內(nèi)部世界,并通過與外部世界的接口來改變外部世界。行動邏輯提供了關(guān)于程序的推理方式,更確切地說,提供了關(guān)于程序的執(zhí)行及其效果的推理方式,這使得我們能夠證明程序的正確性。因此,行動邏輯在計算機科學(xué)中也發(fā)揮著重要的作用[1]7。
人工智能研究領(lǐng)域影響最大的符號主義學(xué)派認為:人的智能表現(xiàn)為認知,認知的基元是符號,認知過程則表現(xiàn)為操作過程,所以可以用計算機的符號操作模擬人的智能行為。知識既是信息的主要形式,又是構(gòu)成智能的基礎(chǔ);因而,人工智能三大核心問題是知識表示、知識推理和知識應(yīng)用。知識既可用符號表示,也可用符號推理,據(jù)此才有可能建立起基于知識的人類智能和機器智能的統(tǒng)一理論體系[6]67。知識表示和知識推理的研究主要是提供對世界的描述方法,并在此基礎(chǔ)上提出相應(yīng)的算法。大致說來,關(guān)于世界的知識可以分為事實和規(guī)則這兩大類。事實用于描述已知的世界狀態(tài),而規(guī)則主要用于預(yù)言外部世界的變化、動作的后果,并從已知的事物演繹未知的事物。
由于從符號處理的角度研究知識的本性太低級,紐厄爾提議在符號處理的上層增加以合理性原則作為其行為法則的知識級。做知識級分析的系統(tǒng)則被稱為智能主體(agent,也翻譯為“主體”、“真體”、“智能體”,比如人或仿人機器人或具有智能的高級動物都可以視為智能主體),它由動作集、目標集和一個知識體組成;合理性原則把知識、目標、動作聯(lián)系在一起,而不需要具體的物理關(guān)聯(lián)機制。知識既是知識級處理的媒介,又是合理性原則工作的依據(jù),它使系統(tǒng)能夠選擇適當?shù)膭幼魅ミ_到目標,從而表現(xiàn)出合理的行為。知識是能力的反映,永遠是抽象的。知識并非真實地存在,只能由智能主體的行為來表現(xiàn)。雖然做知識級分析可以確保系統(tǒng)的可行性和總體性能,但是其操作化必須在符號級實現(xiàn)。知識表示就是實現(xiàn)知識級系統(tǒng)向符號級系統(tǒng)歸約的方式??梢?,作為知識級系統(tǒng)的智能主體并不是計算機系統(tǒng)的操作化模型,而是基于合理化原則的概念設(shè)計。在符號級的操作化實現(xiàn)不僅需要定義數(shù)據(jù)結(jié)構(gòu)(即符號結(jié)構(gòu)),而且需要定義從數(shù)據(jù)結(jié)構(gòu)抽取知識的處理機制[7]56。
好的知識表示方式有助于智能主體獲取和應(yīng)用感知的信息。常見的知識表示方式有:一階謂詞邏輯、產(chǎn)生式表示、結(jié)構(gòu)化表示。由于一般要求專家控制系統(tǒng)具有可靠性、實時性及靈活性等,所以專家控制系統(tǒng)中的知識表示常采用產(chǎn)生式規(guī)則,于是知識庫就變成了規(guī)則庫。規(guī)則庫是由條件-動作型規(guī)則(即所謂的產(chǎn)生式規(guī)則)組成的集合。產(chǎn)生式規(guī)則(其典型描述為“如果(條件),那么(結(jié)果)”)的形式為:“條件單元”→“動作”……若規(guī)則中所有條件部分都匹配,則執(zhí)行動作。推理機則用于重復(fù)尋找所有匹配的規(guī)則,它選擇其中的一種執(zhí)行動作;執(zhí)行的結(jié)果則是給數(shù)據(jù)庫添加新的內(nèi)容、刪除舊的內(nèi)容或執(zhí)行用戶編寫的程序函數(shù)等;新的存儲內(nèi)容又引起新的規(guī)則的匹配,推理機就是這樣不斷地進行匹配的[8]30。換個角度看,推理機就是一組執(zhí)行程序,它根據(jù)數(shù)據(jù)庫中提供的系統(tǒng)當前和過去的動態(tài)特征以及動態(tài)特征變化數(shù)據(jù),利用推理規(guī)則,從規(guī)則庫中尋找合適的控制規(guī)則和參數(shù)調(diào)整規(guī)則,給出最合適的控制參數(shù)[8]46。筆者對此的理解是:推理機研究的重點和難點是執(zhí)行動作的激發(fā)條件的制定,即條件單元中的規(guī)則的制定,也就是說,我們需要弄清成功執(zhí)行一個動作的前提條件究竟是什么;這也應(yīng)該是動態(tài)認知行動邏輯和BDI邏輯研究的關(guān)鍵。由于條件—動作型規(guī)則的條件部分不限于謂詞公式(也可以是關(guān)系表達式和真值函數(shù)),而且動作可以是任何操作(這與規(guī)則演繹系統(tǒng)中的右部只能是推理結(jié)論有所不同),此外產(chǎn)生式規(guī)則可以設(shè)置沖突解法,①在一個循環(huán)的識別階段,如果有多于一條的規(guī)則被激活,就引起了一個沖突。沖突解法就是基于某種控制策略去選定需要執(zhí)行的規(guī)則。因而條件—動作型規(guī)則可以有效控制推理過程,適合表示各種啟發(fā)式知識,使得事物間的經(jīng)驗性關(guān)系得以表征,因此為大多數(shù)成功的專家系統(tǒng)所采用[7]25。
近10多年來,主體和多主體(multi-agent)系統(tǒng)的研究已經(jīng)成為分布式人工智能研究的一個熱點,這些研究極大地促進了人工智能和計算機軟件工程的發(fā)展。主體實際上是一種通過傳感器感知環(huán)境,并通過執(zhí)行器作用于環(huán)境的智能實體,可以定義為一種從感知序列到實體動作的映射[5]208。主體具有行為自主性、作用交互性、環(huán)境協(xié)調(diào)性、面向目標性、存在社會性、工作協(xié)作性、運行持續(xù)性、系統(tǒng)適應(yīng)性和可擴展性、結(jié)構(gòu)分布性、功能智能性等特性。主體強調(diào)理性作用,可作為描述機器智能、動物智能和人類智能的統(tǒng)一模型。而且主體的功能具有較高智能,這種智能往往構(gòu)成社會智能的一部分[5]315。
理想的智能主體是基于知識的問題求解系統(tǒng),它運用知識作推理,以達到某種目標。智能主體的行為則可理解成無窮的推理循環(huán):感知、推理和行動。每當主體(通過傳感器)感覺到外部世界的變化時,就根據(jù)自身的信念、目標和關(guān)于外部世界的模型進行推理,并決定適當?shù)膭幼魅?yīng)答這種變化。所以,主體行為的主要任務(wù)就是獲取外部世界的模型,并努力保持模型與外部世界的一致性。推理的目的是依據(jù)外部世界模型區(qū)分出外部世界狀態(tài)并規(guī)劃出主體的動作。由于推理僅僅導(dǎo)致主體內(nèi)部世界模型的改變,故有必要檢查內(nèi)部模型是否與主體動作導(dǎo)致的外部世界變化相一致,所以在主體行為圖(即:感知、推理和行動)的基礎(chǔ)上應(yīng)該增加“期望”環(huán)節(jié),以便主體做好準備去感知期望的外部世界的變化[7]21。
多主體系統(tǒng)主要研究自主的智能主體之間智能行為的協(xié)調(diào),研究智能主體如何為了一個共同的全局目標(包括各自的不同目標)共享知識,進而對問題協(xié)作求解[9]104。多主體聯(lián)合行動的建立可以通過一個二相協(xié)議來實現(xiàn)。其第一相確定哪些熟人愿意參加協(xié)作并遵從聯(lián)合負責(zé)原則;第二相則是由組織者指派聯(lián)合行動中每個擬定動作應(yīng)該由誰去執(zhí)行以及在什么時刻執(zhí)行。關(guān)于動作執(zhí)行的時間要求,則是在聯(lián)合意向的指導(dǎo)下參與者反復(fù)進行協(xié)商,直到協(xié)商全部成功。這時就產(chǎn)生了贊同一致的公共處方,并通過組織者將公共處方通知到所有愿意參與聯(lián)合行動的主體。開發(fā)共享本體,并將共享本體的通信內(nèi)容翻譯為與各主體特有的本體相容的形式是促進各主體間語義互操作、實現(xiàn)信息和知識共享的關(guān)鍵。從哲學(xué)的角度看,本體是對“存在”的系統(tǒng)化闡述;而從人工智能的角度看,本體則被視為設(shè)計智能系統(tǒng)時建立的世界觀,清晰表示的本體實際上是對應(yīng)用領(lǐng)域概念化的說明。我們可以通過定義由基本術(shù)語構(gòu)成詞匯,并用基本術(shù)語去合成詞匯外延(即領(lǐng)域知識)的法則來建立智能主體協(xié)作時的共享本體。共享本體定義了智能主體在相互交換詢問和斷言時使用的公共詞匯,從而避免了建立和維護大型知識庫的諸多煩惱,而智能主體經(jīng)由通信共享知識的機制則可視為共享一個虛擬的公用知識庫[7]347-349。
智能主體必須利用知識修改其內(nèi)部狀態(tài)(即心理狀態(tài)),以適應(yīng)環(huán)境變化和協(xié)作求解的需要。主體的行動受其心理狀態(tài)的驅(qū)動。人類心理狀態(tài)的要素主要有認知(信念、知識、學(xué)習(xí)等)、情感(愿望、興趣、愛好等)和意向(意圖、目標、規(guī)劃和承諾等)這三種。著重研究信念(belief)、愿望(desire)和意向(intension)的關(guān)系及其形式化描述,力圖建立主體的BDI(信念、愿望和意向)模型,已經(jīng)成為主體理論模型研究的主要方向[5]314。
主體技術(shù)的研究主要集中在主體行為理論、體系結(jié)構(gòu)和通信三方面。主體行為理論把智能主體定義為有意識系統(tǒng),這個系統(tǒng)中的主體行為可以通過歸因于信念、愿望和理性的方法去預(yù)言。智能主體典型的行為模型——BDI邏輯框架是以模態(tài)邏輯和可能世界來描述主體的心理狀態(tài)的。體系結(jié)構(gòu)則主要研究個體主體的構(gòu)成模塊和模塊間的交互作用(數(shù)據(jù)和控制流),并對輸入信息(傳感器數(shù)據(jù)和經(jīng)由通信接收的消息)和當前內(nèi)部狀態(tài)如何決定主體的行動加以解釋。通信機制則構(gòu)成支持主體間互操作和協(xié)同工作的重要基礎(chǔ)[7]15-16。
主體和多主體系統(tǒng)正在崛起,并成為人工智能研究實用化和分布計算環(huán)境中軟件智能化的重要技術(shù)。主體和多系統(tǒng)能夠提供所研究的社會和領(lǐng)域的知識,并能夠依據(jù)心理狀態(tài)BDI(信念、愿望和意向)自主工作,是具有語義互操作、合作行為和協(xié)調(diào)能力的軟件實體。主體行為理論將主體定義為有意識系統(tǒng)。所謂有意識,是指主體的行為可以通過歸因于信念、愿望和理性的方法去預(yù)言。經(jīng)典的一階邏輯并不適合用來表示涉及意識的觀念,因為這會引起語法和語義問題。為了解決語法問題,我們可以引入模態(tài)邏輯和元語言;為了解決語義問題,我們可以借助可能世界語義和解釋的符號結(jié)構(gòu)[7]346-347。
1971年,Dennet認為,理性主體的行為選擇受到其信念和愿望的支配[10]。1987年,Bratman的相關(guān)研究為主體行為描述的BDI方法奠定了堅實的基礎(chǔ),他認為意向在所期望的行為選擇方面發(fā)揮著重要的作用[11]。之后,許多研究者試圖使用邏輯的方法對這一理論進行形式化。其中,影響最為深遠的是Rao和Georgeff(1991)[12]使用分支時間時態(tài)邏輯的方法對BDI主體的形式化研究。他們引入了信念、目標(有時也用愿望來代替)和意向這三個模態(tài)算子,并建立帶有這些算子所涉及的可能世界之間的可及關(guān)系的克里普克模型。并在對不同類型的主體進行建模時,允許加入特定的條件以保持主體的信念、目標和意向的持續(xù)性。此后,諸多學(xué)者發(fā)表多篇論文對他們的理論進行不斷完善和改進。例如:Casali等人(2005)[13]在無窮值的 ?ukasiewicz 邏輯的基礎(chǔ)上對等級(graded)BDI主體進行了建模和實例分析,這為不確定性的表示和推理提供了很好的范例;張曉君等人(2012)[14]把無窮值的 ?ukasiewicz邏輯和命題動態(tài)邏輯進行融合后對等級BDI主體模型進行公理化,并說明了信念、愿望、意圖對主體行為的影響;Pereira等人(2008)[15]通過情感對主體的可適應(yīng)性和自主性的影響的形式分析,來刻畫害怕、自信、焦慮等情感對主體行為的影響,達到對情感BDI主體的行為推理和決策過程進行建模的目的;張曉君(2012)[16]對情感等級 BDI主體模型進行了公理化,清晰地表示了主體的信念、愿望、意圖等心理狀態(tài)以及害怕、自信、焦慮等情感狀態(tài)對主體的不確定性行為的影響。
與Rao和Georgeff的方法不同,van Linder等人(1995)[17]在對Bratman提出的BDI方法進行邏輯化時則是以動態(tài)邏輯而不是以時態(tài)邏輯為基礎(chǔ)的。他們在動態(tài)邏輯的基礎(chǔ)系統(tǒng)——命題動態(tài)邏輯的基礎(chǔ)上增加知識、信念和愿望以及表示執(zhí)行動作的能力的模態(tài)算子,這為動態(tài)認知邏輯乃至動態(tài)認知行動邏輯的發(fā)展提供了諸多可資汲取的養(yǎng)料。
20世紀70年代,為了解決計算機中程序調(diào)用與執(zhí)行方面的邏輯問題,在模態(tài)邏輯基礎(chǔ)上產(chǎn)生的動態(tài)邏輯發(fā)展迅速。動態(tài)邏輯把程序的輸入—輸出關(guān)系看作是克里普克語義學(xué)中的可及關(guān)系。作為動態(tài)邏輯的基礎(chǔ)系統(tǒng)的命題動態(tài)邏輯則致力于處理關(guān)于主體的行動(更確切地說是程序,因為一個程序的執(zhí)行和調(diào)用就是一個行動)和行動選擇的推理。命題動態(tài)邏輯對可以解釋成基于狀態(tài)集合上的二元關(guān)系的基本行為進行抽象和推理。在命題動態(tài)邏輯中,基本行為是初始的,這一特點使得動態(tài)邏輯能夠在諸多領(lǐng)域中得到應(yīng)用。例如,當我們把基本行為解釋成對相互作用的主體集合的認知狀態(tài)起作用的行為,則動態(tài)邏輯就變成動態(tài)認知邏輯[18]91-92。由于主體知識的動態(tài)變化可理解為:“知識—行動—新狀態(tài)—新知識”,其中,對各項知識之間的關(guān)系的處理可以由原先的認知邏輯完成,而對“行動—新狀態(tài)—新知識”的處理則是由動態(tài)邏輯處理。認知邏輯與動態(tài)邏輯這兩種邏輯處理方式的結(jié)合催生出了動態(tài)認知邏輯[19]77。
如果將動態(tài)認知邏輯中的行動定位于公開宣告,則得到關(guān)于公開宣告的動態(tài)認知邏輯,簡稱公開宣告邏輯。本文研究的動態(tài)認知行動邏輯(Dynamic Epistemic Action Logic)可以說是公開宣告邏輯的擴展或推廣,因為“公開宣告”這一認知行動是把相同的信息傳達給所有的主體,而認知行動邏輯研究的更為復(fù)雜的認知行動則可以把不同的信息傳達給不同的主體[20]109。認知行動邏輯研究包括“博弈”在內(nèi)的更為復(fù)雜、更為廣泛的認知行動,比如:左轉(zhuǎn)、右轉(zhuǎn)、走路、開或關(guān)、觀察、玩牌、閱讀、可能閱讀、可能都閱讀、選擇、展示、告訴、說悄悄話、傳播流言等等。動態(tài)認知行動邏輯是對這些認知行動進行模型化的動態(tài)認知邏輯,它不僅可以對由外部行動引起的知識變化過程中的推理進行刻畫和表達,而且可以刻畫由交流行動引起的互動性知識的更新,以及信息流動的整個過程中的知識變化及相應(yīng)推理。
1977年,Moore在其《關(guān)于知識和行動的推理》一文中,提出了行動的“認知前提(epistemic precondition)”的概念,用以表示成功執(zhí)行一個行動需要的知識[21]。1989年,Plaza建立了第一個公開宣告邏輯系統(tǒng),在對主體間的知識分布進行了靜態(tài)描述和認知推理的基礎(chǔ)上,對主體之間在交流過程中的知識變化和認知推理進行了刻畫,并對不帶有公共知識但包含公開宣告的多主體認知邏輯進行了形式化和公理化[22]201-216。1997 年,Gerbrandy和Groeneveld對內(nèi)省主體的更多宣告形式(如半公開宣告、私下宣告)的研究,為公開宣告邏輯的最終確立奠定了堅實的基礎(chǔ)[23]。之后,諸多學(xué)者對公開宣告邏輯進行擴展,他們要么在公開宣告邏輯中加入公共知識,要么研究比公開宣告更為復(fù)雜的認知行動,這樣就使得動態(tài)認知行動邏輯得以逐漸形成。
當今國際上,van Bethem、van Eijck、van Dimarsch等是動態(tài)認知行動邏輯研究的領(lǐng)軍人物。動態(tài)認知行動邏輯研究主要有三個方向:
(1)通過對公開宣告邏輯的改進和擴展研究各類認知行動。具體包括:引入相對化公共知識,得出帶有公共知識算子的公開宣告邏輯的較為簡單的完全性證明(van Bethem,1999)[24];對并發(fā)知識行動的語義學(xué)研究、對博弈行動的描述(van Dimarsch,2001)[25];對交叉并發(fā)行動的邏輯刻畫(Kooi,2003)[26];對玩牌博弈的建模(de Lavalette,1999)[27];對流言傳播行動的考察(van Dimarsch,2000)[28]等等。
(2)使用基于行動模型的方法分析刻畫各種認知行動。具體而言有:Baltag等(2004)[29]在行動模型框架的基礎(chǔ)上提出了認知程序邏輯;范艾杰克等人(2006)[30]用行動仿真的概念代替互模擬來研究認知行動;van Bethem等人(2006)[31]對命題動態(tài)邏輯做認知解釋后提出的交流與更新邏輯,這種邏輯能夠表達帶有有窮行動模型的所有模型轉(zhuǎn)換運算,為更大范圍的信息事件提供了綜合分析的方法;van Eijck(2004)[32]對認知更新進行建模,并圖示了更新的結(jié)果和行動模型。而van Dimarsch 等人(2008)[20]141-174在 Baltag 等人工作的基礎(chǔ)上研究了行動模型邏輯,其基本思路和方法是通過刻畫動作對知識的影響來完成對動作的處理。這種思路在單主體認知行動邏輯的基礎(chǔ)上加入帶有公共知識等群體知識的研究即可進入多主體認知行動邏輯的研究。建立行動模型的關(guān)鍵是:在所建立的行動模型中為每個原子行動指派相應(yīng)語言中的公式作為執(zhí)行該行動的前提條件,這一前提條件相當于克里普克模型中的賦值。
(3)在認知行動邏輯的基礎(chǔ)上增添對認知主體的各種考察因素,從而試圖建立自動推理系統(tǒng)。主要研究有 Raimondi等(2004)[33]通過認知模型檢驗方法來考察對時態(tài)的認知的相關(guān)研究。Schwarzentruber(2010)[34]在模態(tài)邏輯的基礎(chǔ)上,研究了單主體和多主體的“務(wù)必做到”邏輯,提出了關(guān)于行動、知識和偏好的認知博弈模態(tài)邏輯,旨在為智能主體建立一個自動推理系統(tǒng)。其基本思路是:把 Pauly(2002)[35]提出的聯(lián)盟邏輯中的算子〈J〉分解成為“diamond”、“box”、“next”這三個正規(guī)算子后,提出“務(wù)必做到”邏輯,并在此邏輯的基礎(chǔ)上添加“知識”、“義務(wù)”和“意向”等算子,以此建立相應(yīng)的系統(tǒng);以模態(tài)邏輯和博弈論為基礎(chǔ)來研究分析智能主體“seeing、knowing、doing”等行動;并使用動態(tài)認知邏輯的一些結(jié)構(gòu)對認知博弈模態(tài)邏輯進行擴展,從而更好地處理了嚴格劣策略的重復(fù)剔除問題。
通過對上述理論的評述,筆者認為:
首先,現(xiàn)有的各種邏輯體系都無法滿足計算機科學(xué)和人工智能中精確描述和研究各種各樣的不確定性推理的需要,因此邏輯理論的創(chuàng)新成為不可避免的需求。一個好的認知行動邏輯是提高智能系統(tǒng)的可靠性和魯棒性,①魯棒性(robustness)就是系統(tǒng)的健壯性,指控制系統(tǒng)在一定(結(jié)構(gòu),大小)的參數(shù)攝動下,維持某些性能的特性。它是在異常和危險情況下系統(tǒng)生存的關(guān)鍵。比如說,計算機軟件在輸入錯誤、磁盤故障、網(wǎng)絡(luò)過載或有意攻擊情況下,能否不死機、不崩潰,就是該軟件的魯棒性。尤其是自主行為優(yōu)化決策能力的必然要求。
其次,由于第二部分的BDI邏輯和第三部分的動態(tài)認知行動邏輯都是建立在模態(tài)邏輯、可能世界語義學(xué)和克里普克模型的基礎(chǔ)上,通過認真分析比對這兩種邏輯,對它們進行取長補短和融合,提出新的邏輯系統(tǒng),即關(guān)于BDI主體的動態(tài)認知行動邏輯系統(tǒng),從而為智能主體的行為表征和不確定性推理提供更好的邏輯基礎(chǔ)是完全可能的。建立這種新的邏輯系統(tǒng)的關(guān)鍵是:在所建立的行動模型中為每個原子行動指派相應(yīng)語言中的公式作為執(zhí)行該行動的前提條件時,要充分考慮信念、愿望、意向、情感對行動的影響。這一邏輯融合過程,應(yīng)建立在無窮值Lukasiewicz邏輯(或模糊邏輯)和命題動態(tài)邏輯的基礎(chǔ)之上,因此該邏輯系統(tǒng)應(yīng)該是符號的形式演繹和數(shù)值計算并存的連續(xù)值柔性邏輯系統(tǒng)。其可能的研究難點在于:其一,不同模態(tài)算子之間應(yīng)該如何融合的問題;其二,在邏輯推理過程中如何處理符號的形式演繹和數(shù)值計算的問題。
[1]Segerberg K.The logic of action[EB/OL].[2012-05-20].http://plato.stanford.edu/entries/logicaction/.
[2]Jones J L.Robot Programming:A Practical Guide to Behavior-Based Robotics[M].[S.L.]:McGraw-Hill Education(Asia)Co.,China Machine Press,2006.
[3]徐德,鄒偉.室內(nèi)移動式服務(wù)機器人的感知、定位與控制[M].北京:科學(xué)出版社,2008.
[4]蔡自興,賀漢根,陳虹.未知環(huán)境中移動機器人導(dǎo)航控制理論與方法[M].北京:科學(xué)出版社,2009.
[5]蔡自興,徐光佑.人工智能及其應(yīng)用[M].4版.北京:清華大學(xué)出版社,2010.
[6]張曉峰,賈世祥,柳嬋娟,等.計算機科學(xué)與技術(shù)導(dǎo)論[M].北京:清華大學(xué)出版社,2011.
[7]高濟.人工智能高級技術(shù)導(dǎo)論[M].北京:高等教育出版社,2009.
[8]姜長生,王從慶,魏海坤,等.智能控制與應(yīng)用[M].北京:科學(xué)出版社,2007.
[9]譚建豪,章兢,黃耀,等.數(shù)據(jù)挖掘技術(shù)[M].北京:中國水利水電出版社,2009.
[10]Dennett D C.Intentional systems[J].Journal of Philosophy,1971,68(4):87-106.
[11]Bratman M E.Intentions,Plans,and Practical Reason[M].Harvard:Harvard University Press,1987.
[12]Rao A S,Georgeff M P.Modeling rational agents within a BDI-architecture[C]//Proceedings of the 2nd International Conference on Principles of Knowledge Representation and Reasoning,1991:473-484.
[13]Casali A,Godo L,Sierra C.Graded BDI models for agent architecture[C]//Leite J,Torroni P.Computational Logic in Multi-agent Systems.Berlin:Springer,2005:126-143.
[14]Zhang Xiaojun,Jiang Min,Zhou Changle,et al.Graded BDI models for agent architectures based on ?ukasiewicz logic and propositional dynamic logic[C]//Wang F L.WISM2012,LNCS 7529.Berlin,Heidelberg:Springer-Verlag,2012:439-450.
[15]Pereira D,Oliveria E,Moreira N.Formal modeling of emotions in BDI agents[C]//Sadri F,Satoh K.Computational Logic in Multi-Agent Systems.Berlin:Springer,2008:62-81.
[16]Zhang Xiaojun.Modeling emotional agents based on graded BDI architectures[C]//volume 0345 of the Communications in Computer and Information Science series.Berlin,Heidelberg:Springer-Verlag,2011.
[17]van Linder B.Actions that make you change your mind[C]//Laux A,Wansing H.Knowledge and Belief in Philosophy and Artificial Intelligence,1995:103-146.
[18]郝一江,張曉君.動態(tài)邏輯:關(guān)于程序的模態(tài)邏輯[J].哲學(xué)動態(tài),2009(11):90-94.
[19]唐曉嘉,郭美云.現(xiàn)代認知邏輯的理論與應(yīng)用[M].北京:科學(xué)出版社,2010.
[20]van Dimarsch H.Dynamic Epistemic Logic[M].Berlin:Springer,2008:109,141-174.
[21]Moore R C.Reasoning about knowledge and action[C]//Proceedings of the fifth International Joint Conference on Artificial Intelligence(IJCAI-77).Cambridge,Massachusetts:[s.n.],1977.
[22]Plaza J A.Logics of public communications[C]//Emrich M L.Proceedings of the 4th International Symposium on Methodologies for Intelligent Systems,1989:201-216.
[23]Gerbrandy J D.Groeneveld W.Reasoning about information change[J].Journal of Logic,Language,and Information,1997(6):147-169.
[24]van Bethem J.Update as relativization[EB/OL].[2012-05-20]http://www.illc.uva.nl/lgc/postings.html,1999.
[25]van Dimarsch H.The semantics of concurrent knowledge actions[C]//Pauly M,Sandu G.ESSLLI 2001 workshop on Logic and Games,2001.
[26]Kooi B.Knowledge,Chance,and Change[D].Ph.D.thesis,University of Groningen,2003.
[27]de Lavalette R.The anatomy of epistemic actions[EB/OL].[2012-05-20].http://www.cs.rug.nl/~ grl/pub/anatomy.pdf,1999.
[28]van Dimarsch H.Knowledge games[D].Ph.D.thesis,U-niversity of Groningen,2000.
[29]Baltag A,Moss L S.Logics for epistemic programs[J].Synthese,2004(139):165-224.
[30]van Eijck J.Action emulation[EB/OL].[2012-05-20].http://www.cwi.nl/jve/papers/06/ae/ae.pdf,2006.
[31]van Bethem J,van Eijck J,Kooi B.Logic for communication and change[J].Information and Computation,2006,204(11):1620-1662.
[32]van Eijck J.Dynamic epistemic modeling[EB/OL].[2012-05-20].http://www.db.cwi.nl/rapporten,2004.
[33]Raimondi F,Lomuscio A.Verification of multi-agent systems via ordered binary decision diagrams:an algorithm and its implementation[C]//AAMAS 04,2004:630-637.
[34]Schwarzentruber F.Seeing,Knowing,Doing:Case Studies in Modal Logic[EB/OL].[2012-05-20].Ph.D.thesis,http://www.irisa.fr/prive/fschwarz/publications/thesis.pdf,2010.
[35]Pauly M.A modal logic for coalitional power in games[J].Journal of Logic and Computation,2002,12(1):149-166.