• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于偏好排斥等級(jí)BDI主體的決策行為研究

      2022-11-18 14:26:17郝一江陳亞楠
      關(guān)鍵詞:真值感興趣測(cè)度

      郝一江,陳亞楠

      (1.中國社會(huì)科學(xué)院 哲學(xué)研究所, 北京 100732;2.南京大學(xué) 哲學(xué)系, 江蘇 南京 210023)

      一、引言

      “行為”是人工智能、系統(tǒng)工程、哲學(xué)、軍事等諸多領(lǐng)域的核心概念。從人工智能的視角來看,行動(dòng)就是Agent(主體或智能體)“通過感知信息控制執(zhí)行過程的算法”[1]。主體(Agent)是做知識(shí)級(jí)分析而且是有意識(shí)的系統(tǒng),它強(qiáng)調(diào)理性作用,“是描述人類智能、動(dòng)物智能和機(jī)器智能的統(tǒng)一模型”[1];為了利用函數(shù)和數(shù)值形式化地描述其行為,可以把主體定義為從感知序列到實(shí)體動(dòng)作的映射[2]。例如:人、具有高級(jí)智能的動(dòng)物、仿人機(jī)器人、足球機(jī)器人、飛機(jī)、航母、月球探測(cè)儀、無人機(jī)等等都可以看作是Agent。因此,如何對(duì)理性Agent的決策行為進(jìn)行形式化描述,是人工智能中一個(gè)經(jīng)久不衰的話題。

      主體和多主體的行為建模涉及的領(lǐng)域非常廣泛,它們?cè)陔娮由虅?wù)、動(dòng)畫設(shè)計(jì)、機(jī)械設(shè)計(jì)、系統(tǒng)分布與設(shè)計(jì)、仿人機(jī)器人、軍事仿真、網(wǎng)絡(luò)安全、軟件工程、復(fù)雜系統(tǒng)、空中交通系統(tǒng)、電信網(wǎng)絡(luò)、業(yè)務(wù)流程、空間飛行器和醫(yī)療服務(wù)的管理和控制等諸多領(lǐng)域有著廣泛的應(yīng)用[3],是分布式人工智能、系統(tǒng)工程等諸多領(lǐng)域研究的熱點(diǎn)問題,國內(nèi)外相關(guān)研究成果豐碩。

      Linder等[4]認(rèn)為:行動(dòng)改變心智;根據(jù)主體的知識(shí)和信念可以定義主體運(yùn)用信念改變行動(dòng)的能力,而且這些定義是基于這樣的理念:即執(zhí)行可行行動(dòng)可以得到主體所期望的事件狀態(tài)。影響Agent行為決策和行為推理的主要因素是:信念(Belief)、愿望(Desire)和意圖(Intension),因而Agent典型的行為模型就是BDI(Belief-Desire-Intension,簡稱BDI)邏輯框架。應(yīng)用最為廣泛的主體模型是Rao和Georgeff[5- 7]提出的以分支時(shí)間邏輯為基礎(chǔ)的BDI邏輯系統(tǒng),該系統(tǒng)可以根據(jù)主體的信念、愿望和意圖對(duì)Agent的行為決策和推理進(jìn)行形式描述[8]。

      目前,BDI的主體模型已經(jīng)在計(jì)算機(jī)中得以實(shí)現(xiàn),并在實(shí)際生產(chǎn)生活中得到了廣泛應(yīng)用,如在多主體系統(tǒng)的機(jī)器學(xué)習(xí)[9]、計(jì)算機(jī)生成虛擬兵力[10]等多個(gè)領(lǐng)域獲得了應(yīng)用,故引起了人工智能等領(lǐng)域的專家的極大關(guān)注。在具體的應(yīng)用系統(tǒng)中,信念用來表示環(huán)境狀態(tài),愿望用來表示主體動(dòng)機(jī),意圖用來表示主體目的?;谝鈭D的主體結(jié)構(gòu)應(yīng)用最為廣泛。意圖系統(tǒng)描述的實(shí)體行動(dòng)可以通過歸因于某些心智態(tài)度的方法來預(yù)測(cè),這些心智態(tài)度包括知識(shí)、信念、愿望、意圖、義務(wù)、承諾(commitment)(或前態(tài)度(pro-attitudes)),等等[11]。

      在Rao與Georgeff的BDI結(jié)構(gòu)[6]基礎(chǔ)上設(shè)計(jì)和開發(fā)的主體在不確定和動(dòng)態(tài)環(huán)境中具有較好的性能。為了描述不同的主體,一些學(xué)者對(duì)Rao和Georgeff提出的BDI邏輯[5]進(jìn)行了改進(jìn)和擴(kuò)展,例如:等級(jí)(graded)BDI邏輯[12- 13]、帶有規(guī)范性慎思的等級(jí)BDI邏輯[14]、知識(shí)情感等級(jí)BDI邏輯[15]。此外,還有學(xué)者研究了BDI邏輯在有窮狀態(tài)世界上的模型檢測(cè)[16]、基于BDI邏輯的多主體系統(tǒng)中的學(xué)習(xí)問題[9],等等。

      偏好是具有意圖的主體的積極態(tài)度,是促使主體采取行動(dòng)的動(dòng)力,在滿足給定的約束條件的同時(shí),制定適當(dāng)?shù)囊?guī)劃,以滿足最為偏好的目標(biāo)。在Casali等提出的偏好等級(jí)BDI邏輯中[17],把進(jìn)行實(shí)際推理的等級(jí)意圖主體定義為一個(gè)多背景系統(tǒng),然后在相應(yīng)邏輯背景語言中給出了主體的信念、愿望和意圖等心智態(tài)度的形式化表示,對(duì)其進(jìn)行了公理化,并給出了這些心智態(tài)度的交互框架。雖然Casali等能夠?qū)в衅玫腂DI主體行為進(jìn)行建模,但是該邏輯的真值取值范圍是[0,1],只能夠處理正向偏好,無法處理負(fù)向偏好。

      在本文中,為了能夠同時(shí)描述帶有偏好和排斥的主體的決策行為,減少模態(tài)算子的個(gè)數(shù),筆者對(duì)Casali等提出的偏好等級(jí)BDI邏輯進(jìn)行改進(jìn),并把其真值隸屬度從[0,1]擴(kuò)展到[-1,1]。為此,需要把偏好分為正向偏好和負(fù)向偏好,并規(guī)定:能夠促使主體采取行動(dòng)的偏好就是正向偏好(即常規(guī)意義上的偏好,如:喜歡、愛好、偏向、偏好),其偏好測(cè)度值是取(0,1]之間的正實(shí)數(shù);而阻止主體采取行動(dòng)的偏好就是負(fù)向偏好(即常規(guī)意義上的排斥、討厭、厭惡、不喜歡),其偏好測(cè)度值是取[-1,0)之間的負(fù)實(shí)數(shù);并規(guī)定:如果主體沒有偏好,那么偏好測(cè)度值是0。通過這樣處理后,把排斥看作負(fù)向偏好,在對(duì)“帶有偏好和排斥的BDI主體的決策行為”進(jìn)行描述時(shí),只需要在經(jīng)典的BDI邏輯中引入偏好算子,而不必專門引入排斥算子,這樣就能夠使得我們建立的模型與“Casali等只能夠處理偏好但不能處理排斥的等級(jí)BDI模型”一樣簡潔,但是表達(dá)力卻增強(qiáng)了。

      二、偏好排斥等級(jí)BDI邏輯

      利用表示偏好的模態(tài)算子,對(duì)Xiaojun Zhang等[13]提出的等級(jí)BDI邏輯(簡稱g-BDI邏輯)進(jìn)行改進(jìn),可以得到偏好排斥等級(jí)BDI邏輯(簡稱pg-BDI邏輯),該邏輯可以表征帶有偏好和排斥的BDI主體的決策行為。需要特別說明的是:g-BDI邏輯中,主體的信念測(cè)度、愿望測(cè)度和意圖測(cè)度(即其真值隸屬度)是0到1之間的所有實(shí)數(shù)(記作[0,1]);而在本文給出的pg-BDI邏輯中,主體的偏好、信念、愿望、意圖的真值隸屬度是-1到1之間的所有實(shí)數(shù)(記作[-1,1])。

      (一)偏好排斥等級(jí)BDI邏輯的語言

      pg-BDI邏輯建基于命題動(dòng)態(tài)邏輯[18]和擴(kuò)展的無窮值ukasiewicz邏輯[19]。命題動(dòng)態(tài)邏輯可以對(duì)主體的行為進(jìn)行表示和推理。無窮值ukasiewicz邏輯可以對(duì)概率測(cè)度進(jìn)行推理;在該邏輯中,命題真值介于0到1之間的所有實(shí)數(shù),即[0,1];真值函數(shù)包括:x=1-x和x→y=min(1,1-x+y)。本文為了處理排斥這類負(fù)向偏好,把該邏輯的真值隸屬度的取值范圍擴(kuò)展到-1到1之間的所有實(shí)數(shù)(即[-1,1])。并規(guī)定:促使主體采取行動(dòng)的正向偏好所對(duì)應(yīng)的真值隸屬度∈(0,1];阻止主體采取行動(dòng)的負(fù)向偏好所對(duì)應(yīng)的真值隸屬度∈[-1,0);如果主體沒有偏好(即非正向偏好也非負(fù)向偏好),那么所對(duì)應(yīng)的真值隸屬度為0。

      本文給出的pg-BDI邏輯是一種多模態(tài)邏輯,是擴(kuò)展的無窮值ukasiewicz邏輯與命題動(dòng)態(tài)邏輯糅合而成,屬于人工智能邏輯的一個(gè)分支邏輯。偏好排斥等級(jí)BDI邏輯的語言Lpg-BDI是:使用形式為[α]的行動(dòng)模態(tài)詞(其中α是一個(gè)行動(dòng))和4個(gè)模糊模態(tài)算子P(偏好算子)、B(信念算子)、D(愿望算子)、I(意圖算子),對(duì)經(jīng)典命題語言L進(jìn)行擴(kuò)展而成的。

      規(guī)定:Pφ、Bφ、Dφ和Iφ分別表示主體偏好、相信、愿望和意圖命題φ。P([α]φ,p)表示在執(zhí)行行動(dòng)α后,主體偏好命題φ的真值隸屬度(即偏好度)為p。B([α]φ,b)表示主體相信在執(zhí)行行動(dòng)α后,相信φ的真值隸屬度(即信念度)為b;D(φ,d)表示主體愿望命題φ的真值隸屬度(即愿望度)為d;I([α]φ,i)表示在執(zhí)行行動(dòng)α后,主體意圖φ為真的真值隸屬度(即意圖度)為i。

      在本文中:φ,ψ表示命題,α,β表示行動(dòng),行動(dòng)集、原子行動(dòng)集、命題集和原子命題集、分別用Π、Π0、Φ和Φ0表示。語言Lpg-BDI表達(dá)式只有兩種:命題和行動(dòng)。

      (1) 語言Lpg-BDI的公式φ通過如下方式歸納得到:

      即:Lpg-BDI-公式是由原子命題、經(jīng)典算子(否定算子)、→(蘊(yùn)涵算子)和[ ](程序必然算子)通過歸納的方式加以定義,其中[α]φ表示每次執(zhí)行行動(dòng)α后,命題φ成立。

      (2) 語言Lpg-BDI的行動(dòng)α由原子行動(dòng)通過如下方式歸納得到:

      α∷=α0|α; β|α∪β|α*|φ?|

      即:Lpg-BDI-行動(dòng)是由原子行動(dòng)通過歸納的方式,由不確定性選擇算子“∪”、行動(dòng)復(fù)合算子“;”、測(cè)試算子“?”和迭代算子“*”加以定義。而迭代行動(dòng)αn(其中n是自然數(shù),而且n≥0)由α0=id和αn+1=α; αn通過歸納方式加以定義。

      (3) 如果φ∈Lpg-BDI,那么φ,Γφ∈ΓC;

      (4) 如果r∈Q∩[-1,1],那么rc∈ΓC,其中Q表示有理數(shù)的集合;

      (5) 如果Γφ,Γψ∈ΓC,那么Γφ∧Γψ∈ΓC且Γφ→Γψ∈ΓC。

      例如:當(dāng)Γ是偏好算子P且φ∈Lpg-BDI時(shí),由(3)可知:φ,Pψ∈PC(PC表示偏好背景);當(dāng)Γ是偏好算子P且Pφ,Pψ∈PC時(shí),根據(jù)(5)可知:Pφ→ Pψ∈PC且Pφ∧Pψ∈PC。其他模態(tài)算子的理解與此類似。規(guī)定:模態(tài)公式Γφ →Γψ對(duì)應(yīng)真值是1,其意思是,Γφ的真值大于或等于Γψ的真值。rc→Γφ表示φ的真值隸屬度至少為rc,簡記為(Γφ,rc)。

      (二)偏好排斥等級(jí)BDI邏輯的語義

      不同的可能世界對(duì)應(yīng)于主體不同的心智狀態(tài)。利用克里普克模型可以給出pg-BDI邏輯的語義。為此,利用對(duì)偏好進(jìn)行處理的結(jié)構(gòu)和函數(shù)λ,對(duì)Xiaojun Zhang等[13]的等級(jí)BDI邏輯進(jìn)行擴(kuò)展。即,為pg-BDI邏輯定義如下克里普克結(jié)構(gòu):K=〈W,ν,ρ,τ,θ,{μw}w∈W,λ〉,其中:

      (6) W是可能世界集合,且可能世界w,w′∈W≠?。

      (7) ρ:2W→[-1,1]表示W(wǎng)子集上的概率測(cè)度;對(duì)于φ∈Φ0,{w| ν(φ,w)=1}是可測(cè)度的。

      (8) τ:Π0→ 2W×W是指由不同原子行動(dòng)所對(duì)應(yīng)的可能世界之間的轉(zhuǎn)換函數(shù)。

      (9) θ:W →[-1,1]是信念測(cè)度,|θ(w)| < |θ(w′)|表示w′比w更被主體相信。

      (10) μw:W→[-1,1]是愿望測(cè)度,μw(w′)∈[-1,1]表示主體試圖從w到w′的愿望強(qiáng)烈程度。

      (11) λ:W →[-1,1]是偏好對(duì)主體決策行為的影響測(cè)度,|λ(w)| < |λ(w′)|是指w′比w對(duì)主體決策行為影響更大。

      利用關(guān)于偏好的語義,對(duì)Xiaojun Zhang等[13]的等級(jí)BDI邏輯的語義進(jìn)行擴(kuò)展,并把其真值隸屬度從[0,1]擴(kuò)展為[-1,1],就可以得到pg-BDI邏輯的語義:

      (12) ν(Γφ,w)=ξ{w′∈W | ν(φ,w′)=1},對(duì)每個(gè)φ來說,其中ξ ∈{ρ,θ,μw,λ}。

      (13) 對(duì)于所有r∈Q∩[-1,1],ν(rc,w)=r。

      (14) ν(Γφ∧Γψ,w)=max(ν(Γφ)+ν(Γψ)-1,-1)。

      (15) ν(Γφ →Γψ,w)=min(1-ν(Γφ)+ν(Γψ),1)。

      (16) 對(duì)于所有可能世界w∈W,ν(?!?w)=0。

      (三)偏好排斥等級(jí)BDI邏輯的公理和演繹規(guī)則

      與Xiaojun Zhang[20]的情感等級(jí)BDI邏輯類似,pg-BDI邏輯的公理包括三部分:一是經(jīng)典命題邏輯的所有公理,二是基于無窮值ukasiewicz邏輯的Γ-公理,三是基于命題動(dòng)態(tài)邏輯的模態(tài)公式Γ-公理(其中Γ∈{P,B,D,I})。這些公理具體如下:

      (17) 經(jīng)典命題邏輯的所有公理。

      基于盧卡斯維茨邏輯的Γ-公理如下:

      (19) Γ(φ→ψ) →L(Γφ→Γψ)

      基于命題動(dòng)態(tài)邏輯的Γ-公理如下:

      (22)[α]Γ(φ→ψ) → ([α]Γφ→[α]Γψ)

      (23)[α]Γ(φ∧ψ)? [α]Γφ∧[α]Γψ

      (24)[α∪β]Γφ?[α]Γφ∨[β]Γφ

      (25)[α; β]Γφ? [α][β]Γφ

      (26)[Γψ?]Γφ ?(Γψ→Γφ)

      (27) Γφ[α][α*]Γφ?[α*]Γφ

      (28) Γφ[α*](Γφ→[α]Γφ)?[α*]Γφ

      偏好排斥等級(jí)BDI邏輯的演繹規(guī)則有:

      (30) 分離規(guī)則1(MP1):從φ和(φ→ψ)可以推出ψ。

      (31) 分離規(guī)則2(MP):從(φ,r1)和(φ→ψ,r2)可以推出(ψ,r1& r2)。

      (32) 真值常元引入規(guī)則:從(φ,r1) 可以推出(rc→ φ,rc→ r1)。

      (33) 概括規(guī)則1(GEN1):從φ可以推出[α]φ。

      (34) 概括規(guī)則2(GEN2):從φ可以推出Γφ。

      pg-BDI邏輯具有完全性與可靠性,可以通過嵌入(embedding)的方法加以證明。具體證明過程與張曉君[21]96-110的情感等級(jí)BDI邏輯的可靠性與完全性的證明類似,即,通過把pg-BDI邏輯嵌入到命題動(dòng)態(tài)邏輯或無窮值ukasiewicz邏輯中加以證明。

      三、偏好排斥等級(jí)BDI主體模型的不同背景關(guān)系

      主體為了達(dá)成愿望,需要根據(jù)偏好、排斥、信念、愿望,以及執(zhí)行行動(dòng)而導(dǎo)致的可能世界之間的轉(zhuǎn)換,來制定規(guī)劃(即復(fù)合行動(dòng)),并根據(jù)最佳規(guī)劃執(zhí)行行動(dòng)。愿望背景DC、信念背景BC、偏好背景PC與規(guī)劃背景HC之間關(guān)系如下:

      (35) 如果P:(P([α]φ,p)),B:(B([α]φ,b)),D:(Dφ,d)且H:action(α,Pre-,Costα),那么H:plan(φ,action(α,Pre-,Costα),b)。

      其中:α是初始行動(dòng),Pre-是執(zhí)行α的前提條件;Costα∈[-1,1]是主體執(zhí)行α?xí)r付出的代價(jià);p、b分別表示執(zhí)行α達(dá)成φ時(shí)的偏好度、信念度;d表示愿望度。并假定主體的當(dāng)前世界狀態(tài)滿足執(zhí)行α的前提條件,而且規(guī)劃必將使得相關(guān)愿望成真。

      意圖度表示達(dá)成命題φ時(shí),主體將付出的代價(jià)并且獲得的利益,因此對(duì)每個(gè)能夠達(dá)成命題φ的復(fù)合行動(dòng)α而言,Iφ的意圖度i可以由Bφ的信念度b、Pφ的偏好度p、Dφ的愿望度d,以及達(dá)成φ時(shí)所付出的代價(jià)Costα加以定義,即可以利用如下轉(zhuǎn)換函數(shù)加以定義:

      (36) 如果P:(P([α]φ,p)),B:(B([α]φ,b)),D:(Dφ,d),)且H:action(α,Pre-,Costα),那么H:plan(φ,action(α,Pre-,Costα),b),則I:(Iφ,f(p,b,d,Costα))。

      不同主體行為可以由不同的轉(zhuǎn)換函數(shù)f(p,b,d,Costα)來建模,利用函數(shù)f(p,b,d,Costα),就可以把主體的信念、愿望、偏好和排斥對(duì)決策行為的影響都轉(zhuǎn)化成意圖度,即,Iφ的意圖度i承載了偏好度p、信念度b、愿望度d和代價(jià)Costα所攜帶的信息。

      根據(jù)具體要考察的模型,對(duì)主體信念、愿望、偏好和排斥對(duì)意圖度的影響程度賦予不同的權(quán)重,并根據(jù)實(shí)踐反饋的信息制定其相應(yīng)的調(diào)參規(guī)則,而且在實(shí)際應(yīng)用中可以對(duì)權(quán)重進(jìn)行修改完善。例如,對(duì)于本文要考察的工作單位決策行為主體而言,我們指派給p,b,d和Costα對(duì)意圖度影響的權(quán)重分別為0.35、0.16、0.21、0.28。即意圖度i用如下轉(zhuǎn)換函數(shù)f(p,b,d,Costα)加以定義:

      (37) i=f(p,b,d,Costα)= 0.35p+0.16b+0.21d+0.28Costα

      在可供選擇的工作單位中,假定理性主體選擇意圖度最強(qiáng)imax的工作單位。即,如果理性主體的愿望是達(dá)成φ,那么主體將選擇意圖度最強(qiáng)烈的imax所對(duì)應(yīng)的工作單位,并制定相應(yīng)規(guī)劃,之后主體把這一規(guī)劃傳達(dá)給交流背景C。即:

      (38) 如果I:(Iφ,imax)且H:bestplan(φ,action(α,Pre-,Costα),b),則C:C(does(α))。

      四、案例分析:偏好排斥等級(jí)BDI主體工作單位決策行為的形式刻畫

      考慮以下情景:小王大學(xué)畢業(yè)時(shí)面臨工作單位的選擇決策。假設(shè)小王是帶有偏好和排斥的等級(jí)BDI主體。為此,我們指派給該決策主體這樣3個(gè)愿望:一是工資高;二是待遇好(比如有住房、安家費(fèi)、科研啟動(dòng)費(fèi)等);三是自己感興趣。我們指派給該決策主體如下這樣3個(gè)偏好:一是偏好有發(fā)展前途的公司;二是偏好發(fā)達(dá)的大城市;三是偏好交通便利的城市。我們指派給該決策主體如下這樣3個(gè)排斥:一是排斥工作壓力大的公司;二是排斥環(huán)境差的城市;三是排斥離父母家太遠(yuǎn)的公司。

      為了決定所要選擇的工作單位,主體將根據(jù)自己的信念、愿望、偏好和排斥,綜合考慮工作單位所帶來的利益(一是工資高;二是待遇好;三是自己感興趣),以及負(fù)面偏好和工作壓力等所付出的代價(jià)。此實(shí)例中,不同決策行為就是選擇不同的工作單位;假定小王有3個(gè)工作單位可供選擇:

      (39) Π0={公司A、公司B、公司C}。

      在這種情況下,偏好背景PC、愿望背景DC和信念背景BC如下:

      偏好背景(PC):我們可以賦予該主體如下3個(gè)正向偏好:

      (40) P([公司A]有發(fā)展前途,p1=0.80)

      (41) P([公司B]有發(fā)展前途,p1=0.90)

      (42) P([公司C]有發(fā)展前途,p1=0.33)

      (43) P([公司A]發(fā)達(dá)城市,p2=0.79)

      (44) P([公司B]發(fā)達(dá)城市,p2=0.63)

      (45) P([公司C]發(fā)達(dá)城市,p2=0.90)

      (46) P([公司A]交通便利,p3=0.92)

      (47) P([公司B]交通便利,p3=0.82)

      (48) P([公司C]交通便利,p3=0.85)

      (49) P([公司A]壓力大,p4=-0.66)

      (50) P([公司B]壓力大,p4=-0.95)

      (51) P([公司C]壓力大,p4=-0.41)

      (52) P([公司A]環(huán)境差,p5=-0.93)

      (53) P([公司B]環(huán)境差,p5=-0.80)

      (54) P([公司C]環(huán)境差,p5=-0.45)

      (55) P([公司A]離家遠(yuǎn),p6=-0.20)

      (56) P([公司B]離家遠(yuǎn),p6=-0.30)

      (57) P([公司C]離家遠(yuǎn),p6=-0.95)

      在該實(shí)例中,P([公司A]有發(fā)展前途,p1=0.80)的偏好度p1是指在執(zhí)行行動(dòng)α(即選擇工作單位A)后,有發(fā)展前途的概率測(cè)度或真值隸屬度是0.80,即選擇公司A對(duì)意圖的影響程度為0.80;由于此真值隸屬度為正值,會(huì)促使主體選擇該工作單位。其他偏好度與此類似?!坝邪l(fā)展前途、發(fā)達(dá)城市、交通便利”這3個(gè)偏好都會(huì)促使主體選擇所對(duì)應(yīng)的工作單位,屬于正向偏好,故所對(duì)應(yīng)的真值隸屬度∈[0,1]。

      排斥可以看作是負(fù)向偏好。“壓力大、環(huán)境差、離家遠(yuǎn)”這3個(gè)排斥都會(huì)阻止主體選擇所對(duì)應(yīng)的工作單位,屬于負(fù)向偏好,故所對(duì)應(yīng)的真值隸屬度∈[-1,0]。真值隸屬度的絕對(duì)值越大,對(duì)相應(yīng)公司選擇的影響就越強(qiáng)烈。例如,P([公司A]環(huán)境差,p5=-0.93)的負(fù)向偏好度或排斥度p5是指在執(zhí)行行動(dòng)α(即選擇工作單位A)后,環(huán)境差的概率測(cè)度或真值隸屬度是-0.93,即選擇公司A對(duì)意圖的影響程度為-0.93。由于此真值隸屬度為負(fù)值,會(huì)阻止主體選擇該工作單位。在這三個(gè)公司中,公司A所對(duì)應(yīng)p5的絕對(duì)值最大,說明其環(huán)境最差。本文中的其他測(cè)度與此類似。

      假定這3個(gè)偏好和3個(gè)排斥是隨機(jī)獨(dú)立的,為此,根據(jù)這3個(gè)偏好和3個(gè)排斥對(duì)小王意圖影響的不同權(quán)重,可以為偏好背景PC指定如下推理規(guī)則:

      (58)如果P([α]有發(fā)展前途,p1)且P([α]發(fā)達(dá)城市,p2) 且P([α]交通便利,p3)且P([α]壓力大,p4)且P([α]環(huán)境差,p5)且P([α]離家遠(yuǎn),p6),那么P([α]有發(fā)展前途∧發(fā)達(dá)城市∧交通便利∧壓力大∧環(huán)境差∧離家遠(yuǎn)(以下簡記為:3個(gè)偏好∧3個(gè)排斥),p= 0.31p1+0.18p2+ 0.16p3+ 0.12p4+0.10p5+0.13p6)。因此,把前面偏好背景中的p1-p6的值分別代入p中,可得:

      (59) P([公司A]3個(gè)偏好∧3個(gè)排斥,p=0.339 2)

      (60) P([公司B]3個(gè)偏好∧3個(gè)排斥,p=0.290 6)

      (61) P([公司C]3個(gè)偏好∧3個(gè)排斥,p=0.182 6)

      愿望背景(DC):我們可以賦予該主體這樣3個(gè)愿望:

      (62) (D(工資高),d=0.90)

      (63) (D(待遇好),d=0.82)

      (64) (D(感興趣),d=0.88)

      (65) (D(工資高∧待遇好∧感興趣),d=0.98)

      由于此實(shí)例中的3個(gè)愿望都是正向愿望,其真值隸屬度∈[0,1]。真值隸屬度越大,表示其愿望越強(qiáng)烈。

      信念背景(BC):理性決策主體小王具有“執(zhí)行相應(yīng)行動(dòng)后”哪些公式為真的知識(shí)。在該實(shí)例中,B([公司A]工資高,b1)的信念度b1是指在執(zhí)行行動(dòng)α(即選擇工作單位A)后,相信工資高的概率或滿意程度,屬于正向信念,所對(duì)應(yīng)的真值隸屬度∈[0,1]。其他信念與此類似。我們不妨為這一決策主體賦予如下信念:

      (66) B([公司A]工資高,b1=0.70)

      (67) B([公司B]工資高,b1=0.95)

      (68) B([公司C]工資高,b1=0.52)

      (69) B([公司A]待遇好,b2=0.79)

      (70) B([公司B]待遇好,b2=0.61)

      (71) B([公司C]待遇好,b2=0.70)

      (72) B([公司A]感興趣,b3=0.87)

      (73) B([公司B]感興趣,b3=0.92)

      (74) B([公司C]感興趣,b3=0.61)

      根據(jù)它們對(duì)小王意圖影響的不同權(quán)重,可以為信念背景BC指定如下推理規(guī)則:

      (75) 如果B([α]工資高,b1)且B([α]待遇好,b2)且B([α]感興趣,b3),那么B([α]工資高∧待遇好∧感興趣,b=0.45b1+0.30b2+0.25b3)。因此:

      (76) B([公司A]工資高∧待遇好∧感興趣,b=0.769 5)

      (77) B([公司B]工資高∧待遇好∧感興趣,b=0.840 5)

      (78) B([公司C]工資高∧待遇好∧感興趣,b=0.596 5)

      規(guī)劃背景(HC):由于付出的代價(jià)對(duì)采取行動(dòng)(即選擇某公司)的影響是阻止性的,故其真值隸屬度∈[-1,0]。假設(shè)3個(gè)原子行動(dòng)對(duì)應(yīng)的代價(jià)如下:

      (79) action(公司A,Costα=-0.77)

      (80) action(公司B,Costα=-0.83)

      (81) action(公司C,Costα=-0.36)

      由于最強(qiáng)烈的愿望是工資高、待遇好而且感興趣。此愿望所產(chǎn)生的規(guī)劃如下:

      (82) plan(工資高∧待遇好∧感興趣,action(公司A,Costα=-0.77),b=0.769 5)

      (83) plan(工資高∧待遇好∧感興趣,action(公司B,Costα=-0.83),b=0.840 5)

      (84) plan(工資高∧待遇好∧感興趣,action(公司C,Costα=-0.36),b=0.596 5)

      現(xiàn)在,主體可以根據(jù)規(guī)劃所對(duì)應(yīng)的偏好和排斥來判斷意圖的強(qiáng)烈程度。根據(jù)(40) f(p,b,d,Costα)=0.35p+0.16b+0.21d+0.28Costα可知,d相對(duì)于轉(zhuǎn)換函數(shù)f而言是單調(diào)遞增的,故理性主體小王只考慮最強(qiáng)烈的愿望,即選擇工資高、待遇好而且感興趣的工作單位,該愿望的強(qiáng)烈程度d是0.98。因此這3個(gè)公司所對(duì)應(yīng)意圖的強(qiáng)烈程度如下:

      (85) I([公司A]工資高∧待遇好∧感興趣,i=0.35p+0.16b+0.21d+0.28Costα=0.232 04)

      (86) I([公司B]工資高∧待遇好∧感興趣,i=0.35p+0.16b+0.21d+0.28Costα=0.209 59)

      (87) I([公司C]工資高∧待遇好∧感興趣,i=0.35p+0.16b+0.21d+0.28Costα=0.264 35)

      由此可見,意圖度逐漸遞減的公司排序如下:公司C、公司A、公司B,主體在兼顧其3個(gè)愿望、3個(gè)偏好和3個(gè)排斥的情況下,最終選擇公司C的意圖最為強(qiáng)烈,公司C為最佳公司,公司B最次。這里算出的意圖度都不高,主要是由于信念度、愿望度和偏好度均小于1,各種權(quán)重也小于1,經(jīng)過乘積運(yùn)算后,其值更小;而且代價(jià)對(duì)意圖度的影響是負(fù)值。

      最后,主體采納最佳規(guī)劃,執(zhí)行行動(dòng),即選擇工作單位C,這一行動(dòng)信息隨后就傳遞給交流背景。

      五、結(jié)論和未來的工作

      下一步的工作可以考慮:(1)建立帶有通用算子的等級(jí)BDI主體模型,考慮在等級(jí)BDI模型的基礎(chǔ)上,引入“可以解釋為(關(guān)鍵性)知識(shí)和情感(如高興、悲傷、擔(dān)心)等等的”通用算子;(2)把偏好排斥等級(jí)BDI主體模型擴(kuò)展到多主體環(huán)境中,即描述該主體與其他主體的交互行為;(3)偏好排斥等級(jí)BDI主體系統(tǒng)的可計(jì)算性和計(jì)算復(fù)雜性問題;(4)深入開展偏好排斥等級(jí)BDI邏輯的應(yīng)用研究,更好地為Agent理論的諸多應(yīng)用領(lǐng)域服務(wù)。

      猜你喜歡
      真值感興趣測(cè)度
      三個(gè)數(shù)字集生成的自相似測(cè)度的乘積譜
      R1上莫朗測(cè)度關(guān)于幾何平均誤差的最優(yōu)Vornoi分劃
      更 正
      含能材料(2021年1期)2021-01-10 08:34:34
      非等熵Chaplygin氣體測(cè)度值解存在性
      Cookie-Cutter集上的Gibbs測(cè)度
      10kV組合互感器誤差偏真值原因分析
      電子制作(2017年1期)2017-05-17 03:54:35
      這樣的智能廚房臺(tái)面,你會(huì)感興趣嗎?
      真值限定的語言真值直覺模糊推理
      基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評(píng)價(jià)算法
      夢(mèng)斷交易會(huì)
      興趣英語(2013年9期)2013-11-28 05:49:22
      安多县| 饶平县| 两当县| 邵阳县| 闸北区| 仪征市| 德庆县| 乌兰县| 高雄市| 石景山区| 内黄县| 樟树市| 来安县| 邵阳市| 荥经县| 康乐县| 开化县| 岳普湖县| 西畴县| 鄂尔多斯市| 辉县市| 石家庄市| 泌阳县| 六枝特区| 蕉岭县| 鹤庆县| 绩溪县| 大丰市| 安乡县| 通化县| 吴忠市| 汝阳县| 花莲县| 东城区| 合水县| 原平市| 日土县| 璧山县| 无为县| 东山县| 中江县|