伍京華,王競陶,劉 浩,葉慧慧
(中國礦業(yè)大學(xué)(北京) 管理學(xué)院,北京 100083)
在商務(wù)智能領(lǐng)域,自動(dòng)談判是人們解決爭端和達(dá)成一致的重要途徑,能夠根據(jù)外部環(huán)境的動(dòng)態(tài)變化實(shí)現(xiàn)復(fù)雜的談判,從而節(jié)省不必要的人力物力財(cái)力,因此自動(dòng)談判成為人工智能領(lǐng)域的研究熱點(diǎn)[1-2]。基于Agent的情感勸說是基于Agent的自動(dòng)談判發(fā)展到更加智能和高級的模式,這種談判方式不但利用Agent模擬人的情感、意識和行為,而且利用勸說的人工智能特點(diǎn)完成自動(dòng)談判,能節(jié)約談判成本和提高談判理性程度[3]。例如:在國際煤炭行業(yè)供應(yīng)鏈管理的采購及銷售中,由于談判各方處于不同國家,導(dǎo)致談判發(fā)生的時(shí)間、地點(diǎn)等不同,如果采取傳統(tǒng)談判方式,不僅會(huì)耗費(fèi)談判各方的時(shí)間、人力、物力等成本,談判過程及結(jié)果也可能因?yàn)橐陨弦蛩赜绊懚y以達(dá)到最優(yōu)[4]。采取自動(dòng)談判的方式,能在一定程度上避免以上因素影響,較好地解決以上問題,但目前真正能將談判與人工智能優(yōu)勢結(jié)合并深入的研究還較少[5],因此需要進(jìn)一步挖掘更加完善的自動(dòng)談判模式。
國內(nèi)外該領(lǐng)域中不同學(xué)者和專家從不同角度對基于Agent的情感勸說進(jìn)行了研究:
(1)在自動(dòng)談判領(lǐng)域。張京敏[6]考慮到對手分類算法與Q-learning算法能夠更好地適應(yīng)動(dòng)態(tài)變化的環(huán)境,提出了基于對手分類的強(qiáng)化學(xué)習(xí)雙邊多議題相關(guān)的協(xié)商算法。楊興燚[6]向基于Agent的系統(tǒng)引入了信任評估機(jī)制,所建立的信任模型,著重解決信任獲取問題,建立了多Agent的信任信息獲取與集結(jié)模型,并將信任機(jī)制與自動(dòng)談判系統(tǒng)相結(jié)合。曹慕昆[7]利用多目標(biāo)優(yōu)化算法NSGA-Ⅱ獲得談判雙方的Pareto出價(jià)組合,通過基于時(shí)間的固定談判策略沿Pareto邊界對出價(jià)進(jìn)行修正,構(gòu)建了一個(gè)能使談判雙方以較高效率實(shí)現(xiàn)雙贏的多屬性談判模型。
(2)情感量化及將情感引入人工智能方面。吳偉國[8]針對人—機(jī)器人交互構(gòu)建了人工情感計(jì)算模型,該模型能有效模擬人類情緒的變化過程。Jiang Hong[9]利用PAD心情模型構(gòu)建了Agent情感辯論模型,并討論了情感對辯論結(jié)果的影響。郭尚波[10]研究了影響情感產(chǎn)生的認(rèn)知條件以及OCEAN、PAD、OCC三個(gè)情感模型之間的相互作用,提出一種考慮了人類性格的情感產(chǎn)生模型。謝麗君[11]基于馬爾可夫鏈理論研究了情感維度理論,應(yīng)用該理論建立了HMM情感模型并應(yīng)用到了家庭服務(wù)機(jī)中。
(3)針對產(chǎn)生模型,張鴿[12]提出了候選辯論集的產(chǎn)生策略和基于沖突分析的辯論目標(biāo)產(chǎn)生模型,分析了基于多Agent商務(wù)談判決策過程,并給出系統(tǒng)驗(yàn)證。董學(xué)杰[13]針對Agent對動(dòng)態(tài)變化的談判環(huán)境缺乏適應(yīng)性的問題,建立了情感產(chǎn)生模型和決策模型,并在單屬性自動(dòng)談判環(huán)境下,運(yùn)用模型和實(shí)際數(shù)據(jù)進(jìn)行試驗(yàn),實(shí)證了數(shù)據(jù)模型的有效性。Santos MR[14]為了更好地建立Agent情感的產(chǎn)生和評價(jià)模型,將性格模型、心情空間模型、情緒模型與群體決策支持系統(tǒng)相結(jié)合,并通過對比展示了基于Agent的情感勸說的優(yōu)勢。
(4)針對策略模型,李靜[15]針對辯論的產(chǎn)生、評估和策略缺乏系統(tǒng)化研究的現(xiàn)狀,將前景理論引入多Agent辯論協(xié)商模型中,制定出了相應(yīng)的辯論協(xié)商策略。Carolis B[16]提出一種將Agent情感勸說與理性勸說相結(jié)合的計(jì)算模型,根據(jù)該模型對Agent的性格特征和生活習(xí)慣進(jìn)行推理,并使Agent根據(jù)相應(yīng)的推理結(jié)果選擇相應(yīng)的勸說策略。
(5)針對評價(jià)模型,伍京華[17]給出了Agent勸說中輿論的定義和分類,然后結(jié)合形式邏輯理論,提出了Agent勸說中的積極輿論模型以及相應(yīng)的評價(jià)體系,并通過算例進(jìn)行驗(yàn)證。Jiang Hong[18]等將情感融入BDI理論中,建立了EBRI Agent來描述Agent情感產(chǎn)生,并結(jié)合情感層次理論對Agent情感進(jìn)行評價(jià)。伍京華等[19]將情感作為評價(jià)因素,提出了Agent主體情感的評價(jià)模型,構(gòu)建了Agent合作主體選擇模型。
(6)針對讓步模型,伍京華[20]基于Agent辯論談判的流程進(jìn)行了算例分析,提出了相應(yīng)的讓步模型,并實(shí)現(xiàn)了相關(guān)的系統(tǒng)。孫華梅[21]等對Agent勸說進(jìn)行分類,在讓步影響幅度的基礎(chǔ)上構(gòu)建了讓步模型。董學(xué)杰[22]將情感理論與情感模型引入多Agent辯論談判領(lǐng)域,基于期望效用評價(jià)提出了情感的產(chǎn)生模型、評價(jià)模型,并提出了情感決策過程中相應(yīng)的讓步模型和策略選擇。研究表明,在談判過程中,不同權(quán)利不同情感下的談判者會(huì)做出不同的讓步。
在動(dòng)態(tài)變化的談判環(huán)境中,上述已有研究主要存在以下問題:
(1)對情感的研究不夠全面,不夠深入,尤其是情感的量化方面,已有研究在情感量化方面,有的僅僅是考慮情感的分類以及不同情感對勸說的影響,有的只將情緒和情感聯(lián)系起來,并未考慮性格因素對情感產(chǎn)生的影響,有的雖然考慮了性格和情緒對情感的影響,但是并未研究性格對情緒的影響。
(2)將情感理論應(yīng)用到Agent勸說領(lǐng)域的研究較少,存在Agent對動(dòng)態(tài)變化的談判環(huán)境缺乏適應(yīng)性的問題。
(3)對Agent勸說的研究更多的是針對單一模型或算法的研究,對基于映射的勸說過程研究較少,尤其是考慮情感這一因素對基于Agent的映射的勸說過程的影響的研究較少。
針對現(xiàn)有研究中Agent情感勸說的動(dòng)態(tài)變化方面存在的問題,本文重點(diǎn)考慮Agent勸說過程中的情感因素,首先在艾克曼[24]經(jīng)典情感分類的基礎(chǔ)上提出新的Agent情感分類后,利用已有情感理論中典型的OCEAN-PAD-OCC的層次映射模型[23],構(gòu)建了基于Agent的情感映射的勸說產(chǎn)生模型;其次,通過對Agent勸說策略、主導(dǎo)情感和情感閾值的定義,提出了相應(yīng)的策略模型;再次,對Agent情感強(qiáng)度進(jìn)行了定義,分析其影響因素為勸說策略和情感衰減,在對情感衰減進(jìn)行定義的基礎(chǔ)上,提出了基于Agent的情感映射的勸說評價(jià)模型,并通過對受情感影響的讓步步長的計(jì)算構(gòu)建了相應(yīng)的讓步模型;最后,綜合以上模型,構(gòu)建了相應(yīng)的框架流程圖。情感和勸說的加入,讓本文提出的各個(gè)模型更能適應(yīng)復(fù)雜的動(dòng)態(tài)談判環(huán)境。
為了說明上述勸說過程及模型的有效性,本文以煤炭行業(yè)供應(yīng)鏈管理中的采購商和銷售商的談判為背景,構(gòu)建了相應(yīng)算例并進(jìn)行了分析,再結(jié)合JADE平臺,使用JAVA語言,對以上模型進(jìn)行了系統(tǒng)實(shí)現(xiàn)。算例結(jié)果表明,情感映射對基于Agent的勸說的全過程都有著重要影響。與基于Agent的勸說相比,基于Agent的情感映射的勸說在考慮情感映射之后,不但依據(jù)情感映射來進(jìn)行策略選擇,而且依據(jù)情感映射在交互過程中進(jìn)行讓步,使勸說過程變得更加智能,更加接近人類的思維和情感變化,使勸說結(jié)果更加符合勸說實(shí)際?;诖?,驗(yàn)證了本文模型的有效性,也說明了情感映射對基于Agent的勸說產(chǎn)生的重要影響。
Agent情感產(chǎn)生的過程就是Agent模擬人的情感產(chǎn)生的過程,由于人類情感的產(chǎn)生受到性格、心情、情緒等多方面的影響,因此Agent情感的產(chǎn)生也會(huì)受到性格、心情和情緒等多個(gè)因素的影響。Agent性格指的是某個(gè)Agent個(gè)體特有的,受先天性因素和環(huán)境因素所影響的長期存在的心理特征;Agent心情是指Agent個(gè)體受外在環(huán)境所影響的能持續(xù)一段時(shí)間的一種感受;Agent情緒是指是一種瞬間變化的、短暫的、不穩(wěn)定的心理。
在影響Agent情感的分量中,Agent的性格相對穩(wěn)定,Agent心情的穩(wěn)定性介于Agent的個(gè)性與Agent的情緒之間,Agent的情緒最不穩(wěn)定。心理學(xué)研究表明,在相互作用方面,人的心情形成與個(gè)體性格有關(guān),而心情會(huì)影響情緒的形成,從對決策的影響性來看,情緒對人的決策影響是顯式的,即個(gè)人的決策與情緒有著直接的關(guān)系,而個(gè)性和心情對人的影響卻是隱式的[25]。相應(yīng)地,Agent的性格、心情和情緒也具有以上關(guān)系。
Agent情感的變化會(huì)受到性格的影響,不同性格的人處于相同的環(huán)境下會(huì)產(chǎn)生不同的情感。得到最多相關(guān)領(lǐng)域?qū)W者和心理學(xué)家們認(rèn)可的,是大五OCEAN性格模型,該模型通過Openness(開放性)、Conscientiousness(謹(jǐn)慎性)、Extraversion(外向型)、Agreeableness(宜人性)、Neuroticism(神經(jīng)質(zhì))五個(gè)因素對Agent個(gè)性進(jìn)行描述。本文根據(jù)OCEAN大五性格模型定義了一個(gè)五元組ocean來度量Agent的性格,如式(1)所示:
ocean=(oo,oc,oe,oa,on)。
(1)
式中(oo,oc,oe,oa,on)分別表示Agent五種性格特征值。Agent在其中的某一維向量的取值越大,表示該Agent性格中的這個(gè)方面的表現(xiàn)越明顯。
在影響情感的分量中,性格相對穩(wěn)定。心情的穩(wěn)定性和變化介于性格與情緒之間。為了科學(xué)合理地計(jì)算Agent的性格對情感的影響,引入應(yīng)用最廣泛的Mehrabian[26]提出的PAD心情空間作為中間層將性格與情緒聯(lián)系起來。該心情空間包含3個(gè)特質(zhì)分別是:愉悅的程度P(pleasure)、被喚醒的程度A(arousal)、可支配的程度D(dominance),P、A、D∈[-1,1]。Mehrabian提出了PAD三維心情空間,并根據(jù)PAD每一個(gè)維度的正負(fù)值組合,定義了8種心情類型。本文引入三維心情空間變量Pad來表示Agent的心情狀態(tài),如式(2)所示:
Pad=(Pp,Pa,Pd)。
(2)
式中Pp,Pa,Pd表示Agent心情的愉悅度、喚醒度和支配度的值。
由矩陣運(yùn)算規(guī)則可得OCEAN性格模型到PAD心情空間的映射,如式(3)所示:
(3)
因此,通過式(3)就可以將OCEAN性格模型中的5種性格因素量化后映射到PAD情感空間中。
本文參考楊國亮[27]和Gebhard P[28]經(jīng)典研究中的各個(gè)系數(shù)取值,得到Agent的心情轉(zhuǎn)換矩陣,如式(4)所示:
∏OCEAN→PAD=
(4)
因此,如假定Agent在勸說中的性格取值為ocean=[0.4 0.8 0.6 0.3 0.4],則可由式(4)計(jì)算得其心情為PAD=[0.38 -0.08 0.5]。
與性格和心情相比,情緒是影響Agent的情感分量中最容易變化的分量。本文選用的是易于在計(jì)算機(jī)上實(shí)現(xiàn)的、受到計(jì)算機(jī)專家和心理學(xué)專家一致肯定的基于認(rèn)知的情感模型——OCC模型。Ortony等[29]人以情感產(chǎn)生的認(rèn)知為研究出發(fā)點(diǎn),以事件、主體和對象為評價(jià)標(biāo)準(zhǔn),提出了包含22種情緒狀態(tài)的OCC層次結(jié)構(gòu)情緒模型。為了簡化計(jì)算,本文選取模型中的12種情緒:joy、hope、relief、pride、gratitude、love、distress、fear、disappointment、remorse、anger、hate進(jìn)行映射計(jì)算,并用式(5)來表示Agent對應(yīng)12種情緒的取值,
occ=(o1,o2,…,o12)。
(5)
式中occ代表Agent情緒變量。
由12種OCC情緒模型和PAD心情空間的映射關(guān)系可得PAD心情空間映射到OCC情感模型的12×3的過渡矩陣,如式(6)所示:
(6)
根據(jù)文獻(xiàn)[28]中OCC情緒和PAD心情空間的映射關(guān)系,可得到PAD心情空間映射到OCC情感模型的值如式(7)所示:
(7)
基于Agent的情感映射的勸說產(chǎn)生模型的核心是產(chǎn)生相應(yīng)的Agent情感。因此,首先要對其中的Agent情感進(jìn)行分類,然后根據(jù)上文的映射模型建立相應(yīng)的情感產(chǎn)生模型。以往的研究主要按不同維度將Agent情感進(jìn)行分類,可以產(chǎn)生多達(dá)幾十種不同的情感,這導(dǎo)致模型往往比較復(fù)雜,不適合勸說談判中的Agent。艾克曼(Ekman)[24]將情感分為恐懼、憤怒、悲傷、高興、厭惡和驚奇6種基本類型,該分類較為經(jīng)典,在心理學(xué)界和管理學(xué)界占有主體地位。因此,為了簡化研究,本文在此基礎(chǔ)上,將勸說過程中相應(yīng)的Agent情感歸納為喜悅、悲傷、憤怒、恐懼4種基本情感,還有一種平靜的無情感狀態(tài)。將OCC情緒模型中選定的12種情緒映射到這4種基本情感中,建立相應(yīng)的映射,如表1所示。
表1 OCC中12種情緒與4種基本情感的映射
綜合以上分析和研究,可以用一個(gè)四維向量來表示各情感的分量值[12],從而得出基于Agent的情感映射的勸說產(chǎn)生模型,即對以上四種情感的綜合計(jì)算,如式(8)所示:
(8)
在基于Agent的情感映射的勸說中,選擇合適的策略是保證勸說順利進(jìn)行的重要條件,其核心是構(gòu)建相應(yīng)的策略模型,首先要對勸說策略進(jìn)行定義。
定義1Agent勸說策略。是指Agent為了達(dá)到自身目的,而對其他Agent使用的呼吁、引誘等策略。
由定義1可知,Agent勸說策略是影響Agent情感變化的最重要因素。積極的勸說策略會(huì)給雙方Agent帶來正面的積極情感,消極的勸說策略會(huì)給雙方Agent帶來負(fù)面的消極情感。從上述產(chǎn)生模型來看,實(shí)際勸說中,Agent有4種情感,而構(gòu)建相應(yīng)的策略模型,主要根據(jù)其中某種情感來確定。因此,構(gòu)建相應(yīng)的策略模型,其次還要定義Agent的主導(dǎo)情感。
定義2Agent主導(dǎo)情感。是指Agent在勸說的產(chǎn)生模型中取值最大的情感,Agent需要根據(jù)該情感確定相應(yīng)的策略,用Imax來表示。
再次,構(gòu)建相應(yīng)的策略模型,選擇合適的策略,還要對其中的Agent情感閾值進(jìn)行定義和合理計(jì)算。
定義3Agent情感閾值。是指Agent由于性格不同而具有的激發(fā)情感的臨界值。
由定義3可知,判斷Agent某一情感是否被激發(fā),主要看是否超過該閾值。顯然,個(gè)體情感閾值越大,表明個(gè)體情感越穩(wěn)定。邱林[30]和鄭雪等[31]研究表明,外傾性和神經(jīng)質(zhì)對幸福感影響最大,其中外傾性與主觀幸福感有顯著正相關(guān),神經(jīng)質(zhì)與主觀幸福感有顯著負(fù)相關(guān)。因此,借助大五模型性格測定結(jié)果,可以通過式(9)計(jì)算Agent的情感閾值:
m=|oo-on|/10。
(9)
綜上所示,可以通過式(10)表示基于Agent的情感映射的勸說策略模型:
φ(T)={Si,j|Ei,T,Imax,m}。
(10)
式中:Si,j表示不同的勸說策略,φ(T)表示Agent選擇該勸說策略后產(chǎn)生的影響值。根據(jù)以上公式選擇相應(yīng)策略,Agent完成后面的評價(jià)和讓步。
與人類情感類似,Agent的情感不是一成不變的,會(huì)隨著環(huán)境、對方策略、自身性格等各種因素的影響而產(chǎn)生動(dòng)態(tài)變化,并且Agent的情感會(huì)對Agent的評價(jià)造成一定程度的影響,因此,在構(gòu)建了基于Agent的情感映射的勸說產(chǎn)生和策略模型后,需要構(gòu)建相應(yīng)的評價(jià)模型完成勸說,而基于Agent的情感映射的勸說評價(jià)模型的核心是評價(jià)相應(yīng)的Agent的情感強(qiáng)度。根據(jù)情感強(qiáng)度第三定律,首先對Agent的情感強(qiáng)度定義如下:
定義4Agent的情感強(qiáng)度。是用來描述Agent在勸說中某時(shí)刻的情感的強(qiáng)弱,用Ir=(I1,r,I2,r,I3,r,…,In,r)表示。其中,Ii,r表示在第r輪勸說時(shí)Agent第i種基本情感的強(qiáng)度,強(qiáng)度的大小反映了Agent在勸說某輪中的情感的強(qiáng)弱,影響Agent情感強(qiáng)度的主要因素為勸說策略和情感衰減。
定義5情感衰減。是指Agent在勸說過程中受對方勸說影響而導(dǎo)致情感強(qiáng)度逐漸減弱的過程。
考慮情感衰減的前提是Agent已經(jīng)有被激發(fā)的情感,平靜狀態(tài)不會(huì)產(chǎn)生情感衰減。馬爾可夫無后效應(yīng),適用于隨機(jī)過程,因此Agent的情感衰減只考慮前一時(shí)刻情感對當(dāng)前時(shí)刻情感的影響,對于更早時(shí)刻的情感不做考慮[10],如式(11)所示:
ψ(T-1)→T(Ii,T-1)=Ii,T-1e-T0。
(11)
式中:ψ(T-1)→T(Ii,T-1)表示的是Agent在前一時(shí)刻情感衰減到當(dāng)前時(shí)刻的強(qiáng)度值,Ii,T-1表示Agent前一時(shí)刻的情感強(qiáng)度的向量值,e-T0為衰減系數(shù),T0∈[1,+∞]為常數(shù),表示當(dāng)前勸說持續(xù)的時(shí)間,T0越大,情感衰減的越快。衰減系數(shù)隨時(shí)間T0變化的函數(shù)圖像如圖1所示。
根據(jù)文獻(xiàn)[10]可知,前一時(shí)刻情感衰減后的分量與前一時(shí)刻的情感強(qiáng)度成正比,前一時(shí)刻的情感強(qiáng)度值越大,保留到當(dāng)前時(shí)刻的情感強(qiáng)度值也就越大,對當(dāng)前時(shí)刻的情感影響也就越大,反之則越小。
綜合以上分析和研究,可以得出基于Agent的情感映射的勸說評價(jià)模型,即對Agent的情感更新后的情感強(qiáng)度計(jì)算,如式(12)所示:
(12)
式中:Ii,r表示Agent在r輪勸說時(shí)的第i種情感的強(qiáng)度;ψi(Ii,T-1)表示情感i在T-1時(shí)刻的情感強(qiáng)度的衰減;φ(T)表示外界刺激對情感強(qiáng)度的影響;Ei,T表示性格對情感的影響,是產(chǎn)生模型中得出的4種基本情感的分量表示。
在對Agent的情感和策略進(jìn)行相應(yīng)評價(jià)之后,需要進(jìn)一步研究Agent在實(shí)際的勸說交互過程中的讓步模型,Agent需要根據(jù)情感勸說等因素的動(dòng)態(tài)變化不斷進(jìn)行相應(yīng)讓步,以達(dá)成合作。因此,本文對動(dòng)態(tài)環(huán)境影響下,基于Agent的情感勸說的讓步模型進(jìn)行了量化研究,建立了基于Agent的情感映射的勸說讓步模型,以配合上述模型完成勸說。具體如下:
如果Agent的情感被激發(fā),則讓步步長會(huì)受到影響而發(fā)生動(dòng)態(tài)變化。因此,該讓步模型中,關(guān)鍵是根據(jù)Agent雙方的情感被激發(fā)情況,對各勸說屬性的讓步步長的計(jì)算。根據(jù)主導(dǎo)情感與情感閾值之間的關(guān)系,可構(gòu)建相應(yīng)的讓步模型如下:
(13)
綜上所述,本文建立的基于Agent的情感映射的勸說過程,首先利用已有情感理論中典型的OCEAN-PAD-OCC的層次映射模型,建立OCEAN到PAD的映射模型和PAD到OCC的映射模型,構(gòu)成了基于Agent的情感映射模型;其次,對Ekman的經(jīng)典情感分類進(jìn)行改進(jìn),提出了相應(yīng)的Agent情感分類和基于Agent的情感映射的勸說產(chǎn)生模型,并對Agent的主導(dǎo)情感和情感閾值進(jìn)行定義,提出了相應(yīng)的策略模型;再次,根據(jù)情感強(qiáng)度第三定律,對Agent的情感強(qiáng)度進(jìn)行了定義,研究得出其關(guān)鍵影響因素為勸說策略和情感衰減,在對后者定義的基礎(chǔ)上,結(jié)合馬爾可夫理論,提出了相應(yīng)的評價(jià)模型,并通過對讓步步長的算法構(gòu)建,提出了相應(yīng)的讓步模型;產(chǎn)生模型、策略模型、評價(jià)模型和讓步模型共同構(gòu)成了基于Agent的情感映射的整個(gè)勸說過程,如圖2框架流程圖所示。
為使研究有代表性和便于理解,本文以煤炭行業(yè)供應(yīng)鏈管理中的采購商和銷售商的談判為背景,采購商(買方)為Agent a,銷售商(賣方)為Agent b,雙方就煤炭產(chǎn)品的價(jià)格(單位:元)和交貨期(單位:d)兩個(gè)主要屬性進(jìn)行勸說談判,Agent對這兩個(gè)屬性的要求以及讓步步長如表2所示:
表2 Agent對價(jià)格和交貨期的報(bào)價(jià)、極限值以及讓步步長
考慮到最快的勸說結(jié)果,只有在雙方Agent不斷進(jìn)行讓步的情況下,雙方Agent要至少經(jīng)過7次勸說(第一次為報(bào)價(jià))交互后才會(huì)得到成交的最優(yōu)結(jié)果:價(jià)格36元,交貨期5天。這個(gè)結(jié)果相對Agent a來說,是Agent a的最高限度,但并不是其最優(yōu)結(jié)果,因?yàn)椴]有達(dá)到Agent b報(bào)價(jià)的最低限度35.5元和4.5 d。
在基于Agent的情感映射的勸說中,隨機(jī)選擇若干個(gè)Agent,包括Agent a和Agent b及其他Agent,以網(wǎng)址:http://www.apesk.com/bigfive/index.asp?language=cn的測試方法為參考,對這些Agent進(jìn)行大五性格測試,測試得分分別見表3和表4,由此可分別得到如圖3和圖4所示的Agent a和Agent b的得分與該Agent群體平均得分的比較圖。
表3 Agent a大五性格測試數(shù)據(jù)
表4 Agent b大五性格測試數(shù)據(jù)
由圖3可知,Agent a的5個(gè)因素得分都低于該Agent群體的平均值,因此,Agent a具有低開放性、低謹(jǐn)慎性、低外向型、低宜人性和低神經(jīng)質(zhì)的性格,說明Agent a保守但沖動(dòng),謹(jǐn)慎且多疑,尤其是宜人性這一數(shù)值低于該Agent群體的平均值9分,證明Agent a不關(guān)心別人,不樂于幫助其他Agent,且經(jīng)常懷疑其他Agent的動(dòng)機(jī)。
O=[-0.318 5-0.165 7-0.105 7-0.363 8-0.340 7
-0.318 50.362 90.327 10.217 20.239 40.169 00.219 9],
由圖4可以看出,Agent b的前4個(gè)性格因素得分都低于該Agent群體的平均值,而神經(jīng)質(zhì)的得分高于該Agent群體的平均得分,證明Agent b具有低開放性、低謹(jǐn)慎性、低外向型、低宜人性、高神經(jīng)質(zhì)的性格,表明其保守但沖動(dòng),謹(jǐn)慎且多疑。但是神經(jīng)質(zhì)這一性格特點(diǎn)高于該Agent群體的平均值,證明Agent b對外界刺激的反應(yīng)比該Agent群體的其他Agent強(qiáng)烈,對情緒的調(diào)節(jié)能力比較差,經(jīng)常處于一種不良的情緒狀態(tài)下。并且該Agent的思維、決策、以及有效應(yīng)對外部壓力的能力都比較差。
由圖5可以看出,Agent a的開放性、宜人性、神經(jīng)質(zhì)得分都低于Agent b,說明和Agent b相比,Agent a更保守、多疑、情緒更平靜;而Agent a的謹(jǐn)慎性得分高于Agent b,說明和Agent b相比,Agent a的自律能力更強(qiáng)且不容易沖動(dòng);Agent a的外向型得分與Agent b相等,但是都低于該Agent群體的平均得分,這證明雙方Agent都是相對內(nèi)向的性格,比較安靜和謹(jǐn)慎,不喜歡與外界過多接觸。由情感閾值和對雙方Agent的性格分析可以判斷出,Agent a和Agent b都處于平靜狀態(tài),且Agent a的情緒較Agent b不穩(wěn)定,更容易受外界的影響。
為更加完善和適合本文的研究,本文在文獻(xiàn)[14,35]的基礎(chǔ)上,對相應(yīng)的勸說策略分類進(jìn)行改進(jìn),如表5所示。
表5 勸說策略分類
根據(jù)以上模型及數(shù)據(jù),分別設(shè)定Agent a和Agent b的Si,j和φ(T),如表6和表7所示。其中:E1,T表示喜悅,E2,T表示悲傷,E3,T表示煩躁,E4,T表示害怕。同時(shí),為研究方便,取ε=0.5,得到雙方的讓步步長如表8和表9所示。
表6 Agent a的Si,j和φ(T)
表7 Agent b的Si,j和φ(T)
續(xù)表7
表8 Agent a的讓步步長
表9 Agent b的讓步步長
假設(shè)每一輪持續(xù)的時(shí)間T∈[2,10](單位:min),雙方進(jìn)行基于Agent的情感映射的勸說,過程如下圖6所示。
針對上述煤炭行業(yè)供應(yīng)鏈管理中的采購商和銷售商的算例,本文首先將基于Agent的情感映射的勸說模型(Persuasion model of Agent-based Emotional Mapping, PAEM)與傳統(tǒng)既定步長的基于Agent的勸說模型(Traditional Set Step persuasion model, TSS)針對價(jià)格屬性進(jìn)行了以下對比分析,如圖7所示,圖中柱狀圖表示利用PAEM模型的談判過程,折線圖表示利用TSS的談判過程,從圖中可以看出利用PAEM在第五輪就達(dá)成了合作,TSS模型在第6輪才達(dá)成合作,并且從采購商的角度看,達(dá)成合作時(shí)PAEM的結(jié)果比TSS的結(jié)果更優(yōu)。同樣可以對兩種模型針對供貨期屬性進(jìn)行對比分析。
其次本文將基于Agent的情感映射的勸說模型(Persuasion model of Agent-based Emotional Mapping,PAEM)的勸說輪次與傳統(tǒng)既定步長的基于Agent的勸說模型(Traditional Set Step persuasion model, TSS)的勸說輪次進(jìn)行了以下對比分析。
為便于分析,本文取每輪勸說中雙方提議的差值,再取價(jià)格和訂貨期的差值為每輪的勸說結(jié)果值(第一輪為初始提議),即差值為0時(shí)勸說結(jié)束,如圖8所示。結(jié)果表明,基于Agent的情感映射的勸說達(dá)到0值的速度更快,經(jīng)過6輪就能得到最優(yōu)結(jié)果。而在基于Agent的勸說中,雙方Agent在既定讓步步長下進(jìn)行勸說,至少要經(jīng)過7輪勸說才能得到最優(yōu)結(jié)果。而且相對Agent a來說,PAEM的最終結(jié)果更優(yōu)。這就證明了本文提出的基于Agent的情感映射的勸說模型比基于Agent的勸說中的模型更加符合實(shí)際勸說過程和效果。最后,情感及其映射的引入也使得該模型更加符合人的特性,最優(yōu)提議值更容易被接受。
為進(jìn)一步驗(yàn)證上述模型及過程,本文選用Jade平臺,利用Java語言,對以上模型及過程進(jìn)行了系統(tǒng)實(shí)現(xiàn)。
系統(tǒng)初始界面如圖8所示,圖9~圖13則展示了雙方Agent從第一輪到最后一輪的勸說過程。
經(jīng)過歸納和梳理,與本文研究相關(guān)的該領(lǐng)域代表性文獻(xiàn)有[8-12,15,17,19,21-22,27,32-33,35-36]。與這些文獻(xiàn)相比,本文做出的改進(jìn)和相應(yīng)的結(jié)論如下:
(1)本文的研究是將情感與Agent的結(jié)合。文獻(xiàn)[8,11,27]針對Agent的PAD空間情感體驗(yàn)和OCC情感模型,雖然提出了相應(yīng)的情感虛擬人評價(jià)模型和E-learning系統(tǒng)模型等,并有部分應(yīng)用到了機(jī)器人領(lǐng)域,但僅限于人工智能領(lǐng)域,并未把基于Agent的情感勸說應(yīng)用到商務(wù)談判領(lǐng)域,缺乏更廣的應(yīng)用性。因此,相比之下,本文的研究是將更有代表性的Agent的情感和勸說等人工智能特性應(yīng)用到了人們?nèi)粘I虅?wù)活動(dòng)的智能化自動(dòng)談判,既是對人工智能領(lǐng)域的實(shí)際應(yīng)用,也探索了更加合理有效的解決實(shí)際商務(wù)談判問題的方案。
(2)本文的研究是運(yùn)用情感映射,將Agent的情感特性融入了基于Agent的勸說中。文獻(xiàn)[10,32,36]研究了OCEAN、PAD、OCC情感模型之間的相互作用,提出一種考慮了人類性格的情感模型,但是并未結(jié)合基于Agent的勸說領(lǐng)域的相關(guān)理論和方法進(jìn)行研究,因此與本文的研究還存在一定的差距;文獻(xiàn)[12,33,35]考慮了將Agent的情感和勸說相結(jié)合,但文獻(xiàn)[12]沒有考慮情感映射對基于Agent的勸說產(chǎn)生的動(dòng)態(tài)影響,文獻(xiàn)[35]只是簡單的研究了Agent的消極情感方面,文獻(xiàn)[33]則只考慮了正面情緒的變化,提出了相應(yīng)的勸說模型,但并未對Agent的情感進(jìn)行有針對性的分類。本文則在上述文獻(xiàn)的基礎(chǔ)上,對艾克曼經(jīng)典情感分類進(jìn)行改進(jìn),并通過考慮相應(yīng)的情感影響因素如情感閾值、刺激因子、情感衰減等更進(jìn)一步對情感強(qiáng)度進(jìn)行量化,建立了更為復(fù)雜且情感計(jì)算更具說服力的情感強(qiáng)度模型。
(3)本文系統(tǒng)性的分析并提出了基于Agent的情感映射的勸說產(chǎn)生、策略、評價(jià)和讓步模型。
首先,針對產(chǎn)生模型,文獻(xiàn)[12]針對基于辯論的多Agent商務(wù)談判,提出了“候選辯論集的產(chǎn)生策略”和“基于沖突分析的辯論目標(biāo)產(chǎn)生模型”,但與本文相比,不僅缺乏對勸說這種更加理性的方式的研究,而且沒有考慮情感映射對產(chǎn)生模型的影響;本文結(jié)合情感映射模型以及Ekman情感分類理論,提出了相應(yīng)的產(chǎn)生模型,更具說服力。
其次,針對策略模型,文獻(xiàn)[15]基于前景理論,融入Agent的心理偏好,提出了基于前景理論的多Agent辯論協(xié)商策略模型,但是文中只是粗略的分析了談判中Agent對收益和損失差值的感知,并未對Agent主體情感進(jìn)行詳細(xì)分類,研究的策略模型具有一定的局限性;與文獻(xiàn)[9]相比,本文通過建立情感映射模型提出了新的Agent情感分類,構(gòu)建了勸說的產(chǎn)生模型后,定義了Agent主導(dǎo)情感和情感閾值,主導(dǎo)情感主導(dǎo)Agent進(jìn)行策略選擇,使Agent能根據(jù)主導(dǎo)情感與情感閾值的不同關(guān)系做出相應(yīng)的策略選擇,這種策略模型更加符合人的行為和實(shí)際情景。
再次,針對評價(jià)模型,文獻(xiàn)[17]提出了基于期望效用評價(jià)的情感產(chǎn)生和評價(jià)模型,但僅將Agent情感粗略分為正面情感和負(fù)面情感,模型較為簡單,有待深入研究。本文提出的評價(jià)模型由情感強(qiáng)度和情感衰減的概念界定,在分析了影響情感強(qiáng)度和情感衰減的因素及其如何影響后,提出了相應(yīng)的更有應(yīng)用價(jià)值的評價(jià)模型。
最后,針對讓步模型,文獻(xiàn)[21]通過對基于Agent的勸說的分類,在讓步影響幅度的基礎(chǔ)上,構(gòu)建了讓步模型,但是研究表明,在談判過程中,不同權(quán)利不同情感下的談判者會(huì)做出不同的讓步,因此本文通過計(jì)算更進(jìn)一步量化研究了Agent在勸說中由于主導(dǎo)情感變化導(dǎo)致與情感閾值之間的關(guān)系變化而做出的相應(yīng)讓步。
另外,在以上各階段模型研究的基礎(chǔ)上,文獻(xiàn)[22]初步將情感理論與模型引入基于Agent的勸說,采用期望效用評價(jià)理論,系統(tǒng)提出了基于Agent的情感勸說產(chǎn)生、策略、評價(jià)和讓步模型。但一方面,該研究沒有根據(jù)實(shí)際情況對其中的Agent的情感進(jìn)行合理有效分類,因而無法系統(tǒng)建立相應(yīng)的與基于Agent的勸說相關(guān)的情感模型;另一方面,該研究沒有結(jié)合基于Agent的勸說實(shí)際展開,導(dǎo)致最后提出的模型雖然都有所涉及,但僅局限于Agent的情感,涉及勸說較少;最后,該研究中采用的理論和方法過于簡單,導(dǎo)致模型中的定量分析不夠,對Agent的情感量化不夠全面深入,使該研究的系統(tǒng)性仍然不夠,缺乏說服力度。文獻(xiàn)[19]則在該研究的基礎(chǔ)上,對情感進(jìn)行了分類,提出了相應(yīng)的情感產(chǎn)生的形式化模型,并結(jié)合情感強(qiáng)度第一定律,對Agent情感進(jìn)行量化,提出了Agent情感強(qiáng)度的計(jì)算方法,但一方面,該研究只是將情感作為評價(jià)因素,提出了主體Agent的情感評價(jià)模型和相應(yīng)的Agent合作主體選擇模型,建立的模型不夠全面系統(tǒng);另一方面,該研究建立的形式化模型較為簡單,量化說服力度不夠。本文的研究和提出的模型則較好的解決了以上問題。
綜上所述,本文首先結(jié)合Agent的性格、心情和情緒,通過矩陣轉(zhuǎn)換運(yùn)算,構(gòu)建了系統(tǒng)的基于Agent的情感映射模型;其次根據(jù)實(shí)際情況,對心理學(xué)中經(jīng)典的Ekman情感分類進(jìn)行了改進(jìn),在改進(jìn)的情感分類的基礎(chǔ)上,構(gòu)建了基于Agent的情感映射的勸說產(chǎn)生模型;然后對基于Agent的勸說策略、主導(dǎo)情感和情感閾值進(jìn)行了定義,并提出了相應(yīng)的策略模型;再次,對Agent的情感強(qiáng)度進(jìn)行了定義,分析其影響因素為勸說策略和情感衰減,并在根據(jù)馬爾科夫理論對情感衰減進(jìn)行定義的基礎(chǔ)上,提出了基于Agent的情感映射的勸說評價(jià)模型;最后通過對受情感影響的讓步步長的計(jì)算構(gòu)建了相應(yīng)的讓步模型,并以算例及系統(tǒng)實(shí)現(xiàn)的方式進(jìn)行了驗(yàn)證。情感和勸說的加入,讓本文提出的各個(gè)模型更能適應(yīng)復(fù)雜和動(dòng)態(tài)變化的勸說環(huán)境。
本研究對企業(yè)商務(wù)智能中的自動(dòng)談判領(lǐng)域及人工智能情感研究領(lǐng)域都有一定的理論和實(shí)踐意義。
(1)在理論方面,首先本文引入Agent的性格、心情、情緒,結(jié)合大五模型和馬爾可夫模型等有代表性的心理學(xué)模型,結(jié)合提出的情感映射概念,利用情感第三定律對基于Agent的勸說中的Agent的情感進(jìn)行了量化計(jì)算,對情感的量化可以推動(dòng)情感理論及模型的應(yīng)用研究;其次本文利用Agent在情感勸說動(dòng)態(tài)變化影響下理性調(diào)整自身情感勸說的優(yōu)勢,模擬人類商務(wù)談判中的思想和理性行為,是對商務(wù)智能中基于Agent的勸說研究的進(jìn)一步拓展,對豐富和發(fā)展商務(wù)智能領(lǐng)域的理論及模型具有重大意義;最后本文結(jié)合經(jīng)典的Agent開發(fā)平臺Jade和Java語言,研發(fā)出了相應(yīng)的系統(tǒng),從系統(tǒng)實(shí)現(xiàn)和應(yīng)用的角度豐富和發(fā)展人工智能領(lǐng)域相關(guān)理論知識。
(2)在實(shí)踐方面,實(shí)際商務(wù)談判環(huán)境復(fù)雜,談判結(jié)果不確定性高,開發(fā)符合企業(yè)談判需求的系統(tǒng)一直是企業(yè)管理人員尤其是相應(yīng)的系統(tǒng)開發(fā)人員所追求的重點(diǎn)。目前有關(guān)商務(wù)智能中自動(dòng)談判系統(tǒng)的理論還只是簡單的將討價(jià)還價(jià)的功能封裝在對應(yīng)的Agent內(nèi),并沒有充分體現(xiàn)其作為人工智能的心智和態(tài)度,開發(fā)出的系統(tǒng)針對的也是企業(yè)的特定業(yè)務(wù)或特征,通用性不強(qiáng)。而且目前存在基于Agent的自動(dòng)談判系統(tǒng)實(shí)際應(yīng)用較少的不利局面,導(dǎo)致企業(yè)管理者難以體會(huì)到該系統(tǒng)的優(yōu)勢。本研究充分考慮了Agent的情感的人工智能特性,對企業(yè)實(shí)際談判人員的情感及情感變化進(jìn)行模擬,并計(jì)劃利用已有相關(guān)研究的應(yīng)用基礎(chǔ)和項(xiàng)目申請依托單位在煤炭行業(yè)積累的大數(shù)據(jù)優(yōu)勢,將該系統(tǒng)應(yīng)用于煤炭行業(yè)供應(yīng)鏈上下游企業(yè)之間的采購或者銷售,從而體現(xiàn)該研究的應(yīng)用價(jià)值。
由于本文提出的模型具有一定的通用性,建議企業(yè)在實(shí)際應(yīng)用中,結(jié)合自身業(yè)務(wù)特點(diǎn),對實(shí)際談判中的情感更進(jìn)一步分類,采用以上模型進(jìn)一步開發(fā)和使用更適合本企業(yè)管理特色的同類系統(tǒng)。此外,建議企業(yè)管理者在開發(fā)使用該類系統(tǒng)前,能充分掌握采用該類系統(tǒng)能給企業(yè)帶來的益處,同時(shí)能將其作為企業(yè)管理理念,對企業(yè)所有人員進(jìn)行培訓(xùn)。
由于本文的研究是對該領(lǐng)域的初步探索,因此所提出的模型相對簡單直觀,今后的研究將分別針對這些模型進(jìn)行改進(jìn),提出更加復(fù)雜有效的模型。另外,由于不同的情感會(huì)對勸說過程產(chǎn)生不同的影響,因此筆者擬在今后研究的基礎(chǔ)上,基于不同的情感類型,對情感進(jìn)行更深入有效的分類,如積極情感和消極情感,研究在本文模型的基礎(chǔ)上不同類型的情感及其映射對基于Agent的勸說的影響。