陳穎
摘?要:近幾年社交機(jī)器人在社交媒體上的應(yīng)用越來越廣泛,并對政治、經(jīng)濟(jì)、社會造成了重大影響,如何實(shí)現(xiàn)人與社交機(jī)器人的和諧相處也成為傳播學(xué)的研究熱點(diǎn)。正因?yàn)樯缃粰C(jī)器人的類人性與人機(jī)交互效果有關(guān),而圖靈測驗(yàn)是一個非常好的測量機(jī)器類人性的方法,因此本文嘗試從圖靈測驗(yàn)入手來思考如何促進(jìn)人機(jī)社交傳播,并介紹了如何將圖靈測驗(yàn)應(yīng)用于人機(jī)社交傳播領(lǐng)域,提出目前的圖靈測驗(yàn)在應(yīng)用過程中有哪些局限性及相應(yīng)改進(jìn)措施。
關(guān)鍵詞:人機(jī)社交傳播;社交機(jī)器人;圖靈測驗(yàn)
中圖分類號:G206.2文獻(xiàn)標(biāo)識碼:A?文章編號:1672-8122(2020)01-0135-04
隨著信息技術(shù)的突破,社交機(jī)器人得到了普及和應(yīng)用,在各個社交平臺掌握的話語權(quán)也不斷擴(kuò)大,對當(dāng)今的社交媒體環(huán)境造成了巨大的沖擊,人機(jī)社交傳播也引起各領(lǐng)域?qū)W者的重視,并成為一個重要的研究方向。
一、社交機(jī)器人的興起
“社交機(jī)器人”的定義較為廣泛,這里采用張洪忠等學(xué)者的定義,指在社交媒體上與真人用戶進(jìn)行互動的計算機(jī)算法,可以分為聊天機(jī)器人與垃圾機(jī)器人[1]。前者指通過自然語言與人類進(jìn)行互動的聊天軟件(如微軟小冰),后者指通過自動化技術(shù)在社交媒體上控制多個社交賬號并傳播特定信息的人工智能。目前社交機(jī)器人技術(shù)尚處于初級階段,但是發(fā)展迅速。一方面,開發(fā)者可以獲取大量的用戶行為數(shù)據(jù)(如各種社交網(wǎng)站及APP上面的視頻、聲音、文本等);另一方面,出現(xiàn)了可以收集、組織和處理這些豐富數(shù)據(jù)集的復(fù)雜技術(shù)(如云計算、自然語言處理等),社交機(jī)器人已從早期功能單一的機(jī)器人進(jìn)化到可以熟練模仿真實(shí)用戶在線行為的社交機(jī)器人。
社交機(jī)器人賬號普遍存在于各類社交平臺,可以模仿人類的語言批量生產(chǎn)內(nèi)容,模擬人類的情感構(gòu)建社交關(guān)系,對政治、經(jīng)濟(jì)、社會等產(chǎn)生重要影響。社交媒體正由人類主導(dǎo)的現(xiàn)狀慢慢轉(zhuǎn)化為人機(jī)共同生存的狀態(tài)[1]。人類與社交機(jī)器人的互動由“計算機(jī)中介傳播”轉(zhuǎn)化為“人機(jī)傳播”,社交機(jī)器人由傳播的“中介”轉(zhuǎn)化為傳播的“主體”,人機(jī)交互發(fā)展為具有社交性質(zhì)的人機(jī)社交傳播[2]。因此,如何實(shí)現(xiàn)人類與社交機(jī)器人的和諧相處也成為一個傳播學(xué)的研究熱點(diǎn)[1]。
社交機(jī)器人的傳播效果以及與人類的傳播關(guān)系受到其類人性的影響[1]。研究者們認(rèn)為一個理想的社交機(jī)器人應(yīng)該能夠以一種自然的、擬人的方式與人類進(jìn)行溝通或者互動[3]。人工智能專家在設(shè)計社交機(jī)器人時,非常關(guān)注社交機(jī)器人是否能夠模擬人類的情感與行為,這里的潛在邏輯是:人類更喜歡用與他人(其他同類)互動的方式與機(jī)器進(jìn)行互動[4]。前人的實(shí)證研究也表明,機(jī)器的類人性在人機(jī)交互中起著重要的作用,例如,當(dāng)社交機(jī)器人對人類表達(dá)同理心[5]、情感行為[6]和恰當(dāng)?shù)恼Z言形式[7]時,人們會體會到更強(qiáng)烈的愉悅感和可接受感;在暴力條件下,人們對具有更多類人性的機(jī)器人表現(xiàn)出更多的同理心[8]。
那么如何衡量社交機(jī)器人的類人性程度呢?人工智能專家們傾向于從技術(shù)層面來判斷社交機(jī)器人的類人性程度,通過一些客觀的指標(biāo)來定義社交機(jī)器人的類人性水平。此外,圖靈測驗(yàn)作為一種主觀的輔助測量方法,也常常被用于衡量社交機(jī)器人的類人性程度。與技術(shù)層面的測量方法相比,圖靈測驗(yàn)則著眼于社交機(jī)器人在人機(jī)互動過程中對人類的影響,以人的判斷作為衡量社交機(jī)器人類人性程度的標(biāo)準(zhǔn),這個標(biāo)準(zhǔn)是一種主觀的指標(biāo)。本文主要討論如何應(yīng)用圖靈測驗(yàn)去測量社交機(jī)器人的類人性,從而為社交機(jī)器人的設(shè)計提供一些啟發(fā),使人機(jī)關(guān)系更加和諧。
二、圖靈測驗(yàn)在人機(jī)社交傳播領(lǐng)域的應(yīng)用
Turing在《Computing Machinery and Intelligence》一文中最早提出了圖靈測驗(yàn)的思想[9]。他為了回答“機(jī)器是否可以具有意識”這個問題,設(shè)計出這樣一個思想實(shí)驗(yàn):假設(shè)一個機(jī)器能夠在對話過程中完美模仿人類語言而不被發(fā)現(xiàn),即可認(rèn)為該機(jī)器通過圖靈測驗(yàn),該機(jī)器可以被認(rèn)為具有自我意識。因此,圖靈測驗(yàn)又被稱為“模仿游戲”,通過機(jī)器在語言水平上是否可以模仿人類來判定機(jī)器的意識水平。關(guān)于圖靈測驗(yàn)是否能夠證明機(jī)器具有意識這個問題,自圖靈測驗(yàn)提出以來一直備受爭議,這里不對此進(jìn)行深入討論。目前比較認(rèn)可的說法是,通過圖靈測驗(yàn)意味著機(jī)器可以在行為上模仿人類。圖靈測驗(yàn)可以用于測量一個社交機(jī)器人是否能夠在行為層面(包括語言層面)模仿人類,假如一個社交機(jī)器人能夠模仿人類的行為,在人與人的交流中取代人類而無法被感知,使判斷者無法對其身份進(jìn)行正確區(qū)分,即可以說該社交機(jī)器人在行為層面與人類非常接近。那么,社交機(jī)器人的類人性就可以通過這種方法進(jìn)行衡量。
Harnad在圖靈測驗(yàn)的基礎(chǔ)上提出了5級圖靈測試層次結(jié)構(gòu),以涵蓋圖靈測驗(yàn)的各種難度[10]。T1水平是“玩具模型”水平,它只需要機(jī)器具有我們認(rèn)知能力的一小部分,假設(shè)機(jī)器能夠完美模仿偏執(zhí)型精神分裂癥患者的語言交流能力即可視為通過了T1。標(biāo)準(zhǔn)圖靈測驗(yàn)位于T2水平,這要求機(jī)器在語言能力上與正常的成年人類無法區(qū)分。T3水平則要求機(jī)器在所有外部表現(xiàn)(如外觀、聲音、表情等)層面與正常人類完全不可區(qū)分。T4水平要求在微觀功能水平具有不可區(qū)分性,如機(jī)器的人造神經(jīng)元和合成神經(jīng)遞質(zhì)在功能上與真實(shí)人類的神經(jīng)元和神經(jīng)遞質(zhì)不可區(qū)分。T5水平則要求機(jī)器與人類在所有微觀粒子層面具有同一性。
目前圖靈測驗(yàn)在社交機(jī)器人中的應(yīng)用主要在T1到T2之間,當(dāng)前的自然語言技術(shù)使社交機(jī)器人已經(jīng)達(dá)到T1水平,但暫時無法通過T2。標(biāo)準(zhǔn)圖靈測驗(yàn)通過的標(biāo)準(zhǔn)是:與人類進(jìn)行自由的交流,并在交流結(jié)束后使人類無法做出正確區(qū)分。這里的“自由”意味著不對對話主題、對話方式、對話時間等進(jìn)行限制?!罢_區(qū)分”指的是將人類(具有正常智力的成年人)分類為人,將機(jī)器分類為機(jī)器,其他所有情況均視為“無法正確區(qū)分”[11]。
目前社交機(jī)器人距離通過標(biāo)準(zhǔn)圖靈測驗(yàn)還有很長一段距離,但是確實(shí)在迅速逼近這個目標(biāo),標(biāo)準(zhǔn)圖靈測驗(yàn)只有通過與不通過之分,很難體現(xiàn)出機(jī)器智能水平的進(jìn)步。標(biāo)準(zhǔn)圖靈測驗(yàn)的一個限制是標(biāo)準(zhǔn)過于嚴(yán)格同時又沒有精細(xì)的劃分標(biāo)準(zhǔn)。為了使圖靈測驗(yàn)更具應(yīng)用價值,研究者們常常對圖靈測驗(yàn)進(jìn)行不同程度的限制,使圖靈測驗(yàn)由一個思想實(shí)驗(yàn)具現(xiàn)化為實(shí)際的可操作測試,從而制定各種不同難度水平的圖靈測驗(yàn),這樣可以更加清晰地觀察到社交機(jī)器人的水平。例如,英國倫敦皇家學(xué)會在2014年就進(jìn)行過一場圖靈測驗(yàn),測驗(yàn)時每次對話時長被限制為5分鐘,模仿對象為13歲小男孩,通過標(biāo)準(zhǔn)設(shè)定為30%,對話主題沒有限制[12];2018年5月,谷歌首席執(zhí)行官在2018年的I/O大會上展示了語音助手 “Google Assistant”如何通過電話預(yù)約方面的圖靈測驗(yàn)(通過電話預(yù)約美發(fā)沙龍和餐館)[13]。
通過總結(jié)發(fā)現(xiàn),前人的各種修正版圖靈測驗(yàn)主要從對話主題、對話時間、參照物、評價標(biāo)準(zhǔn)等方面入手。
1.對于對話主題,目前的技術(shù)水平無法使社交機(jī)器人涵蓋各個方面的知識,所以可以根據(jù)社交機(jī)器人的應(yīng)用領(lǐng)域來對對話主題進(jìn)行設(shè)置。如專門用于交友的機(jī)器人可以把對話主題限制在交友這個范圍內(nèi);幼兒教育機(jī)器人可以把對話主題限制在幼兒教育這個領(lǐng)域。
2.對于對話時間,可以根據(jù)時長設(shè)置不同難度的圖靈測驗(yàn),如從1分鐘到半小時。
3.對于參照物,可以設(shè)置為正常智力的兒童、少年、青年、成年人等。
4.對于評價標(biāo)準(zhǔn),比較常用的標(biāo)準(zhǔn)是超過30%的判斷者無法區(qū)分即可認(rèn)為通過圖靈測驗(yàn),隨著技術(shù)水平的增長,可以逐漸增加為50%、80%等。
通過上述各種方法,圖靈測驗(yàn)就從一個思想實(shí)驗(yàn)轉(zhuǎn)換成一種實(shí)用性更強(qiáng)的社交機(jī)器人類人性測量工具。
三、圖靈測驗(yàn)在應(yīng)用過程中存在的缺陷及相應(yīng)改進(jìn)措施
1.目前所有的圖靈測驗(yàn)都是通過判斷者的自我報告來確定社交機(jī)器人的類人性,自我報告技術(shù)允許判斷者描述他們的主觀經(jīng)歷[14],是一種直接而明確的測量方法,一直被認(rèn)為是歸因意識的黃金標(biāo)準(zhǔn)[15]。但是自我報告技術(shù)的一致性和有效性一直受到批評,因?yàn)樗鼰o法探測無意識認(rèn)知[15]。無意識認(rèn)知是指當(dāng)前的經(jīng)歷和行為受到無法意識到的心理結(jié)構(gòu)和心理過程所影響的一種現(xiàn)象[16],它包括內(nèi)隱學(xué)習(xí)[17]、內(nèi)隱思維[18]、內(nèi)隱語言處理[19]、內(nèi)隱情感[20]、內(nèi)隱態(tài)度[21]等。
意識認(rèn)知和無意識認(rèn)知都對評價、決策和推理等心理過程具有普遍而強(qiáng)大的影響,它們具有不同的特點(diǎn),適用于不同的環(huán)境[22]。人類的意識和無意識并不總是一致的,二者之間存在分離。例如,Greenwald等研究者針對相同心理結(jié)構(gòu)(如態(tài)度、刻板印象或自尊)的內(nèi)隱測量結(jié)果和外顯自我報告測量結(jié)果之間的關(guān)系進(jìn)行了研究,他們發(fā)現(xiàn)結(jié)果往往是弱內(nèi)隱-外顯相關(guān)的[23]。此外,Zhang X等學(xué)者也在神經(jīng)層面發(fā)現(xiàn)了意識與無意識的分離[24]。這種分離意味著無意識也可以提供很多信息,無意識可以解釋影響判斷的心理過程和刺激,這通常是無法通過意識檢測到的[25]。因此,在應(yīng)用圖靈測驗(yàn)時考慮無意識認(rèn)知的結(jié)果可能會為我們理解機(jī)器的類人性提供更全面的信息,如人們?nèi)绾螌⑷诵詺w因于他人。
神經(jīng)影像學(xué)的方法(包括功能磁共振、腦電等)被廣泛應(yīng)用于無意識研究。如Krach等研究者使用功能磁共振成像的方法來研究人類在人機(jī)交互過程中是如何內(nèi)隱地將心理狀態(tài)歸因于機(jī)器的,他們發(fā)現(xiàn),當(dāng)受試者在做決策任務(wù)時,他們無意識地傾向于推測類人性更高的機(jī)器[26]。
我們可以將自我報告法與功能磁共振成像等神經(jīng)影像學(xué)方法相結(jié)合,研究圖靈測驗(yàn)中人機(jī)交互的神經(jīng)基礎(chǔ)。因?yàn)楫?dāng)判斷者在圖靈測驗(yàn)中對人類與機(jī)器做出不可區(qū)分的口頭報告時,神經(jīng)層面的活動也許會有顯著差異。也許存在某些腦區(qū)或者腦網(wǎng)絡(luò)對圖靈測驗(yàn)中的判斷起到至關(guān)重要的作用。與通過圖靈測驗(yàn)的機(jī)器相比,當(dāng)判斷者與人類互動時,可能會有不同的大腦模式。結(jié)合圖靈測驗(yàn)與神經(jīng)影像學(xué)的手段也許可以解釋為什么人類被認(rèn)為是人類,為什么機(jī)器被認(rèn)為是機(jī)器的神經(jīng)機(jī)制。未來的研究可以探討神經(jīng)影像學(xué)的結(jié)果、自我報告的結(jié)果與日常人機(jī)交互行為記錄之間的關(guān)系。不同的方法強(qiáng)調(diào)了同一心理過程的不同方面,相比單獨(dú)使用一種方法能夠更全面地了解心理過程。
2.此外,圖靈測驗(yàn)中的自我報告會受到報告者心理狀態(tài)的影響。因?yàn)樵趫D靈測驗(yàn)中判斷者需要做一定的邏輯推理,而以往的研究表明,極端情感狀態(tài)(如積極情緒、消極情緒)、情感特質(zhì)(如焦慮、抑郁)、情感內(nèi)容(如圖像、文字)會顯著損害邏輯推理能力[27]。為了避免極端心理狀態(tài)對判斷結(jié)果的影響,我們可以將貝克抑郁量表、貝克焦慮量表和PAD情緒量表等應(yīng)用于判斷者的篩選中,這是為了避免這樣一種狀況,即判斷者具有極端的心理狀態(tài)但因?yàn)槲催_(dá)到臨床標(biāo)準(zhǔn)所以無法通過簡單的交流識別出來。這時就需要借助專業(yè)的心理測量工具來排除處于極端心理狀態(tài)的判斷者。
3.不可忽視的是,圖靈測驗(yàn)中的自我報告會受到實(shí)驗(yàn)者偏差和確認(rèn)偏差的影響。實(shí)驗(yàn)者偏差[28]意味著研究人員可能無意識地誘導(dǎo)判斷者做出符合實(shí)驗(yàn)假設(shè)的反應(yīng)。確認(rèn)偏差[29]指的是人們傾向于收集、解釋信息,以支持他們現(xiàn)有的信念或假設(shè)。圖靈測驗(yàn)可能會受到這些偏差的影響。例如,Loebner prize(一個基于圖靈測驗(yàn)的聊天機(jī)器人競賽,致力于找到最接近人類的聊天機(jī)器人)為了幫助聊天機(jī)器人愚弄更多的判斷者,而故意選擇資質(zhì)較差的判斷者,將對話限制在異想天開的話題中,這種做法備受質(zhì)疑。為了避免這種偏差,可以對競賽的相關(guān)組織者(負(fù)責(zé)招募判斷者的工作人員、確立對話主題的工作人員、負(fù)責(zé)接待競賽參與者的工作人員等)隱瞞真正的目的。
四、結(jié)?語
目前社交機(jī)器人已經(jīng)成為自然科學(xué)、社會科學(xué)及交叉科學(xué)研究的熱點(diǎn),人機(jī)交互傳播在機(jī)器人學(xué)、倫理學(xué)、傳播學(xué)、心理學(xué)等領(lǐng)域都引起了高度重視。如何促進(jìn)人機(jī)社交傳播,使人機(jī)關(guān)系和諧發(fā)展是一個研究熱點(diǎn)。本文討論了圖靈測驗(yàn)在人機(jī)社交傳播方面的應(yīng)用價值,以及可能存在的缺陷和相應(yīng)的改進(jìn)措施。因?yàn)閳D靈測驗(yàn)是對社交機(jī)器人與人類進(jìn)行情感互動可視化測量的最佳方法之一,圖靈測驗(yàn)的改進(jìn)在促進(jìn)人機(jī)社交傳播方面有一定的意義。社交機(jī)器人的一個基本假設(shè)是“人類更喜歡以與他人互動的方式與機(jī)器互動”,因此,通過特定的圖靈測驗(yàn)可能是理想的社交機(jī)器人的必要條件。雖然圖靈測驗(yàn)相對于許多簡單的社交機(jī)器人標(biāo)準(zhǔn)而言更為復(fù)雜,但在本文中,我們認(rèn)為圖靈測驗(yàn)仍然是評估社交機(jī)器人性能的一種好方法。本文認(rèn)為未來在人機(jī)社交傳播領(lǐng)域的研究可以應(yīng)用圖靈測驗(yàn)來評估和量化社交機(jī)器人的類人性。
參考文獻(xiàn):
[1]?張洪忠, 段澤寧, 韓秀. 異類還是共生:社交媒體中的社交機(jī)器人研究路徑探討[J].新聞界, 2019(2): 10-17.
[2]?蔡潤芳. 人機(jī)社交傳播與自動傳播技術(shù)的社會建構(gòu)——基于歐美學(xué)界對Socialbots的研究討論[J]. 當(dāng)代傳播, 2017(6): 53-58.
[3]?Graaf D, Allouch B, Dijk V. What Makes Robots Social? A Users Perspective on Characteristics for Social Human-Robot Interaction[C].in International Conference on Social Robotics.2015:184-193.
[4]?Fong T, Nourbakhsh I, Dautenhahn K. A survey of socially interactive robots[J]. Robotics and autonomous systems, 2003,42(3-4): 143-166.
[5]?Pereira A, Leite I, Mascarenhas S, et al. Using empathy to improve human-robot relationships[C]. in International Conference on Human-Robot Personal Relationship. Springer, 2010:130-138.
[6]?Breazeal C. Emotion and sociable humanoid robots[J]. International Journal of Human-Computer Studies, 2003,59(1-2): 119-155.
[7]?Kim Y, Kwak S, Kim M. Am I acceptable to you? Effect of a robots verbal language forms on peoples social distance from robots[J]. Computers in Human Behavior, 2013,29(3): 1091-1101.
[8]?Riek L, Rabinowitch T, Chakrabarti B, et al. Empathizing with robots: Fellow feeling along the anthropomorphic spectrum[C]. in 2009 3rd International Conference on Affective Computing and Intelligent Interaction and Workshops. IEEE, 2009:1-6.
[9]?Turing A. Computing machinery and intelligence[J]. Mind, 1950,59(236): 433.
[10]?Harnad S. Other bodies, other minds: A machine incarnation of an old philosophical problem[J]. Minds and Machines, 1991,1(1): 43-54.
[11]?Warwick K, Shah H. Passing the Turing test does not mean the end of humanity[J].Cognitive computation, 2016,8(3): 409-419.
[12]?Warwick K, Shah H. Can machines think? A report on Turing test experiments at the Royal Society[J]. Journal of experimental & Theoretical artificial Intelligence, 2016,28(6): 989-1007.
[13]?李潮文. 2018 Google I/O:谷歌展示AI打電話預(yù)約技術(shù)[EB/OL].https://www.guancha.cn/economy/2018_2005_2009_456287.shtml. 2018.
[14]?Chan D. So why ask me? Are self-report data really that bad[J].Statistical and methodological myths and urban legends: Doctrine, verity and fable in the organizational and social sciences, 2009:309-336.
[15]?Destrebecqz A, Peigneux P. Methods for studying unconscious learning[J].Progress in brain research, 2005(150): 69-80.
[16]?Kihlstrom F. Cognition, unconscious processes[J]. Neuroscience year: supplement, 1989(1): 34-36.
[17]?Reber S.Implicit learning of artificial grammars[J].Journal of verbal learning and verbal behavior, 1967,6(6): 855-863.
[18]?Bowers S, Regehr G, Balthazard C, et al. Intuition in the context of discovery[J].Cognitive psychology, 1990,22(1): 72-110.
[19]?Schacterr L, Rapscak Z, Rubens B, et al. Priming effects in a letter-by-letter reader depend upon access to the word form system[J]. Neuropsychologia, 1990,28(10): 1079-1094.
[20]?Hodgson R, Rachman S. II. Desynchrony in measures of fear[J]. Behaviour Research and Therapy, 1974,12(4): 319-326.
[21]?Greenwald G, Banaji R, Rudman A, et al. A unified theory of implicit attitudes, stereotypes, self-esteem, and self-concept[J]. Psychological review, 2002,109(1): 3.
[22]?Dijksterhuis A, Nordgren F. A theory of unconscious thought[J].Perspectives on Psychological science, 2006,1(2): 95-109.
[23]?Greenwald G, Nosek A, Banaji R, et al. Validity of the salience asymmetry interpretation of the Implicit Association Test: Comment on Rothermund and Wentura(2004)[J].Journal of experimental psychology General, 2005,134(3): 420-425; author reply 426-430.
[24]?Zhang X, Chen X, Yu Y, et al. Masked smoking‐related images modulate brain activity in smokers[J]. Human brain mapping, 2009,30(3): 896-907.
[25]?Nisbett E, Wilson D. Telling more than we can know: Verbal reports on mental processes[J]. Psychological review, 1977,84(3): 231.
[26]?Krach S, Hegel F, Wrede B, et al. Can machines think? Interaction and perspective taking with robots investigated via fMRI[J].PloS one,2008,3(7): e2597.
[27]?Blanchette I, Richards A.The influence of affect on higher level cognition: A review of research on interpretation, judgement, decision making and reasoning[J].Cognition & Emotion, 2010,24(4): 561-595.
[28]?Rosenthal R, Fode L. The effect of experimenter bias on the performance of the albino rat[J].Systems Research and Behavioral Science, 1963,8(3): 183-189.
[29]?Nickerson S. Confirmation bias: A ubiquitous phenomenon in many guises[J].Review of general psychology, 1998,2(2): 175.
[責(zé)任編輯:楊楚珺]