徐英瑾
摘 要:站在當代認識論的立場上看,“網(wǎng)絡謠言”的構成要件之一——“與事實不符的虛構”——可以被替換為“目標信念的認知欠安妥性”,即“目標信念太容易為假”。而一個自動避謠系統(tǒng)對于一個信念的“欠安妥性”的評估,則可以按照評測“特定背景信息下目標信念的‘使真者的成真概率”的方式來進行。此外,由于上述背景知識的具體內(nèi)容對于特定用戶的價值觀的依賴,這一方案在原則上就是與以“泯滅個體用戶個性”為必然后果的大數(shù)據(jù)技術截然不同的,并因此足以構成對于大數(shù)據(jù)技術的某種對沖技術。站在更宏觀的角度看,此項研究所具有的“打通人文思辨與工程學研究之間的壁壘”的意蘊,又包含了如下兩個目標指向:其一,通過工程學問題自身自帶的“跨文化性”,為英美認識論在華語世界的傳播降低文化門檻;其二,通過上述這種工程學研究所自帶的“可操作性”要求,倒逼學院哲學家對認識論領域內(nèi)的“安妥性”概念進行“可編程性”檢查。
關鍵詞:網(wǎng)絡謠言;通用人工智能;認知安妥性;概率論;背景知識
中圖分類號:G20;B017 ? ? ?文獻標識碼:A ? ? ?文章編號:1003-0751(2020)06-0111-10
一、導論
首先,筆者要解釋本文標題中的“認知安妥性”(epistemic safety)究竟是何意。先請讀者考慮如下案例:張三在化學測驗之前復習不足,因此,在做選擇題時,他只能通過抓鬮來押答案。假設最后一題的答案是“B”,而且他也押中了,那么,這是否意味著他已經(jīng)獲取了囊括在該答案中的化學知識呢?從常識角度看,答案當然是否定的。說得具體一點,張三此次獲取正確答案的過程包含了太多的運氣成分,而只要幸運女神下次不再那么眷顧他,他就會馬上得出錯誤的答案。此外,根據(jù)大多數(shù)人對于作為名詞的“知識”(knowledge)與作為動詞的“知道”(to know)的語義直覺,任何人要獲取一項知識,或是要知道某事,其獲知的方式都應當具有一定的公開可辯護性與可重復性,并由此在相當程度上排除掉“認知運氣”(epistemic luck)的成分。因此,張三如果足夠理智的話,他就不能在自我評測時認為自己已經(jīng)掌握了囊括在答案B中的相關化學知識,因為他所蒙對的答案是缺乏“認知安妥性”的。由于“認知運氣”本身就意味著產(chǎn)生錯誤的風險的存在,故此,我們就不妨先將“認知安妥性”(以下簡稱為“安妥性”)大致定義為一種能夠在相當程度上豁免于錯誤風險的認知狀態(tài)。在當代西方認識論(epistemology)①文獻中,“認知安妥性”也被視為“知識之為知識”的一項必要條件。
——以上說的這些,與“網(wǎng)絡謠言”又有什么關系呢?
由于“網(wǎng)絡謠言”本身不是一個成熟的學術詞匯,所以,在此我們只能滿足于對于它的一個非常粗疏的常識定義。按照“百度百科”的說法,網(wǎng)絡謠言是指通過網(wǎng)絡介質(zhì)( 例如微博、國外網(wǎng)站、網(wǎng)絡論壇、社交網(wǎng)站、聊天軟件等)而傳播的沒有事實依據(jù),帶有攻擊性、目的性的話語。②按照這個粗疏的定義,網(wǎng)絡謠言的特征有:(甲)通過互聯(lián)網(wǎng)傳播;(乙)是與事實不符的虛構;(丙)帶有一定的傳播目的。很明顯,在這三個特征之中,(乙)最為關鍵,因為不借助互聯(lián)網(wǎng)傳播的謠言依然還會是謠言,而帶有一定的傳播目的的真信息也依然不會成為謠言。那么,(乙)與“安妥性”的關系又是什么呢?
筆者認為,“安妥性”標準乃是我們用以判斷一條信息是否觸發(fā)了條件(乙)的簡易標準。那為何我們需要一個簡易標準呢?這是因為,對于一個知識與信息處理能力有限的智能體來說,要判斷一條信息是不是與外部事實真正相符乃是非常困難的,因為這樣的智能體往往缺乏獨立調(diào)查真相的能力與精力。相對容易做的反而是判斷一條信息的“安妥性”,即判斷這條信息是不是容易出錯。譬如,若有條信息說有個數(shù)學功底很差的高中生通過在高考中一路抓鬮而考上了清華,這樣的信息雖然也可能是真的,但因為太欠缺“安妥性”(即太容易錯),而依然會被任何一個心智正常的人判斷為謠言。這里需要注意的是,從邏輯上看,當然存在著一條信息既欠安妥性,同時又為真的可能性,在這種情況下,按照條件(乙),該信息反而不算謠言。但考慮到這種“誤殺”的可能性其實不高,將“欠安妥性”視為將某信息被判為謠言的“測試標準”,依然是妥當?shù)摹?/p>
——以上說的這些,與人工智能又有什么關系呢?
假設有一臺具有“通用人工智能”(Artificial General Intelligence,以下簡稱為AGI)③特征的推理機器,設計者希望它能夠自動地在海量的互聯(lián)網(wǎng)信息中將網(wǎng)絡謠言篩選出來。那么,我們該如何設計這樣的系統(tǒng)呢?一種目下似乎很受青睞的做法,乃是基于大數(shù)據(jù)技術而設計的。譬如,根據(jù)所謂的“多能動者的信息主體信任識別機制”,相關系統(tǒng)能夠自動尋找每條信息背后的信息發(fā)布者的權威度或可信度(這一點又取決于發(fā)布者自身的互聯(lián)網(wǎng)活動痕跡),然后延及對于信息傳播者的權威度與可信度的計算,由此決定信息本身的可信度。④但這個做法本身卻是有問題的,因為它沒有辦法應對如何揭穿“楚門的世界”這一難題,即,在網(wǎng)絡本身充斥著大量虛假的網(wǎng)絡意見領袖與“權威避謠人”的情況下,這樣的避謠機制很容易被錯誤的網(wǎng)絡風向帶到錯誤的方向上去,而不能根據(jù)所傳播的信息本身的質(zhì)量給出獨立的評斷意見。換言之,這樣的機制無法豁免于任何基于大數(shù)據(jù)的AI技術所無法避免的困難,即它只能根據(jù)既有的數(shù)據(jù)對未來的時態(tài)發(fā)展趨勢進行推測,而無法對所涉及的信息內(nèi)容本身進行真正的思考。
而要避免這個問題,筆者的建議是讓AI能夠?qū)π畔⒌膬?nèi)容進行獨立的評斷,特別是對于其“安妥性”的評估。由于“安妥性”本身意味著相關信息“不太容易為假”,而對“不容易為假”的判斷又牽涉到對于信息內(nèi)容的內(nèi)部特征——而不是信息發(fā)布者——的判斷,所以,這樣的系統(tǒng)的運作方式,顯然就應當具備英語認識論文獻中所經(jīng)常提到的“內(nèi)在主義理路”(the internalist approach)的某些特征,以便由此提供更多的理論空間來模擬人類的內(nèi)部思維過程。
那么,我們又該使用怎樣的技術手段,以一種親和于“內(nèi)在主義”的方式,來表征“安妥性”與“安妥性欠缺”之間的差別呢?一條很容易被想到的表征思路就是訴諸概率論,比如將一個更具“安妥性”的信念表征為一個具有更高成真概率的信念,并將一個不那么具“安妥性”的信念表征為一個成真概率較低的信念。雖然這個想法本身還是非常粗糙的,但考慮到基于貝葉斯式概率計算的AI研究早已通過珀爾(Judea Pearl)的工作⑤而成為AI學界的通識,因此我們不妨就認為:在概率論的大框架里去理解刻畫“安妥性”,至少在大方向上是具有可行性的。此外,特別需要指出的是,筆者所推崇的這種概率統(tǒng)計本身并不是基于那種泯滅用戶個性的大數(shù)據(jù)處理技術的(盡管將概率論與大數(shù)據(jù)技術結合,其實并不困難),而恰恰是通過引入“概率值歸賦者的背景知識”,而與特定用戶的個性畫像發(fā)生了密切關聯(lián)(詳后)。因此,這種技術路徑與其說是大數(shù)據(jù)技術的一種,還不如說是構成了大數(shù)據(jù)技術的對沖技術。
不過,有意思的是,在西方認識論討論“安妥性”的典型文獻中,特別是在英國哲學家普理查德(Ducan Prichard)的理論框架中,處理安妥性的技術工具卻不是概率論,而是“可能世界語義學”(possible world semantics),即一種通過“可能世界”的理論假設來對“反事實條件句”(counterfactuals)的含義進行闡釋的技術工具。而本文首先將論證,至少站在AGI的立場上看,這一技術路徑是根本無法被編程化的。與之相比較,筆者將要在本文中提出的基于概率論的“安妥性”概念,不僅不會引發(fā)“循環(huán)論證”的問題,而且它還將產(chǎn)生對以“斑馬案例”為典型的諸認識論經(jīng)典案例的足夠解釋力(此外,筆者還將提到“斑馬案例”與一般謠言甄別過程之間的類似性)。從更宏大的視角去看,筆者所給出的技術路線,不僅對AI的研究具有意義,也將向哲學界提供一條經(jīng)由經(jīng)驗科學改造傳統(tǒng)的認識論理論的新道路,以便在AI時代以新的技術內(nèi)容夯實奎因(Willard Van Orman Quine)所提出的“自然主義的認識論”(naturalized epistemology)概念的內(nèi)涵。
二、基于“可能世界語義學”的“安妥性”概念是無法被編程的
用“可能世界”概念解釋“安妥性”的學者很多,但最具代表性的乃是英國學者普理查德。他對于“安妥性”的定義,大致可以被概括如下。⑥
某主體所持有的某目標信念P是安妥的,當且僅當如下條件被滿足:就與該主體所處的那個現(xiàn)實世界最為切近的大多數(shù)的可能世界而言,只要在那些可能世界中,主體繼續(xù)以他在現(xiàn)實世界中持有P的方式持有P,那么,P依然是真的。
這個定義貌似還很抽象,我們不妨便用所謂的“谷倉案例”⑦來解釋一下(順便說一句,本文已經(jīng)在“謠言甄別”的語境中對該案例進行了改寫)。假設讀者已經(jīng)知道在橫店影視城有大量的假谷倉(里面當然是沒谷子的),以便為影視劇的拍攝提供布景。而且讀者還知道,在這些假谷倉中,混有一個編號為“88號”的真谷倉(里面藏有很多優(yōu)質(zhì)黑龍江產(chǎn)壓縮真空大米),以便為廣大群眾演員提供后勤保障。⑧同時,讀者還知道,關于谷倉之虛實,乃是包括讀者在內(nèi)的小圈子里的秘密知識,廣大公眾對此是一無所知的。這時候,假設讀者再獲得一條新信息:有個叫“張三”的竊糧賊(他不屬于上述小圈子),騎了一輛自行車進入“谷倉陣”,而且,他在沒有任何內(nèi)部情報支援的情況下就隨機找到了88號谷倉,并偷走了其中的一袋大米。你覺得這是謠言嗎?
很多人恐怕會傾向于認為這是謠言,因為張三碰巧撞上88號谷倉這件事太容易成假了。譬如,只要張三稍微轉(zhuǎn)轉(zhuǎn)頭,或者他的自行車騎得快一點或者慢一點,他就會看到那些假谷倉,并由此錯過唯一藏有糧食的88號谷倉。若按照普理查德的“可能世界語義學”的話語方式來重述這個故事,那么在這個案例中,所謂的“現(xiàn)實世界”,就是指“張三撞上88號谷倉”這一狀況,而所謂的“與現(xiàn)實世界非常切近的可能世界”,就是指“張三稍微轉(zhuǎn)頭并由此注意到假谷倉”的那些狀況。由此看來,張三的信念(即“我看到的的確是真谷倉”)之所以是不安妥的,就是因為它僅僅在現(xiàn)實世界中為真,卻在那些與現(xiàn)實世界非常接近的可能世界中為假。
上文提到的“非常切近”一詞,顯然涉及了某種空間性隱喻,而在威廉姆森(Timothy Williamson)的知識論模型中,關于“安妥性”的空間化隱喻還得到了一種更為淋漓盡致的表達。具體而言,在他的隱喻框架中,目標信念被看成了一個圓潤的球體,而其真值則被視為球與所在平面之間的關系——如果球能夠在平面上停穩(wěn),則代表“真”,若停不穩(wěn),則代表“假”。至于球在平面上的投影位置,則被視為“現(xiàn)實世界”,與該位置接近的那些位置,就代表那些“與現(xiàn)實世界非常接近的可能世界”。這樣一來,如果一個信念被認為是“安妥的”,那么就可以通過這種空間隱喻而被理解為:即使球稍微離開其所在的位置,并在與之非常接近的位置出現(xiàn),它也能停穩(wěn)當。換言之,如果它一離開自己原來的位置就馬上就無法停穩(wěn)了,它就是不安妥的。⑨
然而,上述這種基于空間隱喻的理解方式雖然很直觀,但從計算機編程的角度看,它卻很難被恰當?shù)爻绦蚧?,因為上述描述方式中已?jīng)包含了一個難以被消除的循環(huán)論證。
很明顯,任何人若要按照普理查德的要求去確定一個信念是否安妥的話,他就不得不先去依次做三件事情:
(1)分辨出哪種情況是現(xiàn)實世界,哪些情況是可能世界;
(2)根據(jù)每個可能世界與現(xiàn)實世界之間的舉例,來判定哪些可能世界是與現(xiàn)實世界“切近”的,哪些則否;
(3)在那些與現(xiàn)實世界非常切近的可能世界中,我們再去判斷目標信念在其中是否依然是真的——若是真的,則目標信念安妥,否則相關信念就是不安妥的。
然而,上述這個路線圖的步驟(1)預設(2)已經(jīng)被執(zhí)行了,而(2)的執(zhí)行卻必須預設(1)已經(jīng)被執(zhí)行。這種自相矛盾的狀況就必然導致(1)與(2)都不能得到執(zhí)行,由此導致整個路線圖的崩塌。為何這么說呢?