傳統(tǒng)哲學(xué)問題的機(jī)器建模

2020-10-09 11:16王小紅科林·艾倫高元昊楊冰潔

江淮論壇 2020年4期

王小紅科林·艾倫高元昊楊冰潔

摘要：國(guó)內(nèi)外海量人文經(jīng)典文獻(xiàn)數(shù)字化工程雖已實(shí)施和完成，傳統(tǒng)人文研究方法（依靠學(xué)者個(gè)人細(xì)讀文本）卻歷經(jīng)千年未變。近年來，包括西安交通大學(xué)哲學(xué)實(shí)驗(yàn)室在內(nèi)，國(guó)際、國(guó)內(nèi)學(xué)者探究運(yùn)用主題建模（topic modeling，縮寫為TM）技術(shù)融入傳統(tǒng)哲學(xué)研究有三個(gè)具體分支領(lǐng)域：一，基于LDA-TM特有的語(yǔ)境聚類特征，實(shí)驗(yàn)室模型第一次計(jì)算展示了中國(guó)古代哲學(xué)核心詞的一詞多義性，并基于全新漢典語(yǔ)料庫(kù)呈現(xiàn)了張載宇宙論的獨(dú)特性;二，科史哲（HPS）領(lǐng)域?qū)_(dá)爾文的閱讀內(nèi)容做主題建模，用驚異度描畫并測(cè)量其閱讀模式，研究結(jié)果有助于探究溯因啟發(fā)式策略在科學(xué)發(fā)現(xiàn)中的發(fā)生機(jī)制;三，TM的語(yǔ)義測(cè)量、詞相關(guān)性語(yǔ)境之網(wǎng)融入文化研究，對(duì)語(yǔ)言哲學(xué)中意義的意義難題的揭示?？梢哉f，計(jì)算哲學(xué)方法在拓展哲學(xué)解釋空間、帶來新發(fā)現(xiàn)和新證據(jù)的同時(shí)，也凸顯了其異于傳統(tǒng)方法的復(fù)雜性及深度學(xué)科交融性。

關(guān)鍵詞：主題模型;遠(yuǎn)距離閱讀;中國(guó)哲學(xué);科史哲;文化

中圖分類號(hào)：B2? ? 文獻(xiàn)標(biāo)志碼：A? ? 文章編號(hào)：1001-862X（2020）04-0082-009

一直以來，人文學(xué)者研讀文獻(xiàn)是直接閱讀單個(gè)文本，而主題建模（Topic Modeling，縮寫為TM）引入新的“遠(yuǎn)距離閱讀”方式，從而具有超書架功能。將一個(gè)大型文件集的語(yǔ)料庫(kù)作為計(jì)算機(jī)的輸入數(shù)據(jù)，只需運(yùn)行TM算法，就可以自動(dòng)產(chǎn)生在人文專家看來頗有解釋意義的主題。一個(gè)主題可以看作許多詞語(yǔ)的聚類，無(wú)論什么時(shí)候要討論這個(gè)主題，這些詞語(yǔ)就會(huì)共同出現(xiàn)。從概率上說，這些聚類詞的共現(xiàn)頻率更高于不討論該主題時(shí)這些詞的共現(xiàn)頻率。TM屬于語(yǔ)義統(tǒng)計(jì)模型中的一種，是對(duì)語(yǔ)義進(jìn)行概率統(tǒng)計(jì)建模的方法。最簡(jiǎn)單、應(yīng)用最廣的概率建模技術(shù)是LDA（Latent Dirichlet Allocation，隱形狄利克雷分布），由David Blei團(tuán)隊(duì)于2003年提出。[1]

近些年來，人文學(xué)者大膽嘗試借助主題建模技術(shù)輔助文獻(xiàn)研讀，已經(jīng)涵蓋包括新聞傳播、文學(xué)、史學(xué)、文化學(xué)、詩(shī)歌和哲學(xué)等各個(gè)領(lǐng)域，取得的研究成果展現(xiàn)了分外有趣的人文意蘊(yùn)。在此基礎(chǔ)上，本文著重剖析機(jī)器學(xué)習(xí)對(duì)傳統(tǒng)哲學(xué)問題的主題建模。

一、通過語(yǔ)義抓取實(shí)現(xiàn)對(duì)大型古典哲學(xué)語(yǔ)料庫(kù)的結(jié)構(gòu)化

依靠人工辨識(shí)和分類，要使一個(gè)龐大的文件庫(kù)呈現(xiàn)清晰的結(jié)構(gòu)，往往需要耗費(fèi)大量人力和時(shí)間。傳統(tǒng)人工只能依據(jù)文章和著作的名稱、著者名、關(guān)鍵詞這些外部信息作外圍框架的分類和查詢，要想深入文檔內(nèi)容來分類海量文檔庫(kù)，靠人力是不可能做到的。然而，TM實(shí)現(xiàn)了根據(jù)文檔內(nèi)容對(duì)龐大文件庫(kù)進(jìn)行結(jié)構(gòu)化。這種分類管理的核心是主題，可以呈現(xiàn)每個(gè)文件依據(jù)主題（20、40直到100個(gè)）分布的結(jié)構(gòu)表、結(jié)構(gòu)圖，就是說，將文集具有的可解釋性的隱含結(jié)構(gòu)呈現(xiàn)出來。通過超書架和遠(yuǎn)距離閱讀，研究者可以直接看到文件的內(nèi)容結(jié)構(gòu)，從而根據(jù)研究主題去獲取相關(guān)信息，并直接看到文檔庫(kù)中其他文件與此文件主題的關(guān)聯(lián)度，不僅可以便捷和高效地找到所需，而且還將獲得用傳統(tǒng)人工方法無(wú)法得到的洞見。

（一）“氣”概念多重語(yǔ)義蘊(yùn)含的計(jì)算呈現(xiàn)

2015年以來，我們和匹茲堡大學(xué)計(jì)算哲學(xué)家Colin Allen團(tuán)隊(duì)合作建立了一個(gè)包含近18000個(gè)文本的中國(guó)古代哲學(xué)語(yǔ)料庫(kù)，通過主題建模分析，呈現(xiàn)了對(duì)于中國(guó)哲學(xué)研究和學(xué)習(xí)頗有解釋意義的主題，提供了通過主題建模對(duì)中國(guó)古代哲學(xué)典籍計(jì)算分析的平臺(tái)，這是國(guó)際學(xué)術(shù)界第一個(gè)比較成功的嘗試。[2][3]基于國(guó)內(nèi)漢典庫(kù)[4]，結(jié)合日本京都大學(xué)的KANRIPO[5]和美國(guó)哈佛大學(xué)ctext的中國(guó)古籍文本庫(kù)[6]，我們建立了更全的新漢典主題建模平臺(tái)，包含2萬(wàn)多個(gè)文本，總字?jǐn)?shù)近4.3億。[7]

如上表所示，TM算法具有語(yǔ)境聚類特征，能夠梳理出一個(gè)詞在使用中的多重語(yǔ)境。這在解釋中文一詞多義方面非常有意義，尤其是中國(guó)古代哲學(xué)中的核心詞如氣、道、禮等的語(yǔ)義蘊(yùn)含。表1顯示與“氣”相關(guān)的Top 10主題（K=100），可以看到，不僅每個(gè)主題的意義易識(shí)別、可解釋，且各主題的意義明顯不同。表1中，TM算法自動(dòng)分出了“氣”一詞的多種含義和使用情境，這些不同的主題聚類分別表示醫(yī)學(xué)（T78）、理學(xué)（T13）、陰陽(yáng)（T26）、風(fēng)水-命理（T86）、時(shí)節(jié)-天氣（T48）、道家與道教思想（T52）、天文-歷法（T20）、醫(yī)藥（T6），兵家-占卜（T57），以及理學(xué)-工夫論（T29）等不同語(yǔ)境下的“氣”之意涵（1），契合了中國(guó)哲學(xué)研究者關(guān)于“氣”之豐富語(yǔ)境的如下討論：

中國(guó)身體觀的一大特色，乃是除了五臟六腑的系統(tǒng)外，另有一種氣——經(jīng)脈的系統(tǒng)，而氣尤可視為根本的原理。將氣與身體結(jié)合并論（以下簡(jiǎn)稱氣-身體），不但見之于傳統(tǒng)醫(yī)學(xué)，也是以往的許多“經(jīng)驗(yàn)科學(xué)”，如占卜、星相、武術(shù)等，得以運(yùn)作的理論基礎(chǔ)。不但如此，它還提供了中國(guó)以往主流思潮無(wú)比重要的動(dòng)力，我們甚至于可以說：沒有氣-身體的理論預(yù)設(shè)，儒道兩家的許多重要命題即不可能成立，至少也需要重新改寫。氣-身體觀與儒道兩家親密的關(guān)系，主要見之于玄學(xué)、理學(xué)與道教里的內(nèi)丹傳統(tǒng)。[8]導(dǎo)論第3頁(yè)

作為中國(guó)哲學(xué)的核心詞，“氣”這一概念在中國(guó)古典文獻(xiàn)中頻繁出現(xiàn)、在理論和實(shí)踐中又廣泛運(yùn)用，對(duì)這一概念的理解卻是“見仁見智、意義極易產(chǎn)生歧解的”[9]。通過TM等AI和大數(shù)據(jù)方法的輔助，對(duì)于那些歧解和爭(zhēng)議，中國(guó)哲學(xué)研究者或許可以給出新的洞見。

上圖基于我們建立的一個(gè)以中國(guó)古代氣論思想為主的語(yǔ)料庫(kù)，從先秦至明末清初，基本涵蓋最重要?dú)庹撍枷爰业恼撝＝Y(jié)合可視化圖形分析手段Sankey圖，TM算法可以更直觀地展示“氣”相關(guān)主題的流變（K=100，圖中顯示與“氣”最相關(guān)的Top 10主題）。[10]圖1中，權(quán)重相對(duì)較高的三個(gè)主題分別是T44（醫(yī)學(xué)）、T87（理學(xué)）和T10（朱子文字風(fēng)格）。從圖中可以看到，先秦諸家思想存在的差異能夠被算法抓取，并反映在模型中，如圖中T78（中醫(yī)-理論）、T99（道家）、T1（中醫(yī)-處方）和T97（天文-歷法）等不同主題分別關(guān)聯(lián)先秦不同學(xué)派、不同典籍。同時(shí)，相對(duì)于先秦諸家思想之差異，不同發(fā)展階段的理學(xué)所具有的高度統(tǒng)一性也直觀顯示在模型中，即不同理學(xué)流派都與T87這一理學(xué)特征主題相關(guān)聯(lián)。

人文學(xué)某種程度上需要保留歧義性、多義性和融會(huì)貫通性。對(duì)此，有學(xué)者討論了LDA算法用于輔助哲學(xué)論證的優(yōu)勢(shì)和缺陷[11]，也有學(xué)者從解釋學(xué)角度強(qiáng)調(diào)計(jì)算模型的解釋問題[12]，幾位該領(lǐng)域領(lǐng)軍學(xué)者正致力于同時(shí)運(yùn)行多種模型來增進(jìn)人文知識(shí)所特有的“多元解釋性”。[12][13]這方面亟待探索的問題空間十分廣闊，需要大量工作探究人工智能機(jī)器學(xué)習(xí)接近人文思想的豐富性。

（二）計(jì)算建模凸顯張載宇宙論思想的獨(dú)特性

對(duì)張載全文本做主題建模分析[14][15][16]，如表2和表3所示，新漢典主題模型顯示，張載處于宇宙論思想的轉(zhuǎn)折點(diǎn)。在張載之前的宇宙論思想相關(guān)著述中，道家思想文本占主導(dǎo)地位;而張載之后的宇宙論思想相關(guān)文本卻呈現(xiàn)明顯的變化，即儒家思想文本占據(jù)了主導(dǎo)地位。如何解釋這一現(xiàn)象呢？通過直接細(xì)讀大量中國(guó)古代典籍，包括對(duì)張載全文本的閱讀，我們了解到中國(guó)古代儒家思想大致呈現(xiàn)的變化特征：先秦至兩漢之前，儒家思想主要關(guān)注人的性命之理，由于漢代開始關(guān)注宇宙天道，儒家思想似乎出現(xiàn)了一個(gè)轉(zhuǎn)型，但是漢代以后人倫和天道究竟何為儒家關(guān)注點(diǎn)一直存在爭(zhēng)議;宋明理學(xué)的開創(chuàng)者之一張載，他的儒家思想研究將性命之理與天道相融合，建構(gòu)了獨(dú)特的宇宙論思想。正如有學(xué)者所總結(jié)的：從某種意義上說，張載建立天道本體，目的就是通向性命之學(xué)，他所謂的“知天”，目的是為了“知人”。那種作為西方哲學(xué)宇宙論意義上的單純的天道，在中國(guó)思想傳統(tǒng)中擔(dān)當(dāng)不起“天道”這兩個(gè)字。[17][18]

西方宇宙論依托主客二元之分，而中國(guó)的天道思想則是天人合一的。所以，張載的理路是天道本體和人的性命之理相貫通的儒家倫理思想。我們運(yùn)用TM手段為此提供了計(jì)算哲學(xué)的新事實(shí)。

但是，張載宇宙論不僅僅有儒家精神，也一定程度上吸收了道家、佛學(xué)的理論觀點(diǎn)。在接下來的工作中，我們將嘗試從多層面數(shù)據(jù)給出進(jìn)一步的證據(jù)，探討張載思想受道家和佛學(xué)怎樣的影響，以及關(guān)于張載思想的一些歧義。有學(xué)者提出，為什么這個(gè)轉(zhuǎn)折點(diǎn)是張載而不是周敦頤？作為與張載同時(shí)期的另一位理學(xué)開創(chuàng)者，周敦頤的宇宙論也應(yīng)當(dāng)處于這個(gè)轉(zhuǎn)折點(diǎn)上，但他的著作文本量只有幾千字，并不適合建模方法。由此可見，欲達(dá)到更為全面的分析，TM的遠(yuǎn)讀需要與文本細(xì)讀相結(jié)合。

張載開創(chuàng)關(guān)學(xué)，他的思想在中國(guó)哲學(xué)中具有重要地位，一直是學(xué)界關(guān)注的熱點(diǎn)。牟宗三、馮友蘭、張岱年、陳俊民、林樂昌等代表性的海內(nèi)外及當(dāng)代學(xué)者對(duì)其思想的豐富性和獨(dú)特性進(jìn)行了系統(tǒng)而全面的揭示，可謂成果豐碩。但學(xué)界公認(rèn)張載哲學(xué)難度大，產(chǎn)生的歧義也很多[19]，這些有爭(zhēng)議的問題需要繼續(xù)反思和研討。如，張載哲學(xué)是一種唯物論嗎，是一元論、二元論還是其他，是“氣”本體論還是“太虛”本體論，對(duì)其宇宙論作本體論（本源論）和生成論（發(fā)生論或構(gòu)成論）二分的證據(jù)充分嗎？還有“太虛”和“氣”的關(guān)系、“太虛”的含義，等等。[20][21][22][23][24]針對(duì)張載思想研究中存在的不同解釋，學(xué)者不妨大膽結(jié)合機(jī)器學(xué)習(xí)新方法給出新證據(jù)，這無(wú)疑是對(duì)傳統(tǒng)研究的有益補(bǔ)充。

二、為科史哲（科學(xué)史與科學(xué)哲學(xué)，HPS）研究科學(xué)發(fā)現(xiàn)提供新的解讀和證據(jù)

Colin Allen的IU團(tuán)隊(duì)首次使用TM對(duì)達(dá)爾文的閱讀日記進(jìn)行定量研究[25][26]，不僅重新發(fā)現(xiàn)了達(dá)爾文研究生涯中的關(guān)鍵特征，還就三個(gè)圍繞達(dá)爾文研究生涯的問題提供了新的證據(jù)和回答，為科史哲（HPS）傳統(tǒng)一直關(guān)注的“發(fā)現(xiàn)的邏輯”（2）提供了新素材。

（一）HPS中的“發(fā)現(xiàn)”難題與計(jì)算的結(jié)合

漢森是HPS事業(yè)的奠基者，庫(kù)恩是HPS事業(yè)最有影響力的建構(gòu)者，兩位科學(xué)哲學(xué)家的科學(xué)發(fā)現(xiàn)觀早已成為科學(xué)發(fā)現(xiàn)計(jì)算模擬的豐富“養(yǎng)料”，直接影響了西蒙開創(chuàng)的機(jī)器發(fā)現(xiàn)（Machine Discovery，簡(jiǎn)稱MD）工作。[27][28]

漢森復(fù)興了皮爾斯的發(fā)現(xiàn)邏輯，即溯因式的推理。他深入論證了溯因推理方法在物理學(xué)發(fā)現(xiàn)中的作用：人們溯因式地考察現(xiàn)象P，把它“扔”進(jìn)一個(gè)可理解的模式里，通過提出假說H使現(xiàn)象P得到解釋。但“是P控制著H，不是相反。推斷是從數(shù)據(jù)到假說和理論，而不是相反”[29]88。漢森反復(fù)強(qiáng)調(diào)，在溯因式推理中，數(shù)據(jù)、事實(shí)或現(xiàn)象對(duì)提出新假說具有基礎(chǔ)性作用和指引作用，這正是所有自然科學(xué)發(fā)現(xiàn)的共性。

達(dá)爾文發(fā)現(xiàn)進(jìn)化論假說也是一個(gè)溯因式推理的過程：收集大量事實(shí)，觀察到大量現(xiàn)象，進(jìn)化論假說將這些零散的事實(shí)和現(xiàn)象納入一個(gè)統(tǒng)一的模式中，給予解釋。與演繹和歸納推理不同，溯因式推理之于發(fā)現(xiàn)的最奇妙之處在于，結(jié)論與前提之間既不是歸納式因果關(guān)系，也不是演繹式蘊(yùn)含關(guān)系，而是一種“看似合理”的關(guān)系，這種看似合理性只具有邏輯上的可能性而沒有必然性，在現(xiàn)實(shí)中也未有任何證據(jù)。

那么，究竟如何提出那個(gè)看似合理的假說，將已有現(xiàn)象前所未有地關(guān)聯(lián)起來呢？對(duì)此，漢森終究未能有清晰的表述。當(dāng)代“發(fā)現(xiàn)之友”哲學(xué)家對(duì)此進(jìn)行了一些新的探索，將認(rèn)知科學(xué)哲學(xué)與傳統(tǒng)發(fā)現(xiàn)哲學(xué)相結(jié)合，如Paul Thagard、 Nancy Nersessian等人分別研究了類比心智模型、類比推理模型在發(fā)現(xiàn)中的作用機(jī)制[30]，但是發(fā)現(xiàn)邏輯的“硬核”依然缺乏清晰的說明。

庫(kù)恩反復(fù)強(qiáng)調(diào)常規(guī)科學(xué)的重要性，即遵循范式推進(jìn)科學(xué)理論的成熟和完善?？墒强茖W(xué)史進(jìn)程中一再出現(xiàn)的超越范式、基于范式而始料未及的現(xiàn)象，又如何用范式去解釋呢？庫(kù)恩提出了歷史主義的發(fā)現(xiàn)觀：新事物最初的突現(xiàn)，只是對(duì)那些能夠識(shí)別是什么地方不對(duì)勁兒的人而言的，因?yàn)橹挥兴麄儾啪_地了解預(yù)期應(yīng)該出現(xiàn)的是什么。于是，依然只是在已有范式背景下，反常才會(huì)顯現(xiàn)。[31]60在庫(kù)恩看來，任何革命性的新范式都產(chǎn)生自早先的常規(guī)科學(xué)時(shí)期，正是常規(guī)科學(xué)的范式導(dǎo)致了反常。然而，新范式究竟如何產(chǎn)生？庫(kù)恩訴諸宗教信仰的皈依或心理學(xué)所謂的格式塔轉(zhuǎn)換，不僅使庫(kù)恩遠(yuǎn)離“發(fā)現(xiàn)之友”，也使“發(fā)現(xiàn)的邏輯”無(wú)解。

面對(duì)上述發(fā)現(xiàn)哲學(xué)的難題和困境，我們不妨通過對(duì)閱讀內(nèi)容主題建模這一新手段，以達(dá)爾文的創(chuàng)造性假說的涌現(xiàn)機(jī)制為例，探究他是如何積聚又深又廣的解題思路空間的。

（二）達(dá)爾文的閱讀模式：由深度閱讀到探索閱讀

任何科學(xué)發(fā)現(xiàn)都是多種活動(dòng)或者子任務(wù)的復(fù)合，成功的發(fā)現(xiàn)者不僅具有超乎常人的堅(jiān)持，還使用了與真實(shí)任務(wù)具有適應(yīng)性擬合的啟發(fā)式?jīng)Q策（3）引導(dǎo)其完成各項(xiàng)子任務(wù)。閱讀文獻(xiàn)資料無(wú)疑是發(fā)現(xiàn)的重要子任務(wù)，成功的研究者如何在閱讀的廣度和深度間權(quán)衡和轉(zhuǎn)換，他們閱讀模式背后的啟發(fā)式抉擇是怎樣的？如圖2所示，對(duì)達(dá)爾文1837—1860年間閱讀筆記中記錄的閱讀文本建立主題模型，以信息理論中的驚異度為度量，從局域和全局兩個(gè)方面分析達(dá)爾文閱讀習(xí)慣與閱讀歷程的轉(zhuǎn)變，可以發(fā)現(xiàn)：在閱讀習(xí)慣方面，對(duì)新領(lǐng)域的探索閱讀與對(duì)已熟知領(lǐng)域的深度閱讀兩種習(xí)慣的相互交替貫穿了達(dá)爾文的整個(gè)研究生涯，整體上來看，達(dá)爾文的閱讀習(xí)慣是向著探索閱讀演變的;通過使用無(wú)監(jiān)督貝葉斯模型對(duì)驚異度進(jìn)行分析，得到了達(dá)爾文傳記生涯的三個(gè)主要分期：小獵犬號(hào)上的航海日記時(shí)期，對(duì)藤壺的研究時(shí)期，以及研究進(jìn)化論的時(shí)期。分析結(jié)果與科學(xué)史家進(jìn)行的傳記分期相一致，這表明了TM方法用于科學(xué)史料分析的適當(dāng)性。

在此基礎(chǔ)上，以局域或全局方法觀察何者與實(shí)際分期更匹配，推斷達(dá)爾文的閱讀習(xí)慣是傾向于探索閱讀還是深度閱讀。此外，分別計(jì)算達(dá)爾文閱讀文本的順序和文本實(shí)際出版的順序，考察各自的驚異度變化趨勢(shì)，發(fā)現(xiàn)達(dá)爾文閱讀順序下的驚異度遠(yuǎn)高于那些書目在出版順序下的驚異度，這一結(jié)果為達(dá)爾文選擇如此的閱讀順序提供了實(shí)驗(yàn)證明。這個(gè)結(jié)果對(duì)發(fā)現(xiàn)邏輯的工作頗有啟發(fā)，或許表明，高出書籍出版驚異度的探索式閱讀，為達(dá)爾文積聚了巨大的原創(chuàng)性發(fā)現(xiàn)動(dòng)力。但究竟這種閱讀模式只為達(dá)爾文個(gè)人所獨(dú)有，還是在原創(chuàng)性發(fā)現(xiàn)者中具有一定程度的共性，尚需進(jìn)一步研究。另外，類比信息科學(xué)中的驚異度測(cè)量，可以說，科學(xué)研究中消除反常的過程就是驚異度降低的過程。達(dá)爾文有時(shí)是驚異度降低的閱讀，有時(shí)又是驚異度增加的閱讀，之間的轉(zhuǎn)換機(jī)制是什么？而且，賴爾的《地質(zhì)學(xué)原理》（1837）、馬爾薩斯的《人口論》（1803）、錢伯斯的《創(chuàng)造物博物學(xué)的遺跡》（1844）又是如何在達(dá)爾文那里發(fā)生理論的認(rèn)知轉(zhuǎn)換的呢？

這種基于TM的量化方法對(duì)個(gè)體與群體間行為習(xí)慣以及個(gè)體長(zhǎng)期和短期下的閱讀選擇進(jìn)行探討，擴(kuò)大了TM在認(rèn)知搜索領(lǐng)域的應(yīng)用范圍。從文化視角看，科學(xué)創(chuàng)新往往被視為一種廣闊視域上的知識(shí)積累趨勢(shì)。這里的發(fā)現(xiàn)表明，個(gè)體可以產(chǎn)生先于時(shí)代文化的創(chuàng)新，之后再被接納為文化整體的一部分，這為“發(fā)現(xiàn)的哲學(xué)”HPS理論帶來新的個(gè)體視角。

當(dāng)前，探討發(fā)現(xiàn)邏輯的工作大多關(guān)注兩個(gè)主要途徑：一是溯因推理，二是啟發(fā)式規(guī)則輔助下的解題算法。[30]我們?cè)缦葘?duì)MD的考察揭示了西蒙開創(chuàng)的機(jī)器發(fā)現(xiàn)恰恰在AI實(shí)踐領(lǐng)域奠定了這兩個(gè)途徑的基礎(chǔ)：一方面，他通過AI模擬科學(xué)發(fā)現(xiàn)，填補(bǔ)了漢森的溯因推理給不可表征的神秘留下的空位;另一方面，他結(jié)合大量科學(xué)史中的發(fā)現(xiàn)案例和認(rèn)知心理學(xué)實(shí)驗(yàn)，設(shè)計(jì)MD程序的具體啟發(fā)式規(guī)則，為啟發(fā)式?jīng)Q策在科學(xué)發(fā)現(xiàn)中的角色給出了更清晰的闡發(fā)。[27][28]運(yùn)用TM對(duì)達(dá)爾文閱讀模式實(shí)現(xiàn)的定量描畫，有助于我們探究溯因啟發(fā)式策略在科學(xué)發(fā)現(xiàn)中的發(fā)生機(jī)制。

（三）為達(dá)爾文的HPS研究提供新證據(jù)

進(jìn)一步的研究，則回應(yīng)了著名的“達(dá)爾文延遲”問題。通過對(duì)TM生成的不同主題做集群分析，發(fā)現(xiàn)在完成《物種起源》期間，達(dá)爾文的閱讀習(xí)慣表現(xiàn)出前所未有的探索性特點(diǎn)，這一結(jié)論為達(dá)爾文的延遲是在為自己的著作收集證據(jù)以及發(fā)展論證這一解釋提供了證據(jù)。而達(dá)爾文突然在1859年火速出版《物種起源》一書的原因，普遍認(rèn)為是由于達(dá)爾文1858年收到華萊士 On the Tendency of Varieties to Depart Infinitely from the Original Type一書的手稿，得知華萊士也幾乎同時(shí)發(fā)現(xiàn)了自然選擇假說。達(dá)爾文在一次與賴爾的書信中提及此事，稱華萊士的觀點(diǎn)與自己1842年文章中的觀點(diǎn)頗為相似。通過使用TM方法發(fā)現(xiàn)，比之《物種起源》一書的觀點(diǎn)，華萊士1858年寄給達(dá)爾文的文章的觀點(diǎn)，反而與達(dá)爾文在1842年和1844年兩篇文章中的觀點(diǎn)更為相似，并且與達(dá)爾文1844年文章的觀點(diǎn)最為相似。這一發(fā)現(xiàn)為解釋兩人理論之間相似性的問題提供了新的也更精準(zhǔn)的視角。

此外，對(duì)于達(dá)爾文Outline and Draft文稿完成日期的爭(zhēng)議，通過使用TM方法給出了新的證據(jù)。該文稿是由Peter Vorzimmer于1975年在劍橋大學(xué)圖書館發(fā)現(xiàn)的，他推定該文稿的完成日期為1839年。后來的學(xué)者通過文稿上的注釋以及文稿標(biāo)題在達(dá)爾文1844年文章中出現(xiàn)這一事實(shí)，將這一文稿的完成日期重新推定為1842—1844年之間。使用TM比較該文稿、1842年文章、1844年文章與最終的《物種起源》，發(fā)現(xiàn)該文稿與《物種起源》一書之間差異最大，而1844年文章與《物種起源》最為類似。這就為Outline and Draft文稿完成于1839年這一觀點(diǎn)的合理性提供了新支持。

從上世紀(jì)70年代至21世紀(jì)初，以西蒙為代表的一批AI科學(xué)家、認(rèn)知科學(xué)家致力于機(jī)器發(fā)現(xiàn)，將科學(xué)發(fā)現(xiàn)這項(xiàng)復(fù)合事業(yè)分解為一個(gè)個(gè)子任務(wù)，各個(gè)擊破，取得了一批頗有成效的成果，如：探測(cè)數(shù)據(jù)規(guī)律子任務(wù)的BACON1-6、FAHRENHEIT、IDS，發(fā)現(xiàn)定性定律和概念的GLAUBER、STAHL、DALTON、AM，完成表征或解釋子任務(wù)的GELL-MANN、BR3-4、PAULI、MECHEM、ECHO，設(shè)計(jì)實(shí)驗(yàn)子任務(wù)并進(jìn)行理論修改的KEKADA、COAST，探測(cè)錯(cuò)誤并執(zhí)行修復(fù)任務(wù)的STAHLp、AbE、TRANSGENE，執(zhí)行類比任務(wù)的Drama、 ACME、Copycat、SME、LISA。[32]雖然MECHEM和PAULI等程序分別提出了新的化學(xué)反應(yīng)機(jī)理和量子力學(xué)解釋，但這些新發(fā)現(xiàn)在增長(zhǎng)人類知識(shí)方面的意義微乎其微，未引起學(xué)界重視。

近20年，MD和ASD（Autonomous Scientific Discovery自動(dòng)科學(xué)發(fā)現(xiàn)）取得了一些新進(jìn)展。2009年4月，Science同時(shí)刊發(fā)了3篇自動(dòng)化科學(xué)發(fā)現(xiàn)方面的文章：Bruce Buchanan是第一個(gè)專家系統(tǒng)DENDRAL（1965年）的主要開發(fā)者，他撰寫的綜述從西蒙MD傳統(tǒng)出發(fā)，描述當(dāng)前ASD的進(jìn)展及其長(zhǎng)遠(yuǎn)任務(wù)[33];兩篇最新研究中，一個(gè)在辨識(shí)何為重要的數(shù)據(jù)關(guān)系式方面提出了新穎的算法，通過此算法，沒有任何理論知識(shí)背景該系統(tǒng)就發(fā)現(xiàn)了真正重要的能夠表達(dá)自然定律的數(shù)學(xué)關(guān)系式，且比20世紀(jì)70—80年代BACON的發(fā)現(xiàn)在復(fù)雜度上有了很大進(jìn)展，能夠發(fā)現(xiàn) Hamiltonians、 Lagrangians表達(dá)式[34];另一個(gè)ASD系統(tǒng)能夠自動(dòng)對(duì)系統(tǒng)推導(dǎo)出的假說表達(dá)式進(jìn)行評(píng)估，并自動(dòng)決定下一步的實(shí)驗(yàn)，完成一個(gè)完整的科學(xué)實(shí)驗(yàn)任務(wù)。[35]

最近兩年，關(guān)注AI模擬科學(xué)發(fā)現(xiàn)的兩個(gè)最新進(jìn)展皆使用了神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)模型：一個(gè)是Renato Renner小組，他們思考物理學(xué)家在建構(gòu)解釋模型時(shí)所使用的傳統(tǒng)方法是否能自然而然地出自實(shí)驗(yàn)數(shù)據(jù)，而不依賴任何預(yù)先的數(shù)學(xué)和物理知識(shí)，他們的ASD系統(tǒng)重新發(fā)現(xiàn)了經(jīng)典力學(xué)和量子力學(xué)中的一些重要概念，發(fā)表在新近的《物理評(píng)論快報(bào)》（Physical Review Letters）上[36];另一項(xiàng)工作則重新發(fā)現(xiàn)了量子波函數(shù)概念和薛定諤方程。[37]總體來說，上述MD以及ASD還沒有做出真正引起學(xué)界重視的新發(fā)現(xiàn)。不過，艾倫小組關(guān)于達(dá)爾文的HPS計(jì)算建模所得到的一些新證據(jù)和新解釋，除了發(fā)表在認(rèn)知領(lǐng)域頂級(jí)學(xué)術(shù)期刊上，也引起了公共媒體的關(guān)注，美國(guó)國(guó)家公共電臺(tái)（NPR）進(jìn)行了專門評(píng)述和報(bào)道。

本文討論主題模型在三大類哲學(xué)和人文知識(shí)領(lǐng)域的應(yīng)用，不論是中國(guó)古代哲學(xué)、科史哲，還是下面討論的文化哲學(xué)，TM在人文領(lǐng)域的知識(shí)發(fā)現(xiàn)都是頗有潛力的。

三、與文化哲學(xué)有高度的親和性

（一）對(duì)孔、孟、荀哲學(xué)的建模

加拿大漢學(xué)家Edward Slingerland（森舸瀾）和美國(guó)哲學(xué)家Ryan Nichols合作（下文簡(jiǎn)稱SN團(tuán)隊(duì)），近幾年一直致力于結(jié)合機(jī)器學(xué)習(xí)研究中國(guó)古代文化。2018年，他們用TM遠(yuǎn)距離閱讀方法對(duì)《論語(yǔ)》《孟子》和《荀子》的內(nèi)容進(jìn)行比較[38]，分別揭示了三部哲學(xué)論著中共同和不同的主題。他們的結(jié)果確證了許多學(xué)者一直以來采用傳統(tǒng)的直接細(xì)讀所得到的結(jié)論，即荀子的論著與《論語(yǔ)》在語(yǔ)義內(nèi)容上有共性。進(jìn)而，他們嘗試用TM方法探究頗有爭(zhēng)議的傳統(tǒng)哲學(xué)問題，如，在孔、孟、荀三位思想家中，孟子比荀子更接近孔子的思想嗎？這與道德哲學(xué)的一個(gè)核心問題密切相關(guān)，即，人性中的善這種道德規(guī)范是先天的和內(nèi)在的，還是后天的和外在的？

《論語(yǔ)》的TM結(jié)果顯示了一個(gè)區(qū)別于《孟子》《荀子》的特點(diǎn)，即，《論語(yǔ)》的高權(quán)重主題在內(nèi)容上與“三禮”的部分內(nèi)容相關(guān)，經(jīng)過專家細(xì)讀，確認(rèn)是《論語(yǔ)》第十篇與“三禮”的內(nèi)容十分相似。這個(gè)計(jì)算結(jié)果是有意義的，因?yàn)門M作為無(wú)監(jiān)督方法，沒有預(yù)先給定它任何中國(guó)哲學(xué)知識(shí)，它的計(jì)算結(jié)果與學(xué)界共識(shí)相一致證明TM用來分析中國(guó)哲學(xué)的適當(dāng)性。基于這個(gè)計(jì)算結(jié)果，SN進(jìn)一步探究，孔子對(duì)于神靈的態(tài)度究竟是理性的還是非理性的？對(duì)此問題有兩種意見，以馮友蘭為代表的一方認(rèn)為孔子是理性的，孔子很可能并不相信他的同時(shí)代人的迷信，而以Thomas Wilson為代表的一方認(rèn)為孔子對(duì)神靈有虔誠(chéng)的信仰。雙方都是采用傳統(tǒng)細(xì)讀原著的方法，也各有文本證據(jù)，誰(shuí)也駁不倒誰(shuí)。采用TM計(jì)算分析，就為這樣的爭(zhēng)議給出了第三方證據(jù)。

SN認(rèn)為，TM計(jì)算結(jié)果提供了支持孟子持內(nèi)在美德論的證據(jù)，即，人性中內(nèi)在地和先天地具有向善的潛能。同時(shí)，計(jì)算結(jié)果支持了荀子比孔、孟更注重通過外在的制度手段實(shí)現(xiàn)社會(huì)控制的觀點(diǎn)。但SN認(rèn)為，不能因此就認(rèn)為孔、孟思想的近似度高于孔、荀思想的近似度，因?yàn)橛锌赡苁且驗(yàn)檐髯佑袨楣俚慕?jīng)歷，故而更有興趣討論管理機(jī)構(gòu)的細(xì)節(jié)如法律、懲治、官職等等。

根據(jù)《論語(yǔ)》和《荀子》共同高頻主題“禮”在《孟子》中出現(xiàn)頻率很低，可以支持《荀子》和《論語(yǔ)》之間更大的近似性，即都認(rèn)同通過學(xué)習(xí)、外在文化禮儀來成就規(guī)范價(jià)值，即外在美德論的共識(shí)。

為了使上述哲學(xué)問題的計(jì)算建模具有可重復(fù)性和可檢驗(yàn)性，王小紅和艾倫計(jì)算哲學(xué)組基于全新漢典TM平臺(tái)，試圖重復(fù)SN組關(guān)于孔、孟、荀比較的研究結(jié)論，目前看來數(shù)據(jù)的差異性明顯高于一致性（4），進(jìn)一步的分析和解釋，還需更多工作。

（二）對(duì)中國(guó)哲學(xué)身-心關(guān)系的建模

2017年，SN采用TM結(jié)合其他算法技術(shù)，分析引起西方諸多權(quán)威漢學(xué)家很大爭(zhēng)議的問題：中國(guó)傳統(tǒng)思想是不是以強(qiáng)身心整體論為特征的？[39]他們建立了一個(gè)包括前戰(zhàn)國(guó)時(shí)期至宋代的古籍文本語(yǔ)料庫(kù)。計(jì)算結(jié)果顯示，荀子以及其他中國(guó)早期思想家，在提到“心”時(shí)往往會(huì)提到“心”與身體的關(guān)系，這表明，比之身體的其他器官，“心”在早期中國(guó)思想中有著不同的認(rèn)知地位?；跈C(jī)器學(xué)習(xí)的三種計(jì)算分析結(jié)果，他們提出中國(guó)古代早期思想至少是一種弱二元論。

得益于我們可以非常便利地閱讀更多中國(guó)哲學(xué)最新研究文獻(xiàn)，在深入分析SN的方法之后，我們發(fā)現(xiàn)，他們用于計(jì)算分析的中國(guó)哲學(xué)基礎(chǔ)概念可能有問題，具體說就是用于表示“心-身”概念關(guān)系對(duì)中的“身”所對(duì)應(yīng)的古漢語(yǔ)詞。森舸瀾將“身”的表達(dá)對(duì)應(yīng)于三個(gè)詞：身、形、體?；谒詈竦臐h學(xué)修養(yǎng)，這種意義表達(dá)的拆分頗有道理，但是將形、體的意義歸于單一的生理性的形和體，與中國(guó)哲學(xué)思想中的意義指涉并不完全符合。仔細(xì)閱讀中國(guó)哲學(xué)研究權(quán)威文獻(xiàn)可以看到，形、體同其他中國(guó)哲學(xué)核心詞如道、理、禮等一樣，有著豐富的和變化的含義，形、體不僅表示生理的形和體，還有超出生理的，甚至超驗(yàn)的意涵。[40]

（三）TM與文化研究中的意義理論

另一項(xiàng)有趣的漢學(xué)研究工作是哈佛大學(xué)Ian M. Miller對(duì)中國(guó)清代社會(huì)變亂實(shí)況的考察。[41]不同歷史時(shí)期反映社會(huì)實(shí)況的詞，如banditry、unrest、rebellion等，難以有固定的定義，史學(xué)家研究史料時(shí)不得不有先驗(yàn)的分類定義。Miller通過使用TM方法，對(duì)這一時(shí)期的奏折內(nèi)容實(shí)錄文本材料進(jìn)行主題建模，通過嘗試TM特有的語(yǔ)境解釋性算法，輔助史學(xué)文本分析，避免了范疇模糊的詞語(yǔ)對(duì)理解文意的干擾，比之傳統(tǒng)方法增強(qiáng)了客觀性，在此基礎(chǔ)上探究了清代出現(xiàn)的幾起大型變亂現(xiàn)象的規(guī)律性。

還有一項(xiàng)是研究TM技術(shù)與文化研究的高度親和，實(shí)際運(yùn)演了文化哲學(xué)和語(yǔ)言哲學(xué)的意涵。文化社會(huì)學(xué)研究者Paul Di Maggio 和Blei于2013年合作，[42]選取有代表性的報(bào)紙所刊登的公共藝術(shù)資助方面的新聞報(bào)道，用TM分析其中的演變趨勢(shì)。他們建立了一個(gè)近8000個(gè)文本、超過300萬(wàn)詞語(yǔ)的語(yǔ)料庫(kù)，用TM分析識(shí)別出最重要的話題，正是這些話題框定了政府資助方面的討論。

這是一個(gè)文化學(xué)研究案例，該研究揭示了TM進(jìn)路對(duì)文化學(xué)研究的優(yōu)勢(shì)，因?yàn)門M模型使得文化哲學(xué)、語(yǔ)言哲學(xué)中的重要概念如框架、一詞多義性、雜語(yǔ)性、意義的關(guān)系等具有了可操作性，具體表現(xiàn)在：第一，TM產(chǎn)生的具有可解釋性的主題內(nèi)容，展現(xiàn)了文化意義上的解釋框架。第二，TM基于一個(gè)詞出現(xiàn)的語(yǔ)境，具有抓取一詞多義性和一個(gè)詞模棱兩可的不同用法的能力。TM強(qiáng)調(diào)關(guān)系性，抓住了許多語(yǔ)言學(xué)學(xué)者的共識(shí)，即，意義是在關(guān)系中顯現(xiàn)的，而非居留于一個(gè)個(gè)詞中。索緒爾認(rèn)為[43]，意義并非內(nèi)在于符號(hào)中，符號(hào)的意義得自和它一同出現(xiàn)并相互作用的其他符號(hào)。結(jié)構(gòu)主義語(yǔ)言學(xué)的中心論點(diǎn)是：語(yǔ)言是一個(gè)系統(tǒng)，在這個(gè)系統(tǒng)中，各個(gè)成分的功能和意義完全由它們?cè)谙到y(tǒng)中的相互關(guān)系來定義。這種關(guān)系式語(yǔ)義特性恰恰體現(xiàn)在主題模型LDA的算法中，按照LDA設(shè)計(jì)者Blei的話來說，就是體現(xiàn)在LDA的“基因”里。第三，文化學(xué)的核心洞見之一即文本的雜語(yǔ)性。文本往往并不只是反映某種單一的觀點(diǎn)，而時(shí)常呈現(xiàn)雜語(yǔ)性特征，在一個(gè)文本中常見多個(gè)“聲音”（觀點(diǎn)或者表達(dá)類型）共存甚至不分強(qiáng)弱。Blei寫道：“LDA背后的基本直覺就是，文件都呈現(xiàn)多個(gè)主題。”[44]78這樣，LDA生成的結(jié)果，即每一篇文章中的多個(gè)主題結(jié)構(gòu)，就有助于從實(shí)證層面檢視雜語(yǔ)性。

語(yǔ)言哲學(xué)探究“意義”的普遍、客觀性本質(zhì)，從明示定義（包括直接明示、間接明示、直接內(nèi)在明示）到行為主義的操作定義，再到語(yǔ)義網(wǎng)絡(luò)定義，各種意義理論都在試圖接近“意義”的普遍性和客觀性。維特根斯坦的一個(gè)核心思想是，不要問意義，“要問使用”[45]80。維氏論證“意義”的初衷與行為主義傳統(tǒng)一致，皆反對(duì)標(biāo)準(zhǔn)語(yǔ)義理論中的感受質(zhì)、私人語(yǔ)言、意義唯我論。但維氏的結(jié)論不同，他認(rèn)為，理解一個(gè)詞，只需要這個(gè)詞帶來的心理感覺與別的現(xiàn)象之間的聯(lián)系，而別的現(xiàn)象并不需要是公共可觀察的，也可以是別的心理狀態(tài)。維氏論證的結(jié)論就是：一個(gè)詞的意義就在于它與別的詞所發(fā)生的系統(tǒng)性關(guān)聯(lián)，沒有這些關(guān)聯(lián)，則沒有該詞的意義?？梢?，“意義”就是某件事物，它存在于詞與詞所構(gòu)成的情境之網(wǎng)，在這個(gè)網(wǎng)中，詞與詞彼此通過那些包含這些詞的一般陳述相互關(guān)聯(lián)。

無(wú)獨(dú)有偶，丘奇蘭德也以自然科學(xué)理論中名詞術(shù)語(yǔ)為例，清晰地闡釋了語(yǔ)詞意義的網(wǎng)絡(luò)理論，即，一個(gè)個(gè)理論詞項(xiàng)的意義就隱含于它們所嵌入其中的原理之網(wǎng)。[46]53TM的計(jì)算結(jié)果呈現(xiàn)了詞的使用情境之網(wǎng)，其背后的算法沒有包含人類閱讀者會(huì)有的個(gè)體體驗(yàn)、知識(shí)積累、文化背景，甚至情感情緒。TM生成的可重復(fù)、可檢驗(yàn)的“意義”之網(wǎng)，有助于使意義理論走出唯我論的泥潭，為構(gòu)建更加一般性的意義理論帶來希望。普特南說：“意義就不在頭腦里?！盵47]464而我們可以這樣說：意義就在語(yǔ)詞使用情境的收斂特征里！

注釋：

（1）TM對(duì)“氣”之多重語(yǔ)義進(jìn)行了集簇聚類，我們結(jié)合細(xì)讀中國(guó)哲學(xué)相關(guān)文獻(xiàn)仔細(xì)檢視了TM計(jì)算結(jié)果的有效性和適當(dāng)性。

（2）按照“發(fā)現(xiàn)之友”哲學(xué)家的共識(shí)，發(fā)現(xiàn)的邏輯是指關(guān)于產(chǎn)生知識(shí)的一套程式化的推理過程。

（3）認(rèn)知心理學(xué)對(duì)啟發(fā)式?jīng)Q策的研究從未停止。早期西蒙傳統(tǒng)主要從人的內(nèi)在認(rèn)知活動(dòng)如記憶、注意的研究出發(fā)來設(shè)計(jì)計(jì)算表征的啟發(fā)式規(guī)則，關(guān)注假想世界中的人工難題;當(dāng)前以Gerd Gigerenzer和Peter Todd為代表的生態(tài)理性進(jìn)路，則強(qiáng)調(diào)推理和決策成功的外部考量，探索啟發(fā)式規(guī)則與真實(shí)環(huán)境的適應(yīng)性擬合在計(jì)算機(jī)科學(xué)中的具體技術(shù)含義，也不再尋求對(duì)所有環(huán)境都普遍適用的策略，而探究在不同真實(shí)環(huán)境中具有良好適應(yīng)性、往往是“多快好省”式的簡(jiǎn)單多樣啟發(fā)式策略。

（4）SN文章使用的語(yǔ)料庫(kù)下載自ctext。2019年6月ctext創(chuàng)建者哈佛學(xué)者Donald Sturgeon應(yīng)實(shí)驗(yàn)室邀請(qǐng)來訪與我們一起工作，他給予我們完整的ctext語(yǔ)料庫(kù)。經(jīng)過比較，我們計(jì)算得出的孔孟荀語(yǔ)料庫(kù)權(quán)重最高十大主題與SN結(jié)果差異明顯。具體原因并不清楚，因?yàn)镾N文章沒有公布所有主題內(nèi)容，也沒有描述運(yùn)行TM的參數(shù)細(xì)節(jié)，我們只能估計(jì)差異明顯的原因可能在于作為測(cè)度主題結(jié)構(gòu)相似度的基本單元的選取不同。另外，我們得出的十大主題更為全面地反映了語(yǔ)料庫(kù)涵蓋的內(nèi)容，而SN的十大主題明顯缺乏語(yǔ)料庫(kù)中的字書、兵家、占卜、醫(yī)書的內(nèi)容。當(dāng)然，只有SN公布所有的主題內(nèi)容，才可以要么確證要么推翻我們對(duì)SN下載語(yǔ)料庫(kù)缺漏內(nèi)容的懷疑。相比我們的十大主題，SN十大主題之間的意義相差不大，界限不夠清楚。

參考文獻(xiàn)：

[1]Blei，D.M.，et al. Latent Dirichlet Allocation[J]. Journal of Machine Learning Research 3，2003，（1）：993-1022.

[2]艾倫和王小紅計(jì)算哲學(xué)組.Topic Modeling the Han Dian Ancient Classics[DB/OL]. Journal of Cultural Analytics，2017，（10）.https：//doi.org/10.22148/16.016.

[3]王小紅，科林·艾倫，浦江淮，等.人文知識(shí)發(fā)現(xiàn)的計(jì)算機(jī)實(shí)現(xiàn)——對(duì)“漢典古籍”主題建模的實(shí)證分析[J].自然辯證法通訊，2018，（4）：50-58.

[4]漢典古籍[DB/OL].http：//www.zdic.net.

[5]（KANRIPO）Kanseki Repository[DB/OL].http：//www.kanripo.org.

[6]Sturgeon. D. Chinese Text Project[DB/OL].https：//ctext.org.

[7]艾倫和王小紅計(jì)算哲學(xué)組.新漢典主題模型（New_Handian）[DB/OL].2019，http：//inpho.xjtu.edu.cn/New_Handian2/200.

[33]Waltz. D， Buchanan. B. G. Automating Science[J].Science，2009，（3）：43-44.

[34]Schmidt. M， Lipson. H. Distilling Free-Form Natural Laws from Experimental Data[J].Science，2009，（3）：81-85.

[35]King. R. D，et al. The Automation of Science[J].Science，2009，（3）：85-89.

[36]Renner. R研究組. Discovering Physical Concepts with Neural Networks[DB/OL].Physical Review Letters， 2020，（1）.doi： 10.1103/PhysRevLett.124.010508.

[37]Wang. C. etc. Emergent Quantum Mechanics in an Introspective Machine Learning Architecture[J].Science Bulletin，2019，（17）：1228-1233.

[38]Nichols. R， Slingerland. E， et al. Modeling the Contested Relationship between Analects，Mencius and Xunzi[J]. Journal of Asian Studies，2018，（1）：19-57.

[39]Slingerland. E， Nichols. R， et al. The Distant? Reading of Religious Texts： A “Big Data”? Approach to Mind-Body Concepts in Early China[J].Journal of the American Academy of Religion，2017，（4）：985-1016.

[40]貢華南.從“形與體之辯”到“體與理之辯”——中國(guó)古典哲學(xué)思想范式之嬗變歷程[J].中國(guó)社會(huì)科學(xué)，2017，（4）：128-148，208.

[41]Ian Matthew Miller. Rebellion，Crime and Violence in Qing China，1722-1911：A Topic Modeling Approach[J].Poetics，2013，（41）：626-649.

[42]Dimaggio. P， Nag. M， Blei. D. Exploiting Affinities between Topic Modeling and the Sociological Perspective on Culture：Application to Newspaper Coverage of U.S. Government Arts Funding[J].Poetics，2013，（41）：570-606.

[43]Saussure. F. Course in General Linguistics[M].La Salle：Open Court Press，1983.

[44]Blei. D. M. Probabilistic Topic Models[J].Communications of the ACM，2012，（4）： 77-84.

[45]維特根斯坦.哲學(xué)研究[M].陳嘉映，譯.上海：上海世紀(jì)出版集團(tuán)、上海人民出版社，2002.

[46]Churchland. P. M. Matter and Consciousness：A Contemporary Introduction to the Philosophy of Mind[M]. Cambridge：The MIT Press，1994.

[47]普特南.“意義”的意義[C]//陳波，主編.邏輯與語(yǔ)言.北京：東方出版社，2005.

（責(zé)任編輯吳勇）