王小紅 科林·艾倫 高元昊 楊冰潔
摘要:國(guó)內(nèi)外海量人文經(jīng)典文獻(xiàn)數(shù)字化工程雖已實(shí)施和完成,傳統(tǒng)人文研究方法(依靠學(xué)者個(gè)人細(xì)讀文本)卻歷經(jīng)千年未變。近年來,包括西安交通大學(xué)哲學(xué)實(shí)驗(yàn)室在內(nèi),國(guó)際、國(guó)內(nèi)學(xué)者探究運(yùn)用主題建模(topic modeling,縮寫為TM)技術(shù)融入傳統(tǒng)哲學(xué)研究有三個(gè)具體分支領(lǐng)域:一,基于LDA-TM特有的語(yǔ)境聚類特征,實(shí)驗(yàn)室模型第一次計(jì)算展示了中國(guó)古代哲學(xué)核心詞的一詞多義性,并基于全新漢典語(yǔ)料庫(kù)呈現(xiàn)了張載宇宙論的獨(dú)特性;二,科史哲(HPS)領(lǐng)域?qū)_(dá)爾文的閱讀內(nèi)容做主題建模,用驚異度描畫并測(cè)量其閱讀模式,研究結(jié)果有助于探究溯因啟發(fā)式策略在科學(xué)發(fā)現(xiàn)中的發(fā)生機(jī)制;三,TM的語(yǔ)義測(cè)量、詞相關(guān)性語(yǔ)境之網(wǎng)融入文化研究,對(duì)語(yǔ)言哲學(xué)中意義的意義難題的揭示??梢哉f,計(jì)算哲學(xué)方法在拓展哲學(xué)解釋空間、帶來新發(fā)現(xiàn)和新證據(jù)的同時(shí),也凸顯了其異于傳統(tǒng)方法的復(fù)雜性及深度學(xué)科交融性。
關(guān)鍵詞:主題模型;遠(yuǎn)距離閱讀;中國(guó)哲學(xué);科史哲;文化
中圖分類號(hào):B2? ? 文獻(xiàn)標(biāo)志碼:A? ? 文章編號(hào):1001-862X(2020)04-0082-009
一直以來,人文學(xué)者研讀文獻(xiàn)是直接閱讀單個(gè)文本,而主題建模(Topic Modeling,縮寫為TM)引入新的“遠(yuǎn)距離閱讀”方式,從而具有超書架功能。將一個(gè)大型文件集的語(yǔ)料庫(kù)作為計(jì)算機(jī)的輸入數(shù)據(jù),只需運(yùn)行TM算法,就可以自動(dòng)產(chǎn)生在人文專家看來頗有解釋意義的主題。一個(gè)主題可以看作許多詞語(yǔ)的聚類,無(wú)論什么時(shí)候要討論這個(gè)主題,這些詞語(yǔ)就會(huì)共同出現(xiàn)。從概率上說,這些聚類詞的共現(xiàn)頻率更高于不討論該主題時(shí)這些詞的共現(xiàn)頻率。TM屬于語(yǔ)義統(tǒng)計(jì)模型中的一種,是對(duì)語(yǔ)義進(jìn)行概率統(tǒng)計(jì)建模的方法。最簡(jiǎn)單、應(yīng)用最廣的概率建模技術(shù)是LDA(Latent Dirichlet Allocation,隱形狄利克雷分布),由David Blei團(tuán)隊(duì)于2003年提出。[1]
近些年來,人文學(xué)者大膽嘗試借助主題建模技術(shù)輔助文獻(xiàn)研讀,已經(jīng)涵蓋包括新聞傳播、文學(xué)、史學(xué)、文化學(xué)、詩(shī)歌和哲學(xué)等各個(gè)領(lǐng)域,取得的研究成果展現(xiàn)了分外有趣的人文意蘊(yùn)。在此基礎(chǔ)上,本文著重剖析機(jī)器學(xué)習(xí)對(duì)傳統(tǒng)哲學(xué)問題的主題建模。
一、通過語(yǔ)義抓取實(shí)現(xiàn)對(duì)大型古典哲學(xué)語(yǔ)料庫(kù)的結(jié)構(gòu)化
依靠人工辨識(shí)和分類,要使一個(gè)龐大的文件庫(kù)呈現(xiàn)清晰的結(jié)構(gòu),往往需要耗費(fèi)大量人力和時(shí)間。傳統(tǒng)人工只能依據(jù)文章和著作的名稱、著者名、關(guān)鍵詞這些外部信息作外圍框架的分類和查詢,要想深入文檔內(nèi)容來分類海量文檔庫(kù),靠人力是不可能做到的。然而,TM實(shí)現(xiàn)了根據(jù)文檔內(nèi)容對(duì)龐大文件庫(kù)進(jìn)行結(jié)構(gòu)化。這種分類管理的核心是主題,可以呈現(xiàn)每個(gè)文件依據(jù)主題(20、40直到100個(gè))分布的結(jié)構(gòu)表、結(jié)構(gòu)圖,就是說,將文集具有的可解釋性的隱含結(jié)構(gòu)呈現(xiàn)出來。通過超書架和遠(yuǎn)距離閱讀,研究者可以直接看到文件的內(nèi)容結(jié)構(gòu),從而根據(jù)研究主題去獲取相關(guān)信息,并直接看到文檔庫(kù)中其他文件與此文件主題的關(guān)聯(lián)度,不僅可以便捷和高效地找到所需,而且還將獲得用傳統(tǒng)人工方法無(wú)法得到的洞見。
(一)“氣”概念多重語(yǔ)義蘊(yùn)含的計(jì)算呈現(xiàn)
2015年以來,我們和匹茲堡大學(xué)計(jì)算哲學(xué)家Colin Allen團(tuán)隊(duì)合作建立了一個(gè)包含近18000個(gè)文本的中國(guó)古代哲學(xué)語(yǔ)料庫(kù),通過主題建模分析,呈現(xiàn)了對(duì)于中國(guó)哲學(xué)研究和學(xué)習(xí)頗有解釋意義的主題,提供了通過主題建模對(duì)中國(guó)古代哲學(xué)典籍計(jì)算分析的平臺(tái),這是國(guó)際學(xué)術(shù)界第一個(gè)比較成功的嘗試。[2][3]基于國(guó)內(nèi)漢典庫(kù)[4],結(jié)合日本京都大學(xué)的KANRIPO[5]和美國(guó)哈佛大學(xué)ctext的中國(guó)古籍文本庫(kù)[6],我們建立了更全的新漢典主題建模平臺(tái),包含2萬(wàn)多個(gè)文本,總字?jǐn)?shù)近4.3億。[7]
如上表所示,TM算法具有語(yǔ)境聚類特征,能夠梳理出一個(gè)詞在使用中的多重語(yǔ)境。這在解釋中文一詞多義方面非常有意義,尤其是中國(guó)古代哲學(xué)中的核心詞如氣、道、禮等的語(yǔ)義蘊(yùn)含。表1顯示與“氣”相關(guān)的Top 10主題(K=100),可以看到,不僅每個(gè)主題的意義易識(shí)別、可解釋,且各主題的意義明顯不同。表1中,TM算法自動(dòng)分出了“氣”一詞的多種含義和使用情境,這些不同的主題聚類分別表示醫(yī)學(xué)(T78)、理學(xué)(T13)、陰陽(yáng)(T26)、風(fēng)水-命理(T86)、時(shí)節(jié)-天氣(T48)、道家與道教思想(T52)、天文-歷法(T20)、醫(yī)藥(T6),兵家-占卜(T57),以及理學(xué)-工夫論(T29)等不同語(yǔ)境下的“氣”之意涵(1),契合了中國(guó)哲學(xué)研究者關(guān)于“氣”之豐富語(yǔ)境的如下討論:
中國(guó)身體觀的一大特色,乃是除了五臟六腑的系統(tǒng)外,另有一種氣——經(jīng)脈的系統(tǒng),而氣尤可視為根本的原理。將氣與身體結(jié)合并論(以下簡(jiǎn)稱氣-身體),不但見之于傳統(tǒng)醫(yī)學(xué),也是以往的許多“經(jīng)驗(yàn)科學(xué)”,如占卜、星相、武術(shù)等,得以運(yùn)作的理論基礎(chǔ)。不但如此,它還提供了中國(guó)以往主流思潮無(wú)比重要的動(dòng)力,我們甚至于可以說:沒有氣-身體的理論預(yù)設(shè),儒道兩家的許多重要命題即不可能成立,至少也需要重新改寫。氣-身體觀與儒道兩家親密的關(guān)系,主要見之于玄學(xué)、理學(xué)與道教里的內(nèi)丹傳統(tǒng)。[8]導(dǎo)論第3頁(yè)
作為中國(guó)哲學(xué)的核心詞,“氣”這一概念在中國(guó)古典文獻(xiàn)中頻繁出現(xiàn)、在理論和實(shí)踐中又廣泛運(yùn)用,對(duì)這一概念的理解卻是“見仁見智、意義極易產(chǎn)生歧解的”[9]。通過TM等AI和大數(shù)據(jù)方法的輔助,對(duì)于那些歧解和爭(zhēng)議,中國(guó)哲學(xué)研究者或許可以給出新的洞見。
上圖基于我們建立的一個(gè)以中國(guó)古代氣論思想為主的語(yǔ)料庫(kù),從先秦至明末清初,基本涵蓋最重要?dú)庹撍枷爰业恼撝=Y(jié)合可視化圖形分析手段Sankey圖,TM算法可以更直觀地展示“氣”相關(guān)主題的流變(K=100,圖中顯示與“氣”最相關(guān)的Top 10主題)。[10]圖1中,權(quán)重相對(duì)較高的三個(gè)主題分別是T44(醫(yī)學(xué))、T87(理學(xué))和T10(朱子文字風(fēng)格)。從圖中可以看到,先秦諸家思想存在的差異能夠被算法抓取,并反映在模型中,如圖中T78(中醫(yī)-理論)、T99(道家)、T1(中醫(yī)-處方)和T97(天文-歷法)等不同主題分別關(guān)聯(lián)先秦不同學(xué)派、不同典籍。同時(shí),相對(duì)于先秦諸家思想之差異,不同發(fā)展階段的理學(xué)所具有的高度統(tǒng)一性也直觀顯示在模型中,即不同理學(xué)流派都與T87這一理學(xué)特征主題相關(guān)聯(lián)。
人文學(xué)某種程度上需要保留歧義性、多義性和融會(huì)貫通性。對(duì)此,有學(xué)者討論了LDA算法用于輔助哲學(xué)論證的優(yōu)勢(shì)和缺陷[11],也有學(xué)者從解釋學(xué)角度強(qiáng)調(diào)計(jì)算模型的解釋問題[12],幾位該領(lǐng)域領(lǐng)軍學(xué)者正致力于同時(shí)運(yùn)行多種模型來增進(jìn)人文知識(shí)所特有的“多元解釋性”。[12][13]這方面亟待探索的問題空間十分廣闊,需要大量工作探究人工智能機(jī)器學(xué)習(xí)接近人文思想的豐富性。
(二)計(jì)算建模凸顯張載宇宙論思想的獨(dú)特性
對(duì)張載全文本做主題建模分析[14][15][16],如表2和表3所示,新漢典主題模型顯示,張載處于宇宙論思想的轉(zhuǎn)折點(diǎn)。在張載之前的宇宙論思想相關(guān)著述中,道家思想文本占主導(dǎo)地位;而張載之后的宇宙論思想相關(guān)文本卻呈現(xiàn)明顯的變化,即儒家思想文本占據(jù)了主導(dǎo)地位。如何解釋這一現(xiàn)象呢?通過直接細(xì)讀大量中國(guó)古代典籍,包括對(duì)張載全文本的閱讀,我們了解到中國(guó)古代儒家思想大致呈現(xiàn)的變化特征:先秦至兩漢之前,儒家思想主要關(guān)注人的性命之理,由于漢代開始關(guān)注宇宙天道,儒家思想似乎出現(xiàn)了一個(gè)轉(zhuǎn)型,但是漢代以后人倫和天道究竟何為儒家關(guān)注點(diǎn)一直存在爭(zhēng)議;宋明理學(xué)的開創(chuàng)者之一張載,他的儒家思想研究將性命之理與天道相融合,建構(gòu)了獨(dú)特的宇宙論思想。正如有學(xué)者所總結(jié)的:從某種意義上說,張載建立天道本體,目的就是通向性命之學(xué),他所謂的“知天”,目的是為了“知人”。那種作為西方哲學(xué)宇宙論意義上的單純的天道,在中國(guó)思想傳統(tǒng)中擔(dān)當(dāng)不起“天道”這兩個(gè)字。[17][18]
西方宇宙論依托主客二元之分,而中國(guó)的天道思想則是天人合一的。所以,張載的理路是天道本體和人的性命之理相貫通的儒家倫理思想。我們運(yùn)用TM手段為此提供了計(jì)算哲學(xué)的新事實(shí)。
但是,張載宇宙論不僅僅有儒家精神,也一定程度上吸收了道家、佛學(xué)的理論觀點(diǎn)。在接下來的工作中,我們將嘗試從多層面數(shù)據(jù)給出進(jìn)一步的證據(jù),探討張載思想受道家和佛學(xué)怎樣的影響,以及關(guān)于張載思想的一些歧義。有學(xué)者提出,為什么這個(gè)轉(zhuǎn)折點(diǎn)是張載而不是周敦頤?作為與張載同時(shí)期的另一位理學(xué)開創(chuàng)者,周敦頤的宇宙論也應(yīng)當(dāng)處于這個(gè)轉(zhuǎn)折點(diǎn)上,但他的著作文本量只有幾千字,并不適合建模方法。由此可見,欲達(dá)到更為全面的分析,TM的遠(yuǎn)讀需要與文本細(xì)讀相結(jié)合。
張載開創(chuàng)關(guān)學(xué),他的思想在中國(guó)哲學(xué)中具有重要地位,一直是學(xué)界關(guān)注的熱點(diǎn)。牟宗三、馮友蘭、張岱年、陳俊民、林樂昌等代表性的海內(nèi)外及當(dāng)代學(xué)者對(duì)其思想的豐富性和獨(dú)特性進(jìn)行了系統(tǒng)而全面的揭示,可謂成果豐碩。但學(xué)界公認(rèn)張載哲學(xué)難度大,產(chǎn)生的歧義也很多[19],這些有爭(zhēng)議的問題需要繼續(xù)反思和研討。如,張載哲學(xué)是一種唯物論嗎,是一元論、二元論還是其他,是“氣”本體論還是“太虛”本體論,對(duì)其宇宙論作本體論(本源論)和生成論(發(fā)生論或構(gòu)成論)二分的證據(jù)充分嗎?還有“太虛”和“氣”的關(guān)系、“太虛”的含義,等等。[20][21][22][23][24]針對(duì)張載思想研究中存在的不同解釋,學(xué)者不妨大膽結(jié)合機(jī)器學(xué)習(xí)新方法給出新證據(jù),這無(wú)疑是對(duì)傳統(tǒng)研究的有益補(bǔ)充。
二、為科史哲(科學(xué)史與科學(xué)哲學(xué),HPS)研究科學(xué)發(fā)現(xiàn)提供新的解讀和證據(jù)
Colin Allen的IU團(tuán)隊(duì)首次使用TM對(duì)達(dá)爾文的閱讀日記進(jìn)行定量研究[25][26],不僅重新發(fā)現(xiàn)了達(dá)爾文研究生涯中的關(guān)鍵特征,還就三個(gè)圍繞達(dá)爾文研究生涯的問題提供了新的證據(jù)和回答,為科史哲(HPS)傳統(tǒng)一直關(guān)注的“發(fā)現(xiàn)的邏輯”(2)提供了新素材。
(一)HPS中的“發(fā)現(xiàn)”難題與計(jì)算的結(jié)合
漢森是HPS事業(yè)的奠基者,庫(kù)恩是HPS事業(yè)最有影響力的建構(gòu)者,兩位科學(xué)哲學(xué)家的科學(xué)發(fā)現(xiàn)觀早已成為科學(xué)發(fā)現(xiàn)計(jì)算模擬的豐富“養(yǎng)料”,直接影響了西蒙開創(chuàng)的機(jī)器發(fā)現(xiàn)(Machine Discovery,簡(jiǎn)稱MD)工作。[27][28]
漢森復(fù)興了皮爾斯的發(fā)現(xiàn)邏輯,即溯因式的推理。他深入論證了溯因推理方法在物理學(xué)發(fā)現(xiàn)中的作用:人們溯因式地考察現(xiàn)象P,把它“扔”進(jìn)一個(gè)可理解的模式里,通過提出假說H使現(xiàn)象P得到解釋。但“是P控制著H,不是相反。推斷是從數(shù)據(jù)到假說和理論,而不是相反”[29]88。漢森反復(fù)強(qiáng)調(diào),在溯因式推理中,數(shù)據(jù)、事實(shí)或現(xiàn)象對(duì)提出新假說具有基礎(chǔ)性作用和指引作用,這正是所有自然科學(xué)發(fā)現(xiàn)的共性。
達(dá)爾文發(fā)現(xiàn)進(jìn)化論假說也是一個(gè)溯因式推理的過程:收集大量事實(shí),觀察到大量現(xiàn)象,進(jìn)化論假說將這些零散的事實(shí)和現(xiàn)象納入一個(gè)統(tǒng)一的模式中,給予解釋。與演繹和歸納推理不同,溯因式推理之于發(fā)現(xiàn)的最奇妙之處在于,結(jié)論與前提之間既不是歸納式因果關(guān)系,也不是演繹式蘊(yùn)含關(guān)系,而是一種“看似合理”的關(guān)系,這種看似合理性只具有邏輯上的可能性而沒有必然性,在現(xiàn)實(shí)中也未有任何證據(jù)。
那么,究竟如何提出那個(gè)看似合理的假說,將已有現(xiàn)象前所未有地關(guān)聯(lián)起來呢?對(duì)此,漢森終究未能有清晰的表述。當(dāng)代“發(fā)現(xiàn)之友”哲學(xué)家對(duì)此進(jìn)行了一些新的探索,將認(rèn)知科學(xué)哲學(xué)與傳統(tǒng)發(fā)現(xiàn)哲學(xué)相結(jié)合,如Paul Thagard、 Nancy Nersessian等人分別研究了類比心智模型、類比推理模型在發(fā)現(xiàn)中的作用機(jī)制[30],但是發(fā)現(xiàn)邏輯的“硬核”依然缺乏清晰的說明。
庫(kù)恩反復(fù)強(qiáng)調(diào)常規(guī)科學(xué)的重要性,即遵循范式推進(jìn)科學(xué)理論的成熟和完善??墒强茖W(xué)史進(jìn)程中一再出現(xiàn)的超越范式、基于范式而始料未及的現(xiàn)象,又如何用范式去解釋呢?庫(kù)恩提出了歷史主義的發(fā)現(xiàn)觀:新事物最初的突現(xiàn),只是對(duì)那些能夠識(shí)別是什么地方不對(duì)勁兒的人而言的,因?yàn)橹挥兴麄儾啪_地了解預(yù)期應(yīng)該出現(xiàn)的是什么。于是,依然只是在已有范式背景下,反常才會(huì)顯現(xiàn)。[31]60在庫(kù)恩看來,任何革命性的新范式都產(chǎn)生自早先的常規(guī)科學(xué)時(shí)期,正是常規(guī)科學(xué)的范式導(dǎo)致了反常。然而,新范式究竟如何產(chǎn)生?庫(kù)恩訴諸宗教信仰的皈依或心理學(xué)所謂的格式塔轉(zhuǎn)換,不僅使庫(kù)恩遠(yuǎn)離“發(fā)現(xiàn)之友”,也使“發(fā)現(xiàn)的邏輯”無(wú)解。
面對(duì)上述發(fā)現(xiàn)哲學(xué)的難題和困境,我們不妨通過對(duì)閱讀內(nèi)容主題建模這一新手段,以達(dá)爾文的創(chuàng)造性假說的涌現(xiàn)機(jī)制為例,探究他是如何積聚又深又廣的解題思路空間的。
(二)達(dá)爾文的閱讀模式:由深度閱讀到探索閱讀
任何科學(xué)發(fā)現(xiàn)都是多種活動(dòng)或者子任務(wù)的復(fù)合,成功的發(fā)現(xiàn)者不僅具有超乎常人的堅(jiān)持,還使用了與真實(shí)任務(wù)具有適應(yīng)性擬合的啟發(fā)式?jīng)Q策(3)引導(dǎo)其完成各項(xiàng)子任務(wù)。閱讀文獻(xiàn)資料無(wú)疑是發(fā)現(xiàn)的重要子任務(wù),成功的研究者如何在閱讀的廣度和深度間權(quán)衡和轉(zhuǎn)換,他們閱讀模式背后的啟發(fā)式抉擇是怎樣的?如圖2所示,對(duì)達(dá)爾文1837—1860年間閱讀筆記中記錄的閱讀文本建立主題模型,以信息理論中的驚異度為度量,從局域和全局兩個(gè)方面分析達(dá)爾文閱讀習(xí)慣與閱讀歷程的轉(zhuǎn)變,可以發(fā)現(xiàn):在閱讀習(xí)慣方面,對(duì)新領(lǐng)域的探索閱讀與對(duì)已熟知領(lǐng)域的深度閱讀兩種習(xí)慣的相互交替貫穿了達(dá)爾文的整個(gè)研究生涯,整體上來看,達(dá)爾文的閱讀習(xí)慣是向著探索閱讀演變的;通過使用無(wú)監(jiān)督貝葉斯模型對(duì)驚異度進(jìn)行分析,得到了達(dá)爾文傳記生涯的三個(gè)主要分期:小獵犬號(hào)上的航海日記時(shí)期,對(duì)藤壺的研究時(shí)期,以及研究進(jìn)化論的時(shí)期。分析結(jié)果與科學(xué)史家進(jìn)行的傳記分期相一致,這表明了TM方法用于科學(xué)史料分析的適當(dāng)性。
在此基礎(chǔ)上,以局域或全局方法觀察何者與實(shí)際分期更匹配,推斷達(dá)爾文的閱讀習(xí)慣是傾向于探索閱讀還是深度閱讀。此外,分別計(jì)算達(dá)爾文閱讀文本的順序和文本實(shí)際出版的順序,考察各自的驚異度變化趨勢(shì),發(fā)現(xiàn)達(dá)爾文閱讀順序下的驚異度遠(yuǎn)高于那些書目在出版順序下的驚異度,這一結(jié)果為達(dá)爾文選擇如此的閱讀順序提供了實(shí)驗(yàn)證明。這個(gè)結(jié)果對(duì)發(fā)現(xiàn)邏輯的工作頗有啟發(fā),或許表明,高出書籍出版驚異度的探索式閱讀,為達(dá)爾文積聚了巨大的原創(chuàng)性發(fā)現(xiàn)動(dòng)力。但究竟這種閱讀模式只為達(dá)爾文個(gè)人所獨(dú)有,還是在原創(chuàng)性發(fā)現(xiàn)者中具有一定程度的共性,尚需進(jìn)一步研究。另外,類比信息科學(xué)中的驚異度測(cè)量,可以說,科學(xué)研究中消除反常的過程就是驚異度降低的過程。達(dá)爾文有時(shí)是驚異度降低的閱讀,有時(shí)又是驚異度增加的閱讀,之間的轉(zhuǎn)換機(jī)制是什么?而且,賴爾的《地質(zhì)學(xué)原理》(1837)、馬爾薩斯的《人口論》(1803)、錢伯斯的《創(chuàng)造物博物學(xué)的遺跡》(1844)又是如何在達(dá)爾文那里發(fā)生理論的認(rèn)知轉(zhuǎn)換的呢?
這種基于TM的量化方法對(duì)個(gè)體與群體間行為習(xí)慣以及個(gè)體長(zhǎng)期和短期下的閱讀選擇進(jìn)行探討,擴(kuò)大了TM在認(rèn)知搜索領(lǐng)域的應(yīng)用范圍。從文化視角看,科學(xué)創(chuàng)新往往被視為一種廣闊視域上的知識(shí)積累趨勢(shì)。這里的發(fā)現(xiàn)表明,個(gè)體可以產(chǎn)生先于時(shí)代文化的創(chuàng)新,之后再被接納為文化整體的一部分,這為“發(fā)現(xiàn)的哲學(xué)”HPS理論帶來新的個(gè)體視角。
當(dāng)前,探討發(fā)現(xiàn)邏輯的工作大多關(guān)注兩個(gè)主要途徑:一是溯因推理,二是啟發(fā)式規(guī)則輔助下的解題算法。[30]我們?cè)缦葘?duì)MD的考察揭示了西蒙開創(chuàng)的機(jī)器發(fā)現(xiàn)恰恰在AI實(shí)踐領(lǐng)域奠定了這兩個(gè)途徑的基礎(chǔ):一方面,他通過AI模擬科學(xué)發(fā)現(xiàn),填補(bǔ)了漢森的溯因推理給不可表征的神秘留下的空位;另一方面,他結(jié)合大量科學(xué)史中的發(fā)現(xiàn)案例和認(rèn)知心理學(xué)實(shí)驗(yàn),設(shè)計(jì)MD程序的具體啟發(fā)式規(guī)則,為啟發(fā)式?jīng)Q策在科學(xué)發(fā)現(xiàn)中的角色給出了更清晰的闡發(fā)。[27][28]運(yùn)用TM對(duì)達(dá)爾文閱讀模式實(shí)現(xiàn)的定量描畫,有助于我們探究溯因啟發(fā)式策略在科學(xué)發(fā)現(xiàn)中的發(fā)生機(jī)制。
(三)為達(dá)爾文的HPS研究提供新證據(jù)
進(jìn)一步的研究,則回應(yīng)了著名的“達(dá)爾文延遲”問題。通過對(duì)TM生成的不同主題做集群分析,發(fā)現(xiàn)在完成《物種起源》期間,達(dá)爾文的閱讀習(xí)慣表現(xiàn)出前所未有的探索性特點(diǎn),這一結(jié)論為達(dá)爾文的延遲是在為自己的著作收集證據(jù)以及發(fā)展論證這一解釋提供了證據(jù)。而達(dá)爾文突然在1859年火速出版《物種起源》一書的原因,普遍認(rèn)為是由于達(dá)爾文1858年收到華萊士 On the Tendency of Varieties to Depart Infinitely from the Original Type一書的手稿,得知華萊士也幾乎同時(shí)發(fā)現(xiàn)了自然選擇假說。達(dá)爾文在一次與賴爾的書信中提及此事,稱華萊士的觀點(diǎn)與自己1842年文章中的觀點(diǎn)頗為相似。通過使用TM方法發(fā)現(xiàn),比之《物種起源》一書的觀點(diǎn),華萊士1858年寄給達(dá)爾文的文章的觀點(diǎn),反而與達(dá)爾文在1842年和1844年兩篇文章中的觀點(diǎn)更為相似,并且與達(dá)爾文1844年文章的觀點(diǎn)最為相似。這一發(fā)現(xiàn)為解釋兩人理論之間相似性的問題提供了新的也更精準(zhǔn)的視角。
此外,對(duì)于達(dá)爾文Outline and Draft文稿完成日期的爭(zhēng)議,通過使用TM方法給出了新的證據(jù)。該文稿是由Peter Vorzimmer于1975年在劍橋大學(xué)圖書館發(fā)現(xiàn)的,他推定該文稿的完成日期為1839年。后來的學(xué)者通過文稿上的注釋以及文稿標(biāo)題在達(dá)爾文1844年文章中出現(xiàn)這一事實(shí),將這一文稿的完成日期重新推定為1842—1844年之間。使用TM比較該文稿、1842年文章、1844年文章與最終的《物種起源》,發(fā)現(xiàn)該文稿與《物種起源》一書之間差異最大,而1844年文章與《物種起源》最為類似。這就為Outline and Draft文稿完成于1839年這一觀點(diǎn)的合理性提供了新支持。
從上世紀(jì)70年代至21世紀(jì)初,以西蒙為代表的一批AI科學(xué)家、認(rèn)知科學(xué)家致力于機(jī)器發(fā)現(xiàn),將科學(xué)發(fā)現(xiàn)這項(xiàng)復(fù)合事業(yè)分解為一個(gè)個(gè)子任務(wù),各個(gè)擊破,取得了一批頗有成效的成果,如:探測(cè)數(shù)據(jù)規(guī)律子任務(wù)的BACON1-6、FAHRENHEIT、IDS,發(fā)現(xiàn)定性定律和概念的GLAUBER、STAHL、DALTON、AM,完成表征或解釋子任務(wù)的GELL-MANN、BR3-4、PAULI、MECHEM、ECHO,設(shè)計(jì)實(shí)驗(yàn)子任務(wù)并進(jìn)行理論修改的KEKADA、COAST,探測(cè)錯(cuò)誤并執(zhí)行修復(fù)任務(wù)的STAHLp、AbE、TRANSGENE,執(zhí)行類比任務(wù)的Drama、 ACME、Copycat、SME、LISA。[32]雖然MECHEM和PAULI等程序分別提出了新的化學(xué)反應(yīng)機(jī)理和量子力學(xué)解釋,但這些新發(fā)現(xiàn)在增長(zhǎng)人類知識(shí)方面的意義微乎其微,未引起學(xué)界重視。
近20年,MD和ASD(Autonomous Scientific Discovery自動(dòng)科學(xué)發(fā)現(xiàn))取得了一些新進(jìn)展。2009年4月,Science同時(shí)刊發(fā)了3篇自動(dòng)化科學(xué)發(fā)現(xiàn)方面的文章:Bruce Buchanan是第一個(gè)專家系統(tǒng)DENDRAL(1965年)的主要開發(fā)者,他撰寫的綜述從西蒙MD傳統(tǒng)出發(fā),描述當(dāng)前ASD的進(jìn)展及其長(zhǎng)遠(yuǎn)任務(wù)[33];兩篇最新研究中,一個(gè)在辨識(shí)何為重要的數(shù)據(jù)關(guān)系式方面提出了新穎的算法,通過此算法,沒有任何理論知識(shí)背景該系統(tǒng)就發(fā)現(xiàn)了真正重要的能夠表達(dá)自然定律的數(shù)學(xué)關(guān)系式,且比20世紀(jì)70—80年代BACON的發(fā)現(xiàn)在復(fù)雜度上有了很大進(jìn)展,能夠發(fā)現(xiàn) Hamiltonians、 Lagrangians表達(dá)式[34];另一個(gè)ASD系統(tǒng)能夠自動(dòng)對(duì)系統(tǒng)推導(dǎo)出的假說表達(dá)式進(jìn)行評(píng)估,并自動(dòng)決定下一步的實(shí)驗(yàn),完成一個(gè)完整的科學(xué)實(shí)驗(yàn)任務(wù)。[35]
最近兩年,關(guān)注AI模擬科學(xué)發(fā)現(xiàn)的兩個(gè)最新進(jìn)展皆使用了神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)模型:一個(gè)是Renato Renner小組,他們思考物理學(xué)家在建構(gòu)解釋模型時(shí)所使用的傳統(tǒng)方法是否能自然而然地出自實(shí)驗(yàn)數(shù)據(jù),而不依賴任何預(yù)先的數(shù)學(xué)和物理知識(shí),他們的ASD系統(tǒng)重新發(fā)現(xiàn)了經(jīng)典力學(xué)和量子力學(xué)中的一些重要概念,發(fā)表在新近的《物理評(píng)論快報(bào)》(Physical Review Letters)上[36];另一項(xiàng)工作則重新發(fā)現(xiàn)了量子波函數(shù)概念和薛定諤方程。[37]總體來說,上述MD以及ASD還沒有做出真正引起學(xué)界重視的新發(fā)現(xiàn)。不過,艾倫小組關(guān)于達(dá)爾文的HPS計(jì)算建模所得到的一些新證據(jù)和新解釋,除了發(fā)表在認(rèn)知領(lǐng)域頂級(jí)學(xué)術(shù)期刊上,也引起了公共媒體的關(guān)注,美國(guó)國(guó)家公共電臺(tái)(NPR)進(jìn)行了專門評(píng)述和報(bào)道。
本文討論主題模型在三大類哲學(xué)和人文知識(shí)領(lǐng)域的應(yīng)用,不論是中國(guó)古代哲學(xué)、科史哲,還是下面討論的文化哲學(xué),TM在人文領(lǐng)域的知識(shí)發(fā)現(xiàn)都是頗有潛力的。
三、與文化哲學(xué)有高度的親和性
(一)對(duì)孔、孟、荀哲學(xué)的建模
加拿大漢學(xué)家Edward Slingerland(森舸瀾)和美國(guó)哲學(xué)家Ryan Nichols合作(下文簡(jiǎn)稱SN團(tuán)隊(duì)),近幾年一直致力于結(jié)合機(jī)器學(xué)習(xí)研究中國(guó)古代文化。2018年,他們用TM遠(yuǎn)距離閱讀方法對(duì)《論語(yǔ)》《孟子》和《荀子》的內(nèi)容進(jìn)行比較[38],分別揭示了三部哲學(xué)論著中共同和不同的主題。他們的結(jié)果確證了許多學(xué)者一直以來采用傳統(tǒng)的直接細(xì)讀所得到的結(jié)論,即荀子的論著與《論語(yǔ)》在語(yǔ)義內(nèi)容上有共性。進(jìn)而,他們嘗試用TM方法探究頗有爭(zhēng)議的傳統(tǒng)哲學(xué)問題,如,在孔、孟、荀三位思想家中,孟子比荀子更接近孔子的思想嗎?這與道德哲學(xué)的一個(gè)核心問題密切相關(guān),即,人性中的善這種道德規(guī)范是先天的和內(nèi)在的,還是后天的和外在的?
《論語(yǔ)》的TM結(jié)果顯示了一個(gè)區(qū)別于《孟子》《荀子》的特點(diǎn),即,《論語(yǔ)》的高權(quán)重主題在內(nèi)容上與“三禮”的部分內(nèi)容相關(guān),經(jīng)過專家細(xì)讀,確認(rèn)是《論語(yǔ)》第十篇與“三禮”的內(nèi)容十分相似。這個(gè)計(jì)算結(jié)果是有意義的,因?yàn)門M作為無(wú)監(jiān)督方法,沒有預(yù)先給定它任何中國(guó)哲學(xué)知識(shí),它的計(jì)算結(jié)果與學(xué)界共識(shí)相一致證明TM用來分析中國(guó)哲學(xué)的適當(dāng)性。基于這個(gè)計(jì)算結(jié)果,SN進(jìn)一步探究,孔子對(duì)于神靈的態(tài)度究竟是理性的還是非理性的?對(duì)此問題有兩種意見,以馮友蘭為代表的一方認(rèn)為孔子是理性的,孔子很可能并不相信他的同時(shí)代人的迷信,而以Thomas Wilson為代表的一方認(rèn)為孔子對(duì)神靈有虔誠(chéng)的信仰。雙方都是采用傳統(tǒng)細(xì)讀原著的方法,也各有文本證據(jù),誰(shuí)也駁不倒誰(shuí)。采用TM計(jì)算分析,就為這樣的爭(zhēng)議給出了第三方證據(jù)。
SN認(rèn)為,TM計(jì)算結(jié)果提供了支持孟子持內(nèi)在美德論的證據(jù),即,人性中內(nèi)在地和先天地具有向善的潛能。同時(shí),計(jì)算結(jié)果支持了荀子比孔、孟更注重通過外在的制度手段實(shí)現(xiàn)社會(huì)控制的觀點(diǎn)。但SN認(rèn)為,不能因此就認(rèn)為孔、孟思想的近似度高于孔、荀思想的近似度,因?yàn)橛锌赡苁且驗(yàn)檐髯佑袨楣俚慕?jīng)歷,故而更有興趣討論管理機(jī)構(gòu)的細(xì)節(jié)如法律、懲治、官職等等。
根據(jù)《論語(yǔ)》和《荀子》共同高頻主題“禮”在《孟子》中出現(xiàn)頻率很低,可以支持《荀子》和《論語(yǔ)》之間更大的近似性,即都認(rèn)同通過學(xué)習(xí)、外在文化禮儀來成就規(guī)范價(jià)值,即外在美德論的共識(shí)。
為了使上述哲學(xué)問題的計(jì)算建模具有可重復(fù)性和可檢驗(yàn)性,王小紅和艾倫計(jì)算哲學(xué)組基于全新漢典TM平臺(tái),試圖重復(fù)SN組關(guān)于孔、孟、荀比較的研究結(jié)論,目前看來數(shù)據(jù)的差異性明顯高于一致性(4),進(jìn)一步的分析和解釋,還需更多工作。
(二)對(duì)中國(guó)哲學(xué)身-心關(guān)系的建模
2017年,SN采用TM結(jié)合其他算法技術(shù),分析引起西方諸多權(quán)威漢學(xué)家很大爭(zhēng)議的問題:中國(guó)傳統(tǒng)思想是不是以強(qiáng)身心整體論為特征的?[39]他們建立了一個(gè)包括前戰(zhàn)國(guó)時(shí)期至宋代的古籍文本語(yǔ)料庫(kù)。計(jì)算結(jié)果顯示,荀子以及其他中國(guó)早期思想家,在提到“心”時(shí)往往會(huì)提到“心”與身體的關(guān)系,這表明,比之身體的其他器官,“心”在早期中國(guó)思想中有著不同的認(rèn)知地位?;跈C(jī)器學(xué)習(xí)的三種計(jì)算分析結(jié)果,他們提出中國(guó)古代早期思想至少是一種弱二元論。
得益于我們可以非常便利地閱讀更多中國(guó)哲學(xué)最新研究文獻(xiàn),在深入分析SN的方法之后,我們發(fā)現(xiàn),他們用于計(jì)算分析的中國(guó)哲學(xué)基礎(chǔ)概念可能有問題,具體說就是用于表示“心-身”概念關(guān)系對(duì)中的“身”所對(duì)應(yīng)的古漢語(yǔ)詞。森舸瀾將“身”的表達(dá)對(duì)應(yīng)于三個(gè)詞:身、形、體?;谒詈竦臐h學(xué)修養(yǎng),這種意義表達(dá)的拆分頗有道理,但是將形、體的意義歸于單一的生理性的形和體,與中國(guó)哲學(xué)思想中的意義指涉并不完全符合。仔細(xì)閱讀中國(guó)哲學(xué)研究權(quán)威文獻(xiàn)可以看到,形、體同其他中國(guó)哲學(xué)核心詞如道、理、禮等一樣,有著豐富的和變化的含義,形、體不僅表示生理的形和體,還有超出生理的,甚至超驗(yàn)的意涵。[40]
(三)TM與文化研究中的意義理論
另一項(xiàng)有趣的漢學(xué)研究工作是哈佛大學(xué)Ian M. Miller對(duì)中國(guó)清代社會(huì)變亂實(shí)況的考察。[41]不同歷史時(shí)期反映社會(huì)實(shí)況的詞,如banditry、unrest、rebellion等,難以有固定的定義,史學(xué)家研究史料時(shí)不得不有先驗(yàn)的分類定義。Miller通過使用TM方法,對(duì)這一時(shí)期的奏折內(nèi)容實(shí)錄文本材料進(jìn)行主題建模,通過嘗試TM特有的語(yǔ)境解釋性算法,輔助史學(xué)文本分析,避免了范疇模糊的詞語(yǔ)對(duì)理解文意的干擾,比之傳統(tǒng)方法增強(qiáng)了客觀性,在此基礎(chǔ)上探究了清代出現(xiàn)的幾起大型變亂現(xiàn)象的規(guī)律性。
還有一項(xiàng)是研究TM技術(shù)與文化研究的高度親和,實(shí)際運(yùn)演了文化哲學(xué)和語(yǔ)言哲學(xué)的意涵。文化社會(huì)學(xué)研究者Paul Di Maggio 和Blei于2013年合作,[42]選取有代表性的報(bào)紙所刊登的公共藝術(shù)資助方面的新聞報(bào)道,用TM分析其中的演變趨勢(shì)。他們建立了一個(gè)近8000個(gè)文本、超過300萬(wàn)詞語(yǔ)的語(yǔ)料庫(kù),用TM分析識(shí)別出最重要的話題,正是這些話題框定了政府資助方面的討論。
這是一個(gè)文化學(xué)研究案例,該研究揭示了TM進(jìn)路對(duì)文化學(xué)研究的優(yōu)勢(shì),因?yàn)門M模型使得文化哲學(xué)、語(yǔ)言哲學(xué)中的重要概念如框架、一詞多義性、雜語(yǔ)性、意義的關(guān)系等具有了可操作性,具體表現(xiàn)在:第一,TM產(chǎn)生的具有可解釋性的主題內(nèi)容,展現(xiàn)了文化意義上的解釋框架。第二,TM基于一個(gè)詞出現(xiàn)的語(yǔ)境,具有抓取一詞多義性和一個(gè)詞模棱兩可的不同用法的能力。TM強(qiáng)調(diào)關(guān)系性,抓住了許多語(yǔ)言學(xué)學(xué)者的共識(shí),即,意義是在關(guān)系中顯現(xiàn)的,而非居留于一個(gè)個(gè)詞中。索緒爾認(rèn)為[43],意義并非內(nèi)在于符號(hào)中,符號(hào)的意義得自和它一同出現(xiàn)并相互作用的其他符號(hào)。結(jié)構(gòu)主義語(yǔ)言學(xué)的中心論點(diǎn)是:語(yǔ)言是一個(gè)系統(tǒng),在這個(gè)系統(tǒng)中,各個(gè)成分的功能和意義完全由它們?cè)谙到y(tǒng)中的相互關(guān)系來定義。這種關(guān)系式語(yǔ)義特性恰恰體現(xiàn)在主題模型LDA的算法中,按照LDA設(shè)計(jì)者Blei的話來說,就是體現(xiàn)在LDA的“基因”里。第三,文化學(xué)的核心洞見之一即文本的雜語(yǔ)性。文本往往并不只是反映某種單一的觀點(diǎn),而時(shí)常呈現(xiàn)雜語(yǔ)性特征,在一個(gè)文本中常見多個(gè)“聲音”(觀點(diǎn)或者表達(dá)類型)共存甚至不分強(qiáng)弱。Blei寫道:“LDA背后的基本直覺就是,文件都呈現(xiàn)多個(gè)主題。”[44]78這樣,LDA生成的結(jié)果,即每一篇文章中的多個(gè)主題結(jié)構(gòu),就有助于從實(shí)證層面檢視雜語(yǔ)性。
語(yǔ)言哲學(xué)探究“意義”的普遍、客觀性本質(zhì),從明示定義(包括直接明示、間接明示、直接內(nèi)在明示)到行為主義的操作定義,再到語(yǔ)義網(wǎng)絡(luò)定義,各種意義理論都在試圖接近“意義”的普遍性和客觀性。維特根斯坦的一個(gè)核心思想是,不要問意義,“要問使用”[45]80。維氏論證“意義”的初衷與行為主義傳統(tǒng)一致,皆反對(duì)標(biāo)準(zhǔn)語(yǔ)義理論中的感受質(zhì)、私人語(yǔ)言、意義唯我論。但維氏的結(jié)論不同,他認(rèn)為,理解一個(gè)詞,只需要這個(gè)詞帶來的心理感覺與別的現(xiàn)象之間的聯(lián)系,而別的現(xiàn)象并不需要是公共可觀察的,也可以是別的心理狀態(tài)。維氏論證的結(jié)論就是:一個(gè)詞的意義就在于它與別的詞所發(fā)生的系統(tǒng)性關(guān)聯(lián),沒有這些關(guān)聯(lián),則沒有該詞的意義??梢?,“意義”就是某件事物,它存在于詞與詞所構(gòu)成的情境之網(wǎng),在這個(gè)網(wǎng)中,詞與詞彼此通過那些包含這些詞的一般陳述相互關(guān)聯(lián)。
無(wú)獨(dú)有偶,丘奇蘭德也以自然科學(xué)理論中名詞術(shù)語(yǔ)為例,清晰地闡釋了語(yǔ)詞意義的網(wǎng)絡(luò)理論,即,一個(gè)個(gè)理論詞項(xiàng)的意義就隱含于它們所嵌入其中的原理之網(wǎng)。[46]53TM的計(jì)算結(jié)果呈現(xiàn)了詞的使用情境之網(wǎng),其背后的算法沒有包含人類閱讀者會(huì)有的個(gè)體體驗(yàn)、知識(shí)積累、文化背景,甚至情感情緒。TM生成的可重復(fù)、可檢驗(yàn)的“意義”之網(wǎng),有助于使意義理論走出唯我論的泥潭,為構(gòu)建更加一般性的意義理論帶來希望。普特南說:“意義就不在頭腦里?!盵47]464而我們可以這樣說:意義就在語(yǔ)詞使用情境的收斂特征里!
注釋:
(1)TM對(duì)“氣”之多重語(yǔ)義進(jìn)行了集簇聚類,我們結(jié)合細(xì)讀中國(guó)哲學(xué)相關(guān)文獻(xiàn)仔細(xì)檢視了TM計(jì)算結(jié)果的有效性和適當(dāng)性。
(2)按照“發(fā)現(xiàn)之友”哲學(xué)家的共識(shí),發(fā)現(xiàn)的邏輯是指關(guān)于產(chǎn)生知識(shí)的一套程式化的推理過程。
(3)認(rèn)知心理學(xué)對(duì)啟發(fā)式?jīng)Q策的研究從未停止。早期西蒙傳統(tǒng)主要從人的內(nèi)在認(rèn)知活動(dòng)如記憶、注意的研究出發(fā)來設(shè)計(jì)計(jì)算表征的啟發(fā)式規(guī)則,關(guān)注假想世界中的人工難題;當(dāng)前以Gerd Gigerenzer和Peter Todd為代表的生態(tài)理性進(jìn)路,則強(qiáng)調(diào)推理和決策成功的外部考量,探索啟發(fā)式規(guī)則與真實(shí)環(huán)境的適應(yīng)性擬合在計(jì)算機(jī)科學(xué)中的具體技術(shù)含義,也不再尋求對(duì)所有環(huán)境都普遍適用的策略,而探究在不同真實(shí)環(huán)境中具有良好適應(yīng)性、往往是“多快好省”式的簡(jiǎn)單多樣啟發(fā)式策略。
(4)SN文章使用的語(yǔ)料庫(kù)下載自ctext。2019年6月ctext創(chuàng)建者哈佛學(xué)者Donald Sturgeon應(yīng)實(shí)驗(yàn)室邀請(qǐng)來訪與我們一起工作,他給予我們完整的ctext語(yǔ)料庫(kù)。經(jīng)過比較,我們計(jì)算得出的孔孟荀語(yǔ)料庫(kù)權(quán)重最高十大主題與SN結(jié)果差異明顯。具體原因并不清楚,因?yàn)镾N文章沒有公布所有主題內(nèi)容,也沒有描述運(yùn)行TM的參數(shù)細(xì)節(jié),我們只能估計(jì)差異明顯的原因可能在于作為測(cè)度主題結(jié)構(gòu)相似度的基本單元的選取不同。另外,我們得出的十大主題更為全面地反映了語(yǔ)料庫(kù)涵蓋的內(nèi)容,而SN的十大主題明顯缺乏語(yǔ)料庫(kù)中的字書、兵家、占卜、醫(yī)書的內(nèi)容。當(dāng)然,只有SN公布所有的主題內(nèi)容,才可以要么確證要么推翻我們對(duì)SN下載語(yǔ)料庫(kù)缺漏內(nèi)容的懷疑。相比我們的十大主題,SN十大主題之間的意義相差不大,界限不夠清楚。
參考文獻(xiàn):
[1]Blei,D.M.,et al. Latent Dirichlet Allocation[J]. Journal of Machine Learning Research 3,2003,(1):993-1022.
[2]艾倫和王小紅計(jì)算哲學(xué)組.Topic Modeling the Han Dian Ancient Classics[DB/OL]. Journal of Cultural Analytics,2017,(10).https://doi.org/10.22148/16.016.
[3]王小紅,科林·艾倫,浦江淮,等.人文知識(shí)發(fā)現(xiàn)的計(jì)算機(jī)實(shí)現(xiàn)——對(duì)“漢典古籍”主題建模的實(shí)證分析[J].自然辯證法通訊,2018,(4):50-58.
[4]漢典古籍[DB/OL].http://www.zdic.net.
[5](KANRIPO)Kanseki Repository[DB/OL].http://www.kanripo.org.
[6]Sturgeon. D. Chinese Text Project[DB/OL].https://ctext.org.
[7]艾倫和王小紅計(jì)算哲學(xué)組.新漢典主題模型(New_Handian)[DB/OL].2019,http://inpho.xjtu.edu.cn/New_Handian2/200.
[33]Waltz. D, Buchanan. B. G. Automating Science[J].Science,2009,(3):43-44.
[34]Schmidt. M, Lipson. H. Distilling Free-Form Natural Laws from Experimental Data[J].Science,2009,(3):81-85.
[35]King. R. D,et al. The Automation of Science[J].Science,2009,(3):85-89.
[36]Renner. R研究組. Discovering Physical Concepts with Neural Networks[DB/OL].Physical Review Letters, 2020,(1).doi: 10.1103/PhysRevLett.124.010508.
[37]Wang. C. etc. Emergent Quantum Mechanics in an Introspective Machine Learning Architecture[J].Science Bulletin,2019,(17):1228-1233.
[38]Nichols. R, Slingerland. E, et al. Modeling the Contested Relationship between Analects,Mencius and Xunzi[J]. Journal of Asian Studies,2018,(1):19-57.
[39]Slingerland. E, Nichols. R, et al. The Distant? Reading of Religious Texts: A “Big Data”? Approach to Mind-Body Concepts in Early China[J].Journal of the American Academy of Religion,2017,(4):985-1016.
[40]貢華南.從“形與體之辯”到“體與理之辯”——中國(guó)古典哲學(xué)思想范式之嬗變歷程[J].中國(guó)社會(huì)科學(xué),2017,(4):128-148,208.
[41]Ian Matthew Miller. Rebellion,Crime and Violence in Qing China,1722-1911:A Topic Modeling Approach[J].Poetics,2013,(41):626-649.
[42]Dimaggio. P, Nag. M, Blei. D. Exploiting Affinities between Topic Modeling and the Sociological Perspective on Culture:Application to Newspaper Coverage of U.S. Government Arts Funding[J].Poetics,2013,(41):570-606.
[43]Saussure. F. Course in General Linguistics[M].La Salle:Open Court Press,1983.
[44]Blei. D. M. Probabilistic Topic Models[J].Communications of the ACM,2012,(4): 77-84.
[45]維特根斯坦.哲學(xué)研究[M].陳嘉映,譯.上海:上海世紀(jì)出版集團(tuán)、上海人民出版社,2002.
[46]Churchland. P. M. Matter and Consciousness:A Contemporary Introduction to the Philosophy of Mind[M]. Cambridge:The MIT Press,1994.
[47]普特南.“意義”的意義[C]//陳波,主編.邏輯與語(yǔ)言.北京:東方出版社,2005.
(責(zé)任編輯 吳 勇)