劉偉偉,吳澤鵬
(山西大學(xué)哲學(xué)社會學(xué)學(xué)院,山西太原030006)
大數(shù)據(jù)分析是近年來在信息技術(shù)革命下所產(chǎn)生的一種全新的科學(xué)研究方法。本質(zhì)上看,大數(shù)據(jù)分析依然是一種現(xiàn)代的統(tǒng)計方法,它的直接分析對象是數(shù)據(jù),通過數(shù)據(jù)的可視化輸出分析的直接結(jié)果——數(shù)據(jù)之間的關(guān)系結(jié)構(gòu),最終交給決策者進(jìn)行審視和判斷。自從圖靈獎得主吉姆·格雷將數(shù)據(jù)范式作為經(jīng)驗范式、理論范式、計算范式之后的第四種科學(xué)研究的方法范式后,[1]ix-xxiv與“大數(shù)據(jù)”相關(guān)的論題為當(dāng)下科學(xué)哲學(xué)的研究熱點,然而尚未有人嘗試為大數(shù)據(jù)分析這種科學(xué)研究方法在哲學(xué)層面上建立起一個可靠的理論支撐。眾所周知,語境論思想作為一種在當(dāng)代國內(nèi)外哲學(xué)研究中有前途的研究趨向,已經(jīng)得到了學(xué)界越來越多的認(rèn)可與支持,它所具有的融合科學(xué)理性與人文理性、實現(xiàn)語形-語義-語用三元關(guān)聯(lián)整體結(jié)構(gòu)的方法論優(yōu)勢為傳統(tǒng)哲學(xué)問題的求解提出了新的思路。筆者認(rèn)為,大數(shù)據(jù)分析方法所具有的方法論特征與語境論思想有諸多契合之處,本文希望結(jié)合語境論的觀點為大數(shù)據(jù)分析方法建立一個科學(xué)有效的思想基礎(chǔ)。
在語境論的視域下對大數(shù)據(jù)分析——作為一種科學(xué)研究方法的科學(xué)性和合理性進(jìn)行辯護(hù)——從數(shù)據(jù)的實在性這個本體論問題出發(fā)將是非常便利的,因為海量數(shù)據(jù)所描述的“數(shù)據(jù)世界”與哲學(xué)抽象意義上的“語境”之間可以建立起溝通的渠道。數(shù)據(jù)的實在性問題是與本體論的哲學(xué)范疇相關(guān)的,原因在于盡管當(dāng)代哲學(xué)試圖從“技術(shù)”操作的層面上回避傳統(tǒng)的哲學(xué)本體論糾纏,但“本體論”作為一種“信仰”仍然會潛移默化地滲透進(jìn)入哲學(xué)認(rèn)識論問題理解的不同層面中去,而對于數(shù)據(jù)實在性的追問恰恰契合了這一當(dāng)代哲學(xué)研究的典型思維特征——與之類似的是,語境論思想在某種程度上也為當(dāng)代哲學(xué)問題的求解提供了一種可供選擇的“本體論”基礎(chǔ)。顯然,這里的“本體論”意蘊(yùn)已經(jīng)與傳統(tǒng)的哲學(xué)本體論在形而上學(xué)的層面上形成了較為鮮明的差異,其核心思路就是使得“本體論”更加具體化、明確化和實證化,這樣才能夠為傳統(tǒng)哲學(xué)問題的求解開辟新的路徑。一般來說,如果一種理論描述的東西在一段時期內(nèi)是獨立于人的思想和理論而客觀存在的,我們就說它具有實在性。[2]7數(shù)據(jù)實在性的問題,則是從本體論上討論數(shù)據(jù)與客觀世界之間的關(guān)系問題。在小數(shù)據(jù)時代,數(shù)據(jù)是人對某種孤立事件的簡單描述,數(shù)據(jù)與其所描述事件的對應(yīng)關(guān)系是單一而不變的,因而沒有必要進(jìn)一步討論其實在性的需要。在大數(shù)據(jù)時代下,海量數(shù)據(jù)的出現(xiàn)使得人們理解的“數(shù)據(jù)”不再簡單地對應(yīng)于某個特殊事件,全樣本模式下的數(shù)據(jù)集合“同構(gòu)”于客觀世界而形成了一個具有整體性特征的“數(shù)據(jù)世界”。從語境論的角度來看,對于海量數(shù)據(jù)集合的分析即大數(shù)據(jù)分析,本質(zhì)上這是一種將事物置于語境中去認(rèn)識客觀世界實在的有效手段。具體來說,數(shù)據(jù)容量的變化達(dá)到了一定的“度”而產(chǎn)生了一種質(zhì)變,數(shù)據(jù)不再僅僅是一種對于事物簡單的描述,而是變成了對研究對象的多角度描述,所涉及的是研究對象所在的整體語境,這種語境包含了許多過去無法直接量化的影響因素,例如歷史因素、心理因素、社會文化因素、經(jīng)濟(jì)因素等非理性因素。海量數(shù)據(jù)對整體語境的描述使得在以大數(shù)據(jù)分析為工具的認(rèn)知手段中,雖然以數(shù)據(jù)為直接的認(rèn)知對象,但是最終的認(rèn)知對象則是事物所在的整體語境及其背后隱藏的客觀世界。而且,數(shù)據(jù)的實在性可以借助于客觀世界的客觀性和語境的本體性來獲得解釋:數(shù)據(jù)來源于客觀世界,數(shù)據(jù)的客觀性可以通過數(shù)據(jù)的真實有效性獲得保障;從本體論的層面上看,語境對意義而言有著約定性和規(guī)定性的作用,即結(jié)合時間、空間和其他的一切可觀測和不可觀測的語境成分確定此語境下的特定意義,[2]252而海量數(shù)據(jù)對研究事物和研究問題所在的整體語境進(jìn)行描述的同時,也是在語境的約定性和規(guī)范性作用下對客觀世界的有機(jī)表征。
那么,如何理解海量數(shù)據(jù)是對客觀世界的有機(jī)表征呢?首先要明確的是,通過龐大的數(shù)據(jù)向我們呈現(xiàn)出來的“數(shù)據(jù)世界”并不是對客觀世界的直接復(fù)制,而是被建構(gòu)出來的一個由數(shù)據(jù)組成的理論實體。[3]任何具有實在性的存在都是在相互關(guān)聯(lián)中被表達(dá)的,語境論提倡在整個語境關(guān)系網(wǎng)中去理解實體。在進(jìn)行大數(shù)據(jù)分析時,不論是數(shù)據(jù)的收集還是數(shù)據(jù)的分析處理都關(guān)聯(lián)于當(dāng)前人類的科學(xué)語境和技術(shù)語境,數(shù)據(jù)在被收集和分析時會參與到人與客觀世界的互動中。原因在于,數(shù)據(jù)的收集能力被人類的科學(xué)語境和技術(shù)語境所限制,超語境即超過人類當(dāng)前認(rèn)識能力的數(shù)據(jù)都無法被人類設(shè)計的接受器收集到,只有在人類認(rèn)識能力提升的基礎(chǔ)上才會提升其數(shù)據(jù)收集的能力;但是對已知數(shù)據(jù)的分析又有可能進(jìn)一步提升人的認(rèn)識能力進(jìn)而提升收集數(shù)據(jù)的能力,從而形成一種良性循環(huán)。對于已經(jīng)收集到的數(shù)據(jù),在接下來的數(shù)據(jù)處理中人們將發(fā)現(xiàn)數(shù)據(jù)與數(shù)據(jù)之間的相互關(guān)聯(lián),也就是數(shù)據(jù)的結(jié)構(gòu)。數(shù)據(jù)的結(jié)構(gòu)同時也是分析數(shù)據(jù)得到的結(jié)果,發(fā)現(xiàn)數(shù)據(jù)結(jié)構(gòu)的過程也只能是在現(xiàn)有科學(xué)的理論體系和技術(shù)應(yīng)用能力范圍內(nèi)所展開的計算和分析,同樣不會超出科學(xué)語境與技術(shù)語境的限制。同理,人的認(rèn)識能力的提升會提升現(xiàn)有科學(xué)的理論體系和技術(shù)應(yīng)用能力范圍,使得我們可以在對同樣的數(shù)據(jù)進(jìn)行分析時得到更多的數(shù)據(jù)結(jié)構(gòu),掌握新的知識??梢哉f,通過海量數(shù)據(jù)所建構(gòu)出來的“數(shù)據(jù)世界”,是以科學(xué)語境和技術(shù)語境所提供的框架為基礎(chǔ)的,大數(shù)據(jù)分析通過解析數(shù)據(jù)結(jié)構(gòu)而反饋給人的認(rèn)知結(jié)果,是被分析的數(shù)據(jù)在與人類的科學(xué)語境和技術(shù)語境互動時產(chǎn)生的。
當(dāng)然,數(shù)據(jù)的結(jié)構(gòu)不僅僅取決于科學(xué)語境和技術(shù)語境的規(guī)定性,數(shù)據(jù)結(jié)構(gòu)是海量數(shù)據(jù)與包括科學(xué)語境、技術(shù)語境、歷史語境、社會語境、認(rèn)知語境等等多個維度語境組成的整體語境互動得到的結(jié)果。在這個語境系統(tǒng)中,不僅包含了可以用科學(xué)理性解釋的因素,也包含了過去無法進(jìn)行量化計算的非理性因素,而數(shù)據(jù)的結(jié)構(gòu)更像是被協(xié)商約定好了的。被分析對象所在的整體語境會產(chǎn)生規(guī)定性和約定性作用,這使得被收集到的數(shù)據(jù)不再簡單地對應(yīng)著某物,還具有了同構(gòu)于整體語境系統(tǒng)的實在性。
在使用大數(shù)據(jù)分析作為工具的認(rèn)知過程中,分析的直接對象是數(shù)據(jù)和數(shù)據(jù)中的結(jié)構(gòu),而借助數(shù)據(jù)實在性所“具現(xiàn)化”出來的則是研究問題背后的整體語境,這使得探究問題背后的整體語境成為了大數(shù)據(jù)分析的本質(zhì)對象。大數(shù)據(jù)分析對象的語境化,完美契合了語境論者試圖將事物放到整體語境中去理解和分析問題的主張。那么,什么是數(shù)據(jù)的“具現(xiàn)化”呢?在全數(shù)據(jù)分析模式下,富有多樣性且被規(guī)定了結(jié)構(gòu)的數(shù)據(jù)集合正是對所研究事件的多角度描述,這種描述將語境這種理論實在得以“具現(xiàn)”,即把事件背后具有不可計算性和不可還原性的整體語境,通過數(shù)據(jù)的形式以一種可以被量化的姿態(tài)展現(xiàn)出來,這使得事件背后的整體語境可以依靠大數(shù)據(jù)分析的結(jié)果被量化計算而進(jìn)一步被人認(rèn)知。當(dāng)然,這種可量化和可計算性并不是說我們可以把語境像數(shù)學(xué)和物理學(xué)那樣進(jìn)行類公式化的運算,具體對某個語境影響因素的還原分析還是無法通過大數(shù)據(jù)分析而得到實現(xiàn)。通過大數(shù)據(jù)分析所能夠做到的,只是將整體語境變化對客觀事物的影響程度以概率值變化的形式整體地呈現(xiàn)出來。
大數(shù)據(jù)分析對象的語境化迎合了語境論思想的理論主張,也就意味著我們可以將大數(shù)據(jù)分析看作是抽象的語境分析法在具體的科學(xué)研究中的一種實踐。那么這對大數(shù)據(jù)分析這種科學(xué)方法來說,又有何意義呢?數(shù)據(jù)的實在性預(yù)設(shè),解決的是數(shù)據(jù)與客觀世界之間的關(guān)系問題,而把分析對象語境化則意味著我們能夠借助語境概念解釋大數(shù)據(jù)知識與數(shù)據(jù)和客觀世界之間的關(guān)系問題。歸根到底,人們使用大數(shù)據(jù)分析的目的就是要通過對數(shù)據(jù)的分析實現(xiàn)對客觀世界的理解和認(rèn)知。在大數(shù)據(jù)分析對象的語境化詮釋過程中,雖然大數(shù)據(jù)分析的直接對象是收集到的數(shù)據(jù),但是數(shù)據(jù)的集合同構(gòu)于研究問題和認(rèn)知活動所在的整體語境,這使得最終的認(rèn)知對象變成了以研究問題為中心的整體語境,認(rèn)知結(jié)果所得到的知識則是對數(shù)據(jù)結(jié)構(gòu)或者說是語境關(guān)系網(wǎng)的一種表征。在語境論的視閾中,大數(shù)據(jù)分析以數(shù)據(jù)的實在性為基礎(chǔ),建構(gòu)了數(shù)據(jù)、客觀世界和語境三者之間關(guān)聯(lián)互動的系統(tǒng)機(jī)制,這樣就從本體論角度為大數(shù)據(jù)分析這種科學(xué)方法的合理性做出了辯護(hù),同時也為接下來對大數(shù)據(jù)知識的論證提供了理論前提。
大數(shù)據(jù)分析作為一種研究方法和科學(xué)工具,要想完成人類拓展認(rèn)知范圍和強(qiáng)化知識生產(chǎn)效率的目的,其中必然要有認(rèn)知主體的介入,而任何一種認(rèn)知過程也都離不開主體和客體的相互作用,同時主體也是將各種潛在的語境要素聯(lián)結(jié)為一個完整語境系統(tǒng)的關(guān)鍵成分。因此,在繼續(xù)論證如何使用大數(shù)據(jù)分析生產(chǎn)知識之前,討論一下大數(shù)據(jù)分析的認(rèn)知主體是必要的。上文對數(shù)據(jù)與客觀世界之間關(guān)系的討論中,已經(jīng)提到數(shù)據(jù)的產(chǎn)生離不開人的參與,數(shù)據(jù)反映的特征并不是完全由客體強(qiáng)加的,還來自于認(rèn)知主體的主動性選擇和功能建構(gòu)。[4]更進(jìn)一步說,數(shù)據(jù)的客觀性問題是相對于人的主觀性而提出的,數(shù)據(jù)實在也是建立在人類思想和理論上的理論實體。[3]不同于小數(shù)據(jù)時代,數(shù)據(jù)的收集和分析都是由人直接完成,在使用大數(shù)據(jù)分析作為研究工具時,認(rèn)知主體不再是僅僅由幾個人或者幾個具有近似觀點的研究團(tuán)體組成,計算機(jī)和其他社會因素的介入使得大數(shù)據(jù)分析的認(rèn)知主體呈現(xiàn)出復(fù)雜性和多元性,因此我們需要從主體語境的構(gòu)成狀況來解釋大數(shù)據(jù)分析的主體語境轉(zhuǎn)換。
具體來看,在以大數(shù)據(jù)分析為工具所展開的認(rèn)知活動中,認(rèn)知的主體語境能夠劃分為三個層面:(1)進(jìn)行大數(shù)據(jù)分析時,直接的認(rèn)知主體主要是進(jìn)行數(shù)據(jù)挖掘和數(shù)據(jù)分析的計算機(jī)和人工智能。計算機(jī)只能嚴(yán)格運行一道道程序代碼,目前還在發(fā)展的人工智能依然不具備人的能動性和主體性。之所以把它們視為主體語境的一部分,是因為計算機(jī)不僅僅作為一種工具替代人完成了很多過去只有人才能完成的任務(wù),而分析數(shù)據(jù)的過程更是人結(jié)合客觀世界中研究問題所在的整體語境,同時使用計算機(jī)和人工智能作為工具建構(gòu)數(shù)據(jù)結(jié)構(gòu)的過程,在這個過程中計算機(jī)和人工智能的功能代表了人的認(rèn)識能力。(2)真正的認(rèn)知主體是操作計算機(jī)和編寫算法的人。他們在操作計算機(jī)和編寫算法的時候,不僅將人的認(rèn)識能力寫入計算機(jī)程序中,也將人的主體性和能動性內(nèi)在于分析過程之中,是大數(shù)據(jù)分析中主體語境的核心層面。(3)社會語境因素組成主體語境的外在層面,它對整個認(rèn)知活動起著不可或缺的推動作用。科學(xué)家的求知訴求、政府的政策支持、企業(yè)的利益驅(qū)動、民眾的普遍關(guān)注等等,將推動力作用到操作計算機(jī)和編寫算法的人身上,進(jìn)而影響著整個分析過程,推動著相關(guān)技術(shù)的發(fā)展和人類認(rèn)識能力的進(jìn)步。[5]進(jìn)一步來看,海量數(shù)據(jù)的快速產(chǎn)生和實時收集流動促使認(rèn)知主體語境的這三個層面緊密結(jié)合且積極互動:分析大量數(shù)據(jù)所產(chǎn)生的知識反饋到數(shù)據(jù)分析者和整個社會語境中,人類由此獲得的認(rèn)識能力進(jìn)步加上由新知識產(chǎn)生的社會推動力,促使我們獲得更多的數(shù)據(jù)進(jìn)而產(chǎn)生新的大數(shù)據(jù)知識,在這三個層面的緊密結(jié)合和積極互動中,形成了一個完整的主體語境,從而為人類全新維度的認(rèn)知過程展開奠定了基礎(chǔ)。
顯而易見的是,相對于小數(shù)據(jù)時代的研究方法,在大數(shù)據(jù)分析的認(rèn)知活動中,主體語境的內(nèi)容大大增加了,這使得在認(rèn)知活動中主體性的表達(dá)受到了更多內(nèi)在的約束;而且,在全數(shù)據(jù)分析模式下,認(rèn)知主體的活動也會被采集數(shù)據(jù),進(jìn)入作為本質(zhì)認(rèn)知對象的整體語境中成為被認(rèn)知的對象。隨著人的主體性表達(dá)受到約束以及主客體之間不斷發(fā)生角色交互,在以大數(shù)據(jù)分析為手段的認(rèn)知活動中,主體語境中的“主體性”作用得到了一定程度的削弱,認(rèn)知結(jié)果的客觀性隨著主體性的這種削弱得到了加強(qiáng)。具體來看,大數(shù)據(jù)分析過程中認(rèn)知主體與客體之間的互動,使得人的目的和實踐貫穿于整個認(rèn)知過程,主體語境中預(yù)設(shè)的理論基礎(chǔ)和前提不再刻板地制約人的認(rèn)識能力,避免了主體偏見對認(rèn)知結(jié)果可能產(chǎn)生的影響,進(jìn)而形成“唯我論式”的主觀臆想。這種主體性被削弱的特質(zhì)在科學(xué)理論變得越來越抽象和超經(jīng)驗的今天將變得難能可貴。[6]語境論思想從語用思維的效用性追求出發(fā),高度認(rèn)同這種強(qiáng)調(diào)實踐的認(rèn)知模式。在這種模式下,人們從認(rèn)識的結(jié)果而不是原因方面來考察產(chǎn)生的知識,突出強(qiáng)調(diào)生活實踐中經(jīng)驗的地位。[2]360-361具體到大數(shù)據(jù)分析的過程中,從最開始的數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理和存儲、數(shù)據(jù)計算和分析,以及最后分析結(jié)果的可視化和人對分析結(jié)果的審查,都包含著主體語境中以發(fā)現(xiàn)問題和解決問題為優(yōu)先的考慮,以及強(qiáng)調(diào)實踐性和突出效用性的思維邏輯。從方法論上看,人們在使用大數(shù)據(jù)分析時所遵循的容錯思維和相關(guān)思維,也可以結(jié)合主體語境的這種效用性追求而得到解釋:容錯思維拋棄過去科學(xué)研究中認(rèn)知主體所追求的絕對精確性,實則是主體語境轉(zhuǎn)變后的認(rèn)知主體為了能夠生產(chǎn)出相應(yīng)的知識,結(jié)合實踐中數(shù)據(jù)錯誤可能性和分析可行性的實際考慮,利用數(shù)據(jù)的龐大數(shù)量來淡化其中少量數(shù)據(jù)錯誤造成的影響,進(jìn)而得到合格可用但并非絕對精確的分析結(jié)果;相關(guān)性思維一改傳統(tǒng)認(rèn)識論尋求因果性解釋的態(tài)度,從數(shù)據(jù)之間的關(guān)聯(lián)性得到的大數(shù)據(jù)知識,亦是主體語境為了更經(jīng)濟(jì)地發(fā)現(xiàn)和解決問題而放寬了對知識普遍性的要求。
總之,在以大數(shù)據(jù)分析為手段的認(rèn)知過程中,認(rèn)知的主體語境轉(zhuǎn)換表現(xiàn)為由計算機(jī)、操縱者和社會因素三個層面所組成的緊密結(jié)合且互相促進(jìn)的一個有機(jī)系統(tǒng),再加上主體語境的組成部分也會成為被分析的對象而作為認(rèn)知的客體,大數(shù)據(jù)分析的主客體之間存在了互動,最終使得認(rèn)知過程中主體語境的主體性受到削弱,人的目的和實踐也隨著這種主客互動貫穿了整個認(rèn)知過程。
大數(shù)據(jù)分析作為一種科學(xué)研究方法,使用它進(jìn)行分析的目的必然是輸出知識。大數(shù)據(jù)知識是通過對海量數(shù)據(jù)的收集儲存、挖掘分析、可視化輸出來反映數(shù)據(jù)之間存在的概率關(guān)系,進(jìn)而反映客觀事物背后語境關(guān)系的一種知識。然而,大數(shù)據(jù)知識是否具有作為現(xiàn)代科學(xué)知識的合理性,或者說大數(shù)據(jù)知識在什么樣的語境下能夠具有合理性,還需要進(jìn)一步討論。
在認(rèn)識論的層面上討論大數(shù)據(jù)知識的構(gòu)成是十分必要的。上文中已經(jīng)論證了大數(shù)據(jù)分析的過程,數(shù)據(jù)實在性的本體論論證和主體語境轉(zhuǎn)換,海量數(shù)據(jù)對事物的多角度描述實質(zhì)上在“數(shù)據(jù)世界”中“具現(xiàn)”了研究事物所在的整體語境,對數(shù)據(jù)的分析也就變成了分析客觀世界中事物所在的整體語境,而認(rèn)知主體與客體的互動使得主體語境也進(jìn)入到整體語境中被認(rèn)知,進(jìn)而成為大數(shù)據(jù)知識的來源之一。從發(fā)生學(xué)的角度來看,由于將研究問題所在的整體語境作為廣義上的認(rèn)知對象,大數(shù)據(jù)知識內(nèi)含了人的主觀能動性和數(shù)據(jù)實在性帶來的客觀性,是認(rèn)識論意義上的“合格”知識。首先,使用大數(shù)據(jù)分析時雖然看似在漫無目的地收集和分析著大量數(shù)據(jù),但是分析得到的所有大數(shù)據(jù)知識都來自主體語境帶來的實踐要求,被人的目的性和社會因素帶來的影響推動著。其次,所有的被分析數(shù)據(jù)都來自客觀世界,它們的集合在“數(shù)據(jù)世界”“具現(xiàn)”為一種理論式和概率化的整體語境,因而分析得到的大數(shù)據(jù)知識也是對客觀世界中語境關(guān)系的表征,其客觀性由數(shù)據(jù)的真實性來加以保障。最后,數(shù)據(jù)之間的結(jié)構(gòu)和概率關(guān)系,一方面來自客觀世界,另一方面也是在主體語境與客體語境的不斷互動中被規(guī)范和約定得到的,分析和總結(jié)數(shù)據(jù)之間的結(jié)構(gòu)與概率關(guān)系得到的大數(shù)據(jù)知識同樣離不開主體語境與客體語境之間的互動。這種互動意味著大數(shù)據(jù)知識不再符合基礎(chǔ)主義和融貫主義所堅持的普遍主義知識觀,而走向一種語境主義知識觀:大數(shù)據(jù)知識不需要建立一個可靠的基礎(chǔ),因為它的“基礎(chǔ)”是一直在變動和層次遞進(jìn)的語境;大數(shù)據(jù)知識也不需要一種邏輯自洽的辯護(hù),因為它是從結(jié)果和實踐出發(fā)得到的知識,在它之中包含了許多不可邏輯化、非理性化的修辭性語境因素。最重要的一點是,由主客互動得到的大數(shù)據(jù)知識,也在認(rèn)識論的層面上超越了知識外在論和知識內(nèi)在論在知識確證問題上的狹隘辯護(hù),為此我們需要從語境主義知識觀的角度,結(jié)合具體的語境進(jìn)行解釋學(xué)和修辭學(xué)性質(zhì)的分析,來討論大數(shù)據(jù)知識的合理性。[7]
大數(shù)據(jù)知識的形式是使用統(tǒng)計概率表示事件與事件相關(guān)程度的數(shù)據(jù)之間的結(jié)構(gòu),也是在海量數(shù)據(jù)所表征的語境中某一事件發(fā)生的可能性,再結(jié)合人的理性思維來展開具體的預(yù)測和判斷。舍恩伯格也指出,“大數(shù)據(jù)的核心是預(yù)測,而此預(yù)測是基于相關(guān)關(guān)系分析法基礎(chǔ)上的”。[8]75可是,概率形式的知識與傳統(tǒng)認(rèn)識論尋求確定的解釋且執(zhí)著于拉普拉斯式的決定論因果關(guān)系不同,相關(guān)關(guān)系無法實現(xiàn)精確的認(rèn)識目標(biāo),從這個意義上說大數(shù)據(jù)知識具有反認(rèn)識論特征。那么,大數(shù)據(jù)分析得到的相關(guān)關(guān)系是否與因果關(guān)系有著內(nèi)在的聯(lián)系呢,能否用語境論的知識觀為大數(shù)據(jù)知識提供一種認(rèn)識論上的保證?齊磊磊將相關(guān)關(guān)系細(xì)分為(決定論)因果、統(tǒng)計因果與非因果關(guān)系,而統(tǒng)計因果,也就是最簡單的理想相關(guān)關(guān)系,是協(xié)調(diào)科學(xué)哲學(xué)的方法論與大數(shù)據(jù)方法論的中間橋梁,他認(rèn)為相關(guān)關(guān)系內(nèi)在地包含了確定性的因果關(guān)系,確定性的因果關(guān)系必定是相關(guān)關(guān)系。[9]將原因與結(jié)果置于整個語境中去考察其中的聯(lián)結(jié)關(guān)系,也能得出類似的結(jié)論??梢哉f,語境論視域下的因果性是一種由科學(xué)、社會、歷史、文化等因素組成的整體語境決定的性質(zhì),而隨著認(rèn)識的進(jìn)步和認(rèn)識語境的逐層遞進(jìn),因果性也可能會發(fā)生改變。我們可以把相關(guān)關(guān)系理解為在語境關(guān)系網(wǎng)中不同事物之間的相互聯(lián)系,這個聯(lián)系中內(nèi)在的因果性尚不能在當(dāng)前的認(rèn)識條件下被挖掘出來。例如早期的量子論先驅(qū)們建立了哥本哈根詮釋,聲稱量子躍遷是瞬時、隨機(jī)且不可觀測的,而在經(jīng)過幾十年的科學(xué)理論進(jìn)步和觀測技術(shù)發(fā)展遞進(jìn)到新的科學(xué)語境層次后,耶魯大學(xué)的研究人員在一次實驗中捕捉到了量子躍遷循序漸進(jìn)的過程,(1)證實了薛定諤和愛因斯坦基于自然因果性的推測。反觀大數(shù)據(jù)分析方法,它在某種意義上類似基于哥本哈根詮釋所建立的數(shù)學(xué)模型,這一模型使得人們能夠跳出傳統(tǒng)認(rèn)識論的嚴(yán)格要求,基于當(dāng)前科學(xué)語境間接地去使用統(tǒng)計結(jié)果中內(nèi)在的因果性。從這個意義上說,大數(shù)據(jù)分析得到的相關(guān)關(guān)系中隱藏著尚未被認(rèn)識的因果關(guān)系,大數(shù)據(jù)知識是超前于它自身所在語境的一種知識。
那么,大數(shù)據(jù)知識是由什么樣的相關(guān)關(guān)系構(gòu)成的?相關(guān)關(guān)系又是如何在某個特定層次的語境中運作的呢?這里先分析一下最簡單的理想相關(guān)關(guān)系,即一個原因?qū)?yīng)一個結(jié)果,這個原因在很大程度上是由包含所有可能的影響因素在內(nèi)的整體語境提供的。相關(guān)關(guān)系并不是一個拉普拉斯式的決定論,原因?qū)?yīng)的結(jié)果,即是在這個整體語境下出現(xiàn)特定結(jié)果,它的概率不是1,而是在0 到1 之間的一個數(shù)值。于是,這種最理想的相關(guān)關(guān)系就可以被表示為,在考慮所有影響因素下的整體語境中出現(xiàn)特定結(jié)果的概率。如果是在這種理想的相關(guān)關(guān)系下,那么在使用大數(shù)據(jù)分析時,全體數(shù)據(jù)代替了傳統(tǒng)的隨機(jī)樣本統(tǒng)計,將所有發(fā)生特定結(jié)果的數(shù)據(jù)收集后,整體語境中出現(xiàn)特定結(jié)果的概率在數(shù)值上就等于全體數(shù)據(jù)中出現(xiàn)特定結(jié)果的真實百分比,人們根據(jù)此百分比值對未來事件的發(fā)生進(jìn)行預(yù)測和判斷即能得到大數(shù)據(jù)知識。然而,在使用大數(shù)據(jù)分析進(jìn)行實際操作時,對事件與事件之間相關(guān)關(guān)系的分析并不是那么容易,這主要是溯因困難所導(dǎo)致的:(2)一方面,因為研究問題所在整體語境中與發(fā)生特定結(jié)果具有相關(guān)性的原因往往不止一個,而且原因與原因之間也可能會有相互作用,所以在實際研究中原因與結(jié)果之間不可能保持一種簡單的線性關(guān)系;另一方面,從海量數(shù)據(jù)表征的“客觀世界”中找到所有與結(jié)果相關(guān)的原因并對其進(jìn)行量化分析和計算,這在實際操作中也不具備可行性。基于這種考慮,舍恩伯格提議使用更簡單更容易數(shù)據(jù)化的關(guān)聯(lián)物來繞開原因,直接對結(jié)果進(jìn)行分析。[8]67這里舉一個實際的例子來說明,在分析汽車發(fā)動機(jī)是否有可能發(fā)生故障時,這個問題所在整體語境中可能導(dǎo)致發(fā)動機(jī)故障的原因有發(fā)動機(jī)出廠時沒有被發(fā)現(xiàn)的產(chǎn)品瑕疵、發(fā)動機(jī)的工作環(huán)境、駕駛習(xí)慣、路況、機(jī)械疲勞累積等等方面,這些原因要么難以在故障發(fā)生前進(jìn)行分析,要么只能使用描述性的語言概括而無法對其進(jìn)行量化分析。如果將發(fā)動機(jī)工作時的噪聲、機(jī)械振動頻率、行駛總里程作為關(guān)聯(lián)物而將它們的數(shù)據(jù)收集起來,那么統(tǒng)計上述關(guān)聯(lián)物與發(fā)動機(jī)故障的相關(guān)概率依然可以用來預(yù)測故障的可能性,可是對這些關(guān)聯(lián)物的數(shù)據(jù)采集和分析就要容易得多了。正是因為如此,關(guān)聯(lián)物與結(jié)果之間的相關(guān)關(guān)系才是大數(shù)據(jù)分析在實際操作中得到的分析結(jié)果,大數(shù)據(jù)知識也同樣是人們根據(jù)這種關(guān)聯(lián)物與結(jié)果的相關(guān)關(guān)系對未來進(jìn)行預(yù)測和判斷得到的。
雖然原因與關(guān)聯(lián)物之間、關(guān)聯(lián)物與分析結(jié)果之間都具有一定的相關(guān)關(guān)系,但是關(guān)聯(lián)物與分析結(jié)果之間并不具有直接的必然聯(lián)系,在這之中還有諸多具有不確定性的偶然可能,這使得大數(shù)據(jù)分析的結(jié)果無法具備解釋和說明的作用。因而,大數(shù)據(jù)知識具有強(qiáng)烈的語境依賴性,一旦脫離大數(shù)據(jù)分析時對應(yīng)的整體語境,大數(shù)據(jù)知識便不再具有廣義知識概念蘊(yùn)含的一般性特征。[10]大數(shù)據(jù)知識的語境依賴性在理論層面上是無法避免的,某一次分析結(jié)果的概率數(shù)值無疑對應(yīng)著在靜態(tài)的“數(shù)據(jù)世界”中這個事件發(fā)生的可能性;但是,在現(xiàn)實世界中,事件所在的整體語境是實時變化的,事實發(fā)生的可能性也不可能是一個固定值,這是統(tǒng)計過去與預(yù)測未來之間無法逾越的鴻溝,也是大數(shù)據(jù)知識無法進(jìn)行因果性解釋的最大缺陷。不過,預(yù)測結(jié)果與真實結(jié)果之間的誤差絕對值,無疑相關(guān)于分析對象所在整體語境的變動速率,而實際操作中對同一事件的實時動態(tài)分析和對分析結(jié)果的二次甚至多次分析也能繼續(xù)提高預(yù)測的精確性。況且,這種語境依賴性無法削弱或否定大數(shù)據(jù)知識在認(rèn)識方面和實踐方面的價值,大數(shù)據(jù)知識是從認(rèn)知主體的效用性出發(fā)的,而得到解釋性和因果性的科學(xué)說明始終不是大數(shù)據(jù)分析這種研究方法的必要選擇,能夠通過分析結(jié)果得到該怎么去做的建議就足夠了。拋棄舊認(rèn)識論下無視人類認(rèn)知語境變化的普遍主義知識論,從而經(jīng)濟(jì)又有效地解決問題才是大數(shù)據(jù)知識的價值和大數(shù)據(jù)分析的目的所在。
使用語境論思想為大數(shù)據(jù)分析的科學(xué)性做系統(tǒng)的理論辯護(hù),能夠在本體論和認(rèn)識論層面為大數(shù)據(jù)分析方法提供哲學(xué)高度的理論支持;另一方面,我們用符合現(xiàn)當(dāng)代科學(xué)發(fā)展的世界觀——語境論思想——解釋和審視這種研究方法,也就在某種程度上確保大數(shù)據(jù)分析能真正成為科學(xué)研究的有力工具。本文通過語境概念預(yù)設(shè)數(shù)據(jù)的實在性來解決數(shù)據(jù)與客觀世界之間的關(guān)系問題,然后解釋大數(shù)據(jù)分析的主體語境并闡明這個主體在整個認(rèn)知過程中的特殊作用,最后使用語境主義知識觀論證大數(shù)據(jù)知識的合理性,由此大數(shù)據(jù)分析方法的合理性便能夠獲得來自語境論思想的有力保障——這不僅有利于深化人們對大數(shù)據(jù)分析方法的理解,促進(jìn)這種研究方法在未來的長遠(yuǎn)科學(xué)發(fā)展,同時也從科學(xué)實踐和科學(xué)應(yīng)用上豐富了當(dāng)代科學(xué)哲學(xué)的基本內(nèi)涵。
注釋
(1)詳見耶魯大學(xué)于2019 年發(fā)表在Nature 上的To Catch And Reverse A Quantum Jump Mid-Flight,該研究聲稱耶魯大學(xué)的實驗人員成功捕捉到了躍遷中的量子系統(tǒng),這表明我們能夠計算出量子躍遷在某個時間發(fā)生的概率,而不是像波爾和海森堡所認(rèn)為的那樣,量子躍遷是一個完全隨機(jī)和瞬時發(fā)生的過程。
(2)有觀點認(rèn)為大數(shù)據(jù)分析方法是實現(xiàn)溯因推理的有效工具。雖然我們可以從大數(shù)據(jù)知識逆推發(fā)現(xiàn)影響結(jié)果的原因,但是這種溯因推理的出發(fā)點是已經(jīng)完成分析得到的大數(shù)據(jù)知識,而且這是由人歸納得到。所以這與此處大數(shù)據(jù)分析過程中的溯因困難并不矛盾。