大數(shù)據(jù)因其巨大的數(shù)據(jù)庫存(在量上正趨向于全體數(shù)據(jù))使得量化研究方法不再完全依賴于過去傳統(tǒng)的抽樣、假設檢驗,并為其研究的目的和內(nèi)容提供了前所未有的便利。由此,大數(shù)據(jù)社會學研究應運而生。至此,量化研究在一些(暫且稱之為)定量極端主義論者的鼓吹下逐漸占據(jù)了社會科學方法論領域的“霸權(quán)”地位;而與人文主義、建構(gòu)主義相關聯(lián)的理論研究、定性研究則逐步落入學科的“邊緣化”處境。因而,本文的寫作目的在于兩方面:其一,從人類社會生活意義的視角對大數(shù)據(jù)時代下的方法學轉(zhuǎn)向(以新計算社會學為主要形式)進行回應;其二,大數(shù)據(jù)的到來和以此為基礎的生活方式及全球格局的變化,絕不意味著傳統(tǒng)研究的方法學和理論的終結(jié)。
大數(shù)據(jù)的正式概念始于2011年麥肯錫的報告《大數(shù)據(jù):革新、競爭和生產(chǎn)力的下一個“前沿”》:“大數(shù)據(jù)——能夠獲取、交流、整合、儲存乃至分析的海量數(shù)據(jù)——如今已成為全球經(jīng)濟里每一部門和功能的組成部分。就像其他的生產(chǎn)要素,比如硬資產(chǎn)和人力資本。數(shù)據(jù)越來越成為現(xiàn)代經(jīng)濟活動、革新和增長中不可或缺的要素?!眻蟾嬷袕娬{(diào)運用大數(shù)據(jù)的科學技術將被廣泛地應用到統(tǒng)計學、計算科學、應用數(shù)學乃至經(jīng)濟學中,同時,這也意味著從大數(shù)據(jù)中獲取信息的組織等需要面臨的是一個更為靈活性的、多重規(guī)則的方法手段。正是由于大數(shù)據(jù)量的龐大,因而如何駕馭這個龐然大物來為人們服務越發(fā)受到重視。由于大數(shù)據(jù)應用領域的擴大,因而當今它甚至可以囊括“環(huán)境衛(wèi)星、基因數(shù)據(jù)、GPS和地圖數(shù)據(jù)、數(shù)字圖像,以及諸如社交媒體數(shù)據(jù)之類的人們有意識產(chǎn)生的數(shù)據(jù),等等”。所以,《大數(shù)據(jù)時代:生活、工作與思維的大變革》一書的兩位作者舍恩伯格和庫克耶亦將大數(shù)據(jù)視為“社會以新的方法手段處理信息的一種能力,以生產(chǎn)出具有巨大價值的商品和服務或者產(chǎn)生有用的洞見”。
相較于傳統(tǒng)數(shù)據(jù)采集及統(tǒng)計分析,大數(shù)據(jù)最為突出的特點是舍恩伯格和庫克耶所強調(diào)的三大特性:模糊性、相關性和大樣本性。首先,是模糊性代替精確性。對于傳統(tǒng)數(shù)據(jù)采集而建立的數(shù)據(jù)庫而言,收集的數(shù)據(jù)信息是相對有限的。在有限樣本量的情況下,對于數(shù)據(jù)采集以及建構(gòu)模型精確性具有很高的要求。但是,在大數(shù)據(jù)的前提下,“允許不精確的出現(xiàn)已經(jīng)成為一個新的亮點,而非缺點”。這種所謂的“非缺點”表現(xiàn)為兩個方面:一方面,對于小型數(shù)據(jù)過多的各種統(tǒng)計方法的計算倒不如從大數(shù)據(jù)出發(fā)的簡單運算來得實際,從而在效率層面上完全可以省下更多時間來收集更大的數(shù)據(jù),使得手頭的數(shù)據(jù)庫存累積起來以便獲取更多有用的價值信息;另一方面,大數(shù)據(jù)之所以被提出乃至風靡全球,是因為它能夠滿足人類的追求,即掌握現(xiàn)在和預知未來,尤其是后者。預測代表著一種概率邏輯,而非事實的確定性,所以數(shù)據(jù)的海量采集為預測大方向的追求而不得不或者主動地喪失其精確性,并“擁抱混亂”。其次,是相關性代替因果性。舍恩伯格和庫克耶認為,因果關系存在的前提在于人們的主觀直覺,“在小數(shù)據(jù)時代,很難證明由直覺而來的因果聯(lián)系是錯誤的?!髷?shù)據(jù)之間的相關關系,將經(jīng)常會用來證明直覺的因果關系是錯誤的”,而相關關系則代表著客觀的事實,且后者作用更為明顯。例如,將預測作為最終目的的評估機構(gòu)和企業(yè),只需要知道用戶的目前狀況和需求,就能夠為其提供相應的產(chǎn)品和服務;他們無需也不想去了解用戶之所以會有某類需求的原因。最后,是大樣本性代替小樣本性。當數(shù)據(jù)的收集量越來越龐大乃至可以稱為海量時,以至于可以直接采用這一超大型樣本量而無需顧及小樣本所帶來的一系列代表性問題。如果說傳統(tǒng)統(tǒng)計方法下的抽樣研究是為了描述或解決即時的、有限的、特定的社會現(xiàn)象或問題,那么在大數(shù)據(jù)時代運用更為先進的信息技術對任何與研究旨趣相關的海量數(shù)據(jù)分析則可能著眼于更長遠的、更為龐雜的事件和趨勢。
大數(shù)據(jù)對于社會科學的影響如此巨大,以至于其研究方式的轉(zhuǎn)變使得社會學成為大數(shù)據(jù)時代下方法學被撼動得最厲害的學科之一。典型的例子是“新計算社會學”的誕生及其研究應用。20世紀90年代,拉策爾、加里·金等學者在《科學》上提出了“計算社會科學”的概念,即通過計算機軟件作為媒介對社交關系進行測量的一種應用方法。這一新型學科的研究主要涉及社會網(wǎng)絡理論與研究方法的發(fā)展、基于行動者模擬方法以及互聯(lián)網(wǎng)研究等。從研究范圍來看,這一新興領域是一種社會世界諸多方面的跨學科研究,通過計算的媒介可以從個體的行動者一直到群體。它主要利用計算機中的“自動化信息提取”技術進行信息搜集。例如,我們可以將谷歌圖書語料庫的書本大數(shù)據(jù)、新浪微博、百度搜索等巨大庫存作為數(shù)據(jù)來源,以所需相關變量(關鍵詞)作為指標,從不同維度進行統(tǒng)計分析。因為這是一門相對較新的領域,所以,計算社會科學需要同其他的跨學科研究領域之間建立起一個新的范式和系統(tǒng), 而這又需要諸如計算機科學等的知識背景。因此,從長遠來看,這個學科的發(fā)展就是社會科學家和計算機科學家團隊合作的成果。而隨著計算社會科學領域科研隊伍的不斷壯大,社會學領域的計量方法也在不斷發(fā)展。2014年,美國社會學界在斯坦福大學“計算社會科學中心”召開學術研討會,并提出了“新計算社會學”概念。之所以“新”,主要在于“新計算社會學在理念、方法、思路、工具應用等方面比此前的社會學研究中的‘計算’都更為先進和復雜”。
這一方法學轉(zhuǎn)向的極端形式就是熱衷計量分析、過度注重計算結(jié)果的人越發(fā)增多,并在學科領域有一定的話語權(quán),由此使得理論逐步被邊緣化。例如,彭特蘭嘗試著用這樣的方式來重新解釋社會。他將社會實體間的影響、社會壓力等因素的評估全部簡化為數(shù)字符號,并采用建立等式乃至數(shù)學模型來概括整個社會的運行。這些主張無疑反映出一種具有大概率或然性的、試圖撬動諸多社會學科、人文學科方法根基的趨勢。在筆者看來,人類的社會生活區(qū)別于自然社會之犖犖大端者,正是社會生活充滿了意義或價值。這種人本身同諸多因素的復雜意義關聯(lián)決定了在此社會領域的范圍下并非一切都能被計算。
充滿意義的社會生活先于經(jīng)驗科學時代而存在,同時它呈現(xiàn)給我們的是一種具有歷史特殊性的生命實踐。這意味著它已經(jīng)預設了外在情境和內(nèi)在于歷史個體的生命的雙重前提條件。社會生活作為一種非數(shù)字、非自然的存在,必然涉及實際的活動,因而也必然受制于外在化的情境。情境作為一種“社會時空的特定狀態(tài)”,生產(chǎn)或者建構(gòu)著此刻實踐的結(jié)果乃至更大范圍的歷史環(huán)境;同時就本體性特征這一點來說,所謂情境的再現(xiàn)雖然在特定情況下可能具有相類似的意義,但并非是完全相同狀態(tài)的機械復制,相反,在不同時空維度下所產(chǎn)生的特定情境超越了某種形式化的規(guī)律,充滿著或然性或者不確定性。韋伯行動理論中的“意義層面上的充分性”和“因果層面上的充分性”就是在這種限制條件下個體對意義把握的一種解釋。從這個層面上來說,處于情境當中的實際社會生活是“關系性(即空間性)和可能性(時間性)的總體”,從而徹底否定了所謂的預測。
由于情境在時空因素上的復雜性,使得社會生活本身無法忽視無數(shù)單獨個體包括能動性和策略在內(nèi)的主觀實踐以及個體與其內(nèi)在生命所產(chǎn)生的關聯(lián),所以,以此種歷史個體的內(nèi)在意義為特征的研究都要以理解這些實踐與關聯(lián)為前提,否則研究的結(jié)果只會是“解釋之不可能”。而科學的手段只是對于極其有限的表象和外在化形式進行工具性描述,因此,從本體性中的文化意義上來說,單純的“科學的說明不能替代基于理解的解釋”。就歷史個體生命而言, 其意義的內(nèi)在性特征所指涉的是生命中各個組成部分同生活這一整體的復雜關系,這一關系連接了個體的生命和結(jié)構(gòu)的歷史,這種生命結(jié)構(gòu)同外在環(huán)境的持續(xù)互動構(gòu)成了具有意義的生命。此外,這種互動產(chǎn)生的意義只有通過對不同個體的精神和心靈的感悟、對個體生命的體驗才能夠達成。
關于本體性意義的論證無非意在強調(diào),基于社會生活的社會學學科“必須擁有自身獨特的研究方法,這是基于對意義的理解的方法”。我們認為,這種方法實踐的可能有效性途徑之一是超脫于純經(jīng)驗現(xiàn)實的想象力。具備此種個體、生命、社會、情境相互交織的想象的能力,意味著能夠從重點關注人們即刻行為的科學研究方法中超脫出來,并站在高遠處思索。這是米爾斯所呼吁的心智品質(zhì),它能夠幫助個體使用信息并促進理性的發(fā)展,從而能看到一種清晰的全貌。正如米爾斯所強調(diào)的,“社會學的想象力讓擁有此品質(zhì)的人既能理解一個關乎諸多個體內(nèi)在生命以及外在生涯意義的、更為廣闊的歷史情景,又能使他注意到,在繁雜混亂的日常經(jīng)歷當中,個體是如何錯誤地意識到他們的社會位置的”。在當今,這個60年前所提出的方法學實踐主張隨全球?qū)W術變遷非但沒有失去其必要性,反而變得更為重要而且緊迫。
以上的探討試圖為社會生活意義的本體性特征提供一個非實證的論證分析,目的無非在于將現(xiàn)實的社會生活的固有屬性同科學研究過程中嘗試制造的理想模型進行區(qū)分。它通過對該復雜化意義的內(nèi)涵與特征進行簡要梳理,從外在(方法實踐的可能有效性途徑)和內(nèi)在(關于本體性意義的論證)兩方面形成一種對社會生活科學研究方法批判的視角,從而為本文所主張的研究方法學具體實踐提供一種可能性的本體論根基與分析框架。
誠然,對社會生活的意義強調(diào),并不是對大數(shù)據(jù)之于社會學研究的徹底否定。如一些推崇者所主張的那樣,該時代下對人類部分行為、行動等的研究以及由此所產(chǎn)生的諸多研究成果對于社會生活的進步而言理所當然是有意義的。原因在于,大數(shù)據(jù)的浪潮使得計算機技術的運用在社會學領域中逐步呈主流研究方式,同時試圖在學科領域內(nèi)產(chǎn)生諸如“社會的信息處理范式”、“社會科學的計算范式”等新的主導范式。在這些范式主導下,數(shù)據(jù)收集和處理方式也發(fā)生了改變。具體來說,研究者們可以從網(wǎng)絡采集到的各類數(shù)據(jù)庫中挖掘和獲取各自所需的不同維度的字頻、詞頻等,并根據(jù)不同的研究主題與對象進行諸如文本、差異、流動等分析且建構(gòu)相關的數(shù)理模型。與傳統(tǒng)研究相比,大數(shù)據(jù)研究的數(shù)據(jù)來源就是社會生活中自發(fā)形成的數(shù)據(jù)庫,其客觀性以及研究的可信程度也更高。從這個層面上來說,上述新范式的提出與實踐以及在特定領域內(nèi)的成果確實給諸多研究提供了極大的便利。更進一步說,數(shù)據(jù)收集與分析方式的更新也促進了研究方法的升級。通過更為先進、高級的分析手段可以使傳統(tǒng)手段無法分析出來的相關性、維度等呈現(xiàn)出來,由此既可以對以前的研究成果進行修正,又能夠在更為廣泛的領域中進行探索。因此,研究者們更有理由相信社會學領域內(nèi)的科學研究亦充滿價值和意義。但是,此處所謂的“意義”卻與本文所主張的意義內(nèi)涵大相徑庭,它其實是一種本體論上的曲解。
用計算機等科學手段的研究,其意義的概念實際上是指涉某種特定的經(jīng)驗目的(諸如對個體行動的預測、對社會結(jié)構(gòu)運行的把握等),研究本身所追求的也往往是一種類似自然科學所追尋的、客觀的、普遍的有限意義。而本文所強調(diào)的意義,則是具有社會歷史特殊性的、以社會生活抑或人類生活作為研究對象的意義。且如前文所述,本文立足區(qū)別于自然的、社會的本體意義,是從人類學科的抽象層面上來探討,而非停留在具體研究的手段方法的層面。研究方法即便再先進和復雜,從網(wǎng)絡收集的數(shù)據(jù)仍然受到社會情境以及虛擬性的限制。大數(shù)據(jù)之于當代社會學研究而言,盡管具有部分方法上的優(yōu)勢,但它的作用僅限于捕捉人類的外顯行為或者表面呈現(xiàn)出的狀態(tài)(這種狀態(tài)也即各類樹木);而該行為或狀態(tài)背后深層的內(nèi)在意義(廣袤的樹林)卻是這類量化研究所無法探知到的。
作為對大數(shù)據(jù)時代下方法學轉(zhuǎn)向的回應,關乎社會學學科的關鍵問題就是:它絕不可以自然科學為典范,更不隸屬于自然科學,它的研究對象具有獨特的歷史、社會意義。因此,社會學學科的研究特殊性以及研究對象的意義復雜性,遠非大數(shù)據(jù)的研究方法學所能把握和駕馭。由此可以肯定,大數(shù)據(jù)時代下的科學方法固然在持續(xù)推進,但社會學的研究對象及認知模式明確了前者應用程度的局限性,本體性意義的存在也證明理論具有不可動搖的地位。
“當自身面臨各種主導思想,哪怕是最為崇高的思想時,也要在個人能力這個意義層面上保持一顆冷靜的頭腦,必要的時候甚至還要‘溯洄涵泳’?!边@是韋伯曾經(jīng)對部分職業(yè)思想家的一種指責和建議。同時,這也是他對于政策上純技術的實施不能采取客觀中立態(tài)度現(xiàn)象的一種回應。推而及之,“溯洄涵泳”這一主張的確在一定程度上意味著對時代中主流范式和方法學取向的一種態(tài)度。這并非是為了站在某一極端立場(主張理論終結(jié)的定量至上說抑或徹底排斥量化方法的理論至上說),而是面對大數(shù)據(jù)時代的浪潮以及隨之產(chǎn)生的某種方法學支配傾向所采取的一種謹慎的、自我慎思的方式。否則,無論是哪種形式的狂熱主義或者極端化,用韋伯的話說,“和那些自以為重要的文人們的那種令人厭惡的荒腔走板, 實在沒什么兩樣”。
就當今的社會學而言,研究的計算化為主要特征的方法學轉(zhuǎn)向正在成為學科領域中的主流研究趨勢。所以韋伯的這一反思態(tài)度對目前的情形仍然極具啟發(fā)意義。我們應當承認,相較于傳統(tǒng)的量化研究而言,大數(shù)據(jù)的社會學研究的確能在研究方法手段和數(shù)據(jù)來源等方面起到更大的作用;但論其實質(zhì),它仍然只是從描述的層面上來呈現(xiàn)所發(fā)生的事件和事物的外在;而社會生活的復雜內(nèi)在性和外在性內(nèi)容以及不同個體作為能動者所具有的有意義的行動和策略等終究是大數(shù)據(jù)所無法替代的。另外,有關社會世界的學科研究需要的并不只是人類對靜態(tài)的、充其量反映外在局部特征的表象采取直觀反應和認識的態(tài)度;無論是研究的目的、對象和研究過程,在面對科技對方法學的沖擊時,要像韋伯所強調(diào)的那樣,保持清醒的態(tài)度, 要理解周遭世界的獨特活躍性(相對冷冰冰的數(shù)碼世界而言)和人自身的能力對于他們所創(chuàng)造的知識精神產(chǎn)物的種種突破性。從這個層面上來說,當今的“溯洄涵泳”,也就是對“大數(shù)據(jù)助推的量化研究霸權(quán)地位”以及“計算機科學技術導致的、對人類社會世界的意義和人的崇高意識逐步產(chǎn)生疏離”的一種逆向的審問。簡言之,在這樣的時代下,只有時刻秉持學科方法學的慎思并從根本上真正施予人文的關懷,才不至于為浩瀚的大數(shù)據(jù)洪流所淹沒。