吳玲
【編者按】不久前,在濟(jì)南舉行的國際歷史學(xué)大會(huì)上,數(shù)字史學(xué)為主要議題之一,說明了大數(shù)據(jù)時(shí)代數(shù)字化技術(shù)與歷史學(xué)的密切關(guān)系。本刊對此問題亦給予了較多關(guān)注,陸續(xù)刊發(fā)了相關(guān)議題的文章。為進(jìn)一步對相關(guān)問題展開討論,本刊“關(guān)注新樣態(tài)史料”專欄特開辟筆談,誠邀熱心于數(shù)字化史學(xué)、新樣態(tài)史料的學(xué)界新秀加盟筆談,以期使人們對新樣態(tài)史料的認(rèn)知與研究逐步走向深入。
[中圖分類號(hào)]K0 [文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]1000-3541(2015)05-0068-03
[收稿日期]2015-07-09
大數(shù)據(jù)時(shí)代將帶來歷史學(xué)研究的巨大變革。這種變革不僅體現(xiàn)為新樣態(tài)史料的廣泛應(yīng)用,更表現(xiàn)為以往被視為自然科學(xué)研究工具的統(tǒng)計(jì)學(xué)和數(shù)學(xué)算法、信息處理和存儲(chǔ)技術(shù)等大數(shù)據(jù)技術(shù),將應(yīng)用到歷史學(xué)研究領(lǐng)域,從而促使傳統(tǒng)的歷史學(xué)研究手段發(fā)生根本性變革。這種變革包括史料結(jié)構(gòu)、研究手段與方法、研究隊(duì)伍、歷史研究面向未來的功用等內(nèi)容。隨著電子文本、電子閱讀的推廣和應(yīng)用,數(shù)字化技術(shù)催生的新樣態(tài)史料越來越受到歷史學(xué)研究者的青睞,研究者可以通過計(jì)算機(jī)技術(shù)歸納、整理、分析、綜合海量信息,大數(shù)據(jù)技術(shù)的開發(fā)和應(yīng)用成為歷史學(xué)研究產(chǎn)生新趨勢的推動(dòng)力。同時(shí),歷史學(xué)研究者仍然作為歷史研究的主體,借助大數(shù)據(jù)技術(shù)推動(dòng)歷史學(xué)研究走向?qū)I(yè)化、專門化、多元化、精細(xì)化。
趨勢一:建設(shè)“全史料數(shù)據(jù)平臺(tái)”,實(shí)現(xiàn)傳統(tǒng)紙質(zhì)文本史料向新樣態(tài)史料轉(zhuǎn)變。有“大數(shù)據(jù)之父”之稱的英國學(xué)者維克托·邁爾·舍恩伯格認(rèn)為,大數(shù)據(jù)時(shí)代帶來的信息變革,比人類發(fā)明印刷機(jī)之后發(fā)生的閱讀革命還要猛烈,各種形式的電子閱讀及其高度普及頗能說明這一點(diǎn)。當(dāng)下,世界各國數(shù)字圖書館建設(shè)都獲得了政府的資金支持,各領(lǐng)域的研究者都將訪問數(shù)字圖書館,作為獲取資料的重要途徑。隨著各國數(shù)字圖書館的數(shù)字化工程逐步推進(jìn),傳統(tǒng)的紙質(zhì)史料將在不久的將來完成向數(shù)字化轉(zhuǎn)型,必將出現(xiàn)一個(gè)可以為數(shù)據(jù)化提供計(jì)算、分析、整合基礎(chǔ)的“全史料數(shù)據(jù)平臺(tái)”。此處所言的“全史料數(shù)據(jù)平臺(tái)”應(yīng)是一個(gè)相對性概念,因?yàn)樗肋h(yuǎn)處在不斷完善、充實(shí)的狀態(tài)下。當(dāng)前的史學(xué)研究恰恰處于“全史料數(shù)據(jù)平臺(tái)”的建設(shè)時(shí)期,即量的積累時(shí)期,一旦傳統(tǒng)紙質(zhì)史料大致完成向數(shù)字化轉(zhuǎn)型,并開始設(shè)計(jì)、試用對數(shù)字?jǐn)?shù)據(jù)進(jìn)行計(jì)算機(jī)信息處理的模型或算法,便迎來了由量的積累到質(zhì)的飛躍的節(jié)點(diǎn)。由于通過數(shù)學(xué)模型或算法進(jìn)行的分析與綜合而得出的相關(guān)性數(shù)據(jù),又將作為新樣態(tài)史料充實(shí)到“全史料數(shù)據(jù)平臺(tái)”中去,因此,“全史料數(shù)據(jù)平臺(tái)”必將是一個(gè)不斷進(jìn)行自我充實(shí)的數(shù)據(jù)體系。在“全史料數(shù)據(jù)平臺(tái)”初具規(guī)模,大數(shù)據(jù)技術(shù)逐步運(yùn)用到歷史學(xué)研究領(lǐng)域時(shí),歷史學(xué)研究者不僅能夠通過電子閱讀更便捷、有效地掌握資料,更能夠運(yùn)用大數(shù)據(jù)技術(shù)對新樣態(tài)史料進(jìn)行高效分析,從而大大提升研究效率。
趨勢二:大數(shù)據(jù)可以極大擴(kuò)充歷史學(xué)研究者占有歷史資料的廣度,提升史學(xué)研究的精細(xì)化水平。大數(shù)據(jù)使研究者擁有大規(guī)模收集和分類數(shù)據(jù)的條件,傳統(tǒng)史學(xué)研究中普遍使用的采樣分析法將逐漸被數(shù)據(jù)分析法取代。在傳統(tǒng)史學(xué)研究領(lǐng)域,通過采樣獲取的局部性數(shù)據(jù)構(gòu)成核心史料。歷史研究者按照事先設(shè)計(jì)好的問題范式,對相關(guān)數(shù)據(jù)進(jìn)行搜集、歸類、整合、計(jì)算,如某個(gè)特定區(qū)域在不同歷史時(shí)期的人口數(shù)量、農(nóng)業(yè)產(chǎn)值、工商業(yè)產(chǎn)值、軍事力量等,若時(shí)空設(shè)計(jì)合理,上述數(shù)據(jù)完全可以成為對該時(shí)期該地區(qū)研究的權(quán)威數(shù)據(jù)。然而,由于局部樣本不能等同于全樣本,在設(shè)定了細(xì)致范圍的特定區(qū)域與時(shí)間樣本的分析中,傳統(tǒng)方法可以得出局部性結(jié)論,如果將研究視野擴(kuò)大到較大歷史時(shí)期的經(jīng)濟(jì)、社會(huì)變遷中,傳統(tǒng)的樣本便不足以充分地論證結(jié)論,而必須通過對海量數(shù)據(jù)的分析與處理,在呈現(xiàn)出歷史的多維度特征基礎(chǔ)上,更深入地推進(jìn)歷史學(xué)研究。
趨勢三:新的史料搜索系統(tǒng)的加盟將豐富傳統(tǒng)的史料分類與索引體系。在傳統(tǒng)的歷史學(xué)研究中,分類和索引一直是研究者檢索史料的基本手段。然而,由于這種分類與索引是事先設(shè)定好的高度精確和準(zhǔn)確排列的資料目錄,海量數(shù)據(jù)因無法被該目錄接納,而不得不游離于這個(gè)索引系統(tǒng)之外。因此,傳統(tǒng)的資料索引在提供有限資料的同時(shí),也在一定程度上限制了史學(xué)工作者對資料的獲取廣度。大數(shù)據(jù)時(shí)代,初步掌握大數(shù)據(jù)技術(shù)的研究者,可以通過使用一組標(biāo)簽編組、分類和檢索史料,并可以通過合并多個(gè)搜索標(biāo)簽有效地過濾用于歷史研究的資源。由于史學(xué)研究面臨的是各種各樣、參差不齊的海量數(shù)據(jù),很難用預(yù)先設(shè)計(jì)好的目錄分類這些數(shù)據(jù),因此,適用于大數(shù)據(jù)時(shí)代的史料搜集、分類、辨析的史料搜尋技術(shù)與方法將逐步替代傳統(tǒng)圖書館的卡片式分類與檢索系統(tǒng)。
趨勢四:大數(shù)據(jù)技術(shù)在相關(guān)關(guān)系研究中具有的優(yōu)勢將推動(dòng)歷史學(xué)研究走向多元化,發(fā)揮歷史學(xué)研究的現(xiàn)實(shí)功用。大數(shù)據(jù)時(shí)代的史料搜索系統(tǒng)擁有處理和分析海量數(shù)據(jù)、進(jìn)而尋找數(shù)據(jù)之間關(guān)聯(lián)性的功能,可以幫助史學(xué)工作者發(fā)現(xiàn)新問題、產(chǎn)生新靈感。歷史研究者通過計(jì)算機(jī)分析和統(tǒng)計(jì)技術(shù)迅速獲得一個(gè)事物大概的輪廓和發(fā)展脈絡(luò),比起嚴(yán)格的精確性研究結(jié)論,這個(gè)包納了不精確因素的大概輪廓與脈絡(luò),在評判與分析宏觀歷史規(guī)律時(shí),更具啟發(fā)性?!叭妨蠑?shù)據(jù)平臺(tái)”中豐富的新樣態(tài)史料,將為歷史學(xué)研究提供無限可能性:文學(xué)作品中描繪的人們的生活狀態(tài)與心理傾向,繪畫作品中展現(xiàn)出的社會(huì)風(fēng)貌與審美特征,大量零散的日記與信件中傳遞出的情感欲念與人際交流,商品往來中各種看似無關(guān)緊要的物品交換與信息交流,自媒體時(shí)代出現(xiàn)的海量影音作品中表達(dá)出的個(gè)性化生活場景與流行趨勢等等,這些看似沒有邏輯關(guān)系的數(shù)據(jù),均可用來論證一些重要的歷史性結(jié)論。大數(shù)據(jù)時(shí)代,在傳統(tǒng)史學(xué)依賴清晰和精確數(shù)據(jù)的研究方式的基礎(chǔ)上,較多地接受并利用這些模糊和不確定的史實(shí),將更有助于發(fā)現(xiàn)人類歷史發(fā)展的樣貌。另外,今天的大數(shù)據(jù)技術(shù)可以通過放置在大型機(jī)器、橋梁、建筑物等設(shè)施上的傳感器,分析預(yù)測這些設(shè)施未來的狀態(tài)和故障預(yù)警。由于人類社會(huì)的歷史性變動(dòng)也是由多種因素互相作用、緩慢積累導(dǎo)致的。因此,可以設(shè)想,歷史學(xué)家可以運(yùn)用大數(shù)據(jù)技術(shù)分析導(dǎo)致某區(qū)域發(fā)生社會(huì)騷動(dòng)的諸多關(guān)聯(lián)性因素,找出該區(qū)域多種關(guān)聯(lián)性因素之間的動(dòng)態(tài)規(guī)律,從而預(yù)測該區(qū)域發(fā)生不穩(wěn)定狀況的可能性。
趨勢五:利用計(jì)算機(jī)進(jìn)行文本分析的方法將大大提升歷史研究的效率與總體水平?,F(xiàn)在的歷史學(xué)者仍然以利用數(shù)字圖書館的搜索引擎便捷地閱讀書籍,作為獲取資料的主要方式,利用大數(shù)據(jù)技術(shù)分析、辨別數(shù)字化文本史料的工具僅僅處于嘗試性開發(fā)階段。谷歌公司最先開發(fā)出在文本中統(tǒng)計(jì)詞頻的算法,只要在計(jì)算機(jī)中輸入任何詞或詞組,這種算法都會(huì)輸出這些詞組的詞頻統(tǒng)計(jì)結(jié)果。谷歌公司的工程師分別輸入了“黑鬼、黑人、非裔美國人”,“科學(xué)、哲學(xué)與宗教”等詞組,計(jì)算機(jī)繪出了這些詞組出現(xiàn)的時(shí)間、頻次的對比圖,歷史學(xué)家可以通過分析這些數(shù)據(jù)闡釋黑人在不同時(shí)期美國社會(huì)受到的不同對待,以及科學(xué)、哲學(xué)與宗教在人類歷史不同時(shí)期的地位,從而展開多樣性研究。由于書頁的數(shù)字化圖像被轉(zhuǎn)化成數(shù)據(jù)化文本,使書本中潛藏的巨大價(jià)值被釋放出來,對于歷史學(xué)研究來說,這可以說是一次工具革命,如果開發(fā)出具有分析功能的算法,那么大數(shù)據(jù)技術(shù)必將在歷史學(xué)研究中大顯身手。
趨勢六:計(jì)算機(jī)技術(shù)、云存儲(chǔ)技術(shù)的加盟將改變歷史學(xué)研究隊(duì)伍的構(gòu)成。首先,由于海量數(shù)據(jù)可以被所有人共享,數(shù)據(jù)分析能夠在云處理平臺(tái)上快速、低成本地進(jìn)行,因此,歷史研究不再僅僅是職業(yè)研究人員專屬的領(lǐng)域,所有對歷史學(xué)研究感興趣的人都可以展開個(gè)性化研究,并在資料辨析、古文書辨?zhèn)蔚葘iT性領(lǐng)域參與歷史學(xué)專題性研討與爭鳴,歷史學(xué)研究也將突破單一學(xué)科的限制,向普遍性的多學(xué)科共同參與轉(zhuǎn)變。其次,專門從事歷史數(shù)據(jù)挖掘和分析的公司、專業(yè)化的歷史數(shù)據(jù)分析師、數(shù)據(jù)科學(xué)家會(huì)大量出現(xiàn),成為歷史學(xué)研究隊(duì)伍中不可或缺的組成部分。歷史學(xué)研究也將極大地延展學(xué)術(shù)研究的生產(chǎn)鏈條與傳播途徑,走上多功能、多技術(shù)、多學(xué)科交叉的研究與傳播道路。
綜上所述,大數(shù)據(jù)將改變歷史學(xué)研究的未來發(fā)展方向,然而,如同電腦永遠(yuǎn)不可能取代人腦,大數(shù)據(jù)不可能取代歷史學(xué)工作者的主觀思考,也不可能取代傳統(tǒng)歷史學(xué)研究的基本理論與方法,歷史學(xué)研究者必須明確大數(shù)據(jù)在歷史學(xué)研究中的地位。首先,歷史學(xué)家必須發(fā)揮主導(dǎo)作用,由歷史學(xué)家主導(dǎo)制定相關(guān)計(jì)算機(jī)數(shù)據(jù)分析指令、參數(shù)模型的基本原則,這些原則的制定必須依據(jù)歷史學(xué)的研究理論與方法。其次,大數(shù)據(jù)可以從海量數(shù)據(jù)中提取、挖掘、分析、計(jì)算出趨近于全體數(shù)據(jù)的數(shù)值及其動(dòng)態(tài)變遷趨勢,但分析這些數(shù)值及趨勢之間的本質(zhì)關(guān)系,諸如原因與結(jié)果、現(xiàn)象與本質(zhì)、個(gè)性與共性等理論性問題,還必須借助歷史學(xué)家在歷史學(xué)理論與方法指導(dǎo)下的天才思考。再次,由于歷史學(xué)研究的相關(guān)參數(shù)是從成千上萬的參數(shù)擬合值中通過計(jì)算機(jī)工程性操作得出的,因此,必須判斷這些參數(shù)擬合值在多大程度上能夠成為引出歷史性結(jié)論的可靠依據(jù);這些參數(shù)會(huì)在多大程度上展現(xiàn)歷史發(fā)展的規(guī)律;通過這些參數(shù)對歷史學(xué)研究對象做出怎樣的判斷等等,這些判斷都需要?dú)v史學(xué)家借助歷史學(xué)的研究理念與方法展開深邃思考。大數(shù)據(jù)時(shí)代極大地豐富了歷史學(xué)研究的工具與手段,拓展了歷史學(xué)研究的廣度,但是,大數(shù)據(jù)的研究手段不僅不能完全取代歷史研究的理論與方法,而且其手段與工具的應(yīng)用必須以歷史理論與方法作為指導(dǎo)。(作者系哈爾濱師范大學(xué)副教授,歷史學(xué)博士)