蔣 艷
(河海大學 圖書館,南京 210024)
一般來說,“大數(shù)據”一詞比較權威的提法來自2008年《自然》的“Big Data”專刊[1]。2011年麥肯錫全球研究院(以下簡稱MGI)對“大數(shù)據”做了較為系統(tǒng)的介紹。國內學者開始關注大數(shù)據一致認為始于2013年,并稱之為“大數(shù)據元年”。我國2015發(fā)布的“十三五”規(guī)劃中提出“實施國家大數(shù)據戰(zhàn)略,推進數(shù)據資源開放共享”[2],進一步推動了我國大數(shù)據在各領域的運用。2018年,MGI更是預測未來的生產增長中一大半將來自于最新的“數(shù)字機會”[3]。隨著新型冠狀病毒的來襲,大數(shù)據運用于疫情防控,其帶來的精準便捷使得大數(shù)據迅速轉入民生領域,這為“十四五”規(guī)劃提出“推動互聯(lián)網、大數(shù)據、人工智能等同各產業(yè)深度融合”[4]培植了肥沃的土壤。大數(shù)據無論在日常生活還是在科學研究中煥發(fā)出的勃勃生機激發(fā)了各學科領域學者對大數(shù)據交叉融合的研究,并取得了豐碩的研究成果,在中國知網(CNKI)上以“大數(shù)據”為標題詞檢索,發(fā)現(xiàn)已有CSSCI文獻數(shù)量就達到18367份(截止到2022年3月8日)。就各學科領域學者的研究成果來看,在經過短暫的三年(2013-2015年)井噴后,2016年以來對大數(shù)據的研究趨于理性,產出成果逐年增加,并保持相對穩(wěn)定。學者們對大數(shù)據學科融合的研究主要體現(xiàn)在:(1)大數(shù)據與治理。學者們就大數(shù)據融入學科后的數(shù)據治理研究頗多,從激活政府大數(shù)據、實現(xiàn)政務數(shù)據融合應用等方面論述大數(shù)據推進國家治理體系和治理能力現(xiàn)代化的革命性意義[5],其表現(xiàn)在鄉(xiāng)村治理[6]、公共危機治理[7]、高等教育治理[8]等方面。大數(shù)據運用于社會治理的實踐效果,直接推動了將“提升大數(shù)據等現(xiàn)代技術手段輔助治理能力”[4]列入“十四五”規(guī)劃。(2)大數(shù)據與價值、倫理。學者們思考有關大數(shù)據對價值的沖擊、倫理的挑戰(zhàn)與大數(shù)據的研究幾乎同時展開。學者們認為研究大數(shù)據技術意義的同時,應該關注大數(shù)據的使用帶來的行業(yè)道德、職業(yè)道德的堅守危機[9],關注倫理可能失范后的倫理治理體系的確立[10],關注隱私保護倫理[11]。(3)大數(shù)據與技術工具。大數(shù)據首先是技術工具,具有工具性,其數(shù)據挖掘和分析技術既拓展了解決諸如經濟、管理、教育、醫(yī)療、體育、圖情等領域理論問題的新途徑,也成為研究和解決其他領域新情況、新問題的工具。如基于大數(shù)據的數(shù)據計量學興起[12]、大數(shù)據對人文社會科學的學科研究的技術促進作用、大數(shù)據對圖書情報出版領域的革命性作用等。(4)大數(shù)據及其國際比較。自引入“大數(shù)據”始,國內學者就始終緊跟大數(shù)據的國際發(fā)展和研究動態(tài),經歷了從理論研究到宏觀研究轉變的過程。他們結合當前國內大數(shù)據發(fā)展中存在的需求,在大數(shù)據發(fā)展戰(zhàn)略[13]、大數(shù)據產業(yè)發(fā)展[14]、數(shù)據治理與立法、大數(shù)據協(xié)同創(chuàng)新[15]等與國際研究比較中取得了較好的研究成果。
綜合文獻梳理,可以看到大數(shù)據融合學科研究也存在一些薄弱環(huán)節(jié):學科研究領域寬泛,研究深度不均;宏觀概念研究多,問題導向研究少;技術方法研究深,理論體系研究淺。國家社科基金是我國開展基礎研究的主渠道,服務國家戰(zhàn)略和社會需求是其根本使命,其導向性、權威性和示范性越來越明顯,在促進大數(shù)據與各學科領域交叉融合的過程中,國家社科基金發(fā)揮著支撐理論研究、引領研究潮流、解決現(xiàn)實問題的作用。那么在充足的資金支持、充裕的時間保證、高水平的研究團隊支撐下,近年來大數(shù)據融合學科研究的進展如何?推進大數(shù)據與各學科領域交叉融合的效果又如何?為此,本文以2013年以來以“大數(shù)據”為主題的國家社科基金立項項目為分析樣本進行深入剖析,力圖梳理大數(shù)據與各學科交叉融合的狀態(tài),為推進大數(shù)據運用、大數(shù)據研究、大數(shù)據治理提供借鑒。
1.數(shù)據來源
本研究以全國哲學社會科學工作辦公室官網(www.npopss-cn.gov.cn)數(shù)據庫為數(shù)據來源,以“大數(shù)據”為主題詞進行立項題名的檢索,通過人工篩選,剔除重復和無效數(shù)據,共檢索到有效樣本540個,涵蓋了2013-2021年國家社科基金的重點項目、一般項目、青年項目等類別。檢索時間為2022年3月28日。
2.研究方法
本文采用的研究方法主要是文獻分析法和文獻計量學方法。通過文獻分析法對國家社科基金立項項目和成果進行定量統(tǒng)計和內容的定性分析,把握2013年以來大數(shù)據研究的內容、變化過程和演變特征。通過文獻計量學的分析方法對立項課題呈現(xiàn)的研究成果(主要是期刊文獻)進行計量統(tǒng)計分析。通過以上分析,把握大數(shù)據學科交叉融合研究的現(xiàn)狀,為預測大數(shù)據學科交叉融合研究的發(fā)展趨勢提供依據。
1.學科特征:基金立項數(shù)量學科分布差異大
目前,國家社科基金項目學科分類是23種,以大數(shù)據為標題的立項項目共有20種。其中,“中國歷史”“世界歷史”“中國文學”3個學科目前沒有這方面的研究。從每年立項項目數(shù)量發(fā)展變化看,除了2013年研究剛起步,僅在“統(tǒng)計學”“圖書館、情報與文獻學”“新聞學和傳播學”三個學科有研究外,其他年份都是涵蓋10-16種學科(見表1),學科涵蓋比較穩(wěn)定。其中,“應用經濟”“政治學”“法學”“新聞學與傳播學”“圖書館、情報與文獻學”“統(tǒng)計學”“管理學”7個學科2014年以來均有大數(shù)據主題的立項項目。
表1 以大數(shù)據為主題的立項項目涵蓋學科分布
2.研究力量:高校是大數(shù)據學科融合研究的絕對主力
一般來說,高校、社科院和黨校是國家社科基金項目立項的主要單位。對于大數(shù)據的研究,高校是絕對主力,共有508項,占有效樣本的比率為94.1%,社科院和黨校比例很低,說明高校是大數(shù)據研究和交叉融合探索的主力軍。再從高校的分布來看,雙一流建設高校與“雙非”高校(非一流大學建設高校和非一流學科建設高校)立項項目各占半壁江山,雙一流建設高校大數(shù)據研究優(yōu)勢不明顯。排在前六名的高校是鄭州大學(9項)、安徽大學(8項)、杭州電子科技大學(8項)、清華大學(8項)、上海交通大學(8項)、中國人民大學(8項)。有7位學者有關大數(shù)據的研究獲得過2次立項。從地域分布來看,北京(96項)、江蘇(45項)、上海(43項)、湖北(36項)、浙江(33項)和廣東(32項)排在前六位,這六個省的數(shù)量占據全國半壁江山,這體現(xiàn)了經濟發(fā)達和高等教育發(fā)達的區(qū)域,大數(shù)據研究相對活躍。
1.學科特征:多學科跨領域研究
大數(shù)據技術是推進學科交叉的重要工具和手段,學界為此開展了大量的研究,學科的多樣化呈現(xiàn)了大數(shù)據研究的多學科跨領域的特征。根據研究對象的不同,可以將540項立項項目分為三類。一是“大數(shù)據”的基礎研究,這類項目從社會科學的角度出發(fā),研究大數(shù)據的數(shù)據特征及內在規(guī)律性。這些研究為大數(shù)據融入學科交叉奠定了一定的基礎,如“大數(shù)據相關關系和因果關系研究”(2017年重點項目)。這類項目共有20項,占有效樣本的3.7%(見圖1),且每年均有一定量的項目立項。但是這方面的研究太少,在一定程度上制約了大數(shù)據的學科交叉融合。二是大數(shù)據的學科工具性研究。這類項目以大數(shù)據環(huán)境下的學科研究為對象,它以大數(shù)據技術為工具,用大數(shù)據解決學科研究和學科研究對象中出現(xiàn)的新老問題,承擔著工具性的功能,如“運用大數(shù)據提高新時代思想政治教育有效性研究”(2021年)。這類項目共有403項,占有效樣本的74.6%。三是大數(shù)據與學科的交叉研究,這類研究是大數(shù)據推進學科融合的具體操作,是真正意義上的學科交叉融合,如“大數(shù)據環(huán)境下公安情報學理論體系研究”(2020年)。這類項目共有117項,占有效樣本的21.7%。這類項目立項數(shù)量穩(wěn)中有升,說明目前步入學科交叉實質階段的學科在不斷增加。
圖1 大數(shù)據多學科跨領域研究數(shù)量逐年變化圖
2.特征變化:學科交叉研究不斷深入
進一步分析學科研究隨時間的變化情況,發(fā)現(xiàn)大數(shù)據的學科研究呈現(xiàn)學科融合不斷深化的特點:(1)從以數(shù)據為顯性特征的自然科學學科向社會科學學科擴散。從國家社科基金立項項目的逐年學科分布情況來看,這種擴散經歷了三個過程:一是以數(shù)據為中心的統(tǒng)計學、圖書館、情報與文獻學、新聞學與傳播學等學科最早引入大數(shù)據,其內容在于“方法”“體系”“應用”“集成”等研究。二是擴散至以次生數(shù)據為中心的經濟、管理、社會學、軍事學等學科,其內容在于“模式”“模型”“影響”“預測”“預警”等研究,這些研究是傳統(tǒng)研究方法的升級版或優(yōu)化版。三是全面擴散至與人類活動相關的社會科學學科,其內容在于“路徑”“策略”“治理”“機制”等研究,側重于研究方法的創(chuàng)新和優(yōu)化。(2)從工具性向工具性、人文性并重轉變。大數(shù)據是以研究工具的角色被引入國內,其工具性特征在立項的社科基金項目中基本得以體現(xiàn)。大數(shù)據的引入為解決冗余數(shù)據“無法容忍”問題提供了解決方法,并迅速推廣至以數(shù)據為特征的各學科領域。Web數(shù)據的雜亂無章為社會科學帶來了難題,大數(shù)據方法的應用使這些數(shù)據“從厚到薄”,把大數(shù)據變成小數(shù)據。然而,大數(shù)據的全面鋪開也帶來了思維、關聯(lián)、組織、融合等大數(shù)據治理問題。學者們在研究過程中,越來越重視大數(shù)據的人文性特征,如對大數(shù)據“倫理”“法治”“數(shù)據權利”等的研究。人文性特征的研究揭示出大數(shù)據的實質不是工具而是思想,體現(xiàn)出我國大數(shù)據研究在不斷走向成熟。(3)從單學科融合向多學科交叉融合轉變。盡管大數(shù)據目前不自成為一門學科,但是其價值本質上為人們提供了科學研究的新方法和新思維,為我國學科發(fā)展和創(chuàng)新提供了一條新路徑。計算機與信息、通信、統(tǒng)計等學科最先引入和借鑒大數(shù)據,并開展了諸如“大數(shù)據與統(tǒng)計學理論的發(fā)展研究”(2013年立項基金)、“面向大數(shù)據的單元信息組織體系研究”(2014年立項基金)等。隨著國際和國內大數(shù)據的迅猛發(fā)展,大數(shù)據與學科的融合加速了學科發(fā)展,快速推動了大數(shù)據與多學科的交叉融合。這里既有“傳統(tǒng)”交叉學科與大數(shù)據的融合,如“大數(shù)據時代民族自治地方農村精準扶貧機制研究”(2017年立項基金);也有大數(shù)據推動多學科的交叉融合,如“大數(shù)據驅動的互聯(lián)網平臺價值共創(chuàng)與治理模式研究”(2019年立項基金),就是社會學和管理學的交叉。
1.大數(shù)據支撐學科融合的基礎研究力量偏弱
科學的基礎研究是指對研究對象的內涵、理論、屬性的認識,加強基礎研究是提高原始創(chuàng)新能力的重要途徑。中科院院士梅宏認為,大數(shù)據的價值本質上是“提供一種人類認識復雜系統(tǒng)的新思維和新手段”[16],思維是意識,是社會科學研究人類社會的主要范疇。大數(shù)據的社會科學性特征是我們對大數(shù)據基礎研究的重點。大數(shù)據科學的基礎理論來自計算機科學、統(tǒng)計學、人工智能、社會科學等,其基礎研究應該是數(shù)據應用基礎理論、數(shù)據科學與社會科學(比如社會學、法學)等之間的互動。大數(shù)據的社會科學的基礎研究應該立足于本質、規(guī)律、價值、思維等范疇。就當前已經立項的基金項目來看,大數(shù)據的社會科學基礎研究項目還是偏少,推動大數(shù)據在社會科學領域的發(fā)展上支撐力度不夠,支撐面較窄。在形成大數(shù)據的社會科學基礎理論共性規(guī)律上挖掘不多,成果顯示度不高。在立項項目和可檢索的高質量文獻上,也反映了相同的結論。從已有的CSSCI文獻中,檢索發(fā)現(xiàn)僅有不到100篇文獻(占比2.1%)討論大數(shù)據的社會科學基礎理論?;A研究的缺乏造成核心技術的薄弱,這將導致我國信息技術,尤其是大數(shù)據技術處于低端化的尷尬狀況。
2.大數(shù)據融合研究的學科發(fā)展不平衡
一般認為,數(shù)據來源的途徑有兩種:一是來自物理世界,二是來自人類社會。一切人類社會活動所產生的內容(數(shù)據)均為大數(shù)據研究的對象。大數(shù)據自引入我國,在統(tǒng)計學、圖書館、情報與文獻學、新聞學與傳播學、軍事學等社會科學領域得到了廣泛應用,產生了豐碩的研究成果,極大促進了這些學科的創(chuàng)新發(fā)展。以大數(shù)據與新聞傳播學的融合為例,大數(shù)據使新聞傳播學迅速成為當今的一項“顯學”,其外部與其他學科的融合程度更高,內部學科的定位正從人文學科轉向社會科學[17]。但是,文學、歷史、宗教等學科研究者并沒有通過引入大數(shù)據激發(fā)這些傳統(tǒng)學科的生命力。考古學、黨史、黨建、民族學(民族問題研究)、人口學等學科領域僅有零星立項項目,立項數(shù)量排名前四的學科占據有效樣本的六成,大數(shù)據交叉融合研究的學科發(fā)展不平衡顯著。大數(shù)據與學科交叉的不平衡直接影響學科對應的產業(yè)生態(tài)的構建,直接影響大數(shù)據產業(yè)的發(fā)展,從而影響我國行業(yè)數(shù)字化、網絡化和智能化的轉型、重構和提升。
3.立項項目研究成果影響力略顯不足
國家社科基金立項項目成果是國家學科體系、學術體系、話語體系建設和創(chuàng)新的體現(xiàn)。大數(shù)據盡管是自國外引入,但是隨著國內計算機技術、信息技術、人工智能、互聯(lián)網技術的迅猛發(fā)展,其在國際話語體系中已經占有一席之地。不過,從以大數(shù)據為主題的國家社科基金立項項目研究成果來看,其影響力存在差距。從已發(fā)表的高水平論文來看,以大數(shù)據為主題的文章引用率最高的是孟小峰教授2013年發(fā)表的《大數(shù)據管理:概念、技術與挑戰(zhàn)》,引用數(shù)達4000次,但該文章并未有國家社科基金支撐。國家社科基金支撐的文章中影響力最大的當屬朱建平教授的《大數(shù)據時代下數(shù)據分析理念的辨析》(432次被引用,2.66萬次下載),該文章是其2013年重大項目“大數(shù)據與統(tǒng)計學理論的發(fā)展研究”的成果。另外,國家社科基金立項成果以“研究報告”呈現(xiàn)的占比54.5%,但是從全國哲學社會科學辦公室官網或者其他地方能檢索到的研究報告數(shù)量相當稀少,這類研究成果難以為其他學科的融合提供借鑒和推廣,影響了成果的轉化。
無論是從立項基金研究還是已有文獻成果來看,大數(shù)據為社會科學帶來了方法論的革命,大數(shù)據作為一種方法運用為學科研究提供了全新的路徑,極大提升了學科應用的決策效率。一般認為,大數(shù)據應用于決策系統(tǒng)包含三個層次:描述性分析、預測性分析、指導性分析。它們是層層遞進的關系,也反映了大數(shù)據與學科融合發(fā)展的融合深度。描述性分析是大數(shù)據應用的基礎層次,它幫助人們了解事物發(fā)展的歷程,為人們進一步決策提供依據,即解決大數(shù)據對學科“發(fā)生了什么”的問題。當前的立項基金中,絕大部分是屬于這類研究,應該說,大數(shù)據對各學科的影響已基本描述清楚。預測性分析是較高層次的大數(shù)據應用,是在分析“發(fā)生了什么”的基礎上,進一步分析與其他事物之間發(fā)生的關系并做出判斷,即解決“周圍發(fā)生了什么”的問題。指導性分析是大數(shù)據應用的最高層次,是在“發(fā)生了什么”和“周圍發(fā)生了什么”的基礎上,對各種決策判斷可能的優(yōu)化,即解決“什么最適合”的問題。在立項基金項目中,屬于預測性分析的項目研究有一些,而指導性分析的項目則鳳毛麟角。從一般的決策規(guī)律來說,決策流程層次包括認知、決策和選擇,其恰好對應大數(shù)據的三個層次。大數(shù)據方法運用的最高追求是在各種選項中選擇最佳方案,這也是推動大數(shù)據與學科交叉融合的最高境界,是推動學科革命性發(fā)展的根本所在。因而,學界需對此加強研究以提升大數(shù)據與學科的融合深度,促進學科發(fā)展不斷成熟。
一直以來,大數(shù)據治理是學者關注的熱點問題,有49項立項基金涉及行業(yè)或者學科大數(shù)據治理的課題,占比9.1%,其中重點項目有5個。從有關文獻中也可以看到,大數(shù)據治理的研究聚焦于某一行業(yè)或者某一學科大數(shù)據治理現(xiàn)狀、規(guī)律及應對,其中有關政務(政府)、教育、圖書館等的大數(shù)據治理研究成果頗多。各學科大數(shù)據治理取得的成果為大數(shù)據治理體系構建奠定了基礎。構建健康的大數(shù)據治理體系是大數(shù)據與各學科交叉融合的重要內容,是規(guī)范性制度保障。但是,大數(shù)據治理的研究大多局限于某一個學科而開展,缺乏大數(shù)據治理的跨界研究。隱私、安全和共享是大數(shù)據治理的核心問題,在某一學科(行業(yè))研究和實踐運行過程中,三者與大數(shù)據利用效率之間的矛盾還不顯現(xiàn)。在與其他學科交叉過程中,由于大數(shù)據的確權不清、數(shù)據地位難以達成共識、數(shù)據行業(yè)壁壘難以打破、配套法律不相匹配導致數(shù)據存在安全和隱私隱患,數(shù)據共享效率低下。因而,跨越多學科甚至全行業(yè)的大數(shù)據治理體系構建成為迫切需要。大數(shù)據治理體系構建要重點關注三個問題:一是大數(shù)據治理概念的延展,不能將大數(shù)據治理局限于一個學科領域,要從跨多學科大數(shù)據治理開始做好研究。二是形成各學科對大數(shù)據治理內涵的共識,改變各學科各自定義、各自應用的大數(shù)據治理的現(xiàn)狀,形成系統(tǒng)全面的大數(shù)據治理理論體系。三是各學科大數(shù)據治理的研究要形成學科間大數(shù)據治理的關聯(lián)性、一致性的研究和實踐自覺,在多學科的多線索研究中相向而行,彌補各自為政的不足。
人們通常認同已故圖靈獎得主、數(shù)據庫領域先驅吉姆·格雷(Jim Gray)的觀點,即大數(shù)據方法是基于實驗、推導、模擬之外的“第四范式”——數(shù)據[18]?!暗谒姆妒健弊鳛橐环N科研方法是從傳統(tǒng)的假設驅動向基于科學數(shù)據進行探索的科學方法轉變[19]。對于社會科學而言,無論是從國家社科基金的立項研究還是已有研究成果來看,可以說,大數(shù)據作為一種研究工具,拓寬了社會科學界對科學研究方法的認識。中科院院士李國杰早在2012年就指出,“第四范式”不僅是科學方法的轉變,也是“思維方法的大變化”,并認為大數(shù)據完全可能發(fā)展成為“大數(shù)據科學”[20]。大數(shù)據研究伊始,人們受大數(shù)據的工具性特征限制,對其成為一門科學缺乏戰(zhàn)略性認識。大數(shù)據的研究和實踐經歷了一段時間的跨越式發(fā)展,大數(shù)據的共性問題越來越多,在大數(shù)據技術推動經濟發(fā)展、完善社會治理、提升政府決策及服務效能、行業(yè)預警監(jiān)管等方面取得了革命性的進步,在大數(shù)據的基礎理論、學科的融合發(fā)展、國際交流合作等方面積累了一定的理論基礎,這些為大數(shù)據成為“科學”奠定了深厚的理論和實踐基礎。大數(shù)據之所以成為“科學”,是因為其可以提供學科間的“共性規(guī)律”,能從與不同學科交叉融合過程中研究“共性問題”,提煉可推廣的“共性規(guī)律”,最終普適于一般性學科的研究。因而,在大數(shù)據研究過程中,通過與學科交叉融合研究,可以不斷抽象融合規(guī)律,形成學科融合的共性問題,最終形成“大數(shù)據科學”。
任何一門學科的發(fā)展,以解決現(xiàn)實問題為生命力。評價學科是否在發(fā)展,一要看其自身理論有多大發(fā)展、多少創(chuàng)新,二要看其是否解決了重大現(xiàn)實問題。毋庸置疑,大數(shù)據融入學科的理論研究為推動學科創(chuàng)新發(fā)展注入了活力,取得了顯著成績。然而,大數(shù)據畢竟是以工具性特征見之于世,它到底為我們解決現(xiàn)實問題提供了多少路徑?大數(shù)據快速發(fā)展的動力來自國家戰(zhàn)略。比如,2012年美國奧巴馬政府啟動2億美元的“大數(shù)據研究和發(fā)展計劃(Big Data Research and Development Initiative)”極大地推動了美國對大數(shù)據的研究,一時引領了大數(shù)據研究的潮流。我國于2015年9月發(fā)布《促進大數(shù)據發(fā)展行動綱要》,并將“實施國家大數(shù)據戰(zhàn)略”寫入最近的兩次五年規(guī)劃中,在十八屆五中全會上反復強調大數(shù)據的國家戰(zhàn)略性,這是我國從數(shù)據資源大國向數(shù)據資源強國邁進,力爭成為全球數(shù)據中心的戰(zhàn)略舉措。歷年國家社科基金課題指南中發(fā)布的“大數(shù)據”立項題目,體現(xiàn)了國家社科基金的國家導向和問題意識。但是,僅有不到三成的國家重大或者重點基金立項項目研究大數(shù)據,且不完全與課題指南的研究學科、研究重點相匹配,因此,解決此問題刻不容緩。當前,大數(shù)據的國家戰(zhàn)略首先要解決大數(shù)據服務政務、實體經濟融合(各學科的融合)、大數(shù)據治理體系構建、大數(shù)據核心技術研究等問題。從社會科學研究的角度來說,研究如何服務國家戰(zhàn)略的首要問題是人才隊伍建設問題。只有形成一批大數(shù)據研究的社會科學團隊,才能解決當前研究力量單薄、各自為政、不持續(xù)的問題。