張計龍(復旦大學圖書館副館長)
21世紀迎來了 “數(shù)據爆炸”的大數(shù)據時代, 2011年世界經濟論壇稱大數(shù)據為新財富;2012年美國政府認為大數(shù)據關系到國家經濟結構調整和產業(yè)升級, 是“未來的新石油”;2013年經濟合作與發(fā)展組織報告指出,數(shù)據已經成為科研活動的核心和科技創(chuàng)新發(fā)展的核心驅動要素。作為數(shù)字化革命的引擎,“大數(shù)據”為眾多科學研究帶來新機遇,科學范式開始從模型驅動向數(shù)據驅動轉變,開啟了以數(shù)據為中心思考、設計和實施科學研究的新研究范式。
在大數(shù)據時代, 誰掌握了數(shù)據,誰就站到了大數(shù)據研究的戰(zhàn)略制高點,因此,對數(shù)據資源的爭奪是大數(shù)據研究的必然階段。然而,擁有數(shù)據這一重要的戰(zhàn)略資源是不夠的,保證使用者拿到大數(shù)據資源,并能夠對其進行有效的分析研究、挖掘使用,才能充分發(fā)揮其戰(zhàn)略資源的作用。因此,數(shù)據資源的整合、開放、共享是實施好大數(shù)據發(fā)展戰(zhàn)略中極為重要的一個環(huán)節(jié)。這些也同樣面臨著來自技術、基礎設施、政策和法律、數(shù)據人才等各方面的挑戰(zhàn)。
科學數(shù)據管理與服務具有二個層面的含義。首先是科學數(shù)據的管理,涉及的對象既包括研究者個人如何合理地做科學數(shù)據管理規(guī)劃,也包含研究機構如何制定機構層面的科學數(shù)據管理與服務政策,搭建機構科學數(shù)據管理與服務平臺,既實現(xiàn)機構科學數(shù)據的有效管理,又能進行科學數(shù)據的共享利用,實現(xiàn)科學數(shù)據的增值服務。其次是科學數(shù)據的共享服務,在機構或者研究者個人有效管理科學數(shù)據的基礎上,通過科學數(shù)據交換共享協(xié)議,利用科學數(shù)據共享服務平臺實現(xiàn)數(shù)據共享服務。科學數(shù)據管理與服務對于科研人員和研究機構而言都有著重要的作用與意義。
科研數(shù)據管理過程具有明顯的周期性和階段性特征,基于科研活動不同階段的數(shù)據形態(tài)和數(shù)據處理活動,形成關于科研數(shù)據管理的相關生命周期理論。重點介紹了ICPSR社會科學數(shù)據存檔生命周期管理模型。
科學數(shù)據管理與共享政策有待于政府機構和資助主體的積極推進。
歐盟委員會提出的“FAIR 原則”(Findable、Accessible、Interoperable、Reusable,即可發(fā)現(xiàn)、可訪問、可交互、可重用) 正成為科學數(shù)據管理、監(jiān)管與出版的最新通用原則。2016年7月26日,歐盟委員會公布《Horizon 2020框架下的FAIR數(shù)據管理指南》,提出所有受Horizon 2020資助且參與“開放研究數(shù)據試行計劃”的項目必須提交數(shù)據管理計劃(Data Management Plan,DMP)。
美國國立衛(wèi)生研究院(National Institutes of Health,NIH) 也正在進一步發(fā)展數(shù)據管理、共享和引用策略,其新目標是希望通過一系列數(shù)據管理措施來保證數(shù)據的公平出版。
我國于2018 年3 月17 日由國務院辦公廳印發(fā)了《科學數(shù)據管理辦法》(以下簡稱《辦法》),從職責、科學數(shù)據采集、匯交與保存、共享與利用、保密與安全等方面對科學數(shù)據管理與共享進行了規(guī)范。其中,第四章主要對科學數(shù)據的共享與利用進行了規(guī)范?!犊茖W數(shù)據管理辦法》解讀可從科技部基礎研究司司長葉玉江和國家科技基礎條件平臺中心副主任王瑞丹對《辦法》提出的具體措施中體現(xiàn)?!掇k法》第十九條、二十條、二十一條、二十二條、二十三、二十四條等對科學數(shù)據的共享利用相關問題進行了規(guī)定。
為加強科技創(chuàng)新基礎能力建設,推動我國科技資源整合共享與高效利用,打破科技信息滯留和數(shù)據壟斷格局,“十一五”以來,我國科技部、財政部組織開展國家科技基礎條件平臺建設工作,目前科學數(shù)據共享領域已經建成。數(shù)據開放政策落實中也面臨來自科研激勵機制、知識產權問題、國家安全、機密和隱私保護、成本問題、個體心理和組織文化問題、技術和基礎設施等多方面的阻礙。
國外數(shù)據中心,走訪了芝加哥大學NORC與GSS(綜合社會調查項目)、密西根大學ISR與ICPSR(校際社會科學數(shù)據共享聯(lián)盟)。哈佛大學IQSS、HMDC,HMDC是一個由哈佛大學和麻省理工學院聯(lián)合創(chuàng)建的數(shù)據中心,是定量社會科學研究所(IQSS)的一個成員。加州伯克利大學數(shù)據中心的D-Lab主要為伯克利的師生和研究人員提供一些社會科學數(shù)據的服務和支持,以促進數(shù)據密集型社會科學數(shù)據的研究。另外還走訪了Google 和 Facebook總部、美國人口普查局總部、英國信息系統(tǒng)聯(lián)合委員會(JISC)、澳大利亞科學數(shù)據管理Australian code、莫納什大學的科學數(shù)據管理計劃。
國內主要調研了中國地球與地質物理數(shù)據共享子平臺、上海研發(fā)公共服務平臺(SGST)、北京大學中國社會科學調查中心(ISSS)、中國綜合社會調查(CGSS)。
國外知名的社會科學數(shù)據中心至今已有五十余年的發(fā)展歷史,已構建了比較成熟的數(shù)據交換共享平臺。反觀國內,社會科學數(shù)據中心起步較晚,針對科研機構產生的社會科學數(shù)據的長期保存和共享利用雖有嘗試,但仍處于初級階段,亟待發(fā)展。
復旦大學社會科學數(shù)據中心(FISR)制定了《復旦大學社會科學數(shù)據平臺管理條例》,拓展數(shù)據資源與服務模式,并在交流合作中尋求新發(fā)展。如中國高校研究數(shù)據管理推進工作組依托大數(shù)據學院與大數(shù)據研究院的技術力量、先進設施和成果轉化服務能力,充分發(fā)揮復旦大學人文社會科學的學科優(yōu)勢,構建人文社科科學大數(shù)據共享服務平臺和服務體系,包括復旦大學人文社科數(shù)據平臺的數(shù)據資源、數(shù)據可視化、數(shù)據工具、合作探索數(shù)據出版以及數(shù)據教學科研平臺的建設與推廣等。
科學數(shù)據的價值及數(shù)據管理與共享開放的意義更加明晰,政策導向更加清晰。數(shù)據管理與數(shù)據開放的理念逐步落地,新興技術提供持續(xù)助力,推動更好發(fā)展。數(shù)據權益和數(shù)據安全依然是多方關注的焦點,合作與共贏是不變的發(fā)展之道。不論科研領域,不論利益群體,不論地區(qū)機構,未來更大的發(fā)展需要多方為了共同的目標,不忘初心,砥礪前行。