導讀
在“全民談數(shù)”的大數(shù)據(jù)時代,生生不息的數(shù)據(jù)既遠在天邊,又近在眼前。這些數(shù)據(jù)展現(xiàn)給人們的,既有無窮的價值魅力,也包括應接不暇的數(shù)據(jù)爆炸窘境。為此,數(shù)據(jù)分享持續(xù)成為有意義的討論話題。為了更好地支持數(shù)據(jù)分享,數(shù)據(jù)設施建設尤為重要。所謂數(shù)據(jù)設施建設,并不僅局限在傳統(tǒng)的硬件裝備,還包括在此基礎上的軟件平臺研發(fā)乃至數(shù)據(jù)治理活動本身,其重點在于強調數(shù)據(jù)的透明性、可訪問性、公開服務、有效創(chuàng)新與社會服務的重要性。
在科研數(shù)據(jù)的建設與共享發(fā)展中,來自中國科學院的科研數(shù)據(jù)積累與管理工作已持續(xù)多年,其中較為典型的“科學數(shù)據(jù)庫”項目自1986年建設至今,已積累了PB級的數(shù)據(jù)資源,尤其依托科技數(shù)據(jù)資源整合與共享工程,致力于建設全院乃至國家級科學研究數(shù)據(jù)戰(zhàn)略管理與支撐的巨大寶庫,共享數(shù)據(jù)量現(xiàn)已增加至655 TB,年均在線訪問超過千萬人次。本專題的組建即立足中國科學院的科學數(shù)據(jù)建設進展,分享來自“科學數(shù)據(jù)庫”的數(shù)據(jù)建設成果與管理經(jīng)驗。
其中,黎建輝等人的《中國科學院科學數(shù)據(jù)云建設與服務》概述了中國科學院科學數(shù)據(jù)云的最新建設成果與服務進展;劉峰等人的《大規(guī)模分布式科學數(shù)據(jù)管理與服務技術架構及系統(tǒng)》分享了科學數(shù)據(jù)管理技術的研發(fā)與應用;張麗麗等人的《科研數(shù)據(jù)的開放:進展、模式與新探索》展望了科研數(shù)據(jù)共享的未來探索方向。
此外,還包括多領域科研數(shù)據(jù)管理實踐案例的分享,例如生命科學方面,王亞楠等人的《支持植物學大數(shù)據(jù)整合與公眾服務的iFlora云平臺建設》介紹了“中國植物物種”創(chuàng)建的集數(shù)據(jù)整合與公共服務為一體的“iFlora—大數(shù)據(jù)云平臺”;趙文明等人的《面向國際的生命組學大數(shù)據(jù)管理體系建設》則專注于生命科學研究本土化數(shù)據(jù)服務體系——生命與健康大數(shù)據(jù)中心(BIG Data Center,BIGD)的建設。地學領域,趙江華等人的《眾包模式在大規(guī)模遙感影像信息提取領域的探索》提出了眾包模式在大規(guī)模遙感影像提取層面的創(chuàng)新方法。天文與空間科學方面,張彥霞等人的《21世紀天文學面臨的大數(shù)據(jù)和研究范式轉型》圍繞LSST項目對未來天文科研方法與數(shù)據(jù)管理提出應對思考;為順應大數(shù)據(jù)環(huán)境發(fā)展,王玲玲等人的《SKA數(shù)據(jù)中心云平臺方案的概念性研究》描述了平方公里陣列射(SKA)電望遠鏡數(shù)據(jù)中心進行的嘗試;鄒自明等人的《大數(shù)據(jù)時代空間科學領域的科研信息化實踐與成果》則討論了空間科學虛擬觀測臺(VSSO)和云空間科學綜合應用平臺——日地空間系統(tǒng)研究網(wǎng)絡(STAR-Network)的服務性能與成效方面的內(nèi)容。
順應大數(shù)據(jù)時代的學科發(fā)展特色,專題內(nèi)容圍繞不同規(guī)模、特質的數(shù)據(jù)資源,為人們揭開中國科學院科學數(shù)據(jù)建設的冰山一角。這些數(shù)據(jù)設施建設殊途同歸,強調數(shù)據(jù)管理與學科研究的結合,探索數(shù)據(jù)采集管理與分享的一體化,也展望數(shù)據(jù)工作與科研活動的未來。在革命性的大數(shù)據(jù)時代里,數(shù)據(jù)為科學研究帶來了新的方法論、新的科研范式和全新的思維方式。這些數(shù)據(jù)基礎設施建設也將隨著時代與科研活動的變化而革新演進。這些變化浸潤著時間的氣息與技術的智慧,反作用于科研活動,也深刻影響著你我的生活。