文/劉榮 張娜
共享 體現(xiàn)科學(xué)數(shù)據(jù)價值
——訪中國工程院院士孫九林
文/劉榮 張娜
科學(xué)數(shù)據(jù)是科學(xué)研究的生命,任何科學(xué)研究都離不開科學(xué)數(shù)據(jù)的支撐。隨著我國科技研究的日益繁榮,各界對科學(xué)數(shù)據(jù)的需求也隨之越來越迫切,科學(xué)數(shù)據(jù)共享已成為時代發(fā)展的必然選擇。與此同時,“科學(xué)數(shù)據(jù)共享工程”的有效推進(jìn),開啟了我國科學(xué)數(shù)據(jù)的共享新篇章,而這些成績的取得離不開科學(xué)界眾多有識之士多年來的呼吁和不斷努力,中國工程院院士、中國科學(xué)院地理科學(xué)與資源研究所研究員孫九林便是其中一員。
孫九林是我國農(nóng)業(yè)與資源環(huán)境信息工程學(xué)術(shù)帶頭人之一,一直十分重視地學(xué)領(lǐng)域科學(xué)數(shù)據(jù)的開發(fā)和共享,長期從事信息科學(xué)與國土資源以及農(nóng)業(yè)交叉領(lǐng)域的研究,開拓了“國土資源及農(nóng)業(yè)”信息科學(xué)管理應(yīng)用新領(lǐng)域,主持完成多項國家級重大項目并解決一系列關(guān)鍵技術(shù),為信息科學(xué)在資源環(huán)境中的應(yīng)用作出了開拓性貢獻(xiàn),是國家級有突出貢獻(xiàn)專家。
自21世紀(jì)以來,信息本身也被當(dāng)作一種資源,甚至是一種比物質(zhì)資源和能量資源更為重要的戰(zhàn)略資源,而數(shù)據(jù)就是信息的基礎(chǔ)。2002年底,在孫九林的倡導(dǎo)和親自主持下,我國正式啟動了“地球系統(tǒng)科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng)”的建設(shè)。2004年,該網(wǎng)作為國家“科學(xué)數(shù)據(jù)共享工程”首批 9個試點之一被納入國家科技基礎(chǔ)條件平臺,屬于科學(xué)數(shù)據(jù)共享工程規(guī)劃中的“基礎(chǔ)科學(xué)與前沿研究”領(lǐng)域,主要是為地球系統(tǒng)科學(xué)的基礎(chǔ)研究和學(xué)科前沿創(chuàng)新提供科學(xué)數(shù)據(jù)支撐和數(shù)據(jù)服務(wù),同時也是目前科學(xué)數(shù)據(jù)共享工程中唯一以整合、集成科研院所、高等院校和科學(xué)家個人,通過科研活動所產(chǎn)生的分散科學(xué)數(shù)據(jù)和科研項目產(chǎn)生的數(shù)據(jù)為重點的建設(shè)項目。
據(jù)了解,國家投資產(chǎn)生的科學(xué)數(shù)據(jù)主要包括兩種類型,一是行業(yè)部門長期采集和管理的科學(xué)數(shù)據(jù);二是各類科技計劃項目產(chǎn)生的研究型數(shù)據(jù)。從事科學(xué)研究是數(shù)據(jù)密集型的活動,離不開這些科學(xué)數(shù)據(jù)的支持,它對海量的、多樣化的觀測、探測、調(diào)查和試驗數(shù)據(jù)具有很強的依賴性,對相關(guān)領(lǐng)域科學(xué)數(shù)據(jù)的共享有著強烈的需求。
但孫九林介紹,許多非常規(guī)的監(jiān)測、觀測數(shù)據(jù),特別是研究過程中產(chǎn)生的數(shù)據(jù),以及地球系統(tǒng)科學(xué)研究所需要的專業(yè)數(shù)據(jù)產(chǎn)品,是不能全部從專業(yè)部門獲得的,它們還分布在從事地球?qū)W科研究的機構(gòu)和組織、高校、科研院所以及科學(xué)家手中。長期以來,獲取科研數(shù)據(jù)難一直是科技工作者反應(yīng)比較集中的問題之一,很多科學(xué)家一直呼吁由國家財政支持的科研項目產(chǎn)生的數(shù)據(jù)能夠?qū)崿F(xiàn)共享。
“科學(xué)數(shù)據(jù)既是項目研究成果的組成部分,又是科技創(chuàng)新的重要基礎(chǔ),如果不把它們交匯、管理起來,不僅不能充分在共享和流通中發(fā)揮其使用價值,也會使一些研究結(jié)果無法進(jìn)行追溯檢查和驗證,從而削弱國家對科技投入的效益?!睂O九林表示。為此,2002年我國實施了“科學(xué)數(shù)據(jù)共享工程”,其目的就在于將這些觀測、監(jiān)測、探測、試驗、實驗等獲得的數(shù)據(jù)、研究項目的過程與成果數(shù)據(jù),以及在這些數(shù)據(jù)的基礎(chǔ)上加工融合產(chǎn)生的多學(xué)科、系列化的數(shù)據(jù)產(chǎn)品進(jìn)行整合、集成和分享,從而發(fā)揮它們的最大價值和效能。
孫九林介紹,發(fā)達(dá)國家很早就開始注重數(shù)據(jù)的開放和流動,甚至斥巨資建立許多部門和行業(yè)數(shù)據(jù)中心,為社會公眾提供數(shù)據(jù)共享服務(wù),而且為了滿足科學(xué)技術(shù)發(fā)展和國家經(jīng)濟建設(shè)的需要,國家不斷增加投入獲取更多新的數(shù)據(jù)資源擴大共享活動,促進(jìn)科技創(chuàng)新和增強國力,而美國就是最好的代表之一。美國政府建設(shè)的國家級科學(xué)數(shù)據(jù)中心群和國家級數(shù)據(jù)信息共享服務(wù)網(wǎng),不但實現(xiàn)了公益性科學(xué)數(shù)據(jù)資源的長期積累,也實現(xiàn)了數(shù)據(jù)的高效管理與廣泛應(yīng)用。
近年來,倡導(dǎo)數(shù)據(jù)共享的國際組織也越來越為活躍。例如,國際科學(xué)聯(lián)合會(ICSU)在一系列全球性研究計劃的推動下,將原來專門設(shè)立的“世界數(shù)據(jù)中心”(World Data Center,WDC),改名為“世界數(shù)據(jù)系統(tǒng)”(World Data System,WDS)和“國際科技數(shù)據(jù)委員會”(Committee on DATA for Science and Technology,CODATA)兩大數(shù)據(jù)組織,主要負(fù)責(zé)開展科學(xué)數(shù)據(jù)的收集、交換和服務(wù)等活動。
國內(nèi)近幾年也加大了數(shù)據(jù)共享的力度,越來越多的學(xué)科和單位都開始注重和開展數(shù)據(jù)交換及共享的相關(guān)工作。更為重要的是,由于我國數(shù)據(jù)共享工程的建設(shè),給大量依托于行業(yè)部門的地學(xué)數(shù)據(jù)的流通和共享提出了“為科學(xué)研究服務(wù)”的數(shù)據(jù)產(chǎn)品要求和發(fā)展規(guī)劃。在此背景下,孫九林等科研人員開展了“地球系統(tǒng)科學(xué)數(shù)據(jù)共享網(wǎng)”的研究,“我們希望通過這項研究不僅能夠充分利用和分享國內(nèi)的資源,還能通過鏡像、交換、導(dǎo)航等多種手段將國外資源充分利用起來?!睂O九林說,通過“地球系統(tǒng)科學(xué)數(shù)據(jù)共享網(wǎng)”的研究,目前我國已同“世界數(shù)據(jù)系統(tǒng)”(WDS)建立了數(shù)據(jù)交換和鏡像合作。
此外,2002年,我國實施了“科學(xué)數(shù)據(jù)共享工程”,氣象、地震、農(nóng)業(yè)、林業(yè)、醫(yī)藥衛(wèi)生等領(lǐng)域的數(shù)據(jù)已經(jīng)實現(xiàn)了共享。另外,根據(jù)《科學(xué)數(shù)據(jù)共享工程發(fā)展規(guī)劃》,到2020年,科學(xué)數(shù)據(jù)共享工程將實現(xiàn)80%以上公益性、基礎(chǔ)性數(shù)據(jù)資源面向全社會共享,使科學(xué)數(shù)據(jù)資源的積累與共享達(dá)到基本滿足科技創(chuàng)新和國家發(fā)展的需求,提高國家創(chuàng)新能力和競爭力,最大限度地滿足國家對科技投入的效益。
孫九林說:“數(shù)據(jù)共享工程是國家科技基礎(chǔ)條件平臺建設(shè)的主要內(nèi)容之一,在財政部和科技部的領(lǐng)導(dǎo)和支持下,我國數(shù)據(jù)共享的狀況已經(jīng)得到了很大改善,同時也得到了社會各界的認(rèn)可。該工程在討論立項的最初就得到了眾多知名專家的好評和贊同,并一致認(rèn)為這是一件有百利而無一害的事情?!北M管最初數(shù)據(jù)共享的理念并不能被大多數(shù)人接受,但是經(jīng)過這幾年的發(fā)展,現(xiàn)在理解和支持?jǐn)?shù)據(jù)共享工程工作的人越來越多。未來雖然還有很長的路要走,但數(shù)據(jù)共享工程的明天是光明的。
孫九林院士(右)2009年12月到香港中文大學(xué)太空與地球信息科學(xué)研究所訪問交流
孫九林院士(右)2009年12月在香港中文大學(xué)建筑學(xué)院參觀交流
國家各類科技計劃項目每年都會產(chǎn)生大量的研究型科學(xué)數(shù)據(jù),這些數(shù)據(jù)既是項目研究成果的組成部分,也是科技創(chuàng)新的重要基礎(chǔ)。長期以來,我國科學(xué)家在科研中大量依賴國外科學(xué)數(shù)據(jù),而國內(nèi)各類科研活動中產(chǎn)生的大量科學(xué)數(shù)據(jù),由于缺乏數(shù)據(jù)共享的機制,無法發(fā)揮其應(yīng)有的作用,數(shù)據(jù)的潛力得不到充分挖掘和利用。孫九林說:“科學(xué)數(shù)據(jù)不僅有科研價值,還有社會價值和經(jīng)濟價值,只有在共享平臺上實現(xiàn)數(shù)據(jù)的共享和流動,數(shù)據(jù)才能不斷升值?!?/p>
從2007年開始,科技部在推動氣象、地震、醫(yī)學(xué)與健康等行業(yè)科研數(shù)據(jù)共享的同時,開始嘗試對科研項目產(chǎn)生的數(shù)據(jù)進(jìn)行匯交管理共享的工作,根據(jù)“地球系統(tǒng)科學(xué)數(shù)據(jù)共享網(wǎng)”建設(shè)的經(jīng)驗,選擇973計劃資源環(huán)境領(lǐng)域項目產(chǎn)生的科學(xué)數(shù)據(jù)進(jìn)行匯交和共享試點工作,試圖把分散在科研人員手中的基礎(chǔ)研究項目數(shù)據(jù)集中起來,通過長期積累建立數(shù)據(jù)共享中心,目的是讓更多的科研人員能夠發(fā)掘和利用這些科學(xué)數(shù)據(jù)的價值,從而促進(jìn)我國科學(xué)研究水平的提高,使得科研活動的價值得到進(jìn)一步提升。
孫九林認(rèn)為:“數(shù)據(jù)匯交是手段而不是目的,在匯交相關(guān)數(shù)據(jù)的基礎(chǔ)上,推動科技創(chuàng)新,提高綜合研究的能力才是數(shù)據(jù)匯交的真正目標(biāo)?!备哔|(zhì)量的數(shù)據(jù)是保障高質(zhì)量共享服務(wù)的基礎(chǔ),數(shù)據(jù)匯交中心通過對元數(shù)據(jù)、數(shù)據(jù)說明文檔和數(shù)據(jù)實體的審查來保障數(shù)據(jù)的可靠性;還通過同行專家對項目組預(yù)先制定的數(shù)據(jù)匯交計劃進(jìn)行審核,以此來保障數(shù)據(jù)的準(zhǔn)確性、系統(tǒng)性和科學(xué)性。孫九林說:“這是為了提高數(shù)據(jù)質(zhì)量而不得以采取的約束性制度?!?/p>
據(jù)悉,經(jīng)過一年的調(diào)查研究,科技部形成了《國家重點基礎(chǔ)研究發(fā)展計劃(973)資源環(huán)境領(lǐng)域項目數(shù)據(jù)匯交暫行辦法》,2008年科技部正式啟動了“973計劃資源環(huán)境領(lǐng)域項目數(shù)據(jù)交匯工作”,下發(fā)了《關(guān)于開展國家重點基礎(chǔ)研究發(fā)展計劃資源環(huán)境領(lǐng)域項目數(shù)據(jù)匯交工作的通知》,頒布了形成的“匯交暫行辦法”,并在資源環(huán)境信息系統(tǒng)國家重點實驗室成立“973計劃資源環(huán)境領(lǐng)域項目數(shù)據(jù)匯交管理中心”,由孫九林院士擔(dān)任中心主任。2009年10月,科技部又規(guī)定2009年(含)以后參加驗收的項目必須先完成數(shù)據(jù)匯交工作,才能進(jìn)行項目驗收。973計劃資源環(huán)境領(lǐng)域項目從1998年開始啟動,2010年以前結(jié)題的29個項目均已完成數(shù)據(jù)匯交,絕大部分?jǐn)?shù)據(jù)提供完全開放共享;2010年以前啟動但尚未結(jié)題的32個項目均已完成了數(shù)據(jù)匯交計劃的編制。希望在不久的將來,科學(xué)家能夠把數(shù)據(jù)匯交與共享視為一種自覺行為,這樣才能更好地挖掘科學(xué)數(shù)據(jù)的價值。
孫九林院士2011年5月考察秦嶺山區(qū)登上太白峰
孫九林院士2011年5月在秦嶺北坡考察
數(shù)據(jù)一匯交便涉及到科學(xué)家的知識產(chǎn)權(quán)保護(hù)問題,這是數(shù)據(jù)共享工程中非常重要的一個問題,那么怎樣才能既實現(xiàn)科學(xué)數(shù)據(jù)的共享,又能保護(hù)科學(xué)家的知識產(chǎn)權(quán)呢?談及工作多年對此最深的體會,孫九林表示:“其實科學(xué)數(shù)據(jù)的匯交工作并沒有想象中的難以實現(xiàn),最早我們很擔(dān)心科學(xué)家們不配合工作,但是經(jīng)過幾年的發(fā)展,很大一部分科學(xué)家都明確支持?jǐn)?shù)據(jù)匯交,也愿意將自己的研究數(shù)據(jù)上交到數(shù)據(jù)管理中心。”
據(jù)了解,科學(xué)家們的擔(dān)心主要有兩個方面:首先,文章沒發(fā)表前,關(guān)鍵數(shù)據(jù)如何保密?其次,如何保證引用者在引用時都會注明出處?孫九林介紹,他們剖析了NIH數(shù)據(jù)共享政策和共享規(guī)范,同時深入研究了“世界數(shù)據(jù)系統(tǒng)”的科研項目數(shù)據(jù)管理,科技部基礎(chǔ)司在此基礎(chǔ)上結(jié)合我國項目數(shù)據(jù)交匯的現(xiàn)實狀況,制定了非常詳盡的細(xì)則即上述的“匯交暫行辦法”,以確??茖W(xué)家的知識產(chǎn)權(quán)得到保護(hù)。比如,他們規(guī)定數(shù)據(jù)匯交管理中心工作人員不得從事所負(fù)責(zé)領(lǐng)域的科學(xué)研究。
此外,數(shù)據(jù)還可以設(shè)置保護(hù)期,保護(hù)期內(nèi)的項目數(shù)據(jù)僅供項目和課題承擔(dān)單位及其授權(quán)范圍內(nèi)的用戶訪問和使用。過保護(hù)期后,數(shù)據(jù)匯交中心以在線、離線等方式分期、分批向全社會提供數(shù)據(jù)共享服務(wù),用戶利用匯交數(shù)據(jù)所產(chǎn)生的成果需要注明數(shù)據(jù)來源。另外,有的科學(xué)家也提出,最初產(chǎn)生數(shù)據(jù)的科學(xué)家利用這些數(shù)據(jù)發(fā)表了很多文章,之后再利用這些數(shù)據(jù)的科研人員,不僅要標(biāo)明數(shù)據(jù)來源,也要標(biāo)注已經(jīng)利用這些數(shù)據(jù)發(fā)表的文章。“標(biāo)示清楚了就解除了后顧之憂,而標(biāo)注的形式也都是科學(xué)家自己提出的方式?!睂O九林說。
記者了解到,雖然數(shù)據(jù)是免費提供的,但并不是任何人隨時隨地都可以獲得數(shù)據(jù)。首先使用者要向管理部門提出申請,其次必須寫明從事研究的領(lǐng)域和課題,需要的數(shù)據(jù)類型等,經(jīng)過審核才能提供相關(guān)數(shù)據(jù)。孫九林坦言:“經(jīng)過幾年的實踐,我們已經(jīng)具備了較完整的技術(shù)平臺開發(fā)和建設(shè)能力,而且,我們開發(fā)的所有平臺軟件和工具都具備可移植性和擴展性,在功能體系上,能夠滿足項目數(shù)據(jù)匯交用戶、數(shù)據(jù)使用者、數(shù)據(jù)匯交管理機構(gòu)三方的要求,在其他領(lǐng)域應(yīng)用也很方便,”
科學(xué)數(shù)據(jù)共享通過前期的試點,后期在科技部條件平臺項目中建設(shè),目前共享的科學(xué)數(shù)據(jù)資源基本涵蓋了我國三分之一左右的公益性、基礎(chǔ)性科學(xué)數(shù)據(jù)類型,內(nèi)容涉及自然科學(xué)、社會科學(xué)與人文科學(xué)等學(xué)科,它們都是行業(yè)部門及科研領(lǐng)域通過巨資投入而產(chǎn)生的。據(jù)不完全統(tǒng)計,科學(xué)數(shù)據(jù)共享工程的實施,已經(jīng)整合盤活共享了超過250億元的國家投入產(chǎn)生的科學(xué)數(shù)據(jù)資源,并建立了若干數(shù)據(jù)庫,積極開展數(shù)據(jù)共享服務(wù),為科學(xué)研究、政府決策提供了堅實的支撐,效果顯著??茖W(xué)數(shù)據(jù)共享工程先后為若干 “973”項目、“863”項目、科技支撐項目,以及自然科學(xué)基金等重大項目和工程提供基礎(chǔ)數(shù)據(jù)支撐,有力地促進(jìn)了我國科技創(chuàng)新和社會發(fā)展。
自第一個試點——氣象科學(xué)數(shù)據(jù)共享工程試點以來,在資源環(huán)境、農(nóng)業(yè)、人口與健康、基礎(chǔ)與前沿等領(lǐng)域共24個部門開展了科學(xué)數(shù)據(jù)共享工作,迄今為止已初具規(guī)模。如今,科學(xué)數(shù)據(jù)共享的概念已經(jīng)在科技界得到廣泛認(rèn)可,形成了良好的共享氛圍和服務(wù)意識。我國科學(xué)數(shù)據(jù)封閉獨享的局面也得到了有效改善,該工程不僅帶動了跨行業(yè)數(shù)據(jù)交換工作的發(fā)展,也在科技界乃至全國產(chǎn)生了深遠(yuǎn)的影響。
談到未來的發(fā)展和目標(biāo),孫九林表示:“希望能夠?qū)⒖茖W(xué)數(shù)據(jù)共享工程所形成的管理辦法、標(biāo)準(zhǔn)規(guī)范、技術(shù)平臺,包括一些經(jīng)驗和體會,更好地推廣到更廣泛的領(lǐng)域中去。這也是我們研究這項事業(yè)的初衷?!苯煌ú块T、人口與健康等領(lǐng)域都想開展科研項目產(chǎn)生的數(shù)據(jù)匯交管理工作,就目前的形勢看,數(shù)據(jù)共享工程很有發(fā)展前景。我們也希望科研項目數(shù)據(jù)的匯交工作不僅局限于資源環(huán)境領(lǐng)域的項目,至少能夠逐步使國家財政支持的科學(xué)研究項目,都能采取數(shù)據(jù)匯交的管理辦法,使國家投資所產(chǎn)生的數(shù)據(jù),能對我國的科學(xué)創(chuàng)新作出更多貢獻(xiàn)。
孫九林院士2009年12月在香港中文大學(xué)接受黃乃正副校長(右)贈送的紀(jì)念品
孫九林,中科院地理科學(xué)與資源研究所研究員,博士生導(dǎo)師,資源學(xué)家,農(nóng)業(yè)與資源環(huán)境信息工程學(xué)科帶頭人之一。在其取得的15項重大成果中,11項獲省部級以上18種獎勵;出版專著十余部、發(fā)表論文100余篇。20世紀(jì)80年代首次提出我國資源信息管理體系結(jié)構(gòu)、資源信息分類編碼、區(qū)域開發(fā)模型體系、統(tǒng)計型空間信息系統(tǒng)模式等,為信息科學(xué)在資源環(huán)境中的應(yīng)用做出了開拓性貢獻(xiàn)?!笆濉逼陂g主持國家科技基礎(chǔ)性工作重大項目“中國地球科學(xué)數(shù)據(jù)中心完善與服務(wù)”、中國科學(xué)院知識創(chuàng)新前沿方向性項目“中國自然資源數(shù)據(jù)庫及信息系統(tǒng)”、國際合作項目“全球氣候變暖影響模型研究”及“亞太環(huán)境創(chuàng)新戰(zhàn)略研究”等。2001年當(dāng)選為中國工程院院士,2003年起開始主持國家科學(xué)數(shù)據(jù)共享工程試點項目“中國地球系統(tǒng)科學(xué)數(shù)據(jù)共享網(wǎng)建設(shè)”等。他所領(lǐng)導(dǎo)的“地球系統(tǒng)科學(xué)數(shù)據(jù)共享網(wǎng)”團(tuán)隊獲得“十一五”國家科技計劃執(zhí)行優(yōu)秀團(tuán)隊獎。