李正超
(鄭州師范學(xué)院信息科學(xué)與技術(shù)學(xué)院)
隨著云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)發(fā)展,科技文獻信息數(shù)字化速度加快,數(shù)字資源與技術(shù)流、資金流、人才流一樣,業(yè)已成為區(qū)域重要的生產(chǎn)要素和社會財富。世界各國的政府和相關(guān)組織也對科學(xué)數(shù)據(jù)管理與共享給予有力的支持,聯(lián)合國教科文組織將科學(xué)數(shù)據(jù)定為開放存取信息資源;英國決定由政府資金支持的科學(xué)數(shù)據(jù)、研究成果免費向公眾開放,不受版權(quán)等因素的影響;歐盟委員會也發(fā)表了類似聲明,通過保證科學(xué)數(shù)據(jù)的長期可獲取、共享及重復(fù)利用,為其未來發(fā)揮更大的作用奠定基礎(chǔ)。因此,對科學(xué)數(shù)據(jù)共享進行研究尤為必要,特別是高校,其科學(xué)研究具有整體活躍、學(xué)科范圍廣泛、研究基礎(chǔ)良好等特性,易于產(chǎn)生海量的數(shù)據(jù),這些數(shù)據(jù)各自分散、孤立、互動性較差,造成了科學(xué)數(shù)據(jù)管理極為復(fù)雜的局面。[1]
科學(xué)數(shù)據(jù)共享的模式多種多樣,劉潤達等[2]把科學(xué)數(shù)據(jù)共享歸為專業(yè)化生產(chǎn)、聯(lián)合共建共享、數(shù)據(jù)交換;王培正等[3]認(rèn)為科學(xué)數(shù)據(jù)共享可劃分為基于完全開放數(shù)據(jù)庫的共享、基于查詢接口的共享、基于元數(shù)據(jù)的共享、基于開放網(wǎng)格服務(wù)架構(gòu)(OGSADAI)數(shù)據(jù)集成的共享四種模式;王晴[4]提出了科學(xué)數(shù)據(jù)共享公益性和商業(yè)化兩種模式;完顏鄧鄧[5]根據(jù)澳大利亞高校制訂科學(xué)數(shù)據(jù)管理與共享政策的經(jīng)驗,提出制訂我國高??茖W(xué)數(shù)據(jù)管理與共享政策時,內(nèi)容應(yīng)完整全面、各項規(guī)定應(yīng)具體明確、細化對相關(guān)者責(zé)任的規(guī)定、明確各方職責(zé)、及時更新政策內(nèi)容;張麗麗[6]認(rèn)為科學(xué)數(shù)據(jù)共享可分為組織內(nèi)部的數(shù)據(jù)共享、有管制的數(shù)據(jù)共享、中間體形態(tài)的數(shù)據(jù)共享、市場形態(tài)的數(shù)據(jù)共享等多種模式;魏悅、劉桂鋒[7]針對英美澳三國的高??蒲袛?shù)據(jù)管理政策比較,運用數(shù)據(jù)生命周期理論論述科研數(shù)據(jù)管理政策內(nèi)容,為國內(nèi)高??茖W(xué)數(shù)據(jù)共享平臺建設(shè)和發(fā)展提供理論研究基礎(chǔ)和實踐應(yīng)用參考;溫芳芳[8]通過分析總結(jié)國外科學(xué)數(shù)據(jù)開放共享政策法規(guī),為我國制訂相關(guān)政策提出政府引導(dǎo)、發(fā)揮政府部門與公共資助機構(gòu)的領(lǐng)導(dǎo)力等建議;黃國彬等[9]通過研究英、澳科學(xué)數(shù)據(jù)共享過程中的個人隱私保護政策,為我國科學(xué)數(shù)據(jù)個人隱私保護政策的制定與實施提供借鑒;東方[10]以美國圖書館界科學(xué)數(shù)據(jù)管理與共享的實踐為案例,對國內(nèi)科學(xué)數(shù)據(jù)共享啟示包括持續(xù)關(guān)注科學(xué)數(shù)據(jù)管理與共享、開展科研項目的研究等內(nèi)容;王延飛等[11]結(jié)合國際上科學(xué)數(shù)據(jù)共享發(fā)展的典型案例,通過解析發(fā)現(xiàn),在科學(xué)數(shù)據(jù)共享生態(tài)中重點活躍領(lǐng)域、關(guān)鍵技術(shù)、適時開放評估等內(nèi)容是我國亟待完成的研究任務(wù)。
總的來說,目前國內(nèi)學(xué)者研究科學(xué)數(shù)據(jù)共享大多借鑒國外的文獻研究成果,如,英國、美國等,研究領(lǐng)域涉及共享政策、共享治理、共享實踐、隱私權(quán)等。對于科學(xué)數(shù)據(jù)共享平臺的現(xiàn)狀,雖然有少量的自評估及構(gòu)建情況的報告提交,但整體上對這些科學(xué)數(shù)據(jù)共享網(wǎng)站現(xiàn)狀的研究還很少,更缺乏對其數(shù)據(jù)資源、信息構(gòu)建以及服務(wù)等優(yōu)劣情況進行深入和綜合的考察。
目前,國內(nèi)科學(xué)數(shù)據(jù)共享平臺總量頗具規(guī)模,已有近200個科學(xué)數(shù)據(jù)共享平臺(包括非獨立域名下的二級網(wǎng)站)。其中,高校科學(xué)數(shù)據(jù)共享平臺、復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)管理平臺、北京大學(xué)開放研究數(shù)據(jù)平臺等8個平臺發(fā)展較具代表性(見下表)。
表 國內(nèi)科學(xué)數(shù)據(jù)共享平臺建設(shè)現(xiàn)狀
整體而言,國內(nèi)科學(xué)數(shù)據(jù)共享平臺總體建設(shè)狀況良好,已由高校如武漢大學(xué)、復(fù)旦大學(xué)、北京大學(xué)等延伸到中國科學(xué)院、國家科技基礎(chǔ)條件平臺中心以及省級情報信息機構(gòu),如,四川省、上海市等。這些科學(xué)數(shù)據(jù)共享平臺主要開展科學(xué)數(shù)據(jù)的存儲、備份和共享服務(wù),整合科技資源,提升創(chuàng)新能力。
(1)思想認(rèn)識不足,建設(shè)資金來源單一??茖W(xué)數(shù)據(jù)共享平臺是一個龐大的系統(tǒng)工程,包括建設(shè)目標(biāo)、資金來源、服務(wù)方式、數(shù)據(jù)付費狀況等。據(jù)調(diào)查,個別平臺主管單位或承建者對科學(xué)數(shù)據(jù)共享存在認(rèn)識不清、界定模糊的問題。① 一些科技文獻共享平臺中將鏈接的部分科學(xué)數(shù)據(jù)內(nèi)容等同于科學(xué)數(shù)據(jù)共享平臺,如,廣東省科技文獻共享平臺的科學(xué)數(shù)據(jù)混淆了科技文獻與科學(xué)數(shù)據(jù)的區(qū)別,科技文獻包含了科學(xué)數(shù)據(jù),而科學(xué)數(shù)據(jù)共享平臺突出元數(shù)據(jù)的獲取、組織、共享、保存與安全等,專指性較強,寬泛的界定將不利于科學(xué)數(shù)據(jù)共享平臺健康發(fā)展。② 充足的資金來源是科學(xué)數(shù)據(jù)共享平臺建設(shè)的基本保障。國內(nèi)科學(xué)數(shù)據(jù)共享平臺的建設(shè)資金來源單一,缺乏企業(yè)等商業(yè)機構(gòu)的合作,單一性的資金來源很難維持科學(xué)數(shù)據(jù)共享平臺建設(shè)的可持續(xù)發(fā)展。如,智能制造科學(xué)數(shù)據(jù)服務(wù)平臺是國家科技基礎(chǔ)條件平臺建設(shè)的子項目,由科技部、財政部共同組織實施;中國科學(xué)院科學(xué)數(shù)據(jù)云由中國科學(xué)院信息化專項和國家科技基礎(chǔ)條件平臺資助;復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)研究中心提供經(jīng)費,并主持建設(shè)復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)管理平臺;北京大學(xué)開放研究數(shù)據(jù)平臺的經(jīng)費來源于北京大學(xué)圖書館等。
(2)服務(wù)方式單一??茖W(xué)數(shù)據(jù)服務(wù)功能多種多樣,包括數(shù)據(jù)檢索與獲取、最新動態(tài)推送、工具和模型應(yīng)用、圖書館信息服務(wù)、多媒體展示等。國內(nèi)科學(xué)數(shù)據(jù)共享平臺普遍側(cè)重于數(shù)據(jù)的推送、檢索、瀏覽、查詢、下載、可視化等,而忽視了傳統(tǒng)的信息服務(wù)功能、社交媒體與手機APP研發(fā)等,以至于用戶使用起來較繁瑣,從而降低了科學(xué)數(shù)據(jù)利用率。武漢大學(xué)圖書館高??茖W(xué)數(shù)據(jù)共享平臺以開源軟件Dspace為平臺基礎(chǔ),可獲取各類型科學(xué)數(shù)據(jù),組織、創(chuàng)建符合用戶需求情景的數(shù)據(jù)庫,存儲、發(fā)布自己的數(shù)據(jù);也可在平臺上查詢、搜索已發(fā)布的數(shù)據(jù)。北京大學(xué)開放研究數(shù)據(jù)平臺提供研究數(shù)據(jù)的查詢、瀏覽、檢索、下載、針對性的數(shù)據(jù)支持(如統(tǒng)計分析)等服務(wù)。除了中國科學(xué)院數(shù)據(jù)云DataPub數(shù)據(jù)共享社區(qū)數(shù)據(jù)社交平臺,其他平臺仍存在很大的空白,仍有拓展的空間。
(3)國內(nèi)科學(xué)數(shù)據(jù)共享平臺服務(wù)內(nèi)容強化數(shù)據(jù)主導(dǎo)型,淡化了數(shù)據(jù)服務(wù)型。一方面,國內(nèi)科學(xué)數(shù)據(jù)共享平臺服務(wù)內(nèi)容不完善,沒有認(rèn)清科學(xué)數(shù)據(jù)服務(wù)內(nèi)容生命周期性。科學(xué)數(shù)據(jù)共享平臺服務(wù)內(nèi)容包括數(shù)據(jù)管理計劃、數(shù)據(jù)空間、數(shù)據(jù)集、數(shù)據(jù)組織、數(shù)據(jù)描述、數(shù)據(jù)發(fā)布等,具有明顯的生命周期性,即科學(xué)數(shù)據(jù)生產(chǎn)、科學(xué)數(shù)據(jù)組織、科學(xué)數(shù)據(jù)存儲、科學(xué)數(shù)據(jù)出版與科學(xué)數(shù)據(jù)利用。武漢大學(xué)圖書館高??茖W(xué)數(shù)據(jù)共享平臺、復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)管理平臺、北京大學(xué)開放研究數(shù)據(jù)平臺、中國科學(xué)院科學(xué)數(shù)據(jù)云等均含有數(shù)據(jù)提交、收集、組織、存貯、分析、可視化、共享、分布、出版功能,但缺少數(shù)據(jù)管理計劃功能。復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)管理平臺、北京大學(xué)開放研究數(shù)據(jù)平臺都選擇開源軟件Dataverse為科學(xué)數(shù)據(jù)共享平臺基礎(chǔ),具有較好的數(shù)據(jù)分析和可視化功能,而武漢大學(xué)圖書館高??茖W(xué)數(shù)據(jù)共享平臺以開源軟件Dspace為平臺基礎(chǔ),數(shù)據(jù)分析和可視化功能較弱,用戶不能直接進行在線分析和可視化處理,降低了科學(xué)數(shù)據(jù)的使用率。另一方面,國內(nèi)科學(xué)數(shù)據(jù)共享平臺普遍缺少科學(xué)數(shù)據(jù)教育培訓(xùn)與知識科普宣傳推廣服務(wù)內(nèi)容。教育培訓(xùn)與知識科普宣傳應(yīng)為平臺重點構(gòu)建服務(wù)內(nèi)容之一,僅發(fā)現(xiàn)國家地球系統(tǒng)科學(xué)數(shù)據(jù)共享服務(wù)平臺設(shè)置 “知識百科” 欄目,并對其內(nèi)容進行了分類。
(4)科學(xué)數(shù)據(jù)共享平臺存在不確定因素,風(fēng)險無所不在。科學(xué)數(shù)據(jù)共享平臺往往涉及數(shù)據(jù)資源整合、數(shù)據(jù)出版、數(shù)據(jù)交易等內(nèi)容,而科學(xué)數(shù)據(jù)監(jiān)管項目是一個不斷發(fā)展變化的復(fù)雜系統(tǒng),尤其要在未來相當(dāng)長的一段時間保證科學(xué)數(shù)據(jù)的可用性、真實性和可理解性。實驗數(shù)據(jù)丟失或被損毀、設(shè)備故障、病毒侵襲等風(fēng)險可能同時存在于平臺系統(tǒng)之中,互相作用、產(chǎn)生連鎖反應(yīng),導(dǎo)致科學(xué)數(shù)據(jù)監(jiān)管工作更加繁重、復(fù)雜。現(xiàn)階段,科學(xué)數(shù)據(jù)往往以高校、科研機構(gòu)為單位儲存各自的數(shù)據(jù),但是各個單位之間的數(shù)據(jù)、單位內(nèi)部數(shù)據(jù)與數(shù)據(jù)的關(guān)聯(lián)性不高,數(shù)據(jù)之間的關(guān)聯(lián)價值未能充分體現(xiàn)出來,難以實現(xiàn)跨單位、跨組織科學(xué)數(shù)據(jù)的開放獲取,制約了科學(xué)數(shù)據(jù)的效益與價值得到最大化發(fā)揮。[12]北京大學(xué)開放研究數(shù)據(jù)平臺采取DOI(Digital Object Unique Identifier,數(shù)字化對象的識別符)、規(guī)范的數(shù)據(jù)引用、靈活的訪問控制、請求與審核機制、規(guī)范的版權(quán)保護、實名學(xué)術(shù)社區(qū)等,規(guī)避侵權(quán)風(fēng)險;四川省科技文獻共享服務(wù)平臺對于一些特殊的數(shù)據(jù)訪問,設(shè)置權(quán)限,僅面向四川地區(qū)的用戶。國內(nèi)很少有科學(xué)數(shù)據(jù)共享平臺將數(shù)據(jù)的訪問與安全及共享緊密聯(lián)系起來,在顯著位置提醒用戶數(shù)據(jù)訪問時需要注意保護數(shù)據(jù)的知識產(chǎn)權(quán)、版權(quán)、敏感和私密數(shù)據(jù)的訪問等,也很少有平臺關(guān)注到數(shù)據(jù)組織機構(gòu)對元數(shù)據(jù)做出的說明,如,數(shù)據(jù)描述、文件命名與格式、版本控制,沒有形成統(tǒng)一的規(guī)范標(biāo)準(zhǔn),不利于科學(xué)數(shù)據(jù)的存儲與分享。
大數(shù)據(jù)時代,全社會倡導(dǎo)創(chuàng)建“人人都是數(shù)據(jù)的提供者,人人都是數(shù)據(jù)的使用者”的數(shù)據(jù)共享服務(wù)環(huán)境。科學(xué)數(shù)據(jù)共享平臺建設(shè)者需要轉(zhuǎn)變思想觀念,充分認(rèn)識到科學(xué)數(shù)據(jù)管理的重要性與必要性,敢于進行頂層設(shè)計,制定不同階段的發(fā)展目標(biāo)、實施方案等。科學(xué)數(shù)據(jù)是一個新興事物,需要對其統(tǒng)攬全局,規(guī)避數(shù)據(jù)過時、攜帶病毒等威脅與侵犯風(fēng)險,創(chuàng)建有效、可信的科學(xué)數(shù)據(jù)存儲庫,以便廣泛地進行分享交流。
(1)數(shù)據(jù)云服務(wù)??茖W(xué)數(shù)據(jù)共享平臺由數(shù)據(jù)環(huán)境上升為數(shù)據(jù)云服務(wù),分為三層,第一層為SaaS即科學(xué)數(shù)據(jù)應(yīng)用服務(wù),包括共享社區(qū)、不同學(xué)科的數(shù)據(jù)云;第二層為DaaS即科學(xué)數(shù)據(jù)分析技術(shù),包括數(shù)據(jù)處理、數(shù)據(jù)資源管理;第三層為IaaS即科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施服務(wù),包括存儲資源、計算資源和數(shù)據(jù)資源(見下圖)。
圖 科學(xué)數(shù)據(jù)共享平臺研究框架
(2)合理的組織架構(gòu)??茖W(xué)數(shù)據(jù)共享平臺是一個組織或機構(gòu),應(yīng)具備組織或機構(gòu)的構(gòu)成要件。因此,平臺的主管部門可以為科學(xué)數(shù)據(jù)的共享成立專門的科學(xué)數(shù)據(jù)共享委員會,配置主任、副主任、組員若干名,委員會下設(shè)科學(xué)數(shù)據(jù)共享指導(dǎo)小組和行動小組。[13]指導(dǎo)小組涵蓋不同學(xué)科領(lǐng)域的專家、學(xué)者,提供及時、專業(yè)的知識服務(wù)。行動小組主要由研究機構(gòu)、圖書情報機構(gòu)等牽頭,具體實施用戶服務(wù)、運營管理、參考咨詢以及服務(wù)協(xié)調(diào)。
(3)完善平臺管理??茖W(xué)數(shù)據(jù)共享平臺需要制定加盟協(xié)議、崗位工作職責(zé)、使用規(guī)則、服務(wù)指南、元數(shù)據(jù)標(biāo)準(zhǔn)等。平臺制度也包括專項資金投入制度,如數(shù)據(jù)庫建設(shè)招投標(biāo)、科學(xué)數(shù)據(jù)項目補貼資助等,專項資金可以由政府財政撥款,也可以積極引入社會力量參與科學(xué)數(shù)據(jù)建設(shè),[14]并能夠借鑒高校圖書館數(shù)字資源聯(lián)合采購的成功經(jīng)驗,制定科學(xué)數(shù)據(jù)共享平臺聯(lián)合科學(xué)數(shù)據(jù)采購制度與實施辦法。平臺制度也含共建共享制度,包括統(tǒng)一規(guī)劃科學(xué)數(shù)據(jù)建設(shè)、推進系統(tǒng)內(nèi)數(shù)據(jù)合作建設(shè)、推進跨系統(tǒng)數(shù)據(jù)合作建設(shè)等。平臺應(yīng)制訂科學(xué)數(shù)據(jù)長期保存政策,以及建立科學(xué)數(shù)據(jù)建設(shè)與服務(wù)的信息公開、投訴處理和責(zé)任追究等機制,從宏觀政策層面保障科學(xué)數(shù)據(jù)共享平臺建設(shè)與服務(wù)。
科學(xué)數(shù)據(jù)共享平臺是有效開展科學(xué)數(shù)據(jù)管理的主要手段,服務(wù)方式多種多樣。科學(xué)數(shù)據(jù)共享平臺除具備科技文獻信息服務(wù)方式外,又具備了科學(xué)數(shù)據(jù)服務(wù),即,科學(xué)數(shù)據(jù)管理計劃、科學(xué)數(shù)據(jù)獲取、科學(xué)數(shù)據(jù)存儲與共享、科學(xué)數(shù)據(jù)再利用、科學(xué)數(shù)據(jù)管理培訓(xùn)、科學(xué)數(shù)據(jù)保護與道德,以及科學(xué)數(shù)據(jù)管理參考咨詢。[15]科學(xué)數(shù)據(jù)共享平臺還應(yīng)充分利用主流社交平臺,如,新浪微博、騰訊微博、微信公眾號等,及時更新通知公告、資訊動態(tài)、政策法規(guī)、研究報告等。上海研發(fā)公共服務(wù)平臺的科技創(chuàng)新資源數(shù)據(jù)中心通過開設(shè)科技114服務(wù)熱線、開通微信公眾賬戶等措施,吸引更多用戶使用平臺各類服務(wù),促進科研成果的推廣。中國科學(xué)院數(shù)據(jù)云利用DataPub數(shù)據(jù)共享社區(qū)數(shù)據(jù)社交平臺,推動數(shù)據(jù)共享與交流。DataPub數(shù)據(jù)共享社區(qū)具備以下功能:① 我有數(shù)據(jù),即將數(shù)據(jù)發(fā)布到Datapub上,使更多人知道和可以獲取復(fù)用科學(xué),充分發(fā)揮數(shù)據(jù)價值;② 我要數(shù)據(jù),即查找和獲取Datapub上的數(shù)據(jù),或?qū)?shù)據(jù)需求提給工作人員;③數(shù)據(jù)互動,即朋友圈交互、數(shù)據(jù)社區(qū)交互,進行全方位的數(shù)據(jù)交流與互動。通過DataPub,用戶可以高效地獲取數(shù)據(jù);數(shù)據(jù)提供者獲得了有效的溝通渠道。DataPub以互聯(lián)網(wǎng)社交的方式構(gòu)建數(shù)據(jù)交互系統(tǒng)(關(guān)注、好友、收藏、動態(tài)、社區(qū)),具有完善的數(shù)據(jù)評價機制(數(shù)據(jù)點評、結(jié)果分析、benchmark),可進行統(tǒng)一數(shù)據(jù)服務(wù)與集中管理(統(tǒng)一認(rèn)證、數(shù)據(jù)授權(quán)、數(shù)據(jù)緩存)。
(1)數(shù)據(jù)主導(dǎo)型服務(wù)內(nèi)容??茖W(xué)數(shù)據(jù)共享平臺多為數(shù)據(jù)主導(dǎo)型,重視對用戶已經(jīng)生成的、平臺自身收集、整理的科學(xué)數(shù)據(jù)進行存儲和管理。武漢大學(xué)社會科學(xué)數(shù)據(jù)管理平臺、中國科學(xué)院科學(xué)數(shù)據(jù)管理平臺主要用來實現(xiàn)數(shù)據(jù)的存儲和共享;復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)管理平臺不但具有數(shù)據(jù)存儲和共享功能,而且將數(shù)據(jù)嵌入到用戶科研一線服務(wù)。[16]
(2)教育培訓(xùn)與知識科普宣傳推廣??茖W(xué)數(shù)據(jù)管理與共享教育及培訓(xùn)是科學(xué)數(shù)據(jù)共享平臺一項重要的服務(wù)內(nèi)容,具體包括工作人員培訓(xùn)和用戶培訓(xùn)兩種形式。平臺工作人員需要具備數(shù)據(jù)抽取、轉(zhuǎn)換、加載(ETL)流程和數(shù)據(jù)管道建設(shè)等專業(yè)知識以及豐富的數(shù)據(jù)倉庫技能。通過了解平臺所需的數(shù)據(jù)、識別相關(guān)的新數(shù)據(jù)源、提取可用的格式數(shù)據(jù),確保數(shù)據(jù)不出錯并將數(shù)據(jù)加載到用戶需求中,滿足用戶的知識需要;同時,其必備的工具技能包括精通R語言或Python編程、強大的SQL技能、基于Hadoop的技術(shù)(如MapReduce、Hive和Pig)等。隨著多條數(shù)據(jù)流水線開始出現(xiàn),Dataverse、Airflow和Luigi等開源工作流管理工具可用于創(chuàng)建和監(jiān)控數(shù)據(jù)流水線。以上是對平臺工作人員培訓(xùn)的要求,既可通過短期技能培訓(xùn),也可通過高校、研究機構(gòu)等數(shù)據(jù)管理專業(yè)開展學(xué)歷教育,二者根據(jù)情況而定。短期培訓(xùn)課程的內(nèi)容主要包括制定數(shù)據(jù)管理計劃、科學(xué)數(shù)據(jù)組織、科學(xué)數(shù)據(jù)保存、科學(xué)數(shù)據(jù)監(jiān)管、元數(shù)據(jù)管理、數(shù)據(jù)存、科學(xué)數(shù)據(jù)監(jiān)管、元數(shù)據(jù)管理、數(shù)據(jù)共享等;[1]學(xué)歷專業(yè)教育課程主要包括科學(xué)數(shù)據(jù)分析、科學(xué)數(shù)據(jù)監(jiān)護、數(shù)據(jù)挖掘、科學(xué)數(shù)據(jù)開發(fā)與共享等。國內(nèi)信息專業(yè)教育有必要面向數(shù)據(jù)科學(xué)的信息管理與信息系統(tǒng)專業(yè)課程體系,從數(shù)據(jù)科學(xué)基礎(chǔ)理論、實驗方法和數(shù)據(jù)研究領(lǐng)域全面培養(yǎng)。[17]用戶培訓(xùn)以短期培訓(xùn)為主,注重技巧、經(jīng)驗等應(yīng)用,以提高用戶信息素養(yǎng)。另外,科學(xué)數(shù)據(jù)共享平臺強調(diào)知識科普的重要性。[18]用戶通過知識科普,熟悉科學(xué)數(shù)據(jù)獲取內(nèi)容(如,數(shù)據(jù)過程要求、權(quán)限與認(rèn)可)、數(shù)據(jù)組織、數(shù)據(jù)保存、數(shù)據(jù)共享、數(shù)據(jù)安全等管理政策,提高用戶科學(xué)數(shù)據(jù)利用能力與平臺服務(wù)效率。
(3)特色資源庫建設(shè)。科學(xué)數(shù)據(jù)共享平臺也應(yīng)重視特色資源庫建設(shè),如,上海大型儀器設(shè)施信息服務(wù)數(shù)據(jù)庫,提供上海2萬多臺(套)大型科學(xué)儀器基本信息、共享服務(wù)情況和政策配套等信息的查詢、比對、篩選服務(wù)。
(4)精準(zhǔn)服務(wù)內(nèi)容。科學(xué)數(shù)據(jù)共享平臺提供精準(zhǔn)服務(wù)內(nèi)容,是指由以用戶共性需求為配置資源依據(jù)轉(zhuǎn)變?yōu)橐杂脩魝€性化需求為配置資源依據(jù),為用戶提供資源配置方案。[19]如,利用數(shù)據(jù)倉庫技術(shù),在對大量數(shù)據(jù)進行整理的基礎(chǔ)上,以用戶訪問科學(xué)數(shù)據(jù)日志為依據(jù),選取用戶知識偏好為實驗數(shù)據(jù)進行研究,達到數(shù)據(jù)精確推送。又如,行業(yè)研究報告數(shù)據(jù)庫可按國家行業(yè)分類標(biāo)準(zhǔn)分別建庫,為促進企業(yè)、尤其是科技型中小微企業(yè)加速發(fā)展而量身定做的決策咨詢高端平臺,其主要欄目可分為行業(yè)資訊、市場分析報告、技術(shù)研究報告、政策環(huán)境報告、綜合分析報告、專題報告定制、行業(yè)研究報告題錄等;數(shù)據(jù)庫資源涉及各行各業(yè);其中,行業(yè)資訊每天更新,深度報告按行業(yè)每月更新,全年更新深度報告也應(yīng)達到一定數(shù)量。
科學(xué)數(shù)據(jù)共享平臺建設(shè)之初,將科學(xué)數(shù)據(jù)監(jiān)管項目納入建設(shè)之中,詳細分析系統(tǒng)可能面臨的各種風(fēng)險,制訂完善的風(fēng)險管理策略,保證系統(tǒng)長期、有效運行??茖W(xué)數(shù)據(jù)共享平臺注重研究科學(xué)數(shù)據(jù)共享中監(jiān)管項目風(fēng)險管理,包括數(shù)據(jù)資源優(yōu)化整合、數(shù)據(jù)出版、數(shù)據(jù)交易可能呈現(xiàn)的風(fēng)險;大力培養(yǎng)科學(xué)數(shù)據(jù)人才,如,數(shù)據(jù)管理咨詢?nèi)藛T、科研數(shù)據(jù)館員、數(shù)據(jù)驗證人員、數(shù)據(jù)分析人員、數(shù)據(jù)可視化分析人員、數(shù)據(jù)管理專家、數(shù)據(jù)服務(wù)協(xié)調(diào)人員等。同時,科學(xué)數(shù)據(jù)共享平臺針對價值較高的科學(xué)數(shù)據(jù)長期保存可以通過SaaS軟件實現(xiàn),如通過異地備份來保證數(shù)據(jù)安全;性價較低的科學(xué)數(shù)據(jù),可以進行及時更新,保障科學(xué)數(shù)據(jù)的更新速度。因此,科學(xué)數(shù)據(jù)共享平臺首先充分利用技術(shù)手段,如,利用防火墻和VLAN對不同區(qū)域、不同網(wǎng)絡(luò)、網(wǎng)絡(luò)資源間的訪問進行限制,或建立平臺網(wǎng)絡(luò)防病毒體系,或平臺網(wǎng)絡(luò)安全監(jiān)控中心,全程監(jiān)控。此外,科學(xué)數(shù)據(jù)共享平臺也應(yīng)強化管理,包括人員安全培訓(xùn)、制度建設(shè)、安全普法教育等,規(guī)避科學(xué)數(shù)據(jù)共享平臺的風(fēng)險。