韓金鳳
(廣東技術(shù)師范大學(xué) 圖書館,廣東 廣州 510665)
21 世紀(jì)初,科學(xué)發(fā)現(xiàn)步入數(shù)據(jù)密集型為特征的“第四范式時(shí)代”,科研數(shù)據(jù)成為推動(dòng)科技創(chuàng)新的重要戰(zhàn)略資源,如何有效管理、保存和共享數(shù)據(jù)已成為全球科研人員共同關(guān)注的問題.在數(shù)據(jù)與需求的雙重驅(qū)動(dòng)下,圖書館積極開發(fā)科研數(shù)據(jù)管理服務(wù),為科研人員提供數(shù)據(jù)管理技能、技術(shù)和工具的支持.科研數(shù)據(jù)管理需求調(diào)研是圖書館開展數(shù)據(jù)管理服務(wù)的首要環(huán)節(jié),可幫助高校了解科研人員的數(shù)據(jù)管理實(shí)踐情況,明確其數(shù)據(jù)管理需求,為圖書館拓展數(shù)據(jù)管理服務(wù)與教育提供新思路.
科研數(shù)據(jù)管理需求調(diào)查進(jìn)入學(xué)者和圖書館的研究視野并得到廣泛關(guān)注,目前國內(nèi)外在這個(gè)領(lǐng)域已取得許多成果.雖然調(diào)研范圍和調(diào)研對象各不相同,但都聚焦于揭示科研人員數(shù)據(jù)管理需求的共性.其中,機(jī)構(gòu)層面的數(shù)據(jù)管理需求調(diào)研最為常見,主要確定位于特定機(jī)構(gòu)研究人員的共性需求[1-2],而不關(guān)注因?qū)W科、身份等因素形成的個(gè)性化需求.部分研究則專注于特定學(xué)科(如農(nóng)學(xué)[3]、社會科學(xué)[4])研究人員的數(shù)據(jù)管理行為和需求.還有針對跨機(jī)構(gòu)多學(xué)科的研究人員開展的大規(guī)模調(diào)研,如DataONE 評估小組在2009—2010 年[5]和2013—2014 年[6]對千余名科學(xué)家進(jìn)行的數(shù)據(jù)管理實(shí)踐調(diào)查.以上三種類型的調(diào)研都面向多層次的科研人員,而另一些研究則關(guān)注特定科研子群體的數(shù)據(jù)管理需求,包括研究生[7]、首席研究員(PI)[8]等.此外,還有一些學(xué)者對調(diào)研案例進(jìn)行了總體分析,包括美國數(shù)據(jù)管理調(diào)查的定量分析[9]、英國數(shù)據(jù)管理需求調(diào)研實(shí)踐梳理[10]、研究人員數(shù)據(jù)共享定性調(diào)查的元綜合研究[11]等.
目前科研數(shù)據(jù)管理需求調(diào)研主要著眼于特定機(jī)構(gòu)或?qū)W科研究人員的需求,而缺乏從綜合分析的視角對調(diào)查結(jié)果展開研究.鑒于此,本文對2017—2023 年美國數(shù)據(jù)管理需求的調(diào)查結(jié)果進(jìn)行系統(tǒng)梳理與深入分析,探討科研人員數(shù)據(jù)管理行為特點(diǎn),厘清科研人員數(shù)據(jù)管理需求,為我國高校圖書館實(shí)施科研數(shù)據(jù)管理服務(wù)與數(shù)據(jù)素養(yǎng)教育提供若干啟示.
筆者以檢索式“Title=(research data OR scientific data OR data management OR data curation OR data literacy) AND Title=(survey OR assess OR interview OR practice OR need OR behavior),在 Web of Science、Elsevier、EBSCO、Emerald、Springer、Wiley、google scholar中進(jìn)行檢索,考慮到調(diào)研具有時(shí)效性,為使研究更具科學(xué)性和可比性,將發(fā)表時(shí)間限定為2017年至2023 年.本研究擬定兩項(xiàng)文獻(xiàn)納入標(biāo)準(zhǔn):(1)納入文獻(xiàn)為美國數(shù)據(jù)管理需求調(diào)查研究;(2)文獻(xiàn)內(nèi)容包含數(shù)據(jù)管理實(shí)踐、數(shù)據(jù)素養(yǎng)或數(shù)據(jù)需求的調(diào)查研究.根據(jù)這些納入標(biāo)準(zhǔn)篩選出有效文獻(xiàn),并通過追溯其參考文獻(xiàn)和引證文獻(xiàn)進(jìn)行查漏補(bǔ)缺,最終獲得12 篇納入文獻(xiàn).
概括起來,美國科研數(shù)據(jù)管理需求調(diào)查主要涉及兩個(gè)主題:數(shù)據(jù)管理實(shí)踐、數(shù)據(jù)管理服務(wù)與教育期望.調(diào)研主題是對調(diào)研內(nèi)容的匯總與分類,但僅依據(jù)寬泛的調(diào)研主題無法厘清具體的調(diào)研內(nèi)容,有必要對調(diào)研主題進(jìn)行再細(xì)化.本研究采用內(nèi)容分析法,深入閱讀文獻(xiàn),從中提取出10 個(gè)指標(biāo),通過分析指標(biāo)間內(nèi)在關(guān)系,將其聚類并劃歸入兩個(gè)主題中,美國數(shù)據(jù)管理需求調(diào)研具體內(nèi)容見圖1.圖2 呈現(xiàn)了調(diào)研內(nèi)容的數(shù)量分布,從中可以發(fā)現(xiàn),美國調(diào)研案例中出現(xiàn)最多的前四項(xiàng)依次是:數(shù)據(jù)共享、數(shù)據(jù)存儲、數(shù)據(jù)收集和數(shù)據(jù)組織,這四項(xiàng)常規(guī)的數(shù)據(jù)管理生命周期活動(dòng),構(gòu)成了科研數(shù)據(jù)管理主流程,而數(shù)據(jù)素養(yǎng)教育和數(shù)據(jù)分析的關(guān)注度最低.
圖1 美國科研數(shù)據(jù)管理需求調(diào)研內(nèi)容
圖2 美國科研數(shù)據(jù)管理需求調(diào)研內(nèi)容數(shù)量分布
(1)數(shù)據(jù)管理計(jì)劃.數(shù)據(jù)管理計(jì)劃是基金組織要求受資助者制定的數(shù)據(jù)管理方案,說明在科研活動(dòng)中如何創(chuàng)建、管理、分析、保存和共享數(shù)據(jù).數(shù)據(jù)管理計(jì)劃知識與經(jīng)驗(yàn)方面,克萊姆森大學(xué)2021 年調(diào)查結(jié)果顯示約有50%的受訪者撰寫過數(shù)據(jù)管理計(jì)劃,與2016 年的調(diào)查數(shù)據(jù)(6.5%)相比無疑是一個(gè)進(jìn)步[12];而具備數(shù)據(jù)管理計(jì)劃知識的研究生相對較少[12],得克薩斯農(nóng)工大學(xué)僅有3.1% 的研究生制定過數(shù)據(jù)管理計(jì)劃[13].數(shù)據(jù)管理計(jì)劃求助途徑方面,克萊姆森大學(xué)受訪者稱最有可能向同事尋求幫助(45.2%),其次是資助機(jī)構(gòu)指南(14.6%),向圖書館請求援助僅占9.4%[12],然而,對于圖書館而言,數(shù)據(jù)管理計(jì)劃是一項(xiàng)易于提供服務(wù)和拓展的領(lǐng)域,是圖書館服務(wù)新的生長點(diǎn).
(2)數(shù)據(jù)收集.數(shù)據(jù)收集是通過調(diào)查、實(shí)驗(yàn)、觀測、模擬等方式生成原始數(shù)據(jù),或通過公開或非公開渠道獲取數(shù)據(jù).數(shù)據(jù)生成方面,美國調(diào)研重點(diǎn)在于產(chǎn)出數(shù)據(jù)的類型、格式和數(shù)據(jù)量,調(diào)查發(fā)現(xiàn)科研人員生成的數(shù)據(jù)類型主要有:數(shù)字文本和數(shù)字?jǐn)?shù)據(jù)、PPT、統(tǒng)計(jì)數(shù)據(jù)和視聽數(shù)據(jù)[12];數(shù)據(jù)格式因?qū)W科而異,人文學(xué)科科研人員最常創(chuàng)建和使用的是文本數(shù)據(jù),而其他學(xué)科生成最多的是表格數(shù)據(jù)[14];三項(xiàng)調(diào)查結(jié)果顯示,大多數(shù)研究人員產(chǎn)生的數(shù)據(jù)量不足100GB[12,14-15],與之前的研究結(jié)果相似[16],說明科研人員所創(chuàng)建的數(shù)據(jù)量大小適中,并不屬于“大數(shù)據(jù)”.數(shù)據(jù)獲取方面,現(xiàn)階段越來越多的科研人員利用二手?jǐn)?shù)據(jù)來充實(shí)研究工作,如元分析,只有克萊姆森大學(xué)關(guān)注了數(shù)據(jù)集獲取,43.7%的受訪者在研究中引用過數(shù)據(jù)集,獲取途徑包括向同行請求共享、政府網(wǎng)站、圖書館數(shù)據(jù)庫以及追蹤其他文獻(xiàn)的引證,值得注意的是,73.5%的受訪者表示愿意通過圖書館使用數(shù)據(jù)集[12].
(3)數(shù)據(jù)組織.數(shù)據(jù)組織是對數(shù)據(jù)進(jìn)行記錄、描述和有序組織的過程,確保數(shù)據(jù)能夠被他人理解、查找和再利用.調(diào)研揭示了科研人員在數(shù)據(jù)組織方面存在的問題:①科研人員普遍缺乏元數(shù)據(jù)知識[13]和經(jīng)驗(yàn)[13-14],不了解學(xué)科元數(shù)據(jù)標(biāo)準(zhǔn)[17],佛蒙特大學(xué)調(diào)查發(fā)現(xiàn),僅有2.2% 的人采用了諸如都柏林核心集(DC)、生態(tài)元數(shù)據(jù)語言(EML)等公認(rèn)的元數(shù)據(jù)標(biāo)準(zhǔn),而另一些人則使用個(gè)人自創(chuàng)的標(biāo)準(zhǔn)來描述數(shù)據(jù),通常是自述文件或編碼簿[15];②科研人員傾向于根據(jù)個(gè)人偏好來組織數(shù)據(jù)[18],尤其是研究生們各自為政,缺乏統(tǒng)一的數(shù)據(jù)組織實(shí)踐,導(dǎo)致項(xiàng)目組內(nèi)難以對數(shù)據(jù)進(jìn)行高效的關(guān)聯(lián)和管理,有學(xué)生指出小組成員的數(shù)據(jù)版本跟蹤的標(biāo)識符并不統(tǒng)一,使得他們接手后會通常只能優(yōu)先查看最近的文件,他們意識到這可能是低效的做法[13].
(4)數(shù)據(jù)分析.數(shù)據(jù)分析指對數(shù)據(jù)進(jìn)行清洗、處理和分析,挖掘有價(jià)值的信息,并以圖表的形式直觀展示出來.在現(xiàn)有的調(diào)研案例中,數(shù)據(jù)分析話題的關(guān)注度最低,得克薩斯農(nóng)工大學(xué)調(diào)查發(fā)現(xiàn),大部分研究生表示他們更依賴于使用專有軟件進(jìn)行數(shù)據(jù)分析,因?yàn)樗麄冊谠合甸_設(shè)的統(tǒng)計(jì)學(xué)課程中使用過SPSS 和STATA 等專有軟件,然而,他們同時(shí)也表示,如果能夠獲得適當(dāng)?shù)膶W(xué)習(xí)資源,他們愿意將開源分析軟件應(yīng)用于未來的研究中[13].另一項(xiàng)調(diào)查顯示,生物學(xué)家和獸醫(yī)病理學(xué)家通常使用特定領(lǐng)域的軟件(如MacVector、MAKE、FlowJo 等)來查看和分析特定數(shù)據(jù),包括細(xì)胞數(shù)據(jù)、顯微鏡數(shù)據(jù)和掃描圖像,而生物統(tǒng)計(jì)學(xué)家更偏愛主流的統(tǒng)計(jì)工具[18].
(5)數(shù)據(jù)存儲.數(shù)據(jù)存儲指以合適的存儲介質(zhì)來短期備份或長期存檔數(shù)據(jù),確保數(shù)據(jù)不會丟失和損壞.關(guān)于存儲介質(zhì),調(diào)查結(jié)果一致表明:科研人員最常使用的存儲選項(xiàng)包括電腦、外部存儲設(shè)備、云存儲[14,19],較少選用數(shù)據(jù)存儲庫,其中,10.8%的受訪者使用外部數(shù)據(jù)存儲庫,僅有1.6% 的人使用圖書館機(jī)構(gòu)存儲庫[14].當(dāng)被問及克萊姆森大學(xué)是否應(yīng)設(shè)立一個(gè)數(shù)據(jù)倉儲庫時(shí),80%的受訪者表示支持,但同時(shí)也有許多人對存儲庫的功能表示擔(dān)憂[12].阿肯色大學(xué)調(diào)研發(fā)現(xiàn),科研人員在數(shù)據(jù)備份和數(shù)據(jù)保存時(shí)有不同的選擇策略,在數(shù)據(jù)備份時(shí)他們會優(yōu)先選擇便利的介質(zhì),如云存儲、外部硬盤、辦公室電腦、U盤等,而在數(shù)據(jù)存儲時(shí)會考慮到數(shù)據(jù)丟失風(fēng)險(xiǎn),更傾向于選用穩(wěn)定的介質(zhì),如:辦公室電腦、實(shí)驗(yàn)室電腦、云存儲等[19].綜上,科研人員偏好易于使用且熟悉的數(shù)據(jù)存儲介質(zhì).此外,一些案例調(diào)查了科研人員的數(shù)據(jù)備份與數(shù)據(jù)存檔意識,大多數(shù)科研人員具有較強(qiáng)的數(shù)據(jù)備份意識,他們通常依賴于電腦的每日或每周自動(dòng)備份,或?qū)?shù)據(jù)備份在外部硬盤中,而小規(guī)模研究項(xiàng)目的科研人員往往不太重視數(shù)據(jù)備份,盡管他們認(rèn)識到備份的重要性,但例行程序并不到位[17].另外,研究生缺乏數(shù)據(jù)長期保存和數(shù)據(jù)安全的意識,他們中很少有人考慮到保留數(shù)據(jù)以供長期使用[13].
(6)數(shù)據(jù)共享.數(shù)據(jù)共享指標(biāo)包括數(shù)據(jù)共享意愿、數(shù)據(jù)共享層次及數(shù)據(jù)共享方式等.共享意愿方面,美國某公立研究型大學(xué)的調(diào)查顯示,52.2% 的受訪者愿意與他人分享自己的研究數(shù)據(jù)[14],佛蒙特大學(xué)定性和定量數(shù)據(jù)也表明,研究人員愿意在研究小組之外分享數(shù)據(jù),然而,另一項(xiàng)調(diào)查發(fā)現(xiàn),大部分科研人員不愿意公開共享數(shù)據(jù)或在項(xiàng)目團(tuán)隊(duì)之外共享數(shù)據(jù)[18],且共享意愿存在學(xué)科差異,人文科學(xué)[14]、社會科學(xué)[15]領(lǐng)域的科研人員共享意愿較低.共享層次方面,克萊姆森大學(xué)的調(diào)查揭示了數(shù)據(jù)共享的知識差距,只有22%的人在存儲庫或其他公共場所公開分享,28.7% 的人會在要求或請求時(shí)共享,而43.6%的人從不共享,經(jīng)過三輪調(diào)查,始終共享的比例顯著增長,從2012 年的9% 增長到2016年的15.1%,再到2021 年的22%[12].共享方式方面,美國某公立研究型大學(xué)受訪者最常使用的方式是個(gè)人請求共享(68%),其次是作為期刊出版物的補(bǔ)充材料(43.3%)或在網(wǎng)站上發(fā)布數(shù)據(jù)(20.6%)[14],佛蒙特大學(xué)和美國國立研究院的調(diào)查結(jié)果與之相似,期刊發(fā)表是最常見的數(shù)據(jù)共享方法[15,18].然而,盡管數(shù)據(jù)存儲庫具有數(shù)據(jù)共享和數(shù)據(jù)保存的雙重功能,但并沒有被廣泛用作數(shù)據(jù)共享的手段[13-14].
(7)數(shù)據(jù)素養(yǎng)教育.數(shù)據(jù)素養(yǎng)教育是科研人員通過多種途徑獲取數(shù)據(jù)素養(yǎng)技能提升教育.一項(xiàng)針對科學(xué)會議上81 位科學(xué)家的調(diào)查發(fā)現(xiàn),68%的受訪者表示并未接受過數(shù)據(jù)管理培訓(xùn)[20].關(guān)于數(shù)據(jù)素養(yǎng)教育途徑的調(diào)查主要集中在研究生,研究生表示自主學(xué)習(xí)是他們獲取數(shù)據(jù)管理技能最常用的手段,而教師則認(rèn)為研究生主要通過教師或顧問的指導(dǎo)來學(xué)習(xí)數(shù)據(jù)素養(yǎng),師生一致認(rèn)為:朋輩學(xué)習(xí)與課程也是數(shù)據(jù)管理技能學(xué)習(xí)的常見方式,而圖書館和信息技術(shù)則較少作為教育來源,另外,教師還指出專業(yè)會議、研討會、項(xiàng)目工作以及資助和倫理審查委員會培訓(xùn)也是學(xué)生學(xué)習(xí)數(shù)據(jù)管理的途徑[21].研究生的信息尋求行為通常局限于研究環(huán)境內(nèi),他們更傾向于咨詢導(dǎo)師、其他教師、實(shí)驗(yàn)室管理者和同行[22].綜合來看,研究生主要通過向內(nèi)汲取的方式接受數(shù)據(jù)素養(yǎng)教育.此外,得克薩斯農(nóng)工大學(xué)的調(diào)研指出數(shù)據(jù)素養(yǎng)教育存在的不足:由圖書館提供的數(shù)據(jù)管理培訓(xùn)主要針對教師、研究人員和圖書館員,而研究生和研究助理作為接觸數(shù)據(jù)最多的人,卻缺少數(shù)據(jù)管理培訓(xùn),因此,教師需要鼓勵(lì)或要求學(xué)生在入職時(shí)接受數(shù)據(jù)管理入門培訓(xùn),以確保每個(gè)人都遵循統(tǒng)一的標(biāo)準(zhǔn)和程序[12].
數(shù)據(jù)管理服務(wù)與教育期望是在調(diào)查中由科研人員主動(dòng)反饋的、針對數(shù)據(jù)管理服務(wù)和教育提出的解決方案式的需求,主要包括3 個(gè)指標(biāo):數(shù)據(jù)管理挑戰(zhàn)、數(shù)據(jù)管理服務(wù)期望和數(shù)據(jù)素養(yǎng)教育期望.
(1)數(shù)據(jù)管理挑戰(zhàn).調(diào)查結(jié)果顯示,研究人員在數(shù)據(jù)管理過程中遇到的挑戰(zhàn)主要有:數(shù)據(jù)分析[21-22]、數(shù)據(jù)組織[17,21-22]、大型數(shù)據(jù)集存儲[17]、數(shù)據(jù)共享[17]以及處理學(xué)生離職或畢業(yè)時(shí)遺留的數(shù)據(jù)[17]等.教師和研究生在數(shù)據(jù)管理挑戰(zhàn)的認(rèn)識上有所差異,教師認(rèn)為最大的挑戰(zhàn)在于數(shù)據(jù)監(jiān)管與重用以及數(shù)據(jù)保存,而研究生則認(rèn)為數(shù)據(jù)處理與分析、數(shù)據(jù)規(guī)劃與組織是更大的挑戰(zhàn)[21].研究生指出數(shù)據(jù)分析的困難主要在于:缺乏分析技術(shù)知識、不熟悉分析方法和分析工具的使用,以及統(tǒng)計(jì)建模能力和數(shù)據(jù)解析能力較弱,而數(shù)據(jù)組織的挑戰(zhàn)在于:組織工具技術(shù)障礙、工作量大且耗時(shí)、難以保持一致和準(zhǔn)確[22].數(shù)據(jù)共享的過程中,最常見的障礙是缺乏足夠的文檔和元數(shù)據(jù)[18],其次是缺乏共享數(shù)據(jù)所需的專業(yè)知識[12,14]、缺少共享數(shù)據(jù)所需的時(shí)間和精力[12,14]、擔(dān)心被 誤解誤 用[14-15]、知識產(chǎn)權(quán)問題[14-15]、機(jī)密或?qū)S行畔14-15]以及保護(hù)隱私信息[12]等.
(2)數(shù)據(jù)管理服務(wù)期望.根據(jù)得克薩斯農(nóng)工大學(xué)的調(diào)查,研究生對大學(xué)圖書館數(shù)據(jù)管理服務(wù)的認(rèn)知程度不高,超過一半的受訪者表示從未聽說過這項(xiàng)服務(wù),只有三成的受訪者知道數(shù)據(jù)管理服務(wù),大多數(shù)是通過其他教師、學(xué)生和工作人員了解的,少部分是通過研討會得知的[13].從事大規(guī)模研究的教師比小規(guī)模研究的教師更清楚大學(xué)圖書館提供的數(shù)據(jù)服務(wù)[17].
佛蒙特大學(xué)調(diào)查發(fā)現(xiàn),受訪者對圖書館技術(shù)性數(shù)據(jù)服務(wù)(如數(shù)據(jù)分析和統(tǒng)計(jì)支持服務(wù)、信息門戶網(wǎng)站、數(shù)據(jù)管理模板和工具)的需求較高[15],但對咨詢性數(shù)據(jù)服務(wù)(如數(shù)據(jù)管理咨詢和研討會)的需求較低.美國某公立研究型大學(xué)受訪者希望在以下領(lǐng)域獲得幫助:量化分析、數(shù)據(jù)可視化、查找合適的存儲庫、數(shù)據(jù)管理計(jì)劃、完成資助者共享數(shù)據(jù)的任務(wù)、數(shù)據(jù)收集等,最不需要支持的服務(wù)是數(shù)據(jù)組織和查找現(xiàn)有數(shù)據(jù)集[14].克萊姆森大學(xué)教師和研究生最感興趣的前四項(xiàng)數(shù)據(jù)服務(wù)基本相同,分別是選擇數(shù)據(jù)存儲庫、數(shù)據(jù)共享教育、項(xiàng)目前數(shù)據(jù)管理培訓(xùn)、編寫數(shù)據(jù)管理計(jì)劃,不同之處在于:教師希望獲得數(shù)據(jù)長期存儲與獲取的幫助,而研究生則傾向于查找數(shù)據(jù)集并應(yīng)用于研究中[12].綜合來看,數(shù)據(jù)管理服務(wù)需求主要集中在數(shù)據(jù)存儲、數(shù)據(jù)分析與可視化、數(shù)據(jù)共享、數(shù)據(jù)收集和數(shù)據(jù)管理計(jì)劃等領(lǐng)域,而且數(shù)據(jù)管理服務(wù)需求在不同群體間存在一定差異,因此在提供服務(wù)時(shí)應(yīng)有所側(cè)重,以滿足不同用戶群的需求.
(3)數(shù)據(jù)素養(yǎng)教育期望.主要從教育主題和教育方式兩個(gè)方面對數(shù)據(jù)素養(yǎng)教育期望展開調(diào)查.期望的教育主題方面,阿肯色大學(xué)受訪者表示有興趣參加以下主題的培訓(xùn):數(shù)據(jù)管理計(jì)劃、日??蒲袛?shù)據(jù)管理、準(zhǔn)備數(shù)據(jù)并創(chuàng)建元數(shù)據(jù)、傳播數(shù)據(jù)等[19];而在社會科學(xué)領(lǐng)域,研究生感興趣的培訓(xùn)主題是:數(shù)據(jù)文檔和組織、數(shù)據(jù)版本跟蹤、使用開源軟件進(jìn)行數(shù)據(jù)分析,以及數(shù)據(jù)保存和安全[13].研究生更傾向于參加與研究行為密切相關(guān)的培訓(xùn),如數(shù)據(jù)組織最佳實(shí)踐、數(shù)據(jù)共享、發(fā)表數(shù)據(jù)集等,這與他們在項(xiàng)目期間承擔(dān)的數(shù)據(jù)管理職責(zé)相對應(yīng)[21].期望的教育方式方面,夏威夷大學(xué)馬諾阿分校的師生希望能在線觀看教學(xué)視頻、PPT 和文本等異步學(xué)習(xí)材料,且學(xué)習(xí)模塊應(yīng)設(shè)計(jì)成小段,每個(gè)模塊的學(xué)習(xí)時(shí)間少于2 小時(shí)[23].科學(xué)家們更喜歡研討會和網(wǎng)絡(luò)研討會,而對面對面指導(dǎo)或者書面輔導(dǎo)不太感興趣[20].這些需求和偏好都為數(shù)據(jù)素養(yǎng)教育指明了方向.
綜合上述調(diào)研結(jié)果,探討美國科研人員數(shù)據(jù)管理行為特點(diǎn),從中析出具體的數(shù)據(jù)管理需求.
(1)科研人員數(shù)據(jù)管理行為呈現(xiàn)出個(gè)性化及隨意性特點(diǎn),這在數(shù)據(jù)組織和數(shù)據(jù)存儲兩個(gè)環(huán)節(jié)中尤為明顯.由于缺乏數(shù)據(jù)管理政策、技能培訓(xùn)、基礎(chǔ)設(shè)施等方面的規(guī)范指引,項(xiàng)目組成員按照個(gè)人喜好和習(xí)慣制定多種數(shù)據(jù)管理策略,導(dǎo)致組內(nèi)數(shù)據(jù)管理工作分散且無序.在數(shù)據(jù)存儲方面,科研人員更偏好于使用熟悉且易用的存儲介質(zhì),而很少選擇容量更大、功能更豐富的存儲庫,這對數(shù)據(jù)的安全性、長期維護(hù)及共享造成了不利影響.
(2)科研人員在數(shù)據(jù)管理方面的知識相對薄弱,主要表現(xiàn)在缺乏數(shù)據(jù)管理計(jì)劃、元數(shù)據(jù)、數(shù)據(jù)分析、數(shù)據(jù)存儲、數(shù)據(jù)共享、數(shù)據(jù)服務(wù)等方面的專業(yè)知識,導(dǎo)致數(shù)據(jù)管理效果欠佳.因此,學(xué)校有必要強(qiáng)化數(shù)據(jù)管理教育,幫助科研人員重建數(shù)據(jù)管理知識體系.
(3)科研人員對數(shù)據(jù)存儲量的需求以小數(shù)據(jù)為主.當(dāng)前大多數(shù)科研人員持有的數(shù)據(jù)量較少,對數(shù)據(jù)存儲空間的要求也相對較低,“小數(shù)據(jù)”研究的一個(gè)特點(diǎn)是數(shù)據(jù)存儲過度依賴電腦、筆記本電腦或外部硬盤[15],然而,這些存儲設(shè)備無法滿足大型數(shù)據(jù)集的存儲需求.因此,部分科研人員正在尋求大型數(shù)據(jù)集的解決方案.
(4)科研人員的數(shù)據(jù)共享意愿和共享層次普遍不理想,大多數(shù)選擇局部共享或者完全不共享,這主要?dú)w因于他們不了解數(shù)據(jù)共享的好處、缺乏相關(guān)專業(yè)知識以及擔(dān)心數(shù)據(jù)被誤解誤用和泄露隱私信息等問題.同時(shí),數(shù)據(jù)共享所需的時(shí)間成本和精力成本也較高,這也是他們不愿意共享數(shù)據(jù)的一個(gè)關(guān)鍵因素.
(5)了解和主動(dòng)使用圖書館數(shù)據(jù)管理服務(wù)的科研人員較少,他們主要關(guān)注與項(xiàng)目啟動(dòng)和研究進(jìn)展直接相關(guān)的數(shù)據(jù)服務(wù)支持,如數(shù)據(jù)管理計(jì)劃、數(shù)據(jù)收集、數(shù)據(jù)分析、數(shù)據(jù)存儲、數(shù)據(jù)共享等,同時(shí),與咨詢性數(shù)據(jù)服務(wù)相比,他們對技術(shù)性數(shù)據(jù)服務(wù)的需求更大.
(6)科研人員缺乏數(shù)據(jù)素養(yǎng)教育,其數(shù)據(jù)管理知識與技能主要來自于非正式的教育渠道,如自學(xué)、組內(nèi)指導(dǎo)與咨詢、朋輩學(xué)習(xí)等.在培訓(xùn)主題方面,他們更感興趣的是與研究行為相關(guān)的主題,更喜歡在線提供異步學(xué)習(xí)材料、網(wǎng)絡(luò)研討會、研討會等教育方式.
(7)科研人員的數(shù)據(jù)管理實(shí)踐和需求受到學(xué)科、項(xiàng)目規(guī)模和學(xué)術(shù)角色等因素的影響,因此,學(xué)校應(yīng)針對各學(xué)科各類型研究人員的需求,開展分類分級的數(shù)據(jù)素養(yǎng)教育.
綜合上述分析可知,科研人員數(shù)據(jù)管理需求主要集中在以下四個(gè)方面:①數(shù)據(jù)管理服務(wù)的需求,科研人員對能切實(shí)解決數(shù)據(jù)管理難題的數(shù)據(jù)服務(wù)具有最高優(yōu)先級需求,而且希望加強(qiáng)數(shù)據(jù)服務(wù)的宣傳營銷;②基礎(chǔ)設(shè)施保障的需求,包括能同時(shí)滿足小數(shù)據(jù)研究和大數(shù)據(jù)研究的數(shù)據(jù)存儲庫、集成數(shù)據(jù)管理資源和工具的數(shù)據(jù)管理平臺等;③數(shù)據(jù)素養(yǎng)教育的需求,科研人員希望獲得實(shí)用性強(qiáng)、精準(zhǔn)化的數(shù)據(jù)素養(yǎng)教育;④支持?jǐn)?shù)據(jù)共享的需求,科研人員作為數(shù)據(jù)生產(chǎn)者和數(shù)據(jù)消費(fèi)者都有共享數(shù)據(jù)的需求,希望適時(shí)獲得幫助.
調(diào)查顯示大多數(shù)科研人員對數(shù)據(jù)管理服務(wù)并不熟悉,也很少利用圖書館提供的數(shù)據(jù)服務(wù),遇到問題時(shí)很少向圖書館員尋求幫助.為提高用戶對數(shù)據(jù)管理服務(wù)的認(rèn)知度和使用率,圖書館應(yīng)拓寬數(shù)據(jù)管理服務(wù)的宣傳渠道,采用院系試點(diǎn)、走訪項(xiàng)目組、發(fā)放調(diào)查問卷、宣傳手冊、海報(bào)、網(wǎng)站公告、微信公眾號、QQ 群、微信群、電子屏、學(xué)術(shù)互動(dòng)社區(qū)等多種方式進(jìn)行宣傳,以加強(qiáng)數(shù)據(jù)管理服務(wù)的宣傳營銷.
科研人員在數(shù)據(jù)管理方面的薄弱環(huán)節(jié)、挑戰(zhàn)和期望正是圖書館拓展服務(wù)的切入點(diǎn),包括數(shù)據(jù)獲取、數(shù)據(jù)組織、數(shù)據(jù)分析、數(shù)據(jù)存儲以及數(shù)據(jù)共享等.圖書館應(yīng)以用戶需求為導(dǎo)向,針對用戶在數(shù)據(jù)管理工作中遇到的難題,挖掘新的服務(wù)生長點(diǎn),不斷豐富服務(wù)內(nèi)容和服務(wù)形式,進(jìn)一步拓展數(shù)據(jù)管理服務(wù)的廣度.同時(shí),真正高質(zhì)量的數(shù)據(jù)管理服務(wù)應(yīng)貫穿科學(xué)研究全過程,圖書館應(yīng)重點(diǎn)發(fā)展嵌入式數(shù)據(jù)管理服務(wù),融入用戶科研環(huán)境和工作流程,即時(shí)捕捉用戶數(shù)據(jù)需求,提供深層次、精細(xì)化、個(gè)性化的數(shù)據(jù)服務(wù),推動(dòng)數(shù)據(jù)管理服務(wù)從廣度向深度延伸.
調(diào)查發(fā)現(xiàn)科研人員數(shù)據(jù)組織和數(shù)據(jù)存儲行為具有個(gè)性化、隨意性的特點(diǎn),這與缺乏完善的基礎(chǔ)設(shè)施有關(guān),因此,圖書館應(yīng)著重加強(qiáng)校園數(shù)據(jù)管理基礎(chǔ)設(shè)施的建設(shè),主要從以下兩個(gè)方面構(gòu)建一站式數(shù)據(jù)管理平臺:一是建設(shè)資源配置完善的集成式數(shù)據(jù)管理服務(wù)平臺,我國高校圖書館應(yīng)通過按需購買或搜集數(shù)據(jù)集等方式加強(qiáng)數(shù)據(jù)資源建設(shè),在現(xiàn)有的網(wǎng)站基礎(chǔ)上,將數(shù)據(jù)管理作為一個(gè)獨(dú)立的子模塊,集成數(shù)據(jù)集、數(shù)據(jù)管理培訓(xùn)資源、數(shù)據(jù)服務(wù)內(nèi)容、數(shù)據(jù)管理工具與軟件等資源,實(shí)現(xiàn)數(shù)據(jù)資源一站式發(fā)現(xiàn)與獲取,提升數(shù)據(jù)資源與服務(wù)的利用率;二是建設(shè)易用的數(shù)據(jù)存儲庫,易用性是影響科研人員進(jìn)行數(shù)據(jù)存儲決策的關(guān)鍵因素,圖書館在建設(shè)數(shù)據(jù)存儲庫時(shí),必須重點(diǎn)解決系統(tǒng)易用性問題,此外,圖書館還應(yīng)向科研人員廣泛宣傳存儲庫的獨(dú)特功能,包括:能同時(shí)滿足小數(shù)據(jù)研究和大數(shù)據(jù)研究的數(shù)據(jù)備份與保存、保護(hù)數(shù)據(jù)隱私、數(shù)據(jù)共享、數(shù)據(jù)重用等.
根據(jù)調(diào)研結(jié)果,大部分科研人員并未接受過數(shù)據(jù)管理培訓(xùn),但他們對此類培訓(xùn)比較感興趣,并積極投選所需的數(shù)據(jù)管理培訓(xùn)主題.圖書館應(yīng)以普及數(shù)據(jù)管理知識、提升數(shù)據(jù)素養(yǎng)與技能為目標(biāo),根據(jù)用戶的需求和特征,完善數(shù)據(jù)素養(yǎng)教育內(nèi)容建設(shè),構(gòu)建分層次、多形式的數(shù)據(jù)素養(yǎng)教育體系.第一,教育內(nèi)容方面,在系統(tǒng)覆蓋數(shù)據(jù)管理全生命周期內(nèi)容的基礎(chǔ)上,注重實(shí)踐,將教育重點(diǎn)放在用戶當(dāng)前或不久的將來可以實(shí)施的內(nèi)容上.第二,教育方式方面,除了傳統(tǒng)的課程、培訓(xùn)、研討會、沙龍、面對面指導(dǎo)等線下的方式,還應(yīng)充分利用網(wǎng)絡(luò)課程、在線提供學(xué)習(xí)資料、在線指導(dǎo)、數(shù)據(jù)管理平臺等線上的方式,圖書館應(yīng)采用線上線下相結(jié)合的方式開展數(shù)據(jù)素養(yǎng)教育,以擴(kuò)大教育的覆蓋面和影響力.第三,教育層次方面,圖書館應(yīng)針對各學(xué)科各類型用戶的需求和行為傾向,分類開展差異化的數(shù)據(jù)素養(yǎng)教育,如為新入學(xué)的研究生開展數(shù)據(jù)管理入門培訓(xùn),為科研團(tuán)隊(duì)提供嵌入式數(shù)據(jù)管理培訓(xùn).
針對科研人員的數(shù)據(jù)共享意愿和共享層次普遍不高的現(xiàn)象,圖書館應(yīng)采取多種措施促進(jìn)數(shù)據(jù)共享:首先,圖書館可以與校內(nèi)其他部門合作建設(shè)數(shù)據(jù)共享平臺,整合科研數(shù)據(jù)共享政策、學(xué)科數(shù)據(jù)共享規(guī)范、數(shù)據(jù)共享實(shí)踐優(yōu)秀案例、數(shù)據(jù)存儲共享平臺等信息,為用戶提供便捷的數(shù)據(jù)共享資源導(dǎo)航.其次,圖書館可以與學(xué)??蒲胁块T聯(lián)合制定數(shù)據(jù)共享激勵(lì)機(jī)制,在學(xué)術(shù)任命、晉升、認(rèn)可和獎(jiǎng)勵(lì)等方面對共享數(shù)據(jù)者予以激勵(lì),以提高用戶共享數(shù)據(jù)的積極性,并增強(qiáng)機(jī)構(gòu)數(shù)據(jù)存儲庫的數(shù)據(jù)完整性.最后,圖書館可以通過提供數(shù)據(jù)共享援助,強(qiáng)化用戶對數(shù)據(jù)共享的理解和認(rèn)同,重點(diǎn)為用戶提供元數(shù)據(jù)方面的培訓(xùn)與支持,元數(shù)據(jù)是影響數(shù)據(jù)共享與可訪問性的關(guān)鍵因素,科研人員作為數(shù)據(jù)生產(chǎn)者和數(shù)據(jù)消費(fèi)者都會面臨元數(shù)據(jù)描述與理解的挑戰(zhàn),圖書館應(yīng)提供必要的協(xié)助,幫助科研人員開展元數(shù)據(jù)描述與數(shù)據(jù)文檔利用工作.