胡 卉,吳 鳴,2,歐陽崢崢
(1.中國科學(xué)院文獻(xiàn)情報(bào)中心;2.中國科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院;3.中國科學(xué)院成都文獻(xiàn)情報(bào)中心)
數(shù)據(jù)是開展科學(xué)研究的根基所在,培養(yǎng)研究人員的數(shù)據(jù)意識(shí)、開展數(shù)據(jù)素養(yǎng)技能培訓(xùn)的重要性不言而喻。研究生是未來科研事業(yè)的參與者,在知識(shí)學(xué)習(xí)和專業(yè)實(shí)踐的早期階段培養(yǎng)其數(shù)據(jù)管理技能和數(shù)據(jù)素養(yǎng)能力,有利于他們更好地適應(yīng)學(xué)習(xí)生活和進(jìn)行科研實(shí)踐。因此,本研究選取中國科學(xué)院大學(xué)(以下簡稱中科院)研究生作為調(diào)查對象,設(shè)計(jì)了“中國科學(xué)院大學(xué)研究生數(shù)據(jù)素養(yǎng)現(xiàn)狀與需求調(diào)研”問卷,以期在了解中科院研究生的數(shù)據(jù)素養(yǎng)現(xiàn)狀和需求基礎(chǔ)上,為更好地完善數(shù)據(jù)素養(yǎng)教育和科研數(shù)據(jù)管理服務(wù)提供參考和依據(jù)。
調(diào)查問卷設(shè)計(jì)的前期工作主要包括三個(gè)方面:①調(diào)研和總結(jié)國內(nèi)外科研數(shù)據(jù)管理服務(wù)和數(shù)據(jù)素養(yǎng)教育課程經(jīng)驗(yàn),如,分析 DCC[1]、DataONE[2]、馬薩諸塞大學(xué)醫(yī)學(xué)院圖書館、愛丁堡大學(xué)圖書館等機(jī)構(gòu)的數(shù)據(jù)素養(yǎng)課程框架和數(shù)據(jù)管理服務(wù)內(nèi)容體系,提取關(guān)鍵主題和重要概念;[3]② 參考和借鑒國內(nèi)外學(xué)者編制的數(shù)據(jù)素養(yǎng)調(diào)查表,結(jié)合本研究的調(diào)查目的和內(nèi)容,搭建調(diào)查問卷的主體框架;③ 以生命科學(xué)領(lǐng)域作為切入點(diǎn),分析和歸納生命科學(xué)領(lǐng)域科研數(shù)據(jù)的特點(diǎn)(包括數(shù)據(jù)類型與格式、所在領(lǐng)域的數(shù)據(jù)倉儲(chǔ)、常用數(shù)據(jù)處理工具等),并以此為基礎(chǔ),設(shè)計(jì)了本研究的調(diào)查問卷,調(diào)查問卷包括兩個(gè)模塊。
(1)調(diào)研背景和調(diào)查目的。問卷的開場白強(qiáng)調(diào)了在數(shù)據(jù)驅(qū)動(dòng)的新型科研環(huán)境下對科研數(shù)據(jù)進(jìn)行規(guī)范管理的重要性,以及科研實(shí)踐中科學(xué)工作者面臨的數(shù)據(jù)管理困境,指出本次調(diào)研旨在為圖書館更好地設(shè)計(jì)數(shù)據(jù)管理課程和開展培訓(xùn)服務(wù)提供參考和依據(jù)。
(2)問卷主體。分為調(diào)研對象的基本信息和調(diào)研的主要內(nèi)容兩大部分,共計(jì)30道題目,其中客觀題28道,開放性題目2道。① 調(diào)查對象的基本信息。包括調(diào)查對象所在研究機(jī)構(gòu)、專業(yè)、具體研究方向三個(gè)問題,要求調(diào)查對象根據(jù)自身情況如實(shí)填寫,確保調(diào)查對象和調(diào)查內(nèi)容相匹配。② 調(diào)研的基本內(nèi)容包括數(shù)據(jù)素養(yǎng)現(xiàn)狀和需求兩方面(見表1)?,F(xiàn)狀調(diào)研以數(shù)據(jù)素養(yǎng)內(nèi)涵為基礎(chǔ),涵蓋數(shù)據(jù)意識(shí)、數(shù)據(jù)知識(shí)、數(shù)據(jù)技能及數(shù)據(jù)倫理道德四個(gè)層面的內(nèi)容,結(jié)合科研數(shù)據(jù)生命周期流程,構(gòu)建了包括科研數(shù)據(jù)概況、制定數(shù)據(jù)管理計(jì)劃、數(shù)據(jù)收集與記錄、數(shù)據(jù)處理與分析、數(shù)據(jù)管理與保存、數(shù)據(jù)發(fā)表與共享、數(shù)據(jù)權(quán)益與倫理七個(gè)模塊的現(xiàn)狀調(diào)查框架。在調(diào)研數(shù)據(jù)素養(yǎng)現(xiàn)狀的基礎(chǔ)上,對研究生接受數(shù)據(jù)素養(yǎng)教育的態(tài)度、內(nèi)容和方式進(jìn)行考察,并以開放式問題的形式詢問調(diào)研對象在科研數(shù)據(jù)管理過程中遇到的問題和障礙,以及對數(shù)據(jù)管理和數(shù)據(jù)素養(yǎng)課程的建議。
表1 調(diào)查問卷內(nèi)容結(jié)構(gòu)
本次問卷的調(diào)查對象為中國科學(xué)院大學(xué)生命科學(xué)領(lǐng)域研一新生,調(diào)查對象的選取主要考慮以下兩個(gè)方面。
(1)生命科學(xué)領(lǐng)域的學(xué)科特點(diǎn)。生命科學(xué)作為中科院的重點(diǎn)學(xué)科,每年培養(yǎng)包括中國科學(xué)院大學(xué)生命科學(xué)學(xué)院在內(nèi),以及植物所、動(dòng)物所、遺傳與發(fā)育研究所、微生物研究所等研究生委培單位在內(nèi)的上千名研究生。而生命科學(xué)領(lǐng)域科研數(shù)據(jù)的來源和形式多樣,既包括基因測序,又包括分子通道等不同類型格式的科研數(shù)據(jù),以及不同人群受試數(shù)據(jù)等。因此,本次調(diào)查以生命科學(xué)領(lǐng)域作為切入點(diǎn)。
(2)研一新生接受數(shù)據(jù)素養(yǎng)教育的必要性和可行性。研究生是未來科研事業(yè)的主力軍,而中國科學(xué)院大學(xué)研究生培養(yǎng)為兩段式模式,即研一的基礎(chǔ)課程集中教學(xué)階段和研二后回到研究所進(jìn)行科研實(shí)踐。在研一集中教學(xué)期間,更多的是專業(yè)基礎(chǔ)知識(shí)和基本研究技能的學(xué)習(xí)和培養(yǎng)。因此,通過學(xué)分課程、培訓(xùn)講座等方式預(yù)先培養(yǎng)學(xué)生在未來的科研實(shí)踐工作中所需的科研數(shù)據(jù)管理能力具有可行性。
正式的問卷調(diào)查開始于2016年9月下旬,主要借助問卷星平臺(tái)開展調(diào)研,通過課程網(wǎng)站發(fā)送問卷鏈接,并在課上集中填答。本次調(diào)查共發(fā)放問卷60份,回收問卷59份,回收率98.3%,其中有效問卷59份,問卷有效率100%。
問卷回收后采用Excel進(jìn)行數(shù)據(jù)統(tǒng)計(jì)和分析,通過頻數(shù)、百分比描述性統(tǒng)計(jì)等指標(biāo),探索問卷結(jié)果中所反映的中科院研究生的數(shù)據(jù)素養(yǎng)現(xiàn)狀與需求規(guī)律。
從調(diào)查對象所在機(jī)構(gòu)來看,這59名研一學(xué)生主要分布于中國科學(xué)院不同的科研教育單位,分別是植物研究所、西雙版納熱帶植物園等22所機(jī)構(gòu)。從調(diào)查對象所學(xué)專業(yè)來看,涵蓋了遺傳學(xué)、生物化工等18個(gè)學(xué)科專業(yè)和多個(gè)研究方向;調(diào)查樣本的選取符合中科院生命科學(xué)領(lǐng)域研究分布實(shí)況,具有良好的代表性。
3.2.1 科研數(shù)據(jù)概況
題項(xiàng) 1-6主要考察研究生對科研數(shù)據(jù)及數(shù)據(jù)管理基本知識(shí)的認(rèn)知情況。
(1)科研數(shù)據(jù)管理的重要性。問卷中該題目1表述為“您認(rèn)為科研數(shù)據(jù)管理給科研帶來哪些益處”。問題的選項(xiàng)設(shè)置參照數(shù)據(jù)管理國際組織UKDataArchive對數(shù)據(jù)管理意義的表述,[4]通過調(diào)查研究生對“科研數(shù)據(jù)管理的意義”的認(rèn)識(shí),揭示中科院研究生對科研數(shù)據(jù)管理的認(rèn)知程度和積極態(tài)度。調(diào)查結(jié)果顯示,接受調(diào)查的大多數(shù)研究生能較全面地認(rèn)識(shí)到科研數(shù)據(jù)管理的意義,他們認(rèn)為管理科研數(shù)據(jù)的主要意義在于數(shù)據(jù)再利用,有利于促進(jìn)科學(xué)創(chuàng)新(89.83%)和減少數(shù)據(jù)重復(fù)收集的成本(86.44%),能使研究發(fā)現(xiàn)和學(xué)術(shù)成果可檢驗(yàn)(83.05%),其次,可促進(jìn)科研更加透明公開(79.66%)、引導(dǎo)數(shù)據(jù)生產(chǎn)者和數(shù)據(jù)利用者加強(qiáng)新合作(77.97%),并促進(jìn)研究方法改進(jìn)和驗(yàn)證(76.27%)。綜上,接受調(diào)查的研究生已經(jīng)認(rèn)識(shí)到科研數(shù)據(jù)管理的重要性,并且能夠清晰地辨析科研數(shù)據(jù)管理對其研究工作和學(xué)術(shù)聲譽(yù)各方面的意義所在。
(2)對科研數(shù)據(jù)的認(rèn)知情況。問卷中該題目2表述為“您所了解的科研數(shù)據(jù)包括哪些”。問題的選項(xiàng)設(shè)置參照國際數(shù)據(jù)管理專業(yè)組織數(shù)據(jù)管理培訓(xùn)課程中對“廣義新型科研數(shù)據(jù)”的介紹。[5]通過考察研究生對科研數(shù)據(jù)的認(rèn)知情況,揭示中科院研究生對科研數(shù)據(jù)這一概念的了解程度。調(diào)查結(jié)果顯示,接受調(diào)查的研究生對所在學(xué)科的科研數(shù)據(jù)具有良好的認(rèn)知度,但對采訪記錄、文本和動(dòng)畫材料等廣泛意義上的科研數(shù)據(jù)缺乏了解。其中,認(rèn)知度最高的仍是統(tǒng)計(jì)和測量數(shù)據(jù)(88.14%)、實(shí)驗(yàn)及模擬數(shù)據(jù)(86.44%)等傳統(tǒng)型科研數(shù)據(jù),其次,是從相機(jī)或?qū)嶒?yàn)設(shè)備中導(dǎo)出的圖片(76.27%)、觀測數(shù)據(jù)(71.19%)、模型和軟件(55.93%)。但就文本和動(dòng)畫材料、采訪記錄等廣義科研數(shù)據(jù)而言,僅有1/3的學(xué)生將其視為科研數(shù)據(jù)。此外,有3.39%的學(xué)生表示不清楚什么是科研數(shù)據(jù)。
(3)對科研數(shù)據(jù)管理與共享的相關(guān)政策和要求的認(rèn)知情況。問卷中該題目3表述為“您了解哪些科研數(shù)據(jù)管理與共享的相關(guān)政策和要求”,問題的選項(xiàng)設(shè)置參考顧立平教授提出的科學(xué)數(shù)據(jù)開放獲取政策研究框架。[6]該題主要考察研究生對科研數(shù)據(jù)管理與共享政策的了解情況。調(diào)查結(jié)果顯示,接受調(diào)查的研究生對數(shù)據(jù)管理與共享政策的總體了解程度較低。其中,研究生了解的主要科研數(shù)據(jù)管理政策包括所在實(shí)驗(yàn)室或研究組的數(shù)據(jù)管理?xiàng)l例和規(guī)則政策(50.85%),其次,是所在機(jī)構(gòu)的數(shù)據(jù)管理政策和要求(33.9%)、期刊出版商的數(shù)據(jù)提交和存繳要求(25.42%)、數(shù)據(jù)倉儲(chǔ)的數(shù)據(jù)政策和要求(22.03%)。對國家層面、科研資助機(jī)構(gòu)以及國際組織的數(shù)據(jù)管理與共享政策知之甚少。此外,超過1/4的學(xué)生表示完全不了解科研數(shù)據(jù)管理與共享的政策和要求。
(4)對本學(xué)科科研數(shù)據(jù)類型的認(rèn)知情況。問卷中該題目4表述為“您所在學(xué)科領(lǐng)域的科研數(shù)據(jù)包括哪些類型”,題目選項(xiàng)設(shè)置參照弗吉尼亞理工大學(xué)的科研數(shù)據(jù)分類體系。[7]通過考察學(xué)生是否了解本學(xué)科領(lǐng)域的科研數(shù)據(jù)類型,以及本學(xué)科領(lǐng)域科研數(shù)據(jù)的具體所屬類型,由此可以較好地反映學(xué)生對本領(lǐng)域科研數(shù)據(jù)的熟悉程度。調(diào)查結(jié)果顯示,98.31%的研究生表示了解并能明確界定本學(xué)科科研數(shù)據(jù)所屬的類型,其中,最主要的數(shù)據(jù)類型是實(shí)驗(yàn)型數(shù)據(jù)(98.31%),其次,是引用或規(guī)范數(shù)據(jù)(64.41%)和觀測型數(shù)據(jù)(64.41%),而仿真數(shù)據(jù)(16.95%)、派生或編譯數(shù)據(jù)(13.51%)所占比例較少。
(5)對本學(xué)科科研數(shù)據(jù)格式的認(rèn)知情況。問卷中該題目5表述為“您所在學(xué)科領(lǐng)域的科研數(shù)據(jù)包括哪些格式”,題目選項(xiàng)設(shè)置主要參考國外圖書館科研數(shù)據(jù)管理服務(wù)和教學(xué)課程中對不同數(shù)據(jù)格式的介紹。通過考察學(xué)生是否了解本學(xué)科領(lǐng)域的科研數(shù)據(jù)格式,以及本學(xué)科領(lǐng)域科研數(shù)據(jù)的具體格式,可以較好地反映學(xué)生對本領(lǐng)域科研數(shù)據(jù)的熟悉程度。調(diào)查結(jié)果顯示,98.31%接受調(diào)查的研究生表示了解并能明確界定本學(xué)科科研數(shù)據(jù)的格式,其中,最普遍的數(shù)據(jù)格式是表格(91.53%),其次,是圖像(譜圖)(89.83%)和文本(89.83%)、特定實(shí)驗(yàn)儀器采集的數(shù)據(jù)(69.49%)、模型(44.07%)以及軟件語言(程序代碼)(35.39%),而視頻和音頻格式的科研數(shù)據(jù)則所占比例較小。
(6)對本學(xué)科科研數(shù)據(jù)量的認(rèn)知情況。問卷中該題目6表述為“您所在學(xué)科領(lǐng)域的科研數(shù)據(jù)量大約是什么級(jí)別”,通過考察學(xué)生是否了解本學(xué)科領(lǐng)域的科研數(shù)據(jù)量,以及本學(xué)科領(lǐng)域科研數(shù)據(jù)的具體量級(jí),可以較好地反映學(xué)生對本領(lǐng)域科研數(shù)據(jù)的熟悉程度。調(diào)查結(jié)果顯示,接受調(diào)查的研究生對所在學(xué)科領(lǐng)域的科研數(shù)據(jù)量認(rèn)知度較低,只有54.24%的研究生表示了解并能界定本學(xué)科領(lǐng)域的科研數(shù)據(jù)量,另外45.76%的學(xué)生表示不了解或不確定本學(xué)科領(lǐng)域的科研數(shù)據(jù)量級(jí)。3.2.2 數(shù)據(jù)管理計(jì)劃
題項(xiàng)7-9主要考察學(xué)生在制定數(shù)據(jù)管理計(jì)劃階段的數(shù)據(jù)素養(yǎng)現(xiàn)狀。
(1)對科研數(shù)據(jù)生命周期的認(rèn)知情況。問卷中該題目7表述為“您了解科研數(shù)據(jù)生命周期嗎”。通過考察學(xué)生對科研數(shù)據(jù)生命周期的認(rèn)知情況,揭示學(xué)生對整個(gè)科研流程和數(shù)據(jù)管理流程的認(rèn)識(shí)與掌握。調(diào)查結(jié)果顯示,接受調(diào)查的研究生對科研數(shù)據(jù)生命周期的認(rèn)知度較低,其中,只有20.34%的學(xué)生表示“比較了解”,而79.66%的學(xué)生表示不了解或不確定什么是科研數(shù)據(jù)生命周期。
(2)對科研數(shù)據(jù)管理計(jì)劃的認(rèn)知情況。問卷中該題目8表述為“您認(rèn)為一份數(shù)據(jù)管理計(jì)劃應(yīng)包含哪些內(nèi)容”,題目選項(xiàng)設(shè)置主要參考美國國家科學(xué)基金委發(fā)布的數(shù)據(jù)管理計(jì)劃模板,將其中四大要素設(shè)置為本題目的選項(xiàng)。[8]通過考察學(xué)生是否了解數(shù)據(jù)管理計(jì)劃,以及數(shù)據(jù)管理計(jì)劃應(yīng)包含的具體內(nèi)容,可以較好地體現(xiàn)學(xué)生對數(shù)據(jù)管理計(jì)劃的認(rèn)知程度和掌握情況。調(diào)查結(jié)果顯示,接受調(diào)查的90%的研究生表示了解并能明確數(shù)據(jù)管理計(jì)劃所包含的內(nèi)容。數(shù)據(jù)管理計(jì)劃四項(xiàng)基本要素中,接受調(diào)查的研究生認(rèn)為最重要的是數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)共享策略(79.66%),其次,是科研項(xiàng)目中預(yù)計(jì)產(chǎn)生的數(shù)據(jù)和資料(72.88%),以及數(shù)據(jù)再利用、再傳播、數(shù)據(jù)衍生產(chǎn)品的規(guī)定和限制(64.41%),擬采用的數(shù)據(jù)管理標(biāo)準(zhǔn)和方法(57.63%)。另有10.17%的學(xué)生表示不了解科研數(shù)據(jù)管理計(jì)劃及其包含的內(nèi)容。
(3)對制定科研數(shù)據(jù)管理計(jì)劃工具的認(rèn)知情況。問卷中該題目9表述為“您了解制定數(shù)據(jù)管理計(jì)劃的工具嗎”,題目選項(xiàng)設(shè)置主要列舉了目前國際通用的幾種數(shù)據(jù)管理計(jì)劃工具。通過調(diào)研學(xué)生對科研數(shù)據(jù)管理計(jì)劃工具的認(rèn)知情況,揭示學(xué)生對數(shù)據(jù)管理計(jì)劃的了解程度,以及他們制定和撰寫數(shù)據(jù)管理計(jì)劃的能力水平。調(diào)查結(jié)果顯示,接受調(diào)查的研究生對數(shù)據(jù)管理計(jì)劃工具的認(rèn)知度低,其中89.83%的學(xué)生不了解數(shù)據(jù)管理計(jì)劃工具,也不知道如何利用工具創(chuàng)建數(shù)據(jù)管理計(jì)劃。
3.2.3 數(shù)據(jù)收集與記錄
題項(xiàng)10即記錄科研數(shù)據(jù)的方式。旨在考察學(xué)生在數(shù)據(jù)收集與記錄階段的數(shù)據(jù)素養(yǎng)現(xiàn)狀,問卷中該題目表述為“您了解并使用的本學(xué)科記錄科研數(shù)據(jù)的方式有哪些”。調(diào)查結(jié)果顯示,大多數(shù)接受調(diào)查的研究生了解并能夠較好地掌握本學(xué)科領(lǐng)域科研數(shù)據(jù)的記錄方法(98.31%)。在對科研數(shù)據(jù)進(jìn)行記錄時(shí),使用最廣泛的科研數(shù)據(jù)記錄方式是U盤或移動(dòng)硬盤等便攜式存儲(chǔ)設(shè)備(94.92%)、個(gè)人電腦(94.92%)、紙質(zhì)筆記本或?qū)嶒?yàn)室記錄本(93.22%)以及實(shí)驗(yàn)室或辦公室電腦(86.44%),其次,是網(wǎng)盤或云盤等網(wǎng)上存儲(chǔ)空間(57.63%),此外,還有學(xué)生利用服務(wù)器來記錄和保存科研數(shù)據(jù)。
3.2.4 數(shù)據(jù)處理與分析
題項(xiàng)11-13旨在考察學(xué)生在數(shù)據(jù)處理與分析階段的數(shù)據(jù)素養(yǎng)現(xiàn)狀。
(1)對科研數(shù)據(jù)處理所需工具和軟件的了解和掌握情況。問卷中該題目11表述為“本學(xué)科在處理科研數(shù)據(jù)時(shí),需要使用哪些軟件和工具”,選項(xiàng)中羅列了生命科學(xué)領(lǐng)域常用的數(shù)據(jù)處理工具,考察學(xué)生對本學(xué)科領(lǐng)域科研數(shù)據(jù)處理工具的了解程度,以及對這些數(shù)據(jù)處理工具的掌握水平。調(diào)查結(jié)果顯示,大多數(shù)接受調(diào)查的研究生表示了解本學(xué)科領(lǐng)域的科研數(shù)據(jù)處理工具(89.83%)。具體而言,生命科學(xué)領(lǐng)域數(shù)據(jù)處理工具以基本的數(shù)據(jù)處理工具為主(如Excel占比93.22%,統(tǒng)計(jì)分析軟件SPSS占比72.88%),重視多學(xué)科數(shù)據(jù)分析工具的融合與利用(如用于統(tǒng)計(jì)分析與繪圖的R語言環(huán)境占比40.68%,商業(yè)數(shù)學(xué)軟件Matlab占比27.12%),同時(shí),由于生命科學(xué)領(lǐng)域的學(xué)科專業(yè)性,在數(shù)據(jù)處理和分析過程中還使用較多的專業(yè)性軟件,如Primer、Origin Demo、GraphPad PRISM等。此外,10.17%的學(xué)生表示對科研數(shù)據(jù)分析和處理的工具并不了解。
(2)所用科研數(shù)據(jù)的來源情況。問卷中該題目12表述為“在研究過程中,您使用的科研數(shù)據(jù)來源包括哪些”。本題旨在考察學(xué)生在開放科學(xué)開放數(shù)據(jù)、數(shù)據(jù)再利用的科研大背景下,用于研究實(shí)踐的數(shù)據(jù)來源,對學(xué)生的自主實(shí)驗(yàn)數(shù)據(jù)、團(tuán)隊(duì)實(shí)驗(yàn)數(shù)據(jù),以及從外部獲取的科研數(shù)據(jù)進(jìn)行辨識(shí)。調(diào)查結(jié)果顯示,部分接受調(diào)查的研究生具有廣泛的科研數(shù)據(jù)來源,既有自己和團(tuán)隊(duì)的實(shí)驗(yàn)數(shù)據(jù),還包括從文獻(xiàn)、數(shù)據(jù)中心、數(shù)據(jù)倉儲(chǔ)下載的數(shù)據(jù)(59.32%);但仍有部分學(xué)生的科研數(shù)據(jù)來源渠道較窄,有27.12%的學(xué)生表示在研究過程中只使用自己及所在團(tuán)隊(duì)的實(shí)驗(yàn)數(shù)據(jù),10.17%的學(xué)生表示研究過程中全部是自己的實(shí)驗(yàn)數(shù)據(jù)。此外,有3.39%的學(xué)生表示對自己研究過程中所涉及數(shù)據(jù)的來源尚不明確。
(3)科研數(shù)據(jù)質(zhì)量控制方法。問卷中該題目13表述為“您認(rèn)為控制和評(píng)估科研數(shù)據(jù)質(zhì)量的方法有哪些”。問題選項(xiàng)設(shè)置參考張曉林教授對科學(xué)研究方法的表述,設(shè)置了數(shù)據(jù)真實(shí)性、數(shù)據(jù)完整性、數(shù)據(jù)規(guī)范性、數(shù)據(jù)重現(xiàn)性、數(shù)據(jù)重復(fù)性等科研數(shù)據(jù)質(zhì)量評(píng)價(jià)選項(xiàng)。[9]調(diào)查結(jié)果顯示,接受調(diào)查的研究生在科研數(shù)據(jù)質(zhì)量控制和評(píng)價(jià)方面表現(xiàn)出較高的認(rèn)知度,其中,最重要的指標(biāo)是數(shù)據(jù)真實(shí)性(98.31%),其次,是數(shù)據(jù)完整性(91.53%)、數(shù)據(jù)規(guī)范性(88.14%),以及數(shù)據(jù)重現(xiàn)性(83.05%)和數(shù)據(jù)重復(fù)性(81.36%)。
3.2.5 數(shù)據(jù)管理與保存
科研數(shù)據(jù)的描述與說明情況(元數(shù)據(jù))。問卷中該題目14表述為“您認(rèn)為科研數(shù)據(jù)應(yīng)如何進(jìn)行描述和說明(元數(shù)據(jù))”。實(shí)現(xiàn)數(shù)據(jù)可理解、可重用的前提是使用元數(shù)據(jù)對科研數(shù)據(jù)進(jìn)行規(guī)范描述和說明,因此,本題目主要考察學(xué)生對于數(shù)據(jù)描述和說明的態(tài)度及現(xiàn)狀。調(diào)查結(jié)果顯示,接受調(diào)查的研究生在數(shù)據(jù)描述和說明方面具有較高的認(rèn)知度,絕大多數(shù)學(xué)生認(rèn)為應(yīng)遵循研究團(tuán)隊(duì)或?qū)嶒?yàn)室統(tǒng)一規(guī)范的數(shù)據(jù)描述和說明規(guī)則(94.92%),也可以通過自己設(shè)定規(guī)則來描述數(shù)據(jù)(33.90%)。而5.08%的學(xué)生認(rèn)為不用對數(shù)據(jù)進(jìn)行描述和說明,此外,還有少數(shù)學(xué)生不確定如何描述和說明科研數(shù)據(jù)。
3.2.6 數(shù)據(jù)發(fā)表與共享
題項(xiàng)15-16旨在考察學(xué)生在數(shù)據(jù)發(fā)表與共享階段的數(shù)據(jù)素養(yǎng)現(xiàn)狀。
(1)對科研數(shù)據(jù)共享與發(fā)表途徑的認(rèn)知情況。問卷中該題目15表述為“您知道科研數(shù)據(jù)發(fā)表的途徑嗎”,本題目主要考察學(xué)生對三種數(shù)據(jù)發(fā)表方式的認(rèn)知情況。調(diào)查結(jié)果顯示,大多數(shù)接受調(diào)查的研究生已經(jīng)知曉科研數(shù)據(jù)發(fā)表的方式(84.75%),就具體的發(fā)表途徑而言,發(fā)表論文時(shí)按照期刊要求將數(shù)據(jù)作為補(bǔ)充信息提交是學(xué)生認(rèn)知度最高的數(shù)據(jù)發(fā)表方式(76.27%),這也是目前國際上最主流的數(shù)據(jù)發(fā)表方式;而對于將數(shù)據(jù)提交到本學(xué)科領(lǐng)域的數(shù)據(jù)倉儲(chǔ),在數(shù)據(jù)期刊發(fā)表數(shù)據(jù)論文兩種較新的數(shù)據(jù)發(fā)表方式,也有半數(shù)以上的學(xué)生表示了解。但仍有15.25%的學(xué)生表示不清楚科研數(shù)據(jù)發(fā)表的途徑。
(2)適用的科研數(shù)據(jù)共享激勵(lì)措施。問卷中該題目16表述為“通過下列哪些措施,您愿意開放和共享科研數(shù)據(jù)”。本題目旨在考察學(xué)生的數(shù)據(jù)共享意愿,以及有效的數(shù)據(jù)開放共享激勵(lì)措施。調(diào)查結(jié)果顯示,接受調(diào)查94.92%的研究生具有潛在的數(shù)據(jù)共享意愿,只有5.08%的學(xué)生不確定是否共享科研數(shù)據(jù)。就各種適用的科研數(shù)據(jù)共享激勵(lì)措施來看,學(xué)生最關(guān)注的是通過共享科研數(shù)據(jù)來提高個(gè)人知名度和學(xué)術(shù)影響力(64.41%),其次,是資金鼓勵(lì)共享科研數(shù)據(jù)(59.32%)和優(yōu)先發(fā)表論文(57.63%),對以強(qiáng)制性要求共享科研數(shù)據(jù)這一措施的認(rèn)可度較低(40.68%)。
3.2.7 數(shù)據(jù)權(quán)益與倫理
題項(xiàng)17-18旨在考察學(xué)生的數(shù)據(jù)權(quán)益與倫理現(xiàn)狀。
(1)數(shù)據(jù)引用現(xiàn)狀。問卷中該題目17表述為“在參考或引用他人數(shù)據(jù)時(shí),您會(huì)采取以下哪些措施”。本題目旨在考察學(xué)生的數(shù)據(jù)倫理道德,即數(shù)據(jù)引用情況。調(diào)查結(jié)果顯示,絕大多數(shù)接受調(diào)查的研究生在參考和引用他人數(shù)據(jù)時(shí)都會(huì)有相應(yīng)的數(shù)據(jù)引用行為,其中,以引用規(guī)范標(biāo)注數(shù)據(jù)來源的占96.61%,致謝數(shù)據(jù)來源作者的占52.54%。此外,有5.08%的學(xué)生在參考和引用他人數(shù)據(jù)時(shí)不標(biāo)注數(shù)據(jù)來源,1.69%的學(xué)生表示不知道是否/如何進(jìn)行數(shù)據(jù)引用。
(2)對科研數(shù)據(jù)相關(guān)權(quán)益的認(rèn)知情況。問卷中該題目18表述為“您了解科研數(shù)據(jù)管理和利用過程中涉及的相關(guān)權(quán)益嗎”。本題目旨在考察學(xué)生對科研數(shù)據(jù)相關(guān)權(quán)益的認(rèn)知情況,選項(xiàng)設(shè)置參照顧立平教授提出的科研數(shù)據(jù)權(quán)益研究框架。[10]調(diào)查結(jié)果顯示,接受調(diào)查的研究生對科研數(shù)據(jù)相關(guān)權(quán)益具有較高的認(rèn)知度(86.44%),具體而言,數(shù)據(jù)歸屬權(quán)占比79.66%,知情同意權(quán)占比76.27%,其次,是合法商業(yè)利益占比49.15%,國家安全機(jī)密占比47.46%,隱私權(quán)占比35.59%。但仍有13.56%的學(xué)生表示不清楚科研數(shù)據(jù)管理和利用過程中涉及的相關(guān)權(quán)益。
(1)研究生接受數(shù)據(jù)素養(yǎng)教育的重要性。在調(diào)研中科院研究生的數(shù)據(jù)素養(yǎng)教育需求之前,首先,調(diào)查中科院研究生在從事科研工作前是否有必要接受數(shù)據(jù)素養(yǎng)教育這一問題的看法,這是后期設(shè)計(jì)課程和實(shí)施教學(xué)的基本前提。從調(diào)查結(jié)果可知,接受調(diào)查的研究生對數(shù)據(jù)管理和數(shù)據(jù)素養(yǎng)教育具有強(qiáng)烈需求,接受調(diào)查的學(xué)生均認(rèn)為研究生在從事科研工作前有必要接受數(shù)據(jù)素養(yǎng)的相關(guān)培訓(xùn)(其中非常重要占比81.36%,重要占比18.64%)。由此可見,面向中科院研究生開設(shè)數(shù)據(jù)管理培訓(xùn)和數(shù)據(jù)素養(yǎng)課程具有必要性。在明確了研究生具有的數(shù)據(jù)素養(yǎng)教育需求后,重點(diǎn)調(diào)研了學(xué)生在科研數(shù)據(jù)生命周期各階段的數(shù)據(jù)素養(yǎng)內(nèi)容需求。題項(xiàng)20-24旨在考察學(xué)生對數(shù)據(jù)素養(yǎng)教育的內(nèi)容需求。
(2)制定數(shù)據(jù)管理計(jì)劃階段的需求內(nèi)容。問卷中該題目20表述為“關(guān)于數(shù)據(jù)管理計(jì)劃,您想了解哪些內(nèi)容”,主要調(diào)研學(xué)生在數(shù)據(jù)管理計(jì)劃階段所需的知識(shí)和技能。調(diào)查結(jié)果顯示,接受調(diào)查的研究生對數(shù)據(jù)管理計(jì)劃階段的數(shù)據(jù)素養(yǎng)需求從高到低分別是數(shù)據(jù)管理計(jì)劃工具(89.83%),數(shù)據(jù)管理、共享的政策和要求(81.36%),科研數(shù)據(jù)生命周期(71.19%),數(shù)據(jù)管理計(jì)劃構(gòu)成要素(61.02%)。
(3)數(shù)據(jù)收集與記錄階段的需求內(nèi)容。問卷中該題目21表述為“關(guān)于數(shù)據(jù)收集與記錄,您想了解哪些內(nèi)容”,主要調(diào)查研究生在收集與記錄數(shù)據(jù)階段所需的知識(shí)和技能。調(diào)查結(jié)果顯示,接受調(diào)查的研究生對收集和記錄數(shù)據(jù)階段的數(shù)據(jù)素養(yǎng)需求從高到低分別是本學(xué)科科研數(shù)據(jù)的類型、格式和數(shù)據(jù)量(94.92%),科研數(shù)據(jù)質(zhì)量控制與評(píng)估(83.05%),本學(xué)科科研數(shù)據(jù)的記錄方式(81.36%)。
(4)數(shù)據(jù)處理與分析階段的需求內(nèi)容。問卷中該題目22表述為“關(guān)于數(shù)據(jù)處理與分析,您想了解哪些內(nèi)容”,主要調(diào)查研究生在處理和分析數(shù)據(jù)階段所需的知識(shí)和技能。調(diào)查結(jié)果顯示,接受調(diào)查的研究生對數(shù)據(jù)處理與分析階段的數(shù)據(jù)素養(yǎng)需求主要在數(shù)據(jù)處理和分析工具(98.31%)以及數(shù)據(jù)可視化(76.27%)方面。
(5)數(shù)據(jù)管理與保存階段的需求內(nèi)容。問卷中該題目23表述為“關(guān)于數(shù)據(jù)管理與保存,您想了解哪些內(nèi)容”,主要調(diào)查研究生在管理和保存數(shù)據(jù)階段所需的知識(shí)和技能。調(diào)查結(jié)果顯示,接受調(diào)查的研究生對數(shù)據(jù)管理和保存階段的數(shù)據(jù)素養(yǎng)需求從高到低分別是科研數(shù)據(jù)保護(hù)與安全措施(91.53%),科研數(shù)據(jù)保存與備份(88.14%),本學(xué)科領(lǐng)域?qū)蒲袛?shù)據(jù)進(jìn)行描述的元數(shù)據(jù)標(biāo)準(zhǔn)(81.36%),科研數(shù)據(jù)命名規(guī)則(62.71%)以及科研數(shù)據(jù)版本控制(47.46%)。
(6)數(shù)據(jù)發(fā)表與共享階段的需求內(nèi)容。問卷中該題目24表述為“關(guān)于數(shù)據(jù)共享與再利用,您想了解哪些內(nèi)容”,主要調(diào)查研究生在數(shù)據(jù)共享和再利用階段所需的知識(shí)和技能。調(diào)查結(jié)果顯示,接受調(diào)查的研究生對數(shù)據(jù)共享和再利用階段的數(shù)據(jù)素養(yǎng)需求從高到低分別是檢索和獲取本學(xué)科科研數(shù)據(jù)的來源(98.31%),科研數(shù)據(jù)發(fā)表和共享的途徑(88.14%),科研數(shù)據(jù)引用規(guī)范(79.66%),科研數(shù)據(jù)相關(guān)的權(quán)益問題和保護(hù)措施(77.97%),以及科研數(shù)據(jù)共享與許可協(xié)議(69.49%)。
(7)提升數(shù)據(jù)素養(yǎng)能力的方式。在界定研究生的數(shù)據(jù)素養(yǎng)內(nèi)容需求后,調(diào)研了學(xué)生可接受的數(shù)據(jù)管理和數(shù)據(jù)素養(yǎng)教育方式。問卷中該題目25表述為“您希望通過哪些方式來了解科研數(shù)據(jù)管理的內(nèi)容”,羅列了目前國際上高校圖書館常用的數(shù)據(jù)素養(yǎng)教育方式。調(diào)查結(jié)果顯示,建立數(shù)據(jù)管理平臺(tái)是學(xué)生最期望的數(shù)據(jù)素養(yǎng)教育方式(71.19%),其次,是培訓(xùn)講座(69.49%),微信公眾號(hào)、博客等自媒體(67.80%),在線課程(66.10%),學(xué)分課程(61.02%),而國外高校圖書館使用最廣泛的研討會(huì)卻在中科院研究生中遇冷,僅占比27.12%。
(8)為了更深入、具體地了解研究生的數(shù)據(jù)素養(yǎng)現(xiàn)狀,在以結(jié)構(gòu)化方式調(diào)研了科研數(shù)據(jù)生命周期各階段學(xué)生的數(shù)據(jù)素養(yǎng)現(xiàn)狀后,在問卷的最后設(shè)計(jì)了開放性問題來調(diào)研學(xué)生在數(shù)據(jù)管理過程中面臨的難題和挑戰(zhàn)、收集學(xué)生對數(shù)據(jù)管理課程的意見和建議,旨在進(jìn)一步發(fā)掘和揭示學(xué)生的數(shù)據(jù)素養(yǎng)需求。
就數(shù)據(jù)管理過程中面臨的難題和挑戰(zhàn)方面,調(diào)查結(jié)果顯示,在具體的科研數(shù)據(jù)研究實(shí)踐中,接受調(diào)查的研究生主要面臨以下五個(gè)方面的問題:① 科研數(shù)據(jù)管理意識(shí)淡薄、知識(shí)薄弱,數(shù)據(jù)管理的主動(dòng)性和積極性低;② 數(shù)據(jù)收集和查找困難,數(shù)據(jù)檢索效率低;③ 龐大的數(shù)據(jù)量篩選和取舍困難,難以科學(xué)地評(píng)估科研數(shù)據(jù)的質(zhì)量;④ 數(shù)據(jù)分析與處理的規(guī)范流程不明確,工具軟件的選取和使用不明晰,難以實(shí)現(xiàn)和解讀數(shù)據(jù)可視化;⑤ 數(shù)據(jù)保存和管理等。
就研究生對數(shù)據(jù)管理課程的意見和建議而言,統(tǒng)計(jì)結(jié)果顯示,接受調(diào)查的研究生對數(shù)據(jù)素養(yǎng)課程的建議主要包括以下三個(gè)方面:① 結(jié)合領(lǐng)域科研數(shù)據(jù)特點(diǎn),介紹不同類型數(shù)據(jù)的來源渠道,以及數(shù)據(jù)發(fā)現(xiàn)與檢索的策略方法,提高學(xué)生檢索與獲取數(shù)據(jù)的能力;② 以實(shí)際應(yīng)用場景為基礎(chǔ),強(qiáng)調(diào)數(shù)據(jù)分析與處理工具的應(yīng)用,加大課堂教學(xué)中的實(shí)用性技能比重;③課程講授與課后練習(xí)相結(jié)合,重視課后練習(xí)與交流總結(jié),提高學(xué)生的動(dòng)手實(shí)踐能力。
根據(jù)問卷調(diào)查結(jié)果分析,接受調(diào)查的研究生對數(shù)據(jù)素養(yǎng)教育具有強(qiáng)烈需求。為此,在問卷分析統(tǒng)計(jì)的基礎(chǔ)上,本研究從科研數(shù)據(jù)生命周期流程出發(fā),總結(jié)了生命學(xué)科領(lǐng)域研究生在數(shù)據(jù)生命周期各個(gè)階段的數(shù)據(jù)素養(yǎng)需求問題,并提出相應(yīng)的對策和建議(見表2)。根據(jù)問卷的統(tǒng)計(jì)分析結(jié)果,可將接受調(diào)查的中科院生命學(xué)科領(lǐng)域研究生的數(shù)據(jù)素養(yǎng)現(xiàn)狀特點(diǎn)總結(jié)如下。
(1)能夠較好地認(rèn)識(shí)到科研數(shù)據(jù)管理的重要性,并具有強(qiáng)烈的數(shù)據(jù)素養(yǎng)教育需求。接受調(diào)查的大多數(shù)研究生能夠較全面地認(rèn)識(shí)到科研數(shù)據(jù)管理的重要意義,包括數(shù)據(jù)再利用促進(jìn)科學(xué)創(chuàng)新、減少數(shù)據(jù)重復(fù)收集的成本、使研究發(fā)現(xiàn)和學(xué)術(shù)成果可檢驗(yàn)、促進(jìn)科研更加透明公開、引導(dǎo)數(shù)據(jù)生產(chǎn)者和數(shù)據(jù)利用者加強(qiáng)新合作、促進(jìn)研究方法的改進(jìn)和驗(yàn)證。同時(shí),研究生具有強(qiáng)烈的數(shù)據(jù)素養(yǎng)教育需求,認(rèn)為在知識(shí)學(xué)習(xí)和專業(yè)實(shí)踐的早期階段通過學(xué)分課程、培訓(xùn)講座等方式培養(yǎng)其數(shù)據(jù)素養(yǎng)技能非常必要。
(2)科研數(shù)據(jù)管理知識(shí)基礎(chǔ)薄弱。調(diào)查結(jié)果顯示,盡管學(xué)生能夠認(rèn)識(shí)到數(shù)據(jù)管理的重要性,但對數(shù)據(jù)管理的相關(guān)知識(shí)尤其是對學(xué)科領(lǐng)域內(nèi)科研數(shù)據(jù)管理的專業(yè)知識(shí)了解較少。具體表現(xiàn)為對模型軟件等新型科研數(shù)據(jù)的辨識(shí)度低,對數(shù)據(jù)管理與共享政策的認(rèn)知度低,對數(shù)據(jù)量級(jí)等學(xué)科領(lǐng)域科研數(shù)據(jù)的認(rèn)識(shí)模糊。
(3)科研數(shù)據(jù)管理專業(yè)技能欠缺。研究生以往的數(shù)據(jù)管理實(shí)踐往往是個(gè)性化的、缺乏規(guī)范性,因此在應(yīng)對整個(gè)科研生命周期以及生命周期各個(gè)階段的數(shù)據(jù)管理難題和挑戰(zhàn)時(shí),缺乏系統(tǒng)性的數(shù)據(jù)管理專業(yè)技能,如,數(shù)據(jù)獲取來源渠道單一,數(shù)據(jù)處理工具選取困難,缺乏數(shù)據(jù)管理與保存規(guī)范,數(shù)據(jù)保護(hù)與安全措施欠缺等。
表2 數(shù)據(jù)素養(yǎng)問題總結(jié)與對策建議(生命學(xué)科領(lǐng)域)
(4)具有良好的數(shù)據(jù)倫理與道德意識(shí),但仍需規(guī)范和引導(dǎo)。調(diào)查結(jié)果顯示,研究生在科研實(shí)踐中能夠有較好的數(shù)據(jù)引用意識(shí),也能較好地認(rèn)識(shí)到科研數(shù)據(jù)管理與共享階段中涉及的數(shù)據(jù)歸屬權(quán)、知情同意權(quán)、合法商業(yè)利益、國家安全機(jī)密、隱私權(quán)等權(quán)益問題,但在科研實(shí)踐中如何遵循數(shù)據(jù)倫理與權(quán)益,正確進(jìn)行數(shù)據(jù)引用標(biāo)識(shí),還需要進(jìn)一步規(guī)范和引導(dǎo)。