鄭 琳(北京大學(xué)信息管理系)
大數(shù)據(jù)時代的到來促使科學(xué)研究向著數(shù)據(jù)密集模式轉(zhuǎn)變,科研數(shù)據(jù)已經(jīng)成為科研活動中不可或缺的生產(chǎn)資料。對科研數(shù)據(jù)進(jìn)行共享可以打破對數(shù)據(jù)資源的壟斷,實(shí)現(xiàn)科研數(shù)據(jù)合理配置與再利用,促進(jìn)學(xué)科領(lǐng)域發(fā)展與科技創(chuàng)新。鑒于此,許多國家、組織出臺了相應(yīng)的數(shù)據(jù)政策。然而,單純的外部刺激并不能從根本上解決科研數(shù)據(jù)共享難的問題,作為數(shù)據(jù)共享的主體,科研人員的主觀意愿才是決定數(shù)據(jù)共享效率和效果的最重要因素。為此,許多研究著眼于科研人員的數(shù)據(jù)共享意愿,試圖了解其總體意愿水平和共享意愿的影響因素,進(jìn)而制定更具針對性的數(shù)據(jù)共享機(jī)制,從根本上調(diào)動科研人員的數(shù)據(jù)共享積極性。本文通過對相關(guān)研究的收集和整理,揭示當(dāng)前科研數(shù)據(jù)共享意愿研究的現(xiàn)狀與進(jìn)展,明確研究存在的不足與后續(xù)可供研究的方向,為今后相關(guān)研究提供參考與借鑒。
本文分別在中國知網(wǎng)(CNKI)、萬方、Webof Science等數(shù)據(jù)庫中進(jìn)行了中英文文獻(xiàn)檢索,使用“數(shù)據(jù)共享”“開放數(shù)據(jù)”“數(shù)據(jù)獲取”“意愿”“態(tài)度”等關(guān)鍵詞及其對應(yīng)單詞進(jìn)行組配檢索,截至2017年11月28日,得到中英文文獻(xiàn)100余篇。通過文獻(xiàn)去重、學(xué)科精選和主題分析,最終得到目標(biāo)文獻(xiàn)62篇,其中英文文獻(xiàn)45篇,中文文獻(xiàn)17篇。對得到的文獻(xiàn)進(jìn)行初步分析,從研究的時間跨度上看,相關(guān)研究最早起始于1988年,Stanley B等探討了對科研人員數(shù)據(jù)共享意愿產(chǎn)生負(fù)面影響的因素,包括經(jīng)濟(jì)和時間成本、缺乏合理回報以及喪失對數(shù)據(jù)控制權(quán)的風(fēng)險。[1]同年,Ceci對790位來自不同機(jī)構(gòu)、從事不同學(xué)科領(lǐng)域研究的科研人員進(jìn)行數(shù)據(jù)共享意愿的調(diào)研,發(fā)現(xiàn)科研人員的數(shù)據(jù)共享意愿與實(shí)際行為有差距。同時,影響科研人員數(shù)據(jù)共享意愿的因素因?qū)W科不同而有所差異:在生物技術(shù)領(lǐng)域,經(jīng)濟(jì)因素制約研究人員的共享意愿;而在社會科學(xué)領(lǐng)域,學(xué)術(shù)競爭則成為影響研究人員共享數(shù)據(jù)的主要原因。[2]之后,相關(guān)研究出現(xiàn)斷層,直至2008年,Jacoby對不同學(xué)科領(lǐng)域內(nèi)科研人員的數(shù)據(jù)共享進(jìn)行了探析。[3]此后,相關(guān)主題的研究數(shù)量逐年遞增,并于近幾年達(dá)到最高值。
從研究的內(nèi)容層面看,當(dāng)前的研究可以劃分為兩個主題:科研人員數(shù)據(jù)共享意愿研究和科研人員數(shù)據(jù)共享意愿的影響因素研究。前者試圖明確當(dāng)前科研人員對數(shù)據(jù)共享的總體認(rèn)知狀況和特征,而后者則主要探討影響科研人員數(shù)據(jù)共享意愿的各種因素。
鄰避效應(yīng)最初指居民因?yàn)閾?dān)心項(xiàng)目建設(shè)危害到自身利益而懷有抵觸情緒,進(jìn)而產(chǎn)生“不要建在我家后院”的想法。在鄰避效應(yīng)中,盡管居民能夠清楚地意識到項(xiàng)目的建設(shè)將是一件有利于公共利益的事,但是出于對自身利益的考量仍會對其加以拒絕。[4]當(dāng)前,科研人員的數(shù)據(jù)共享意愿表現(xiàn)出了較為普遍和明顯的鄰避效應(yīng),即科研人員認(rèn)可科研數(shù)據(jù)共享的好處,但是出于對自身利益的維護(hù)卻不愿意共享自己的科研數(shù)據(jù)。Adrian Mulligan等向超過6,000名科研人員發(fā)放問卷,發(fā)現(xiàn)超過3/4的科研人員認(rèn)可科研數(shù)據(jù)共享的積極作用,但卻不會與他人共享自己的科研數(shù)據(jù)。[5]Wiely對世界范圍內(nèi)多達(dá)90,000名科研人員進(jìn)行了大規(guī)模的調(diào)查,對回收的2,886份有效問卷進(jìn)行分析發(fā)現(xiàn),盡管科研數(shù)據(jù)共享運(yùn)動正在如火如荼地開展,但僅有52%的科研人員表示與他人共享過數(shù)據(jù)。[6]即使是愿意共享數(shù)據(jù)的科研人員,也更傾向于在研究小組、同學(xué)、同事等可控范圍內(nèi)進(jìn)行共享,而非將數(shù)據(jù)上傳至專門的數(shù)據(jù)倉儲。[7]
盡管目前許多基金和期刊都出臺了數(shù)據(jù)管理與共享政策,但似乎科研人員數(shù)據(jù)共享意愿的鄰避效應(yīng)并未得到有效緩解。[8,9]因而,有研究提出可以通過干預(yù)的方式避免鄰避現(xiàn)象的出現(xiàn)。[10]吉林醫(yī)藥學(xué)院圖書館通過向科研人員提供科研數(shù)據(jù)共享及相關(guān)知識的培訓(xùn),干預(yù)其數(shù)據(jù)共享意愿,緩解鄰避效應(yīng)。干預(yù)措施前后的兩次調(diào)查結(jié)果顯示,科研人員在干預(yù)后的數(shù)據(jù)共享意愿水平確實(shí)較干預(yù)前有所提升,鄰避效應(yīng)有所緩解。不過,這種通過培訓(xùn)進(jìn)行干預(yù)的方式覆蓋范圍有限,并不能從根本上解決整個科學(xué)領(lǐng)域的數(shù)據(jù)共享困境。并且,單純的外部刺激并不能完全激發(fā)出科研人員的主觀能動性,只有明確有哪些因素影響科研人員的數(shù)據(jù)共享意愿,才能從根本上避免鄰避效應(yīng)的出現(xiàn)。
科研人員在數(shù)據(jù)共享過程中會遵循公平原則,即更愿意與其他人交換數(shù)據(jù)而非單方面向他人提供數(shù)據(jù)。這一特征早在1988年Ceci的研究中就有體現(xiàn)。Ceci發(fā)現(xiàn)科研人員在與他人共享數(shù)據(jù)的同時,往往也伴隨著科研數(shù)據(jù)需求,即要求與他人互換研究數(shù)據(jù)。[2]Neela Enke等以德國的生物多樣性研究人員為對象,隨機(jī)選取了3,000余名科研人員進(jìn)行訪談和網(wǎng)絡(luò)問卷調(diào)查,發(fā)現(xiàn)科研人員之所以愿意參與數(shù)據(jù)共享的最重要原因是想要獲得其他人的數(shù)據(jù)(72%)。[11]2014年,美國國立衛(wèi)生研究院(National Institutesof Health,NIH)圖書館開展的調(diào)查研究表明,數(shù)據(jù)互換與合作是科研人員同意數(shù)據(jù)共享的最重要原因(69%)。[12]
這說明,科研人員的數(shù)據(jù)共享期望并非是無差別、無回報的,只有達(dá)到其預(yù)期收益的科研數(shù)據(jù)共享請求才能激發(fā)科研人員的數(shù)據(jù)共享意愿。并且,遵循公平原則,曾經(jīng)從數(shù)據(jù)共享活動中受益的科研人員更愿意與他人共享自己的科研數(shù)據(jù)。[13]HAPiwowar有關(guān)數(shù)據(jù)再利用的研究也證實(shí)了這一觀點(diǎn):該研究收集了發(fā)表于2000-2009年的微陣列基因表達(dá)論文共11,603篇,通過對比上述文章曾經(jīng)使用公開的共享數(shù)據(jù)集和文章的數(shù)據(jù)集共享情況,發(fā)現(xiàn)那些曾經(jīng)使用過他人科研數(shù)據(jù)的科研人員更愿意將自己的科研數(shù)據(jù)共享出去。[14]
科研人員的數(shù)據(jù)共享意愿會受到多方面因素的綜合影響。Sayogo等采用隨機(jī)抽樣方式對地球觀測數(shù)據(jù)網(wǎng) (Data Observation Network for Earth,DataOne) 上的科研人員進(jìn)行問卷調(diào)查,收回有效問卷555份。通過分析,發(fā)現(xiàn)科研人員的數(shù)據(jù)共享與獲取模式呈現(xiàn)出分散式集群的特點(diǎn),并由此推斷出科研人員的數(shù)據(jù)共享意愿受到多方面因素綜合影響。[15]YKim等探討了機(jī)構(gòu)、資源等因素對科研人員數(shù)據(jù)共享意愿的影響作用。[13]此外,還有研究關(guān)注了數(shù)據(jù)政策、學(xué)科、競爭等因素對科研人員數(shù)據(jù)共享意愿的影響。[16-19]
總體來說,當(dāng)前研究內(nèi)容主要涵蓋了以下影響因素:① 科研人員的個人背景,不僅包括年齡、性別、性格、所處地理位置等人口學(xué)特征,還包括科研人員的學(xué)科背景;② 外部政策,主要包括機(jī)構(gòu)、基金以及期刊的數(shù)據(jù)政策;③ 共享成本,如時間成本、競爭成本、數(shù)據(jù)成本等;④ 支撐技術(shù),主要包括數(shù)據(jù)倉儲的可獲得性、既定的標(biāo)注與技術(shù)支撐;⑤ 數(shù)據(jù)質(zhì)量,即數(shù)據(jù)的真實(shí)性和準(zhǔn)確性。
4.1.1 人口學(xué)特征
(1)年齡。Eynden等對來自5個學(xué)科的22名科研人員進(jìn)行訪談,發(fā)現(xiàn)科研人員的年齡與科研數(shù)據(jù)共享意愿正相關(guān):年輕科研人員出于對數(shù)據(jù)不自信等原因,數(shù)據(jù)共享意愿最低;中年科研人員出于競爭原因,數(shù)據(jù)共享意愿也不理想;年長的科研人員則由于利他因素、獲得聲譽(yù)等原因最愿意共享科研數(shù)據(jù)。[20]另一項(xiàng)研究證實(shí)了這一觀點(diǎn):對2,661名科研人員進(jìn)行調(diào)查顯示,相較之下,年輕人對數(shù)據(jù)共享的態(tài)度更為保守,而年長科研人員則更加傾向于向認(rèn)識的人共享自己的科研數(shù)據(jù)。[21]不過,也有研究提出了相反的觀點(diǎn):Howard等采用問卷、焦點(diǎn)小組和深度訪談的方式對新南威爾士大學(xué)的科研人員進(jìn)行了調(diào)查,發(fā)現(xiàn)年輕科研人員出于其研究方法和結(jié)果被認(rèn)可的目的更加愿意共享自己的科研數(shù)據(jù),而年長科研人員則由于競爭等原因不愿意共享自己的科研數(shù)據(jù)。[22]
(2)性格。Stephanie等試圖明確性格對科研人員數(shù)據(jù)共享意愿的影響作用。研究首先采用大五性格測試、黑暗三性格測試和社會期許量表對2,661名科研人員的性格特征進(jìn)行判斷。之后,研究調(diào)查了受測者的科研數(shù)據(jù)共享意愿,以明確不同性格的科研人員在數(shù)據(jù)共享意愿方面有何差異。最終發(fā)現(xiàn),大五性格測試中的開放度指標(biāo)與數(shù)據(jù)共享意愿呈正相關(guān)關(guān)系,開放度得分高的科研人員對數(shù)據(jù)共享的態(tài)度表現(xiàn)得更為開放和積極;黑暗三性格測試得分與數(shù)據(jù)共享意愿呈負(fù)相關(guān)關(guān)系,得分越高的研究人員越傾向于看到科研數(shù)據(jù)共享的負(fù)面效應(yīng),并且在期刊要求提交數(shù)據(jù)時更容易放棄在該期刊發(fā)表文章;社會期許量表得分與數(shù)據(jù)共享意愿正相關(guān),社會期許得分越高的科研人員數(shù)據(jù)共享意愿水平越高。[21]
(3)性別。Mai等通過對689名受NIH資助的科研人員進(jìn)行調(diào)查發(fā)現(xiàn),女性對于數(shù)據(jù)共享的敏感程度要遠(yuǎn)遠(yuǎn)高于男性。[17]Carol Tenopir等的研究也認(rèn)為,與男性研究人員相比,女性科研人員對數(shù)據(jù)共享的態(tài)度更為謹(jǐn)慎和保守。這直接導(dǎo)致了在數(shù)據(jù)共享過程中,女性的數(shù)據(jù)共享行為比例要低于男性。并且,在期刊要求作者提交科研數(shù)據(jù)的情況下,女性科研人員選擇放棄發(fā)表的比例更高。此外,女性科研人員對其他影響因素的感受也更為敏感,所受影響程度也更高。[23]
(4)地理位置。Neela在一項(xiàng)超過3,000人的調(diào)查中發(fā)現(xiàn),來自加拿大和德國的科研人員的數(shù)據(jù)共享意愿較其他國家更低,而來自美國和歐洲其他國家的科研人員則最愿意與他人共享自己的科研數(shù)據(jù)。[11]另一項(xiàng)研究提出了不同觀點(diǎn):2011年的一項(xiàng)研究將地理位置劃分為三類:歐洲地區(qū)、北美洲地區(qū)和其他地區(qū)。通過對上述地區(qū)科研人員進(jìn)行調(diào)查,發(fā)現(xiàn)除歐洲和北美洲之外的其他地區(qū)的科研人員的數(shù)據(jù)共享意愿最高,其次是北美洲科研人員,歐洲科研人員的數(shù)據(jù)共享意愿則最低。認(rèn)為數(shù)據(jù)共享是一種平等交換行為的科研人員中,其他地區(qū)、北美地區(qū)和歐洲地區(qū)的所占比例依次遞減。[23]
4.1.2 學(xué)科背景
除人口學(xué)特征外,學(xué)科背景也會對科研人員的數(shù)據(jù)共享意愿產(chǎn)生影響??傮w來講,天文學(xué)、環(huán)境科學(xué)、生態(tài)科學(xué)等學(xué)科領(lǐng)域的科研人員對數(shù)據(jù)共享的接受度更高,[23]尤其在天文學(xué)領(lǐng)域,數(shù)據(jù)共享早已成為行業(yè)傳統(tǒng),共享意識和途徑高度成熟。而社會科學(xué)、醫(yī)學(xué)等領(lǐng)域內(nèi)研究人員對數(shù)據(jù)共享的態(tài)度則更為保留;人文藝術(shù)領(lǐng)域數(shù)據(jù)共享規(guī)模最小。[24]
之所以在不同學(xué)科之間有如此大的差別,一方面是由于不同學(xué)科之間科研模式的差異導(dǎo)致其數(shù)據(jù)共享意識有差距。如,在天文學(xué)領(lǐng)域,其科研模式一般為觀測天文學(xué)家收集天文數(shù)據(jù),之后將數(shù)據(jù)提供給理論天文學(xué)家進(jìn)行研究。[24]而在諸如社科等其他學(xué)科,從數(shù)據(jù)的收集到后續(xù)的分析則一般由科研人員全程負(fù)責(zé),因而并未在領(lǐng)域內(nèi)形成廣泛的數(shù)據(jù)共享傳統(tǒng)。另一方面,不同學(xué)科獲取科研數(shù)據(jù)的敏感程度不同。天文學(xué)、生態(tài)學(xué)等學(xué)科收集的科研數(shù)據(jù)多為反應(yīng)自然界或現(xiàn)實(shí)世界客觀事實(shí)的原始數(shù)據(jù),來自公有領(lǐng)域,對其進(jìn)行共享不會侵害數(shù)據(jù)權(quán)利人的合法權(quán)益。但是醫(yī)學(xué)、生物學(xué)以及社會科學(xué)等領(lǐng)域的科研數(shù)據(jù)則可能包含數(shù)據(jù)提供者的生物信息、人口學(xué)特征、政治觀點(diǎn)等十分敏感的內(nèi)容,無法實(shí)現(xiàn)大規(guī)模的數(shù)據(jù)共享。此外,在設(shè)計與制造、計算機(jī)科學(xué)等領(lǐng)域,由于科研數(shù)據(jù)的高度排他性和利益相關(guān)性,科研人員對數(shù)據(jù)共享的態(tài)度也十分消極。[1,24]
開放獲取運(yùn)動的興起促使基金、協(xié)會以及期刊相繼出臺數(shù)據(jù)共享政策,鼓勵科研人員共享科研數(shù)據(jù)。自美國國家科學(xué)基金會(National Science Foundation,NSF)制定科研數(shù)據(jù)共享政策以來,NIH、美國航天航空局、美國疾病控制與預(yù)防中心等機(jī)構(gòu)也相繼出臺了類似的科研數(shù)據(jù)管理政策。但是,外部激勵政策真的能從根本上提升科研人員的數(shù)據(jù)共享意識嗎?圍繞這一問題,一些研究給出了自己的觀點(diǎn)。Neela等采用問卷調(diào)查和訪談的方式對3,000余名科研人員進(jìn)行調(diào)查,認(rèn)為期刊和基金政策會提升其數(shù)據(jù)共享意愿的科研人員分別占到59%和57%,其中,尤以美國和加拿大的科研人員比例最高,分別達(dá)到70%和67%。[11]張晉朝綜合計劃行為理論和認(rèn)知整合理論構(gòu)建了科研人員數(shù)據(jù)共享研究模型,隨機(jī)選取國內(nèi)科研人員發(fā)放調(diào)查問卷,收回有效問卷151份,結(jié)果顯示,主觀規(guī)范(即外部政策和環(huán)境壓力)會對科研人員的數(shù)據(jù)共享意愿產(chǎn)生影響。[25]何琳等的研究進(jìn)一步證實(shí)了這一觀點(diǎn)。[26]英國聯(lián)合信息系統(tǒng)委員會等機(jī)構(gòu)聯(lián)合發(fā)布的一份研究報告中,將資助者和機(jī)構(gòu)列為提升科研人員數(shù)據(jù)共享意愿的重要因素之一。[27]
同時,也有研究提出了不同意見:Kim等對美國理工科領(lǐng)域1,317名研究人員進(jìn)行調(diào)查,結(jié)果顯示來自期刊的數(shù)據(jù)政策確實(shí)會提升科研人員的數(shù)據(jù)共享意愿,但是資助機(jī)構(gòu)的數(shù)據(jù)政策對科研人員并無顯著影響。[28]同年,其對社科領(lǐng)域科研人員的調(diào)查研究進(jìn)一步支持了這一觀點(diǎn)。[29]還有研究認(rèn)為,即使是期刊出臺的數(shù)據(jù)共享政策也不能促使科研人員共享其科研數(shù)據(jù):美國心理學(xué)會下屬期刊要求141名投稿作者提交科研數(shù)據(jù),但是在反復(fù)與作者發(fā)送郵件溝通和簽署協(xié)議保證不濫用數(shù)據(jù)集的情況下,仍有103名科研人員不愿意提交科研數(shù)據(jù)。[30]Savage等試圖向10名于PloS One期刊發(fā)表文章的作者請求獲取數(shù)據(jù),最終只有1名作者表示愿意共享。[9]甚至還有研究證明,期刊的數(shù)據(jù)共享政策不僅不會促使科研人員共享數(shù)據(jù),還會對科研人員的投稿意愿產(chǎn)生負(fù)面影響,進(jìn)而影響期刊的收稿數(shù)量與質(zhì)量。羅曉蘭等于2017年向國內(nèi)高??蒲腥藛T發(fā)放218份調(diào)查問卷,發(fā)現(xiàn)由于期刊實(shí)施數(shù)據(jù)共享政策而影響到投稿意愿的科研人員比例高達(dá) 42%。[31]
對科研數(shù)據(jù)進(jìn)行共享不僅需要時間投入,還可能提升原有的競爭成本,甚至導(dǎo)致科研人員失去對科研數(shù)據(jù)的控制權(quán),喪失原有的數(shù)據(jù)成本。因而,一些研究認(rèn)為共享成本會對科研人員數(shù)據(jù)共享意愿產(chǎn)生負(fù)影響。
在時間成本方面,Neela等對超過3000名科研人員進(jìn)行調(diào)查,結(jié)果顯示,有50%的科研人員認(rèn)為共享數(shù)據(jù)會占據(jù)其原本就不充裕的時間。[11]在另一項(xiàng)針對1,329名科研人員的調(diào)查研究中,有54%的受訪科研人員表示時間成本對其數(shù)據(jù)共享意愿造成了負(fù)面影響。[23]在競爭成本方面,普渡大學(xué)圖書館對學(xué)校戶外水質(zhì)觀測站的6名博士研究生的數(shù)據(jù)共享態(tài)度進(jìn)行了調(diào)查,發(fā)現(xiàn)競爭成本對科研人員的數(shù)據(jù)共享意愿有著非常明顯的負(fù)面影響。[32]另一項(xiàng)針對3,000余名科研人員的調(diào)查研究結(jié)果顯示,出于競爭的考慮,有25%的科研人員希望在項(xiàng)目結(jié)束后再共享科研數(shù)據(jù),甚至有5%的科研人員希望在退休后再共享科研數(shù)據(jù)。[11]在數(shù)據(jù)成本方面,Carlson等的研究認(rèn)為,對數(shù)據(jù)被錯誤解讀和濫用的擔(dān)心將對科研人員數(shù)據(jù)共享意愿造成負(fù)面影響。[32]Neela等的研究進(jìn)一步支持了這一觀點(diǎn):有53%的人擔(dān)心在數(shù)據(jù)共享的過程中失去對科研數(shù)據(jù)的控制權(quán),另有31%的人擔(dān)心自己的科研數(shù)據(jù)被不當(dāng)使用從而得出錯誤結(jié)論。[11]
技術(shù)支撐可以提升科研人員的數(shù)據(jù)共享效率和效果,甚至影響科研人員的數(shù)據(jù)共享意愿,主要包括數(shù)據(jù)倉儲的可獲得性、既定標(biāo)準(zhǔn)以及技術(shù)支援等。Ostaszewski向超過24,000名波蘭學(xué)者發(fā)放問卷,對回收的849份有效問卷進(jìn)行分析發(fā)現(xiàn),有21%的科研人員認(rèn)為缺乏合理的存儲庫將抑制其數(shù)據(jù)共享意愿,另有20%的科研人員認(rèn)為缺少既定的操作標(biāo)準(zhǔn)是其不愿共享科研數(shù)據(jù)的主要原因。[33]通過對22名來自不同學(xué)科的科研人員的調(diào)查發(fā)現(xiàn),好的基礎(chǔ)設(shè)施將提升科研人員的數(shù)據(jù)共享意愿。[20]Youngseek等采用隨機(jī)方式從全球知名的CoS學(xué)者數(shù)據(jù)庫抽樣,對美國的科研人員進(jìn)行調(diào)查,最終收回有效問卷1,298份,對問卷進(jìn)行統(tǒng)計分析發(fā)現(xiàn),數(shù)據(jù)存儲設(shè)施的完備性和可達(dá)性將影響科研人員的數(shù)據(jù)共享意愿。[34]不過,Kim等卻就此提出不同觀點(diǎn),其于Communityof Science數(shù)據(jù)庫中隨機(jī)選取社科研究人員2,285名,回收有效問卷361份,分析發(fā)現(xiàn),數(shù)據(jù)倉儲的可達(dá)性并不會影響科研人員的數(shù)據(jù)共享意愿。[29]同年,其針對理工科1,317名科研人員的調(diào)查研究進(jìn)一步證實(shí)了這一觀點(diǎn)。[28]
科研人員會出于對數(shù)據(jù)質(zhì)量的擔(dān)憂而拒絕共享科研數(shù)據(jù)。圍繞這一問題,Wicherts等開展了深入研究。[35]首先,向49篇心理學(xué)論文的作者請求獲取科研數(shù)據(jù),結(jié)果僅有21名作者愿意共享數(shù)據(jù)。接著,提取上述49篇文章中包含的關(guān)鍵數(shù)據(jù)和檢驗(yàn)值共1,148項(xiàng),綜合采用逆推、計算機(jī)自動算法、人工等方式對1,148項(xiàng)數(shù)值進(jìn)行再分析。為檢驗(yàn)計算方法的準(zhǔn)確率,研究還招募了5名研究生對495項(xiàng)數(shù)據(jù)進(jìn)行獨(dú)立計算,并將研究所采用的計算方法得出的計算結(jié)果與之對比,結(jié)果顯示研究所采用的計算方法非常可靠,準(zhǔn)確率達(dá)到99.4%。對數(shù)值的再分析發(fā)現(xiàn),1,148項(xiàng)數(shù)值中共有49項(xiàng)與原文結(jié)果不相符,其中的47項(xiàng)實(shí)際p值要大于原文提供的p值。而在上述49項(xiàng)錯誤中,有36項(xiàng)來自于不愿意提供原始數(shù)據(jù)的文章,占到總數(shù)量的73.5%。由此證明,科研人員對數(shù)據(jù)質(zhì)量或者說是數(shù)據(jù)與結(jié)果吻合程度的擔(dān)心會導(dǎo)致其不愿意共享科研數(shù)據(jù)。
事實(shí)上,在科研成果的發(fā)表過程中,具有統(tǒng)計學(xué)上顯著性意義的文章確實(shí)比較容易被接受和發(fā)表,因而會存在部分科研人員對原始數(shù)據(jù)進(jìn)行修改以獲得陽性結(jié)果的情況。[36]而在這種情況下,出于對數(shù)據(jù)集質(zhì)量以及科研結(jié)果被推翻的擔(dān)憂,科研人員很可能會選擇拒絕數(shù)據(jù)共享請求。即使沒有對原始數(shù)據(jù)進(jìn)行修改,仍會有部分科研人員出于對數(shù)據(jù)源權(quán)威性、數(shù)據(jù)獲取方法科學(xué)性等不自信而拒絕共享科研數(shù)據(jù),不過這種情況多見于年輕科研人員。[20]
總體來看,當(dāng)前對科研人員數(shù)據(jù)共享意愿方面的研究已經(jīng)取得了初步的成果,研究問題和內(nèi)容涵蓋了科研人員數(shù)據(jù)共享意愿研究的主要方面,初步揭示了科研人員數(shù)據(jù)共享意愿的特點(diǎn)與規(guī)律,并對數(shù)據(jù)共享意愿的主要影響因素進(jìn)行了探討與分析。但是仍然存在一系列的問題。首先,從研究數(shù)量上看,盡管科研數(shù)據(jù)共享已經(jīng)成為科學(xué)界的主要議題,相關(guān)研究數(shù)量正高速增長,但是有關(guān)科研人員數(shù)據(jù)共享意愿的研究數(shù)量卻仍然較少,上文中部分影響因素的支持性研究甚至是孤證,研究結(jié)論缺乏代表性和說服力。其次,從研究方法來看,當(dāng)前絕大多數(shù)研究都采用了問卷調(diào)研方法,研究方法單一。事實(shí)上,問卷調(diào)研確實(shí)是獲取研究對象態(tài)度和意愿數(shù)據(jù)的最直接有效的方式,但是有研究證明,研究對象在自陳式問卷中的回答往往更為積極和正向,而在實(shí)際行為和表現(xiàn)中則更為消極。[37]因而單純的調(diào)查問卷方式并不能完全、準(zhǔn)確地反映出科研人員數(shù)據(jù)共享的真實(shí)意愿。最后,從研究結(jié)論看,部分結(jié)論之間互相矛盾。如,Eynden等人認(rèn)為年齡與數(shù)據(jù)共享意愿正相關(guān),而Howard則認(rèn)為二者之間存在負(fù)相關(guān)關(guān)系,類似的情況在外部政策、共享成本、支撐技術(shù)等部分也有出現(xiàn)。
綜上所述,本文認(rèn)為未來的科研人員數(shù)據(jù)共享意愿研究可以從以下幾個方向入手。第一,繼續(xù)深入對當(dāng)前研究問題與內(nèi)容的探討,提升相關(guān)問題支持性研究的數(shù)量與質(zhì)量,擴(kuò)大影響因素研究的范圍,探索經(jīng)濟(jì)成本、形象和聲譽(yù)預(yù)期等因素對科研人員數(shù)據(jù)共享意愿的影響。事實(shí)上,曾有研究認(rèn)為除上述影響因素外,科研人員的數(shù)據(jù)共享意愿還受到經(jīng)濟(jì)成本、利他因素、形象和聲譽(yù)期望等因素的影響,[1,38]但卻并未對其進(jìn)行深入研究與論述。因而,下一步可以考慮將上述因素納入到研究范疇中來,進(jìn)一步充實(shí)研究問題與內(nèi)容。第二,豐富現(xiàn)有的研究方法體系,不僅要采用問卷調(diào)研、訪談等顯性研究方式,還要結(jié)合文獻(xiàn)計量、觀察等隱形研究方法,為全面、真實(shí)地揭示科研人員數(shù)據(jù)共享意愿提供有力支撐。第三,采用定量的文獻(xiàn)分析方法對當(dāng)前研究結(jié)果進(jìn)行系統(tǒng)、綜合地再分析,以解決不同研究結(jié)果相悖的問題??梢钥紤]引入薈萃分析(Meta-analysis,又稱為Meta分析、元分析)對上述研究成果進(jìn)行定量整合,通過計算納入文獻(xiàn)的合并效應(yīng)值,從整體上明確不同影響因素對科研人員數(shù)據(jù)共享意愿的作用。