聶華
摘要 以O(shè)penAIRE-COAR2014 年會(huì)的基本情況為背景,介紹全球范圍內(nèi)開(kāi)放獲取運(yùn)動(dòng)的最新發(fā)展,包括開(kāi)放獲取生態(tài)系統(tǒng)涉及到的聯(lián)盟、機(jī)構(gòu)、其他參與方及其項(xiàng)目的進(jìn)展,開(kāi)放獲取涉及的多元化和多樣性的主題和內(nèi)容。同時(shí),思考全球尤其是歐洲的開(kāi)放獲取運(yùn)動(dòng)的進(jìn)展和路徑為中國(guó)開(kāi)放獲取運(yùn)動(dòng)的發(fā)展所帶來(lái)的影響、促進(jìn)以及啟示。
關(guān)鍵詞 開(kāi)放獲取 開(kāi)放知識(shí)庫(kù) 研究數(shù)據(jù) 文本與數(shù)據(jù)挖掘
歐洲開(kāi)放獲取基礎(chǔ)設(shè)施研究項(xiàng)目(Open AccessInfrastructure Research for Europe,簡(jiǎn)稱(chēng)OpenAIRE)和國(guó)際開(kāi)放知識(shí)庫(kù)聯(lián)盟(Confederation of Open AccessRepositories,簡(jiǎn)稱(chēng)COAR)于2014年5月21日-22日在位于希臘雅典的著名的衛(wèi)城博物館聯(lián)合舉辦2014年年會(huì)。本屆年會(huì)共有來(lái)自世界各國(guó)的170多名代表參加,同時(shí)還有90多位代表通過(guò)網(wǎng)絡(luò)直播觀摩會(huì)議。參會(huì)者廣泛代表了開(kāi)放獲取的不同參與方,包括來(lái)自各類(lèi)相關(guān)聯(lián)盟和機(jī)構(gòu)的負(fù)責(zé)人、數(shù)據(jù)和技術(shù)專(zhuān)家、歐盟盟國(guó)代表、歐盟委員會(huì)官員,圖書(shū)館館員、出版商、新型出版組織和先導(dǎo)項(xiàng)目、知識(shí)庫(kù)管理者以及其他開(kāi)放獲取運(yùn)動(dòng)的倡導(dǎo)者、擁護(hù)者和踐行者。年會(huì)廣泛探討了開(kāi)放獲取生態(tài)系統(tǒng)所覆蓋的多樣化的主題,包括開(kāi)放獲取系統(tǒng)的構(gòu)建與整合、開(kāi)放獲取的影響和成果、大數(shù)據(jù)和文本與數(shù)據(jù)挖掘等。四個(gè)分主題為:聯(lián)合開(kāi)放知識(shí)庫(kù)網(wǎng)絡(luò)(Aligning Repository Networks)、研究數(shù)據(jù):機(jī)構(gòu)以及更廣泛的視角( Research Data in an Institutional Contextand Beyond)、通過(guò)文本與數(shù)據(jù)挖掘最大化對(duì)于開(kāi)放的科學(xué)研究成果的利用( Maximizing the Exploitation of Open Research Results through TDM)、開(kāi)放性的影響力以及如何評(píng)價(jià)科學(xué)研究( The Impactof Openness and How to Evaluate Research)。本次年會(huì)對(duì)于開(kāi)放獲取運(yùn)動(dòng)在全球范圍內(nèi)的發(fā)展進(jìn)行了全景掃描,積極參與開(kāi)放獲取運(yùn)動(dòng)的主要機(jī)構(gòu)、聯(lián)盟和專(zhuān)家學(xué)者介紹了開(kāi)放獲取生態(tài)系統(tǒng)值得關(guān)注的最新進(jìn)展,涉及了廣泛的多元化主題。本文在全面介紹會(huì)議內(nèi)容的同時(shí),思考全球、尤其是歐洲的開(kāi)放獲取運(yùn)動(dòng)發(fā)展前沿為中國(guó)開(kāi)放獲取運(yùn)動(dòng)的發(fā)展帶來(lái)的影響、促進(jìn)以及啟示。
1 OpenAIRF和COAR簡(jiǎn)介
一直以來(lái),歐盟委員會(huì)將開(kāi)放獲取視為提升歐洲核心競(jìng)爭(zhēng)力的關(guān)鍵舉措。本次年會(huì)的主辦方之一——OpenAIRE,是由歐盟第七框架計(jì)劃(Seventh Framework Programme,簡(jiǎn)稱(chēng)FP7)資助,于2009年12月立項(xiàng)的一個(gè)三年期項(xiàng)目。OpenAIRE在不到一年的時(shí)間內(nèi)得到歐盟范圍內(nèi)27個(gè)國(guó)家的38個(gè)合作方的積極響應(yīng)和參與,其目標(biāo)是促成對(duì)于科學(xué)研究的完整價(jià)值的全面的無(wú)邊界的開(kāi)放獲取。除了在政策和理念層面上倡導(dǎo)和促進(jìn)開(kāi)放獲取的發(fā)展之外,作為歐盟開(kāi)放獲取的基礎(chǔ)設(shè)施,OpenAIRE面向研究者、數(shù)據(jù)提供者、科研管理者和資助機(jī)構(gòu)提供系列基礎(chǔ)設(shè)施和服務(wù)。OpenAIRE廣泛選用低成本技術(shù)開(kāi)發(fā)并維護(hù)面向數(shù)據(jù)和論文的開(kāi)放獲取基礎(chǔ)設(shè)施,以此為基礎(chǔ)按照機(jī)構(gòu)或者學(xué)科/主題構(gòu)建知識(shí)庫(kù)(ZENODO),供研究者和數(shù)據(jù)提供者等存繳研究數(shù)據(jù)和研究論文。7天乘以24小時(shí)開(kāi)放的門(mén)戶(OpenAIRE Portal)提供研究成果記錄的開(kāi)放獲取,以及由研究成果到作者、數(shù)據(jù)、軟件、出版信息和資助信息等的可靠鏈接。同時(shí),OpenAIRE還通過(guò)32個(gè)國(guó)家級(jí)的開(kāi)放獲取工作臺(tái),整合包括圖書(shū)館和研究機(jī)構(gòu)在內(nèi)的各方面的資源,提供關(guān)于開(kāi)放獲取政策的制訂和協(xié)同、相關(guān)指南的共享和規(guī)范,以及一些確定目標(biāo)的活動(dòng)的組織和實(shí)施。截至2014年5月20日,OpenAIRE的包羅萬(wàn)象的泛化知識(shí)庫(kù)的統(tǒng)計(jì)數(shù)字是:840萬(wàn)件已發(fā)表成果(論文、圖書(shū)等),700萬(wàn)名作者,460多個(gè)數(shù)據(jù)提供者,歐盟和英國(guó)維康基金會(huì)(Wellcome Trust)等2個(gè)資助機(jī)構(gòu)的8萬(wàn)個(gè)研究項(xiàng)目的鏈接以及3萬(wàn)3千個(gè)注冊(cè)組織。OpenAIRE還開(kāi)發(fā)了多個(gè)增值服務(wù),用戶可以利用這些服務(wù)對(duì)知識(shí)庫(kù)的內(nèi)容進(jìn)行數(shù)據(jù)挖掘、統(tǒng)計(jì)和報(bào)告等。
成立于2009年,并在幾年之問(wèn)發(fā)展迅速的COAR是目前最為活躍的開(kāi)放獲取國(guó)際組織之一。COAR成立的初衷可追溯到2005-2009年歐盟委員會(huì)資助的歐盟DRIVE項(xiàng)目(Digital Repository Infrastructure Vision for Europe,歐洲數(shù)字知識(shí)庫(kù)基礎(chǔ)設(shè)施展望)。該項(xiàng)目發(fā)現(xiàn),為促進(jìn)全球知識(shí)庫(kù)共同體和世界各地的虛擬知識(shí)庫(kù)網(wǎng)絡(luò)的實(shí)現(xiàn),一個(gè)凝聚機(jī)構(gòu)和組織的國(guó)際知識(shí)庫(kù)共同體的組織模式是非常必要的,這一共識(shí)促成COAR于2009年9月正式成立,并在其后的幾年間發(fā)展為一個(gè)包括24個(gè)國(guó)家近100家組織和機(jī)構(gòu)參與的國(guó)際聯(lián)盟。它的核心任務(wù)是“通過(guò)一個(gè)開(kāi)放獲取數(shù)字知識(shí)庫(kù)的全球網(wǎng)絡(luò),擴(kuò)大研究成果的可見(jiàn)度,促進(jìn)研究成果的廣泛應(yīng)用。”此外,COAR的目標(biāo)是讓世界的每個(gè)公民能夠從公共資助的研究產(chǎn)出中獲取知識(shí),或者從中獲益。COAR的主要任務(wù)是:通過(guò)OA知識(shí)庫(kù)擴(kuò)大研究成果的可見(jiàn)度;作為知識(shí)庫(kù)及其網(wǎng)絡(luò)、國(guó)家和國(guó)際層面的基于電子基礎(chǔ)設(shè)施知識(shí)庫(kù)的展示途徑;確定和推廣知識(shí)庫(kù)的內(nèi)容繳存策略,并促進(jìn)與出版商的共識(shí);致力于知識(shí)庫(kù)標(biāo)準(zhǔn)化和互操作性的知識(shí)庫(kù)共同體開(kāi)展緊密合作;為知識(shí)庫(kù)管理者和從業(yè)人員提供專(zhuān)業(yè)咨詢(xún)及交流機(jī)會(huì)。目前COAR在中國(guó)有三個(gè)正式成員:中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心、北京大學(xué)圖書(shū)館和廈門(mén)大學(xué)圖書(shū)館。
2 聯(lián)合開(kāi)放知識(shí)庫(kù)網(wǎng)絡(luò)(Aligning Repository net-works)
作為開(kāi)放獲取的綠色途徑,開(kāi)放知識(shí)庫(kù)仍然是與會(huì)者的重點(diǎn)關(guān)注之一。會(huì)上的報(bào)告更多地集中在全球范圍內(nèi)機(jī)構(gòu)庫(kù)網(wǎng)絡(luò)發(fā)展的多樣化態(tài)勢(shì),以及相關(guān)機(jī)構(gòu)和組織如何通過(guò)一系列的努力和舉措對(duì)全球的機(jī)構(gòu)庫(kù)網(wǎng)絡(luò)進(jìn)行整合。endprint
有關(guān)背景可以追溯到2014年3月由COAR主辦的“聯(lián)合知識(shí)庫(kù)網(wǎng)絡(luò)”會(huì)議。題為“向一個(gè)無(wú)縫連接的全球科學(xué)研究基礎(chǔ)架構(gòu)推進(jìn)”的會(huì)議報(bào)告指出:科學(xué)研究正在不斷國(guó)際化,許多今天的世界所面臨的問(wèn)題,比如氣候變化、貧困、健康都具有全球化的屬性,因此必須通過(guò)科學(xué)研究人員的跨地區(qū)、跨學(xué)科的合作來(lái)共同面對(duì)和解決。在此背景下,科學(xué)研究的基礎(chǔ)架構(gòu)必須對(duì)這一需求有所應(yīng)對(duì)和順應(yīng)。開(kāi)放知識(shí)庫(kù)正在成為科學(xué)研究基礎(chǔ)架構(gòu)的關(guān)鍵組成部分。作為科學(xué)研究架構(gòu)系統(tǒng)中的重要的內(nèi)容表現(xiàn)層,開(kāi)放知識(shí)庫(kù)具有供研究人員和全世界獲取研究成果,供研究機(jī)構(gòu)管理其科研產(chǎn)出,供政府、資助機(jī)構(gòu)和組織獲得相關(guān)信息等重要功能。自開(kāi)放獲取運(yùn)動(dòng)啟動(dòng)以來(lái),世界很多地區(qū)和國(guó)家開(kāi)始開(kāi)放知識(shí)庫(kù)網(wǎng)絡(luò)的建設(shè)。這些網(wǎng)絡(luò)在特定的本地情景中基于不同的需求和政策而發(fā)展,因此處于不同的發(fā)展階段,具備不同的特征和特點(diǎn)。然而,開(kāi)放知識(shí)庫(kù)的真正價(jià)值在于它們之間的無(wú)縫連接以及在此基礎(chǔ)上對(duì)全球研究成果的統(tǒng)一獲取,也只有在此基礎(chǔ)上,才能夠進(jìn)行整合、數(shù)據(jù)挖掘,開(kāi)發(fā)新的工具和服務(wù),并產(chǎn)生新的知識(shí)。來(lái)自澳大利亞、加拿大、中國(guó)、歐洲、拉丁美洲和美國(guó)的代表在會(huì)議上確定了聯(lián)合開(kāi)放知識(shí)庫(kù)網(wǎng)絡(luò)在政策、技術(shù)和服務(wù)方面的具體舉措及其實(shí)施的優(yōu)先級(jí)。在政策(和法律)方面提出優(yōu)先的延遲期,強(qiáng)調(diào)對(duì)于研究成果的開(kāi)放獲取的任何延遲都在削弱和剝奪科研過(guò)程和創(chuàng)新,對(duì)于成果的立即開(kāi)放是最好實(shí)踐。如果必須設(shè)定延遲期,根據(jù)學(xué)科的差異,最多為6-12個(gè)月。在技術(shù)和語(yǔ)義互操作方面,倡議并推動(dòng)全球開(kāi)放知識(shí)庫(kù)應(yīng)用ORCID作為作者唯一識(shí)別號(hào),鼓勵(lì)使用永久標(biāo)識(shí)符,將表達(dá)重要概念的特定的詞表元素標(biāo)準(zhǔn)化,包括但不限于:延遲期、獲取和重用條件、資助方ID等,建立并采用具有共性的方法收集使用數(shù)據(jù)和影響因子,應(yīng)用有關(guān)在知識(shí)庫(kù)網(wǎng)絡(luò)之間和科研信息系統(tǒng)之間的數(shù)據(jù)交換的協(xié)議。在服務(wù)方面,共享研究數(shù)據(jù)管理以及成果與數(shù)據(jù)鏈接相關(guān)的創(chuàng)新實(shí)踐;促進(jìn)知識(shí)庫(kù)在研究評(píng)價(jià)系統(tǒng)發(fā)揮更為關(guān)鍵的作用;在全球范圍內(nèi)收集整理對(duì)于科學(xué)研究至關(guān)重要的開(kāi)放知識(shí)庫(kù)服務(wù)清單(例如:知識(shí)庫(kù)注冊(cè)、出版商政策注冊(cè)等),并討論如何為這些服務(wù)提供必要的支持。
繼FP7項(xiàng)目于2013年結(jié)束后,歐洲開(kāi)放獲取知識(shí)庫(kù)在歐盟Horizon 2020計(jì)劃[7]的框架下得到進(jìn)一步的繁榮和發(fā)展。相應(yīng)地,OpenAIRE 2020主要著力于三個(gè)方向的計(jì)劃:1)支持歐盟委員會(huì)的Horizon 2020科學(xué)出版開(kāi)放獲取和開(kāi)放數(shù)據(jù)實(shí)驗(yàn)計(jì)劃的愿景;2)開(kāi)發(fā)構(gòu)建一個(gè)泛歐洲研究信息管理系統(tǒng),目標(biāo)是跟蹤、監(jiān)控歐盟和其他國(guó)家資助項(xiàng)目的開(kāi)放獲取學(xué)術(shù)成果;3)創(chuàng)建一個(gè)國(guó)際開(kāi)放知識(shí)庫(kù)合作平臺(tái),真正支持全球化科學(xué)研究和學(xué)術(shù)交流,通過(guò)一系列的目標(biāo)明確的培訓(xùn)和實(shí)驗(yàn)性項(xiàng)目,進(jìn)一步加強(qiáng)由COAR啟動(dòng)的與澳大利亞、中國(guó)、歐洲、拉丁美洲和美國(guó)等國(guó)家和地區(qū)在開(kāi)放共享的很多共同領(lǐng)域的對(duì)話,包括政策、指南、使用統(tǒng)計(jì)、影響力、數(shù)據(jù)知識(shí)庫(kù)的連接和整合等。
美國(guó)也開(kāi)始努力構(gòu)建全國(guó)性的開(kāi)放知識(shí)庫(kù)網(wǎng)絡(luò)。SFIARE( Share Access Research Ecosystem)[9]是美國(guó)研究圖書(shū)館學(xué)會(huì)(Association of ResearchLibraries,ARL)聯(lián)合美國(guó)公立與授地大學(xué)聯(lián)盟(APUL, Association of Public and I,and-grand Universities)和美國(guó)大學(xué)聯(lián)盟(Association of American Universities,AAU)共同發(fā)起的全國(guó)高等教育領(lǐng)域開(kāi)放獲取先導(dǎo)項(xiàng)目,旨在建立強(qiáng)壯的研究成果知識(shí)庫(kù)生態(tài)系統(tǒng),從而影響和改善現(xiàn)存的研究環(huán)境,收集和發(fā)布研究成果并保障其可發(fā)現(xiàn)、可獲取、重用以及長(zhǎng)期保存。根據(jù)AAU的統(tǒng)計(jì)數(shù)字,2011年AAU聯(lián)盟成員高校獲得了總計(jì)235億美元的美國(guó)聯(lián)邦科研經(jīng)費(fèi),占全部經(jīng)費(fèi)的57.7%。而2007年到2011年,美國(guó)高校的學(xué)術(shù)成果發(fā)表總數(shù)為113萬(wàn)項(xiàng),占全國(guó)的67%、全球的19%。然而,對(duì)于如此龐大的公共科研經(jīng)費(fèi)的使用以及成果產(chǎn)出情況的跟蹤和報(bào)告非常匱乏,并無(wú)統(tǒng)一的、結(jié)構(gòu)化的方法和途徑對(duì)研究成果進(jìn)行及時(shí)有效和整合后的發(fā)布。
在此背景下,SHARE項(xiàng)目計(jì)劃的第一步是構(gòu)建一個(gè)供研究機(jī)構(gòu)準(zhǔn)確及時(shí)地跟蹤和報(bào)告研究成果的通知系統(tǒng)(notification system),以此為基礎(chǔ)層,依次建立注冊(cè)層( Registry layer).發(fā)現(xiàn)層(discoverylayer)和內(nèi)容集合層(Content Aggregation Layer),向研究人員、機(jī)構(gòu)、資助方、公眾和業(yè)界提供相應(yīng)的服務(wù)。
SHARE近期發(fā)布了最新的技術(shù)和其他方面的進(jìn)展和計(jì)劃。2014年6月,SFIARE的開(kāi)放科學(xué)中心(Center of Open Science,COS)團(tuán)隊(duì)發(fā)布系統(tǒng)的開(kāi)發(fā)工作取得的進(jìn)展包括:開(kāi)始對(duì)開(kāi)放內(nèi)容來(lái)源的內(nèi)容、API、收割方法等進(jìn)行評(píng)估,這些來(lái)源包括ClinicalTrials. gov、美國(guó)能源部(DOE)、SciTech、ImpactStory、CrossRef、國(guó)家醫(yī)學(xué)圖書(shū)館PubMed Central、公共科學(xué)圖書(shū)館(PLOS)等。除了這些初始的內(nèi)容來(lái)源外,還開(kāi)發(fā)了一個(gè)用來(lái)管理不同來(lái)源的內(nèi)容的scraping integration API(整合API)。7月份,開(kāi)發(fā)團(tuán)隊(duì)開(kāi)始通過(guò)OAI-PMH元數(shù)據(jù)收割協(xié)議處理來(lái)自PLOS、Altmetric、CrossRef、arXiv和其他機(jī)構(gòu)知識(shí)庫(kù)的內(nèi)容。目前,所有工作及其成果已經(jīng)在SHARE知識(shí)庫(kù)的GitHub上開(kāi)放共享。SHARE的長(zhǎng)遠(yuǎn)目標(biāo)是建立健壯的知識(shí)庫(kù)生態(tài)系統(tǒng),以此為平臺(tái)及時(shí)、規(guī)范、全面地向所有相關(guān)方提供科學(xué)研究信息。通知系統(tǒng)可以被看作全面收集研究項(xiàng)目和活動(dòng)相關(guān)原始數(shù)據(jù)的“書(shū)目”,而注冊(cè)系統(tǒng)(Registry System)將進(jìn)一步清洗由通知系統(tǒng)收集的原始數(shù)據(jù)并進(jìn)行明確歸類(lèi),比如,與具體的研究項(xiàng)目連接的預(yù)印本、正式發(fā)表論文、數(shù)據(jù)集等。注冊(cè)系統(tǒng)將提供面向公眾開(kāi)放的檢索API,允許其他系統(tǒng)調(diào)用,目的是向科學(xué)家、研發(fā)公司以及其他興趣方提供一個(gè)可以長(zhǎng)期有效地發(fā)現(xiàn)、獲取和復(fù)用研究成果的平臺(tái)。endprint
拉丁美洲國(guó)家因其在開(kāi)放獲取政策和立法方面的突破而受到矚目,同時(shí),通過(guò)合作建設(shè)開(kāi)放知識(shí)庫(kù)網(wǎng)絡(luò)來(lái)支持有關(guān)的政策和法律法規(guī),從另一個(gè)方面促進(jìn)了拉丁美洲的科學(xué)研究水平的提升。La Refer encla知識(shí)庫(kù)網(wǎng)絡(luò)由阿根廷、巴西、哥倫比亞、智利、墨西哥、秘魯、委內(nèi)瑞拉等八個(gè)國(guó)家聯(lián)合發(fā)起,截至2014年3月,存繳內(nèi)容近60萬(wàn)條。項(xiàng)目最大的效果是有效地提升了拉丁美洲研究成果的可見(jiàn)度,并通過(guò)參與國(guó)際聯(lián)盟和國(guó)家間的合作,在開(kāi)放知識(shí)庫(kù)相關(guān)政策、技術(shù)和最佳實(shí)踐等方面得到交流和促進(jìn)。
國(guó)際機(jī)構(gòu)近年來(lái)對(duì)于開(kāi)放獲取的關(guān)注和參與在持續(xù)加強(qiáng)。世界銀行于2012年確定并推出研究成果和知識(shí)產(chǎn)品的新的開(kāi)放獲取政策,新政策延續(xù)了世界銀行近年來(lái)為加強(qiáng)信息公開(kāi),使其研究成果盡可能得到廣泛傳播利用所做的努力。作為政策的實(shí)際落實(shí),啟動(dòng)了世界銀行開(kāi)放知識(shí)庫(kù)(OpenKnowledge Repository,OKR)。對(duì)OKR中存繳的所有內(nèi)容采用“創(chuàng)作共享”CC授權(quán)許可。為促進(jìn)開(kāi)放獲取,世界銀行還開(kāi)發(fā)了一個(gè)能夠允許其他知識(shí)庫(kù)下載部分OKR內(nèi)容并保存到本地的系統(tǒng),這項(xiàng)服務(wù)使得網(wǎng)絡(luò)帶寬有限的發(fā)展中國(guó)家尤其受益,下載統(tǒng)計(jì)已經(jīng)可以看到這一效果。
隨著開(kāi)放學(xué)術(shù)的發(fā)展,研究者開(kāi)始在更為廣泛的情景中展望機(jī)構(gòu)知識(shí)庫(kù)的新作用。機(jī)構(gòu)知識(shí)庫(kù)的傳統(tǒng)作用包括作為開(kāi)放獲取綠色路徑,作為機(jī)構(gòu)科研產(chǎn)出以及教學(xué)資料的展示窗口和作為機(jī)構(gòu)科研成果管理機(jī)制組成部分等。隨著開(kāi)放學(xué)術(shù)的發(fā)展,機(jī)構(gòu)知識(shí)庫(kù)作為出版平臺(tái),提供各種推動(dòng)學(xué)術(shù)交流的增值服務(wù),以及作為科研管理系統(tǒng)的功能和作用將更為迫切和突出。機(jī)構(gòu)知識(shí)庫(kù)提供這些增值服務(wù)和履行新功能的基礎(chǔ)和前提是在收繳內(nèi)容方面著力加強(qiáng)。根據(jù)OpenDOAR統(tǒng)計(jì),在注冊(cè)的2129個(gè)機(jī)構(gòu)知識(shí)庫(kù)中,成果條數(shù)超過(guò)10萬(wàn)的只有74個(gè),成果條數(shù)超過(guò)1萬(wàn)條的只有570個(gè)。從地域方面看,巨大的南北差異造成當(dāng)前的學(xué)術(shù)出版體系的先天的不平等,而不平等的學(xué)術(shù)出版體系造成發(fā)展中國(guó)家的研究人員無(wú)論是發(fā)表機(jī)會(huì)還是獲取研究成果的機(jī)會(huì)都處于當(dāng)然的劣勢(shì)。因此,開(kāi)放機(jī)構(gòu)知識(shí)庫(kù)正在發(fā)揮的作用以及潛在的作用還在于促進(jìn)既有的學(xué)術(shù)出版體系向著更為平等和理想的方向演變。分布式的開(kāi)放獲取機(jī)構(gòu)庫(kù)網(wǎng)絡(luò)將是機(jī)構(gòu)庫(kù)發(fā)展和提供增值服務(wù)的必要的起點(diǎn),開(kāi)放機(jī)構(gòu)庫(kù)增值服務(wù)的一個(gè)很好的嘗試是利用機(jī)構(gòu)知識(shí)庫(kù)平臺(tái)進(jìn)行出版,這是機(jī)構(gòu)促進(jìn)一個(gè)更具有廣度的學(xué)術(shù)交流體系的合法化的可行的途徑,也是必要的努力。
3 研究數(shù)據(jù):機(jī)構(gòu)視角以及更廣泛的情景(Re-search data in an institutional context and beyond)
本屆年會(huì)對(duì)研究數(shù)據(jù)予以更為集中的關(guān)注和討論,并著重從機(jī)構(gòu)的情景和更為廣泛的視角探討研究數(shù)據(jù)管理的相關(guān)政策、工具和服務(wù),以及研究數(shù)據(jù)管理與科學(xué)研究流程及其管理在架構(gòu)層面的融合。愛(ài)丁堡大學(xué)是英國(guó)最早開(kāi)展研究數(shù)據(jù)管理的大學(xué)之一,早在2011年5月即發(fā)布了由大學(xué)評(píng)議會(huì)/大學(xué)管理處決議通過(guò)的“研究數(shù)據(jù)管理政策”。負(fù)責(zé)知識(shí)管理的副校長(zhǎng)、CIO和圖書(shū)館館長(zhǎng)杰夫海伍德在報(bào)告中介紹愛(ài)丁堡大學(xué)研究數(shù)據(jù)管理的路線圖和系列服務(wù),探討研究數(shù)據(jù)管理相關(guān)政策的制定及其在機(jī)構(gòu)中落實(shí)的各種保障條件。所謂研究數(shù)據(jù),指在研究過(guò)程中產(chǎn)生的任何數(shù)據(jù)和全部數(shù)據(jù)。世界經(jīng)合組織將數(shù)據(jù)描述為“公共財(cái)”,因此應(yīng)該開(kāi)放。英國(guó)研究理事會(huì)早在2009年即提出研究項(xiàng)目應(yīng)該保證其數(shù)據(jù)至少在10年內(nèi)能夠妥善保存和有效獲取。資助機(jī)構(gòu)的數(shù)據(jù)政策不斷地對(duì)研究機(jī)構(gòu)的與研究數(shù)據(jù)管理相關(guān)的承諾和條款提出要求。2012-2013學(xué)年,愛(ài)丁堡大學(xué)提交研究申請(qǐng)2222項(xiàng),其中934個(gè)項(xiàng)目獲得了總計(jì)3.01億英鎊的研究經(jīng)費(fèi)。大部分項(xiàng)目是校內(nèi)、校際、甚至國(guó)際性的合作項(xiàng)目。無(wú)論從研究者、研究團(tuán)隊(duì)、大學(xué)還是資助機(jī)構(gòu)的角度,亟需通過(guò)易用和宜用的工具對(duì)項(xiàng)目申請(qǐng)過(guò)程以及研究數(shù)據(jù)進(jìn)行跟蹤和管理。愛(ài)丁堡大學(xué)RDM的目標(biāo)是尋求包括研究人員、研究團(tuán)隊(duì)、大學(xué)等參與方的共贏。信息服務(wù)研究數(shù)據(jù)管理實(shí)施委員會(huì)于2014年1月重新審核并發(fā)布了研究數(shù)據(jù)管理路線圖(version l.2),主要包括三大板塊:RDM支持性工作(理念倡導(dǎo)宣傳,培訓(xùn)和咨詢(xún)等);RDM系列服務(wù):數(shù)據(jù)管理計(jì)劃;實(shí)時(shí)數(shù)據(jù)管理和服務(wù)架構(gòu),包括實(shí)時(shí)工作文檔和數(shù)據(jù)存儲(chǔ)服務(wù)、數(shù)據(jù)出版/發(fā)表倉(cāng)儲(chǔ)服務(wù)、數(shù)據(jù)長(zhǎng)期存儲(chǔ)服務(wù)和數(shù)據(jù)集注冊(cè)服務(wù)等。
加拿大阿爾伯塔大學(xué)也是研究數(shù)據(jù)管理的早期踐行者之一。數(shù)據(jù)管理館員查爾斯·漢弗萊(Charles FIumphrey)主要介紹研究數(shù)據(jù)長(zhǎng)尾效應(yīng)和研究數(shù)據(jù)的多樣化和多元化為研究數(shù)據(jù)管理所帶來(lái)的挑戰(zhàn)。研究數(shù)據(jù)管理架構(gòu)是在本地或者全球范圍聯(lián)合技術(shù)、服務(wù)和專(zhuān)家來(lái)支持科學(xué)研究全過(guò)程。因此,研究數(shù)據(jù)管理工作迫切需要多個(gè)參與方進(jìn)行有效合作。其中,圖書(shū)館員對(duì)于科研項(xiàng)目流程中數(shù)據(jù)管理的全程參與的重要性在于保證研究人員能夠采用好的數(shù)據(jù)管理方法進(jìn)行數(shù)據(jù)的收集和生產(chǎn)。加拿大已經(jīng)開(kāi)始建立全國(guó)性機(jī)構(gòu)支持研究數(shù)據(jù)管理架構(gòu)的建立和運(yùn)作,圖書(shū)館在該架構(gòu)的建設(shè)初始階段即已參與其中。
開(kāi)放獲取期刊FlOOOR的瓦薩·霍迪亞(Var sha Khodiyar)描述出版過(guò)程的數(shù)據(jù)流,如何通過(guò)建立發(fā)表成果與底層基礎(chǔ)數(shù)據(jù)的鏈接,捕捉研究數(shù)據(jù)長(zhǎng)尾。其中一個(gè)重要條件是研究者和作者在準(zhǔn)備和提交數(shù)據(jù)過(guò)程中的配合與支持。FlOOOR以開(kāi)放獲取形式出版生命科學(xué)領(lǐng)域的各種類(lèi)型的重要的研究成果,其主要特點(diǎn)包括:出版周期為一周,透明的出版后同行評(píng)議,出版成果包含論文的全部數(shù)據(jù),接受非傳統(tǒng)的論文類(lèi)型,包括純數(shù)據(jù)論文,所有發(fā)表的論文必須完全無(wú)條件開(kāi)放獲取等。透明和開(kāi)放是科學(xué)研究的基石,“不允許數(shù)據(jù)重用是科學(xué)的弊端”。研究表明,科學(xué)數(shù)據(jù)不可獲取是科學(xué)研究成果無(wú)法復(fù)制的主要原因。還有研究表明,數(shù)據(jù)的開(kāi)放、共享和重用與論文的高引用率呈正相關(guān)。
會(huì)議邀請(qǐng)希恩·黑爾(Sean Hill)介紹被歐盟選定為未來(lái)新興技術(shù)旗艦項(xiàng)目之一的“人腦項(xiàng)目”(Human Brain Project)。這一項(xiàng)目凝聚了來(lái)自歐盟、美國(guó)、日本和中國(guó)等24個(gè)國(guó)家、126個(gè)機(jī)構(gòu)的近300名神經(jīng)科學(xué)、醫(yī)學(xué)和計(jì)算機(jī)領(lǐng)域的專(zhuān)家,在10年的項(xiàng)目執(zhí)行期間將耗資10億歐元,力圖整合跨學(xué)科的知識(shí)和研究力量,為基于信息通訊技術(shù)的新型腦研究模式奠定技術(shù)基礎(chǔ),并極大地加速腦科學(xué)研究成果的轉(zhuǎn)化,目標(biāo)是切實(shí)提高衛(wèi)生服務(wù),改善公民健康狀況,提升歐洲的產(chǎn)業(yè)競(jìng)爭(zhēng)地位。根據(jù)計(jì)劃,研究人員需將人類(lèi)大腦切成8000片,利用高性能掃描儀進(jìn)行數(shù)字化處理,繪制人腦詳圖;同時(shí)利用超級(jí)計(jì)算機(jī)描繪和模擬大腦所需的海量數(shù)據(jù),最后將成千上萬(wàn)的神經(jīng)元模型組裝為一個(gè)可正常運(yùn)轉(zhuǎn)的、完整的人類(lèi)大腦模型。該項(xiàng)目是數(shù)據(jù)驅(qū)動(dòng)的跨學(xué)科研究的典型案例,研究者采用醫(yī)學(xué)信息學(xué)方法,利用來(lái)自醫(yī)療機(jī)構(gòu)的檔案和其他數(shù)據(jù)庫(kù)的醫(yī)療大數(shù)據(jù)開(kāi)發(fā)數(shù)據(jù)驅(qū)動(dòng)的疾病生物學(xué)簽名(biological signatures),從而發(fā)現(xiàn)解釋疾病原因的新途徑并確定有效的治療新方法。endprint
全球化合作是新型研究模式的關(guān)鍵基礎(chǔ),而有效跟蹤數(shù)據(jù)起源并建立數(shù)據(jù)流,最終整合所有現(xiàn)存的數(shù)據(jù)架構(gòu)是合作的目標(biāo),人腦項(xiàng)目作為全球化合作項(xiàng)目,對(duì)于由機(jī)構(gòu)的研究數(shù)據(jù)集合而成的大數(shù)據(jù)的強(qiáng)調(diào)是這一規(guī)模巨大的全球化合作項(xiàng)目的最為重要的價(jià)值所在。
4 文本與數(shù)據(jù)挖掘最大化對(duì)于開(kāi)放的科學(xué)研究成果的利用( Maximizing the exploitation of open re-search results through TDM)
越來(lái)越多的研究人員開(kāi)始將視線轉(zhuǎn)向大規(guī)模文本和數(shù)據(jù)挖掘。本次年會(huì)的TDM主題引起與會(huì)者的強(qiáng)烈興趣和關(guān)注。文本與數(shù)據(jù)挖掘是從不斷產(chǎn)生和存儲(chǔ)的數(shù)字化數(shù)據(jù),或者說(shuō)大數(shù)據(jù)中,通過(guò)分析和抽取而獲得新的洞察和知識(shí)的重要技術(shù)。作為一個(gè)新興的研究和技術(shù)領(lǐng)域,一方面需要了解其為現(xiàn)有的法律框架帶來(lái)的問(wèn)題和挑戰(zhàn),另一萬(wàn)面需要把握現(xiàn)有的法律框架對(duì)于該新興研究和技術(shù)的促進(jìn)與制約,同時(shí)經(jīng)濟(jì)方面的因素也需要被包含在考量的范疇之內(nèi)。這也是本屆年會(huì)上與會(huì)者對(duì)于歐洲在TDM方面的一些新的限制和一些新的期待強(qiáng)烈關(guān)注的原因。當(dāng)前,仍然存在著很多法律和其他方面的障礙,限制研究人員對(duì)于大規(guī)模的數(shù)字內(nèi)容(大數(shù)據(jù))進(jìn)行有效挖掘。
美國(guó)公共科學(xué)圖書(shū)館(Public Library of Sci ence)的宣傳推廣主管卡梅倫·尼倫(Cameron Ney lon)在報(bào)告中強(qiáng)調(diào),TDM的關(guān)鍵作用在于將作者的成果“有效地”傳遞給那些真正需要并能夠使用它的人,TDM是新型出版模式的核心,也是任何開(kāi)放學(xué)術(shù)出版商以及網(wǎng)絡(luò)服務(wù)應(yīng)該向用戶提供的關(guān)鍵服務(wù)。它將是一個(gè)商業(yè)差異化的顯著標(biāo)志,或者說(shuō)是一個(gè)新的增長(zhǎng)點(diǎn)。
英國(guó)曼徹斯特大學(xué)計(jì)算機(jī)學(xué)院文本挖掘國(guó)家研究中心的Sophia Ananiadou介紹Argo,一個(gè)允許互操作和客制化的文本挖掘與分析工作平臺(tái)。并以Argo的應(yīng)用案例為樣本,探討研究機(jī)構(gòu)和研究社區(qū)如何向研究人員提供更好的TDM服務(wù)。TDM涉及到語(yǔ)言、技術(shù)、學(xué)科、文本類(lèi)型等多個(gè)方面的多樣性和復(fù)雜性,面臨眾多的技術(shù)和非技術(shù)方面的挑戰(zhàn)。因此,TDM架構(gòu)尤其強(qiáng)調(diào)模塊化、互操作性(通用的數(shù)據(jù)表現(xiàn)和數(shù)據(jù)類(lèi)型)以及通用性(跨語(yǔ)言、跨學(xué)科、跨文本類(lèi)型等)方面的要求。一個(gè)通用的、易用的工作平臺(tái)可以為研究人員進(jìn)行與TDM相關(guān)的工作和項(xiàng)目提供直接有效的平臺(tái)、流程、技術(shù)和社區(qū)交流等各方面的支持。
5 開(kāi)放性的影響力及我們?nèi)绾卧u(píng)價(jià)科學(xué)研究(The Impact of Openness and how to evaluate research)
開(kāi)放性的影響力分主題聚集了數(shù)個(gè)有關(guān)科學(xué)研究評(píng)價(jià)的新方法和新趨勢(shì)的討論和報(bào)告。ACU MEN Project的報(bào)告提出評(píng)價(jià)研究人員學(xué)術(shù)影響力的新方法,討論現(xiàn)有的學(xué)術(shù)評(píng)價(jià)系統(tǒng)的缺陷和問(wèn)題,以及評(píng)價(jià)指標(biāo)與科學(xué)的功能之間的亟需跨越和彌補(bǔ)的鴻溝。Mendeley的報(bào)告討論研究成果記錄的個(gè)性化,強(qiáng)調(diào)機(jī)構(gòu)知識(shí)庫(kù)尚未嵌入到研究人員的日常工作流程中,這是機(jī)構(gòu)知識(shí)庫(kù)亟待提升的功能。Atomium Culture的報(bào)告[28]討論如何通過(guò)新型媒體和傳統(tǒng)媒體的合作提高科學(xué)研究影響力。
其中作為新型的開(kāi)放出版模式的報(bào)告令人關(guān)注。互聯(lián)網(wǎng)已經(jīng)改變了學(xué)術(shù)出版范式。以雜志為單元的作為產(chǎn)品的出版分解為以論文為單元的作為服務(wù)的出版。成立于2007年的Frontier剛剛出版了第20000篇開(kāi)放論文,至今Frontier已經(jīng)成為全球五個(gè)最大的開(kāi)放獲取平臺(tái)之一。它的定位是面向科研社區(qū)、由科學(xué)家為科學(xué)家出版的網(wǎng)絡(luò)出版平臺(tái),通過(guò)交互的在線平臺(tái)提供實(shí)時(shí)的嚴(yán)格、公平、透明、快速的同行評(píng)議,以及詳細(xì)的論文影響力評(píng)價(jià)。平均發(fā)表周期為84天,由全球的4500個(gè)相關(guān)領(lǐng)域的知名科學(xué)家和研究者擔(dān)任編輯。自2008年以來(lái),所有的Frontier期刊的評(píng)價(jià)指標(biāo)都高于平均值。
LIBRE是一個(gè)免費(fèi)的開(kāi)放同行評(píng)議平臺(tái),由來(lái)自17個(gè)國(guó)家的108位研究者和學(xué)者志愿開(kāi)發(fā)、維護(hù)和運(yùn)行,他們的共同理念是開(kāi)放性和透明性是學(xué)術(shù)評(píng)價(jià)和學(xué)術(shù)交流新紀(jì)元的標(biāo)志。因此,開(kāi)放的同行評(píng)議應(yīng)該成為開(kāi)放出版范式中的一個(gè)必要的組成。研究者可以在LIBRE的開(kāi)放平臺(tái)上自行提交論文,邀請(qǐng)專(zhuān)家根據(jù)提供的可以選擇的質(zhì)量和可見(jiàn)度相關(guān)的評(píng)價(jià)指標(biāo)進(jìn)行開(kāi)放評(píng)議,對(duì)論文、作者和評(píng)議者進(jìn)行評(píng)級(jí)。LIBRE的目標(biāo)簡(jiǎn)單而言是“謀求科學(xué)研究的解放”。
本次年會(huì)以主題為“五年后的學(xué)術(shù)交流:如何聯(lián)合起來(lái)一起向前?哪些問(wèn)題最為優(yōu)先?”的開(kāi)放討論作為會(huì)議總結(jié)。來(lái)自COAR、SPARC、OECD、HAL以及歐盟等國(guó)際組織、機(jī)構(gòu)和聯(lián)盟的代表對(duì)開(kāi)放獲取的發(fā)展走向以及學(xué)術(shù)交流范式變遷提出看法,或者作出預(yù)測(cè)。①探討在開(kāi)放獲取驅(qū)動(dòng)下的學(xué)術(shù)交流的情景中,大學(xué)、科研機(jī)構(gòu)以及圖書(shū)館將發(fā)揮新的作用,扮演新的角色。大學(xué)應(yīng)該擔(dān)負(fù)起對(duì)于科學(xué)研究成果的全面責(zé)任。國(guó)際性的合作有助于提升圖書(shū)館館員在支持e-Research和學(xué)術(shù)交流方面的競(jìng)爭(zhēng)力,包括提供支持學(xué)術(shù)交流的新的服務(wù)的組織模式等。②學(xué)術(shù)交流范式正在持續(xù)演變,但尚未達(dá)到快速演變、或者說(shuō)巨變的階段。而新的技術(shù)已經(jīng)給學(xué)術(shù)交流范式的演變帶來(lái)巨大的驅(qū)動(dòng)和壓力。我們可以將學(xué)術(shù)交流流程看作一系列的建筑模塊,參與到學(xué)術(shù)交流過(guò)程中的各方可以從各自的角度努力并聯(lián)手推進(jìn)學(xué)術(shù)交流的革命。③開(kāi)放獲取和開(kāi)放科學(xué)已經(jīng)為技術(shù)創(chuàng)新、商業(yè)發(fā)展以及整個(gè)社會(huì)帶來(lái)巨大的影響,并將持續(xù)發(fā)揮其顛覆性的作用。④對(duì)于開(kāi)放內(nèi)容的數(shù)據(jù)的共享和重用的需求持續(xù)增長(zhǎng),包括商業(yè)需求和非商業(yè)需求,這種需求帶來(lái)創(chuàng)新的可能,并為我們所面臨的社會(huì)挑戰(zhàn)帶來(lái)應(yīng)對(duì)的契機(jī)。
6 結(jié)語(yǔ):?jiǎn)⑹九c思考
本屆OpenAIRE-COAR年會(huì)的交流廣泛而深入,參與方分布廣泛,互動(dòng)式的討論更多地專(zhuān)注于開(kāi)放獲取的實(shí)際操作層面。而世界范圍內(nèi)開(kāi)放獲取的發(fā)展和學(xué)術(shù)交流的演變也為我們帶來(lái)深刻的有益的啟示。
(1) 合作共贏:成立開(kāi)放獲取聯(lián)盟的重要性和必要性??梢杂^察到,在經(jīng)濟(jì)全球化、全球信息化的時(shí)代,全球范圍的合作是必然的發(fā)展趨勢(shì)。中國(guó)的高校和科研機(jī)構(gòu)亟待聯(lián)合起來(lái),成立聯(lián)盟,如“中國(guó)高校開(kāi)放獲取聯(lián)盟”,共同發(fā)起全國(guó)性的開(kāi)放獲取先導(dǎo)項(xiàng)目,凝聚力量,搭建平臺(tái),促進(jìn)交流共享,并通過(guò)實(shí)際操作層面的具體實(shí)施,如構(gòu)建聯(lián)合的開(kāi)放知識(shí)庫(kù)網(wǎng)絡(luò)等,并通過(guò)全國(guó)性知識(shí)庫(kù)的構(gòu)建和開(kāi)放,無(wú)縫連接和整合,最終實(shí)現(xiàn)知識(shí)庫(kù)的真正價(jià)值,即支持科學(xué)研究和學(xué)術(shù)交流。
(2) 洞悉轉(zhuǎn)型:圖書(shū)館的角色和職責(zé)的重新定位。在科學(xué)研究走向開(kāi)放與合作,學(xué)術(shù)交流范式持續(xù)演變的背景下,圖書(shū)館應(yīng)該大力提升其支持e-Research和學(xué)術(shù)交流方面的競(jìng)爭(zhēng)力,并為教學(xué)科研和學(xué)術(shù)交流提供新的服務(wù)和支撐模式,包括機(jī)構(gòu)的開(kāi)放信息架構(gòu)(Open Information Infrastructure)的構(gòu)建、開(kāi)放出版、研究數(shù)據(jù)管理等。
(3) 增值服務(wù):機(jī)構(gòu)知識(shí)庫(kù)發(fā)展的新需求和新態(tài)勢(shì)。隨著學(xué)術(shù)交流的日益開(kāi)放,機(jī)構(gòu)知識(shí)庫(kù)在履行學(xué)術(shù)成果的存檔、展示和管理等傳統(tǒng)功能之外,亟待提供各種推動(dòng)學(xué)術(shù)交流和開(kāi)放的增值服務(wù),包括作為開(kāi)放出版平臺(tái)、開(kāi)放的學(xué)者門(mén)戶,以及作為科研信息管理系統(tǒng)的功能和作用。機(jī)構(gòu)知識(shí)庫(kù)提供這些增值服務(wù)和履行新功能的基礎(chǔ)和前提,一是對(duì)機(jī)構(gòu)學(xué)術(shù)成果的全面和準(zhǔn)確的收繳和整理,二是對(duì)教學(xué)科研流程以及科研管理的無(wú)縫嵌入和銜接。
(4) 研究數(shù)據(jù)管理的興起及其面臨的挑戰(zhàn):多樣化和多元化。在大數(shù)據(jù)背景下,數(shù)據(jù)驅(qū)動(dòng)的科學(xué)研究成為充滿潛力的新的知識(shí)來(lái)源。研究數(shù)據(jù)的產(chǎn)生和積累呈指數(shù)級(jí)增長(zhǎng),以及研究數(shù)據(jù)的多樣化和多元化為研究數(shù)據(jù)管理帶來(lái)的挑戰(zhàn),需要包括學(xué)者和研究人員、管理者、圖書(shū)館員以及技術(shù)人員通過(guò)合作共同面對(duì)。
李克強(qiáng)總理在2014年全球研究理事會(huì)的致辭中提到:“應(yīng)采取多種方式,促進(jìn)科學(xué)知識(shí)的廣泛傳播與共享,實(shí)現(xiàn)科學(xué)的最大價(jià)值,不斷增進(jìn)人類(lèi)福祉?!辈?qiáng)調(diào)“支持建立公共財(cái)政資助的科學(xué)知識(shí)開(kāi)放獲取機(jī)制,促進(jìn)中國(guó)和世界科學(xué)事業(yè)共同發(fā)展?!眹?guó)家自然科學(xué)基金委員會(huì)和中國(guó)科學(xué)院于2014年5月分別發(fā)布《關(guān)于受資助科研論文實(shí)行開(kāi)放獲取的政策聲明》和《關(guān)于公共資助科研項(xiàng)目發(fā)表的論文實(shí)行開(kāi)放獲取的政策聲明》,中國(guó)開(kāi)放獲取政策的發(fā)布引起廣泛關(guān)注,在OpenAIRECOAR年會(huì)期間的交流中,人們預(yù)測(cè)中國(guó)的開(kāi)放獲取進(jìn)程將會(huì)有更快的進(jìn)步和更大的突破,為世界所期待。endprint
大學(xué)圖書(shū)館學(xué)報(bào)2015年2期