□ 李穎 / 中國科學(xué)技術(shù)信息研究所 北京 100038
劉靜波 / 河北省圖書館 石家莊 050011
基于DOI RAs機(jī)制的科學(xué)數(shù)據(jù)管理與共享*
——“第一屆中日韓DOI項目合作討論會”概述
□ 李穎 / 中國科學(xué)技術(shù)信息研究所 北京 100038
劉靜波 / 河北省圖書館 石家莊 050011
第一屆中日韓DOI項目合作討論會于2013年5月30日在中國科學(xué)技術(shù)信息研究所成功舉辦,這也是第三屆中日韓科技信息機(jī)構(gòu)聯(lián)席會議的專題討論會。針對ISTIC、KISTI、JST三家的DOI RA職能,會議圍繞DOI RA在科學(xué)數(shù)據(jù)管理與共享方面的共識,三家機(jī)構(gòu)對各自的系統(tǒng)及其相關(guān)活動進(jìn)行了較為深入的討論。文章在概述本次會議的基礎(chǔ)上,重點介紹中日韓目前的系統(tǒng),即中文DOI、日本JaLC、韓國的P-CUBE,以及科學(xué)數(shù)據(jù)管理工作。最后,總結(jié)了三機(jī)構(gòu)未來實施合作的意向。
ISTIC,KISTI,JST,中文DOI,JaLC,P-CUBE,生物科學(xué),科學(xué)數(shù)據(jù)
第一屆中日韓DOI項目合作討論會議于2013年5月30日在北京舉辦,這也是第三屆中日韓科技信息機(jī)構(gòu)聯(lián)席會議的DOI專題討論會[1]。參與方為中國科學(xué)技術(shù)信息研究所(ISTIC)、韓國科技信息研究院(KISTI)、日本科學(xué)技術(shù)振興機(jī)構(gòu)(JST)。會議在ISTIC喬曉東總工(見圖1,第一排左數(shù)第5位)的指導(dǎo)下,三機(jī)構(gòu)代表在第一、二、三屆總會的基礎(chǔ)上[2-4],針對基于DOI RA機(jī)制的科學(xué)數(shù)據(jù)的管理與共享的議題,進(jìn)行了深入的交流與討論(圖2)。會議由ISTIC信息技術(shù)支持中心朱禮軍主持,JST國家生物數(shù)據(jù)中心計劃管理部主任白木澤佳子等三人、KISTI科學(xué)大數(shù)據(jù)研究部李相鎬首席研究員等兩人、我所資源共享中心彭潔主任和信息技術(shù)支持中心朱禮軍副主任以及我所從事DOI項目的相關(guān)人員共計約20人參加了此次會議。
來自中日韓三個機(jī)構(gòu)的六名代表作了發(fā)言,發(fā)表者分別介紹了DOI在中國科學(xué)數(shù)據(jù)領(lǐng)域的應(yīng)用及中文DOI最新進(jìn)展、日本生命科學(xué)數(shù)據(jù)共享以及日本DOI進(jìn)展、韓國KISTI科學(xué)數(shù)據(jù)共享活動及科研數(shù)據(jù)平臺(P-CUBE)。會議代表還討論了如何加強(qiáng)科學(xué)數(shù)據(jù)和電子期刊元數(shù)據(jù)交換、韓國科研數(shù)據(jù)平臺(P-CUBE)系統(tǒng)在中國和日本的測試和使用等事宜。
圖1 會場內(nèi)參會者合影
圖2 會場發(fā)言
目前,韓國科技信息研究所雖然擔(dān)負(fù)著DOI注冊機(jī)構(gòu)(DOI RA)的職能,還沒有申請DOI RA。我所是DOI理事會成員,韓國信息院所希望我所能夠協(xié)調(diào)它成為DOI韓國代理,我所表示愿意積極推進(jìn)此事。
此外,此次參會代表還討論了是否擴(kuò)大中日韓科技信息機(jī)構(gòu)聯(lián)席會議的規(guī)模,邀請三國更多的科技信息機(jī)構(gòu)參加該會議,并商定將此事作為第四屆中日韓科技信息機(jī)構(gòu)聯(lián)席會議的議題之一。
以下針對中日韓DOI系統(tǒng),即日本JaLC、韓國的P-CUBE,進(jìn)行重點介紹,并介紹在系統(tǒng)之上的科學(xué)數(shù)據(jù)管理與共享工作。在總結(jié)部分,介紹三機(jī)構(gòu)未來實施合作的意向。
2007年3月,ISTIC和北京萬方數(shù)據(jù)股份有限公司聯(lián)合申請并取得了中文領(lǐng)域的DOI注冊與管理權(quán),成為IDF授權(quán)的中國DOI注冊機(jī)構(gòu)(DOI RA),并于2007年7月開始正式運(yùn)行中文DOI服務(wù)。這是我國在數(shù)字出版及信息內(nèi)容服務(wù)行業(yè)向國際標(biāo)準(zhǔn)化方向邁出的重要一步。中文DOI服務(wù)從2011年9月開始交由ISTIC的DOI注冊與服務(wù)中心管理和運(yùn)行。2013年起,DOI注冊與服務(wù)中心工作由ISTIC國家科技信息資源綜合利用與公共服務(wù)中心負(fù)責(zé),以加強(qiáng)DOI的知識應(yīng)用研究及國際合作工作。2013年度的重點研發(fā)任務(wù)是基于關(guān)聯(lián)數(shù)據(jù)的DOI數(shù)據(jù)發(fā)布、影視資源的擴(kuò)展應(yīng)用(詳見本專題的相關(guān)文章),與ORCID(Open Research Contributor ID)、CNRI及其DONA(Digital Object Naming Authority Foundation)、CrossRef、JST和KISTI繼續(xù)進(jìn)行深入合作。同時,繼續(xù)參與國內(nèi)外相關(guān)標(biāo)準(zhǔn)的制定及活動,比如PDRI(CY/T 82-2012, Press and publication digital resource identifier)、ISNI(CY/T 83-2012 China standard name identifier)、ISO 26324、ISO 27729及ISBN-A等。
目前(2013年6月1日統(tǒng)計)累計注冊總量已達(dá)17,657,515條。涵蓋5900種期刊的16,364,969條論文數(shù)據(jù)、400所大學(xué)的學(xué)位論文1,276,986篇、8857條科學(xué)數(shù)據(jù),其他數(shù)據(jù)5714條[5],并啟動了圖書的DOI注冊工作。作為實驗,注冊了與期刊論文和科學(xué)數(shù)據(jù)相關(guān)的圖表數(shù)據(jù)。
2013年,中文DOI系統(tǒng)將升級為3.0版,持續(xù)推出新的服務(wù),包括DOI引文鏈接、被引統(tǒng)計、多重解析注冊等。通過系統(tǒng)重構(gòu),有利于擴(kuò)展。重新設(shè)計門戶、中文DOI成員的應(yīng)用體系、統(tǒng)計功能、強(qiáng)化元數(shù)據(jù)查詢功能和桌面工具、機(jī)器接口等[6]。
科學(xué)數(shù)據(jù)現(xiàn)狀見圖3。
在我國,項目結(jié)束后,數(shù)據(jù)很難繼續(xù)管理和共享。在此環(huán)境下,ISTIC資源共享中心,在科學(xué)數(shù)據(jù)領(lǐng)域,通過DOI的應(yīng)用,力圖促進(jìn)科學(xué)數(shù)據(jù)的管理與共享。近年開展的主要工作如圖4所示。
圖3 科學(xué)數(shù)據(jù)管理存在的問題及基于DOI的解決方案
JaLC是整合公共信息服務(wù)的日本國家項目。如圖5,JaCL的主要功能如下:
■ 下列資源DOI的注冊機(jī)構(gòu)
● 學(xué)術(shù)期刊論文
● 博士論文
● 大學(xué)紀(jì)要
● 報告
■ 利用DOIs和PubMed IDs在數(shù)據(jù)庫之間提供雙向鏈接,比如引用及被引鏈接。
通過日本DOI RA機(jī)制,JaLC還將實現(xiàn)如下的服務(wù):
■ 提供日語DOI注冊服務(wù)
■ 多種數(shù)字內(nèi)容的全國范圍的解析(比如電子期刊、學(xué)術(shù)論文、研究報告、紀(jì)要)
■ 兼容多字節(jié)(比如漢字)的元數(shù)據(jù)檢索服務(wù)
■ 促進(jìn)DOI在日本的應(yīng)用
■ 促進(jìn)全球用戶檢索日本公開的學(xué)術(shù)信息
JaLC工作的挑戰(zhàn)如下:
■ 內(nèi)容的重復(fù)
◆ 機(jī)構(gòu)倉儲(Institutional Repository,IR)與出版社之間
◆ IR對多著者論文的IR
■ 處理作者不同版本的論文
■ 非數(shù)據(jù)存儲用戶的服務(wù)
■ 圖書、科學(xué)數(shù)據(jù)的存儲
■ 科學(xué)數(shù)據(jù)注冊問題:
◆ 范圍:由于粒度不同,需要決定目標(biāo)DOI的范圍
◆ 元數(shù)據(jù)政策:不同領(lǐng)域元數(shù)據(jù)描述不同,需要共識與清晰的政策
圖4 ISTIC資源共享中心工作
圖5 JaLC的服務(wù)功能
◆ 可擴(kuò)展性:需要可擴(kuò)展的系統(tǒng)來適應(yīng)元數(shù)據(jù)的修改
小結(jié):
■ 2013年3月,JST被批準(zhǔn)為IDF第9家RA
■ 國立國會圖書館NDL、日本國立情報學(xué)研究所NII、國立材料科學(xué)研究所NIMS及JST共同設(shè)立了JaLC的RA指導(dǎo)委員會,總部在JST,是JaLC項目的管理實體。
■ DOI是日本全國范圍元數(shù)據(jù)整合的關(guān)鍵基礎(chǔ)設(shè)施
■ 通過日語資源的定位來充分利用DOI
如圖6所示,JST國家生物數(shù)據(jù)庫中心NBDC的主要業(yè)務(wù)是:
1) 方針制定
2) 門戶的構(gòu)建與維護(hù)
3) 數(shù)據(jù)庫整合基礎(chǔ)技術(shù)的研究與開發(fā)
4) 生物數(shù)據(jù)庫的整合促進(jìn)
通過NBDC的門戶網(wǎng)站,用戶可以檢索日本構(gòu)建的各種生命科學(xué)數(shù)據(jù)庫。
NBDC實施公共資助下的科學(xué)數(shù)據(jù)共享活動。實施數(shù)據(jù)共享的理由是:
● 增強(qiáng)研究的透明性與再現(xiàn)性
● 加速研究
● 減少研究過程的重復(fù)與資助的重復(fù)
● 為數(shù)據(jù)發(fā)現(xiàn)導(dǎo)入新的方法
● 促進(jìn)發(fā)達(dá)與發(fā)展中國家之間的教育與合作研究
2013年4月,NBDC公布了人類數(shù)據(jù)共享及其數(shù)據(jù)安全處理的指導(dǎo)方案。人類數(shù)據(jù)將通過NBDC的人類數(shù)據(jù)庫共享,包括DNA序列、人腦影像及臨床信息,見圖7。
JST的NBDC建立數(shù)據(jù)共享的動機(jī):
● 強(qiáng)化和拓寬基金機(jī)構(gòu)及政府所有的數(shù)據(jù)共享政策
● 對數(shù)據(jù)共享的研究者給予適當(dāng)?shù)男抛u(yù)
◇ 建立引用標(biāo)準(zhǔn)
◇ 建立數(shù)據(jù)應(yīng)用和重用的評價指標(biāo)
● 可持續(xù)和永久標(biāo)識
◇ 永久標(biāo)識符
(DOI,或PURLs)
◇ 持續(xù)的資助
P-CUBE是KISTI開發(fā)的全球科學(xué)數(shù)據(jù)管理與共享的開放平臺,完全基于國際標(biāo)準(zhǔn)和開源軟件,見圖8所示。
有關(guān)P-CUBE誕生背景、P-CUBE功能特點、P-CUBE架構(gòu)體系、P-CUBE技術(shù)標(biāo)準(zhǔn)、P-CUBE主要功能,本專題有專門的介紹,在此不再贅述。
圖6 NBDC業(yè)務(wù)
圖7 NBDC人類數(shù)據(jù)共享
圖8 P-CUBE主要模塊和開源軟件
KISTI目前的科學(xué)數(shù)據(jù)項目有:
■ CODATA活動:國家代表
■ GBIF:生物多樣性數(shù)據(jù)和GBIF韓國節(jié)點(http://www.kbif.re.kr/index.do)
■ 事實數(shù)據(jù)庫的開發(fā)
◇ 醫(yī)藥圖像、3D、形狀測量數(shù)據(jù)
◇ 政府和研究機(jī)構(gòu)建立的其他事實數(shù)據(jù)
與科學(xué)數(shù)據(jù)有關(guān)的活動:
■ 改變戰(zhàn)略
◇ 構(gòu)建科學(xué)數(shù)據(jù)庫◇ 收集科學(xué)數(shù)據(jù)
◆ 只要政府支持研究項目,科學(xué)數(shù)據(jù)將繼續(xù)產(chǎn)出
◆ KISTI實施政府層面的研究項目的管理系統(tǒng)NTIS
◆ 所有資助機(jī)構(gòu)都加入了NTIS項目
■ 支持機(jī)構(gòu)數(shù)據(jù)的收集
◇ 開發(fā)和發(fā)布數(shù)據(jù)收集工具P-CUBE
◇ 支持研究機(jī)構(gòu)、學(xué)會及大學(xué)構(gòu)建數(shù)據(jù)倉儲
◇ 支持研究者數(shù)據(jù)活動
◇ 支持政府層面的資助活動
◇ 與資金機(jī)構(gòu)、學(xué)會、研究機(jī)構(gòu)、大學(xué)合作,促進(jìn)數(shù)據(jù)收集活動
通過本次交流,中日韓在科學(xué)數(shù)據(jù)管理與共享方面的初步合作設(shè)想為:
■ 通過中日韓國家科技信息研究機(jī)構(gòu)的會議,公共努力,促進(jìn)合作
■ 經(jīng)驗交流(問題、成功案例等)
■ 共享軟件基礎(chǔ),比如P-CUBE
■ 交換元數(shù)據(jù)
■ 采用共同的標(biāo)準(zhǔn),比如OAIPMH或元數(shù)據(jù)格式
■ 設(shè)立新的合作項目
三國合作的基本路線是:KISTI在秋季前,將完善P-CUBE平臺,交由ISTIC和JST進(jìn)行測試和試用,三機(jī)構(gòu)基于P-CUBE嘗試進(jìn)行生物科學(xué)數(shù)據(jù)管理與共享,并向其他領(lǐng)域擴(kuò)展。
[1] 首屆日中韓DOI會議報道.JST北京辦事處[OL]. [2013-06-16]. http://www.jst.org.cn/activity_201306_03.html.
[2] 李穎,徐碩,朱禮軍,等.面向技術(shù)創(chuàng)新服務(wù)與DOI應(yīng)用的國際合作綜述:“第三屆中日韓科技信息機(jī)構(gòu)聯(lián)合研討會”概述[J].數(shù)字圖書館論壇,2012(8):50-60.
[3] 李穎,梁冰,喬曉東.“第二屆中日韓科技信息機(jī)構(gòu)聯(lián)合會議”綜述[J].數(shù)字圖書館論壇,2011(6).
[4] 李穎,喬曉東,梁冰.科技創(chuàng)新信息支持門戶的對比研究:中日韓三國信息系統(tǒng)的介紹與展望(第三屆中日韓科技信息機(jī)構(gòu)聯(lián)合研討會)[J].數(shù)字圖書館論壇,2010(5):2-8.
[5] 中文DOI官網(wǎng)[OL]. [2013-06-16]. http://www.chinadoi.cn.
[6] GUO X F. Updates on Chinese DOI. [2013-05-30].
[7] TU Y. DOI application for scientific data in China [OL]. [2013-05-30].
[8] JaLC官方網(wǎng)站[OL]. [2013-06-16]. http://japanlinkcenter.org/jalc/.
[9] KATO A. Review of JaLC project and the updates [OL]. [2013-05-30].
[10] KOSO A. Sharing Publicly Funded Scientific Data - Activities at NBDC [OL]. [2013-05-30].
[11] JST國立生物科學(xué)數(shù)據(jù)庫中心官網(wǎng)[OL]. [2013-05-30]. http://biosciencedbc.jp/.
[12] 大波純一,佐藤惠子,白木澤佳子,等. JST バイオサイエンスデータベースセンターにおけるデータベース統(tǒng)合への取り組みと醫(yī)學(xué)分野での利活用の紹介[J].情報の科學(xué)と技術(shù),2013,63(5):179-185.
[13] KIM S. Research Data Platform and Development of DOI System [OL]. [2013-05-30].
[14] KIM S. What is P-CUBE? [OL]. [2013-06-16]. http://or2013.net/sites/or2013.net/files/What%20is%20P-CUBE.pdf.
[15] LEE S H. Recent Scientific Data Project in KISTI [OL]. [2013-05-30].
Management and Sharing of Scientific Data Based on the DOI RA Mechanism- Review for "the 1st Korea-China-Japan Cooperation Seminar of DOI-related Projects"
Li Ying / Institute of Scientific and Technical Information of China, Beijing, 100038
Liu Jingbo / Hebei Library, Shijiazhuang, 050011
The 1st China-Japan-Korea Joint Seminar on DOI Project Cooperation was successfully held on May 30, 2013 in ISTIC, China. This is also a special workshop of the 3rd China-Japan-Korea Joint Seminar on Science and Technology Information. With three DOI RA functions of ISTIC, KISTI, JST, around the consensus of DOI RA application in management and sharing of scientific data, the three agencies conducted a more thorough discussion on their system and their related activities.In this paper, overview of the meeting is presented, focused on China, Japan and Korea's current systems, namely China DOI, P-CUBE and JaLC, as well as activities for scientific data management. Finally, it summarizes the cooperation intention of the three agencies in the future.
ISTIC, KISTI, JST, China DOI, JaLC, P-CUBE, Bioscience, Scientific data
2013-06-22)
10.3772/j.issn.1673—2286.2013.08.007
*本研究獲得中國科學(xué)技術(shù)信息研究所科研項目預(yù)研資金“基于DITA標(biāo)準(zhǔn)的語義知識系統(tǒng)框架設(shè)計及應(yīng)用研究”項目的部分資助。獲得國家科技支撐計劃“技術(shù)創(chuàng)新服務(wù)平臺關(guān)鍵技術(shù)研究與應(yīng)用示范”項目的資助(編號:2011BAH30B01)。
DOI機(jī)制,有利于科學(xué)數(shù)據(jù)的發(fā)現(xiàn)、獲取、跟蹤、引用、重用,使其可見度增高,并可核實與跟蹤其影響因子。
李穎,信息系統(tǒng)專業(yè)博士。研究方向:語義知識組織,基于主題的知識組織技術(shù)的應(yīng)用等。E-mail: liying@istic.ac.cn劉靜波,體育教育學(xué)專業(yè)碩士。研究方向:資源管理,數(shù)字資源構(gòu)建。E-mail: ryuseiha@sina.com