• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      Web2.0環(huán)境下的自規(guī)范及其對(duì)個(gè)人名稱規(guī)范維護(hù)工作的啟示

      2016-10-09 06:19:31郝嘉樹(shù)
      關(guān)鍵詞:標(biāo)識(shí)符字段名稱

      郝嘉樹(shù)

      ?

      Web2.0環(huán)境下的自規(guī)范及其對(duì)個(gè)人名稱規(guī)范維護(hù)工作的啟示

      郝嘉樹(shù)

      我國(guó)名稱規(guī)范維護(hù)工作存在著困擾,基于其產(chǎn)生的原因,通過(guò)研究自規(guī)范相關(guān)應(yīng)用ORCID、FOAF和Wikipedia得到啟發(fā):或許可以基于自規(guī)范改進(jìn)個(gè)人名稱規(guī)范維護(hù)模式、利用開(kāi)放語(yǔ)義資源豐富個(gè)人名稱規(guī)范數(shù)據(jù)并拓展名稱規(guī)范數(shù)據(jù)的功能。表1。參考文獻(xiàn)8。

      自規(guī)范ORCIDFOAF名稱規(guī)范維護(hù)模式RDF數(shù)據(jù)

      1 引言

      我國(guó)個(gè)人名稱規(guī)范數(shù)據(jù)存在標(biāo)目形式多樣、不完整數(shù)據(jù)量大和重名等問(wèn)題,這給編目員在維護(hù)和掛接規(guī)范數(shù)據(jù)時(shí)選擇和甄別標(biāo)目帶來(lái)較大障礙,需要人工逐條分析、比對(duì)和辨別。個(gè)人名稱規(guī)范的維護(hù)和控制工作,消耗了編目員較多的時(shí)間和精力,而其發(fā)揮的作用卻很有限,形成了較大的反差。

      造成以上問(wèn)題主要有兩方面原因。一是完全由編目員承擔(dān)名稱規(guī)范數(shù)據(jù)的維護(hù)工作。在海量數(shù)據(jù)、難以獲得相關(guān)信息和不了解作者的情況下,完全由編目員承擔(dān)數(shù)據(jù)的維護(hù)工作,出現(xiàn)規(guī)范記錄不完整、張冠李戴等現(xiàn)象難以避免。因此,探索新的名稱規(guī)范維護(hù)模式是關(guān)鍵所在。二是規(guī)范數(shù)據(jù)所選取的信息主要來(lái)自于受編文獻(xiàn)、網(wǎng)絡(luò)、工具書(shū)、期刊、電話、郵件和交友軟件等。其中,電話和郵件是主動(dòng)式獲取渠道,能根據(jù)數(shù)據(jù)需要向著者取得指定信息,但是費(fèi)時(shí)費(fèi)力,溝通成本比較高;其它信息源大多是被動(dòng)式獲取渠道,可獲取的內(nèi)容完全取決于信息源的非規(guī)范性提供,容易導(dǎo)致信息缺失。因此,尋找低成本高效率的信息獲取方式是另一關(guān)鍵所在。

      然而,目前我國(guó)的應(yīng)對(duì)策略主要是通過(guò)完善規(guī)范格式和制定編目規(guī)則來(lái)提升數(shù)據(jù)質(zhì)量,嘗試聯(lián)合多機(jī)構(gòu)通力解決數(shù)據(jù)的共享和重用。這些做法在一定程度上能控制數(shù)據(jù)質(zhì)量和擴(kuò)大數(shù)據(jù)規(guī)模,但作用十分有限。因此,我們需要借助現(xiàn)代化的技術(shù)和模式來(lái)尋求高效的信息獲取方式以提升數(shù)據(jù)質(zhì)量,改變工作模式以提高數(shù)據(jù)維護(hù)的效率,從而真正發(fā)揮名稱規(guī)范區(qū)分、匯聚等功能。Web2.0技術(shù)注重用戶的交互行為,用戶在Web2.0網(wǎng)絡(luò)環(huán)境中廣泛參與內(nèi)容生產(chǎn)、信息組織、數(shù)據(jù)交流與共享,甚至提供相關(guān)服務(wù),并催生了分眾分類法、博客、簡(jiǎn)易信息聚合(Really Simple Syndication,RSS)等新的方法和媒介。因此,我們或許可以借助Web2.0的機(jī)制、特性和優(yōu)勢(shì),通過(guò)著者用戶的參與來(lái)解決當(dāng)前名稱規(guī)范維護(hù)中的問(wèn)題和困擾。

      2 基于Web2.0的自規(guī)范機(jī)制

      Web2.0的興起和應(yīng)用創(chuàng)造了全新的信息空間。它把復(fù)雜的技術(shù)移至后臺(tái),將互聯(lián)網(wǎng)的主導(dǎo)權(quán)交給個(gè)人,僅有簡(jiǎn)單規(guī)則的約束,從而充分調(diào)動(dòng)了用戶的積極性,使其廣泛參與內(nèi)容的生產(chǎn)、信息的組織、數(shù)據(jù)的交流與共享,甚至提供相關(guān)的服務(wù),如博客、簡(jiǎn)易信息聚合和社會(huì)網(wǎng)絡(luò)服務(wù)(Social Network Service,SNS)等。Web2.0的出現(xiàn)衍生了相關(guān)應(yīng)用,如原傳統(tǒng)的分類法和主題詞表由專門(mén)機(jī)構(gòu)組織構(gòu)建和維護(hù),Web2.0環(huán)境下的自組織(self-Organization)則由網(wǎng)絡(luò)用戶自發(fā)生成分類體系和標(biāo)簽詞,像Social Tagging(社會(huì)化標(biāo)簽)和Wikipedia(維基百科)分類體系。在名稱規(guī)范中,Web2.0環(huán)境下出現(xiàn)了個(gè)人科研管理、個(gè)人展示等應(yīng)用及平臺(tái),它們有明確的目標(biāo)和應(yīng)用邊界。在其運(yùn)行過(guò)程中,由著者用戶自發(fā)地在相關(guān)平臺(tái)中進(jìn)行個(gè)人的描述,完成對(duì)個(gè)人名稱及其他相關(guān)信息的生成和完善;同時(shí),網(wǎng)絡(luò)社會(huì)中的其他用戶又對(duì)其進(jìn)行識(shí)別、認(rèn)證和完善,這種行為模式是隨機(jī)和分散進(jìn)行的,但又協(xié)同地實(shí)現(xiàn)了對(duì)同一個(gè)人名稱的規(guī)范。相較于傳統(tǒng)的名稱規(guī)范由編目人員構(gòu)建和維護(hù), Web2.0環(huán)境下的自規(guī)范則由著者用戶對(duì)個(gè)人名稱進(jìn)行唯一標(biāo)識(shí),并揭示和完善人的事實(shí)信息及其相關(guān)的社會(huì)網(wǎng)絡(luò),典型應(yīng)用有ORCID(Open Researcher and Contributor Identifier,開(kāi)放研究者和貢獻(xiàn)者標(biāo)識(shí)符)、FOAF(Friend-of-a-Friend,朋友的朋友)、Wikipedia和Pubmed Author ID(Pubmed數(shù)據(jù)庫(kù)作者標(biāo)識(shí)符)等。因此,本文將Web2.0環(huán)境下無(wú)需外界指令,由著者用戶自發(fā)、分散和協(xié)同地實(shí)現(xiàn)個(gè)人名稱及其他相關(guān)信息的生成和完善,以及不同人辨識(shí)的過(guò)程稱為自規(guī)范。

      基于Web2.0技術(shù)的平臺(tái)搭建了良好的技術(shù)框架,架構(gòu)中蘊(yùn)含支持自規(guī)范的機(jī)制和功能,如ORCID和Scopus Author ID(斯高帕斯數(shù)據(jù)庫(kù)作者標(biāo)識(shí)符)等自動(dòng)為個(gè)人分配唯一標(biāo)識(shí)符;并制定運(yùn)行規(guī)則約束眾多參與者的行為以保證內(nèi)容的真實(shí)性和準(zhǔn)確性,如Wikipedia為用戶制定建設(shè)Wiki站點(diǎn)的規(guī)則,記錄和封存破壞者的IP等;另外,Web2.0內(nèi)嵌模板圈定了用戶對(duì)人描述和揭示的內(nèi)容,如FOAF和CNO(CSHL Name Ontology,冷泉港實(shí)驗(yàn)室姓名本體)用事先定義好的屬性或模板對(duì)人物的描述進(jìn)行約束。

      通過(guò)自規(guī)范生成的內(nèi)容客觀性強(qiáng)。由著者用戶創(chuàng)建的本人信息是一種“自我申明”,是作者和科研產(chǎn)出者對(duì)自我的真實(shí)反映。排除惡意欺詐,該種模式下申明的內(nèi)容是客觀的。例如,F(xiàn)OAF的目標(biāo)之一是尋找興趣相同的人或合作伙伴,因此創(chuàng)建的內(nèi)容“天然”準(zhǔn)確。除此之外,創(chuàng)建的內(nèi)容在Web2.0技術(shù)支持下由網(wǎng)絡(luò)用戶協(xié)同糾錯(cuò)和認(rèn)證,從而實(shí)現(xiàn)自規(guī)范。如用戶編輯Wiki條目,通過(guò)Wiki平臺(tái)進(jìn)行信息的生成、整合、組織與糾正,最終形成在線大型百科全書(shū),其正確性同《大英百科全書(shū)》不相上下[1]。

      3 自規(guī)范相關(guān)應(yīng)用

      3.1ORCID

      ORCID作為作者標(biāo)識(shí)符(Author Identifier)的一種,用以解決出版界和其他系統(tǒng)中作者姓名混淆和識(shí)別問(wèn)題[2]。它源自湯姆森路透集團(tuán)和自然出版集團(tuán)2009年在英國(guó)劍橋召開(kāi)的第一次名稱標(biāo)識(shí)符高峰會(huì)議,用以消除作者名字歧義相關(guān)問(wèn)題,后得到廣泛關(guān)注。并于2010年正式成立ORCID組織,2012年開(kāi)始提供服務(wù),我國(guó)也于2014年由中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心創(chuàng)建推出iAuthor實(shí)現(xiàn)中國(guó)科研產(chǎn)出者和ORCID的對(duì)接。近年來(lái),作者標(biāo)識(shí)符得到快速發(fā)展,如arXiv、Pubmed、Elsevier和Google Scholar Citation等都開(kāi)發(fā)了各自的ID,這種只局限在某一范圍或系統(tǒng)內(nèi)的做法削弱了作者標(biāo)識(shí)符辨識(shí)度。ORCID除了通過(guò)注冊(cè)平臺(tái)為作者提供唯一標(biāo)識(shí),還在兼容性和互操作方面進(jìn)行嘗試,建立與各系統(tǒng)作者標(biāo)識(shí)符的關(guān)聯(lián),同時(shí)免費(fèi)向全球?qū)W術(shù)界開(kāi)放并提供服務(wù),不受國(guó)家和語(yǔ)言限制,這種擴(kuò)大使用范圍的做法才能起到辨識(shí)不同作者的作用。

      ORCID是一種自下而上、由著者用戶主導(dǎo)的自規(guī)范模式。同VIAF、ISNI等自上而下發(fā)起、由專業(yè)人員和系統(tǒng)集中構(gòu)建的模式相比,ORCID則是由著者用戶自己生成和完善個(gè)人的相關(guān)信息,辨識(shí)同名異人和同人異名,最終完成著者名稱的規(guī)范。此外,ORCID還進(jìn)行真實(shí)性認(rèn)證,即通過(guò)社會(huì)化網(wǎng)絡(luò)中的人員和機(jī)構(gòu)等對(duì)個(gè)人身份進(jìn)行識(shí)別、確認(rèn)和完善。該行為由不同用戶分散、協(xié)同地完成著者名稱的規(guī)范,也屬于用戶自規(guī)范的一種。

      ORCID自規(guī)范后分配由16位碼組成的標(biāo)識(shí)符。與名稱標(biāo)識(shí)相比,ORCID的標(biāo)識(shí)符可解決由重名、別名、翻譯、更名等造成的作者名稱歧義問(wèn)題; 同時(shí),真實(shí)性認(rèn)證使得ORCID平臺(tái)包含的姓名、所在機(jī)構(gòu)、發(fā)表文獻(xiàn)情況、研究興趣、教育程度、工作單位和開(kāi)展項(xiàng)目等信息,可用來(lái)完善名稱規(guī)范數(shù)據(jù)附加成分、單純參照和信息附注,提高個(gè)人名稱規(guī)范數(shù)據(jù)質(zhì)量。

      3.2FOAF

      FOAF是網(wǎng)絡(luò)用戶用已定義好的RDF(Resource Description Framework,資源描述框架)詞匯表形式化的描述“自我”及相關(guān)的社會(huì)網(wǎng)絡(luò),其本質(zhì)為描述個(gè)人的簡(jiǎn)單本體。它由Dan Brickley和Libby Miller于2000年創(chuàng)建,遵循W3C體系,最初只描述個(gè)人,后擴(kuò)展到各類群體,如機(jī)構(gòu)和地點(diǎn)。FOAF描述詞匯歷經(jīng)10次更新,最后于2014年確定下來(lái)不再更改[3]。

      FOAF是Web2.0環(huán)境下自規(guī)范的典型應(yīng)用。由于名稱規(guī)范制作中各信息源的局限性,有關(guān)人的信息獲取并不容易,F(xiàn)OAF通過(guò)UGC(User Generated Content,用戶創(chuàng)造內(nèi)容)形式挖掘存在人頭腦里的有關(guān)人的事實(shí)信息,通過(guò)相關(guān)服務(wù)的開(kāi)發(fā)吸引用戶自己創(chuàng)建或制作有關(guān)個(gè)人的數(shù)據(jù);而用戶出于自身目的(如尋找類似項(xiàng)目的合作人和興趣相同的人等)利用FOAF事先定義好的屬性約束進(jìn)行個(gè)人描述,創(chuàng)建的內(nèi)容“天然”客觀和規(guī)范。

      FOAF文檔可被計(jì)算機(jī)讀取、理解,一經(jīng)發(fā)布便可進(jìn)行搜索和處理。FOAF用RDF Schema定義的詞匯(標(biāo)簽)來(lái)描述個(gè)人及其相關(guān)屬性(信息項(xiàng)),形成FOAF文檔,同時(shí)計(jì)算機(jī)通過(guò)這些詞匯理解和處理FOAF文檔。在揭示個(gè)人屬性的詞匯中,用foaf:mbox即郵箱作為識(shí)別個(gè)人的URI(Uniform Resource Identifier,統(tǒng)一資源標(biāo)識(shí)符)[4];使用foaf:knows表示認(rèn)識(shí)的朋友,通過(guò)該標(biāo)簽可以很容易把相關(guān)人員和實(shí)體關(guān)聯(lián)起來(lái)形成社會(huì)網(wǎng)絡(luò),從而豐富個(gè)人規(guī)范數(shù)據(jù)相關(guān)參照;另外,F(xiàn)OAF還揭示出個(gè)人興趣愛(ài)好、性格特征、工作信息及計(jì)劃、相關(guān)網(wǎng)址等信息,可幫助完善名稱規(guī)范數(shù)據(jù)。

      3.3Wikipedia

      Wikipedia是基于Wiki技術(shù)由大眾自由創(chuàng)建編輯的網(wǎng)絡(luò)百科全書(shū),其中包含了大量個(gè)人條目,有網(wǎng)絡(luò)用戶發(fā)布的各領(lǐng)域貢獻(xiàn)者、名人和公眾人物等,也有為自己創(chuàng)建的條目。

      Wikipedia基于Web2.0平臺(tái)中用戶的協(xié)同進(jìn)行自規(guī)范。網(wǎng)絡(luò)用戶可自由在Wikipedia平臺(tái)創(chuàng)建和修改人物條目,同時(shí)用戶之間還可以通過(guò)作用于Wiki平臺(tái)間接協(xié)同地整合和交互信息,從而避免了由少數(shù)人集中構(gòu)建人物條目的弊端。由網(wǎng)絡(luò)用戶創(chuàng)建內(nèi)容的形式生成了大量的人物條目,同時(shí)條目的準(zhǔn)確性會(huì)被其他網(wǎng)絡(luò)用戶維護(hù),這種無(wú)意識(shí)的分散協(xié)作增強(qiáng)了Wikipedia的客觀性,最終使其正確性同《大英百科全書(shū)》不相上下。

      Wikipedia中包含的結(jié)構(gòu)和語(yǔ)法為計(jì)算機(jī)自動(dòng)收割信息提供便利。Wikipedia有自發(fā)形成的分類體系,可用來(lái)幫助提取人物類條目;該百科為各類實(shí)體定義了模板,可高效地為維基條目添加各類信息。其中信息盒以結(jié)構(gòu)化表單的形式對(duì)某一類實(shí)體的公共屬性進(jìn)行描述,這種結(jié)構(gòu)化格式便于計(jì)算機(jī)程序自動(dòng)抽取出有用的知識(shí)和信息。如人物的信息盒中包含了其他名字、性別、職業(yè)、生卒年等信息[5],可用來(lái)補(bǔ)充名稱規(guī)范信息。Wikipedia允許添加超級(jí)鏈接,使維基條目包含了相關(guān)、引用語(yǔ)義關(guān)系,可幫助構(gòu)建名稱規(guī)范數(shù)據(jù)的相關(guān)參照。

      4 自規(guī)范對(duì)個(gè)人名稱規(guī)范維護(hù)工作的啟示

      4.1基于自規(guī)范改進(jìn)個(gè)人名稱規(guī)范數(shù)據(jù)維護(hù)模式

      針對(duì)難以獲得相關(guān)信息和不了解作者的事實(shí),我們或許可以借鑒Web2.0環(huán)境下自規(guī)范的相關(guān)應(yīng)用,使用UGC進(jìn)行個(gè)人名稱規(guī)范的維護(hù)工作。自規(guī)范應(yīng)該規(guī)避難以讓用戶理解的MARC格式,以網(wǎng)絡(luò)平臺(tái)界面的形式,通過(guò)著者參與挖掘其頭腦里有關(guān)人的事實(shí)信息來(lái)新建、修改和補(bǔ)充個(gè)人記錄的模式來(lái)維護(hù)個(gè)人名稱規(guī)范數(shù)據(jù)。

      (1)構(gòu)建自規(guī)范平臺(tái)

      新建平臺(tái)還是與已有系統(tǒng)進(jìn)行合作,是開(kāi)展自規(guī)范工作模式首先需要論證和探討的問(wèn)題。新建平臺(tái)可以獲得第一手資源,并可根據(jù)自身業(yè)務(wù)及戰(zhàn)略需要設(shè)計(jì)、調(diào)整平臺(tái)信息架構(gòu)。除需資金和人力支持外,新建平臺(tái)最大的難題在于自身的影響力和用戶參與的驅(qū)動(dòng)力。如果只從維護(hù)數(shù)據(jù)的角度考慮,難以提高用戶粘性,除非有行政約束。與已有系統(tǒng)開(kāi)展合作,可以借助其影響力實(shí)現(xiàn)預(yù)期目標(biāo),并節(jié)省資金和人力;但由于其目標(biāo)和應(yīng)用邊界的限定,未必能滿足名稱規(guī)范維護(hù)單位數(shù)據(jù)維護(hù)的需要,并存在支付費(fèi)用或開(kāi)放、共享數(shù)據(jù)等問(wèn)題。維護(hù)單位需要根據(jù)自身資源情況和各方面條件,選擇開(kāi)展自規(guī)范方式。

      對(duì)于新建平臺(tái),在系統(tǒng)業(yè)務(wù)運(yùn)行方面要設(shè)計(jì)基于Web2.0技術(shù)并面向作者的友好型界面,對(duì)已有的名稱規(guī)范記錄采用真實(shí)性認(rèn)證,通過(guò)自我或社會(huì)化認(rèn)證實(shí)現(xiàn)規(guī)范記錄的識(shí)別、確認(rèn)和完善;若沒(méi)有著者用戶對(duì)應(yīng)的名稱規(guī)范記錄,可根據(jù)系統(tǒng)內(nèi)嵌模板完成記錄新建。在用戶參與的驅(qū)動(dòng)力方面,一是要為作者提供有用服務(wù)來(lái)增強(qiáng)粘性,例如方便個(gè)人科研管理,發(fā)現(xiàn)合作者等;二是通過(guò)技術(shù)手段和友好型設(shè)計(jì)降低用戶參與的復(fù)雜度,如同名規(guī)范數(shù)據(jù)的顯示要便于用戶辨識(shí),盡量采取客觀形式填寫(xiě)內(nèi)容。另外,與出版界、科研機(jī)構(gòu)、學(xué)術(shù)界等開(kāi)展合作。這些機(jī)構(gòu)團(tuán)體都存在對(duì)科研產(chǎn)出者準(zhǔn)確識(shí)別、名稱消歧、作者與出版物精確關(guān)聯(lián)的需要,利用這些切合點(diǎn)帶動(dòng)更多的科研產(chǎn)出者參與個(gè)人名稱規(guī)范數(shù)據(jù)的自規(guī)范。

      對(duì)于與已有系統(tǒng)的合作,要衡量合作系統(tǒng)的應(yīng)用邊界能否實(shí)現(xiàn)對(duì)名稱規(guī)范數(shù)據(jù)維護(hù)的需要,如不能滿足要提出數(shù)據(jù)和功能等方面的相關(guān)需求與系統(tǒng)方進(jìn)行協(xié)商;要盡量選擇影響力大、參與用戶多的系統(tǒng),有利于提高與名稱規(guī)范數(shù)據(jù)的匹配率;同時(shí),要了解合作系統(tǒng)的條件和要求,權(quán)衡交換條件及對(duì)自身的影響,從而選擇合適的合作對(duì)象。

      (2)作者唯一標(biāo)識(shí)符

      現(xiàn)行的名稱規(guī)范記錄中,標(biāo)目通過(guò)附加成分加以區(qū)分,以生卒年為首選,生卒年相同的情況下再?gòu)幕顒?dòng)領(lǐng)域、職業(yè)、性別、國(guó)別等中選其一進(jìn)行區(qū)分,這就會(huì)導(dǎo)致標(biāo)目形式的不統(tǒng)一。由此,在對(duì)同名作者進(jìn)行名稱規(guī)范維護(hù)和掛接時(shí),需要人工逐條查看、分析比對(duì)和辨別同名規(guī)范檔,花費(fèi)編目員大量時(shí)間和精力。

      針對(duì)以上情況,借鑒ORCID、FOAF等自規(guī)范應(yīng)用,個(gè)人名稱規(guī)范可以采用唯一標(biāo)識(shí)符區(qū)分不同作者。使用唯一標(biāo)識(shí)符精準(zhǔn)確認(rèn)資源對(duì)象是目前國(guó)際常用的做法,如廣泛應(yīng)用于文獻(xiàn)領(lǐng)域的數(shù)字對(duì)象唯一標(biāo)識(shí)DOI、統(tǒng)一資源標(biāo)識(shí)符URI、國(guó)際標(biāo)準(zhǔn)書(shū)號(hào)ISBN等。名稱規(guī)范記錄中雖然有規(guī)范記錄號(hào),但是該號(hào)碼只局限在本系統(tǒng)內(nèi),不具通用性。采用國(guó)際通用的有關(guān)人的唯一標(biāo)識(shí),有助于精確識(shí)別作者,若能在個(gè)人名稱規(guī)范中廣泛推廣和使用,便能大幅提高維護(hù)和掛接規(guī)范數(shù)據(jù)的效率。隨著作者唯一標(biāo)識(shí)符的普遍使用,名稱規(guī)范甚至不需具有區(qū)分功能,而是轉(zhuǎn)移為以人為中心的資源組織、聚合和相關(guān)服務(wù)的提供。

      4.2利用開(kāi)放語(yǔ)義資源豐富個(gè)人名稱規(guī)范數(shù)據(jù)

      公開(kāi)發(fā)布的個(gè)人RDF數(shù)據(jù),如FOAF、SKOS(Simple Knowledge Organization System,簡(jiǎn)單知識(shí)組織系統(tǒng))、VIAF(RDF/XML)、CNO等,可用于自動(dòng)發(fā)現(xiàn)和收割個(gè)人語(yǔ)義信息,豐富本地名稱規(guī)范數(shù)據(jù)。FOAF是使用較廣的RDF詞表,德國(guó)PND(個(gè)人名稱規(guī)范文檔)和VIAF(Virtual International Authority File,國(guó)際虛擬規(guī)范文檔)等都使用FOAF進(jìn)行語(yǔ)義化描述,下面即以FOAF為例介紹如何自動(dòng)發(fā)現(xiàn)和收割個(gè)人RDF數(shù)據(jù)。

      (1)RDF數(shù)據(jù)的自動(dòng)發(fā)現(xiàn)

      RDF具有開(kāi)放性和互聯(lián)性,實(shí)體經(jīng)RDF描述、發(fā)布后可被計(jì)算機(jī)檢索,并且可將網(wǎng)絡(luò)上離散的數(shù)據(jù)片段自動(dòng)關(guān)聯(lián)起來(lái)發(fā)現(xiàn)新內(nèi)容。在FOAF中,一方面通過(guò)foaf:mbox自動(dòng)整合個(gè)人相關(guān)信息,即通過(guò)URI辨別同名異人,聚合同人異名,并將網(wǎng)絡(luò)中同一URI揭示的任何信息根據(jù)FOAF標(biāo)簽聚合到一起;另一方面,通過(guò)foaf:knows與foaf:mbox的結(jié)合發(fā)現(xiàn)個(gè)人的社會(huì)網(wǎng)絡(luò),foaf:knows將嵌套在其下描述的人(foaf:mbox)與包含該語(yǔ)義標(biāo)簽的人(foaf:mbox)關(guān)聯(lián),最終形成個(gè)人社會(huì)網(wǎng)絡(luò)。

      (2)RDF數(shù)據(jù)的收割

      RDF數(shù)據(jù)具有語(yǔ)義,計(jì)算機(jī)可以解析其含義,通過(guò)語(yǔ)義標(biāo)簽可定向準(zhǔn)確找到相關(guān)信息。因此,只要將個(gè)人RDF數(shù)據(jù)語(yǔ)義標(biāo)簽和規(guī)范記錄MARC字段建立映射,計(jì)算機(jī)程序就能自動(dòng)將RDF數(shù)據(jù)收割到規(guī)范記錄對(duì)應(yīng)的字段中去。根據(jù)名稱規(guī)范記錄揭示的個(gè)人信息項(xiàng),在FOAF中尋找與之對(duì)應(yīng)的屬性,并將屬性對(duì)應(yīng)的標(biāo)簽和名稱規(guī)范MARC字段及子字段建立映射。FOAF屬性與個(gè)人規(guī)范數(shù)據(jù)CNMARC的映射如表1所示。

      表1FOAF屬性對(duì)應(yīng)的個(gè)人規(guī)范數(shù)據(jù)CNMARC字段及子字段

      CNMARC字段解釋FOAF詞匯說(shuō)明重復(fù)與否091$aFOAF$bURI開(kāi)放數(shù)據(jù)類型FOAF及URIfoaf:mbox或foaf:mbox_sha1sum方便數(shù)據(jù)定期維護(hù)可重復(fù)091$aSKOS$bURI與FOAF對(duì)應(yīng)的SKOS及URIfoaf:focus與SKOS搭配使用,幫助指明不同SKOS體系中的個(gè)人、地點(diǎn)、團(tuán)體。可重復(fù)120$a編碼數(shù)據(jù)字段foaf:gender區(qū)分于“200$c職業(yè)行業(yè)”唯一200$c附加成分foaf:interest職業(yè)、行業(yè)可重復(fù)200$f生卒年foaf:birthday唯一391$a發(fā)表著作foaf:publications可重復(fù)391$b開(kāi)展項(xiàng)目foaf:pastProject、foaf:current-Project可重復(fù)391$c工作計(jì)劃foaf:plan可重復(fù)392$a性格foaf:myersBriggs、foaf:geekcode可重復(fù)392$b博客foaf:weblog可重復(fù)392$c人物肖像foaf:image指向圖片庫(kù)可重復(fù)393$a工作單位foaf:workplaceHomepage、foaf:workInfoHomepage可重復(fù)393$b學(xué)校foaf:schoolHomepage可重復(fù)400$a單純參照f(shuō)oaf:name或foaf:lastName+foaf:firstName、foaf:nick、foaf:yahoo-ChatID、foaf:skypeID、foaf:icqChatID其他形式的名字、昵稱及網(wǎng)絡(luò)賬號(hào)可重復(fù)500$a相關(guān)參照f(shuō)oaf:knows相關(guān)的人與機(jī)構(gòu)可重復(fù)810$a參考數(shù)據(jù)源URI發(fā)布的URI地址可重復(fù)

      我國(guó)名稱規(guī)范格式中,200字段附加成分$c與300字段個(gè)人相關(guān)信息并沒(méi)有進(jìn)行區(qū)分。為順應(yīng)當(dāng)下編目主流趨勢(shì),適應(yīng)RDA規(guī)則及新修訂的UNIMARC規(guī)范格式,也方便名稱規(guī)范庫(kù)后續(xù)開(kāi)發(fā)利用,建議啟用和擴(kuò)展新字段對(duì)個(gè)人信息進(jìn)行結(jié)構(gòu)化處理。其中,啟用120字段用于區(qū)分200字段附加成分性別與職業(yè);因FOAF多個(gè)屬性與300$a對(duì)應(yīng),新增391、392、393字段分別著錄個(gè)人工作與科研情況、興趣性格和相關(guān)團(tuán)體信息;新增091字段記錄對(duì)應(yīng)語(yǔ)義數(shù)據(jù)的唯一標(biāo)識(shí),開(kāi)放數(shù)據(jù)處于動(dòng)態(tài)變化中,通過(guò)唯一標(biāo)識(shí)定期完善數(shù)據(jù)。

      4.3拓展名稱規(guī)范數(shù)據(jù)的功能

      未來(lái)數(shù)字社會(huì)的信息組織越來(lái)越傾向于“以人為中心”的資源組織[6],同時(shí)借助Web2.0平臺(tái)進(jìn)行自規(guī)范還需要增強(qiáng)用戶參與的驅(qū)動(dòng)力,如ORCID、FOAF等都在拓展、開(kāi)發(fā)相關(guān)的服務(wù)或應(yīng)用。因此,名稱規(guī)范功能不應(yīng)只局限在區(qū)分和聚集,而應(yīng)發(fā)現(xiàn)和拓展開(kāi)發(fā)多項(xiàng)功能服務(wù)。

      功能的拓展有賴于名稱規(guī)范數(shù)據(jù)中信息的結(jié)構(gòu)化處理。經(jīng)過(guò)結(jié)構(gòu)化處理的名稱規(guī)范數(shù)據(jù),可以為用戶提供以科研產(chǎn)出者為中心的科研信息組織和服務(wù),如科研成果目錄生成(經(jīng)名稱規(guī)范控制的書(shū)目)、與其他系統(tǒng)之間進(jìn)行科研信息的導(dǎo)入導(dǎo)出以及科研計(jì)量分析,基于興趣(200$c、391$a)為作者推薦相關(guān)主題書(shū)目,通過(guò)開(kāi)展的項(xiàng)目(391$b)發(fā)現(xiàn)合作者等。另外,還能幫助資助機(jī)構(gòu)追蹤受資方的科研活動(dòng)和成果產(chǎn)出[7]、幫助科研機(jī)構(gòu)實(shí)現(xiàn)對(duì)科研人員與科研活動(dòng)的有效關(guān)聯(lián)和動(dòng)態(tài)化管理[8]等。

      自規(guī)范的相關(guān)應(yīng)用有其各自的目標(biāo)和邊界,如不對(duì)外開(kāi)放、資源來(lái)源和應(yīng)用對(duì)象不同等造成使用局限。另外,語(yǔ)義網(wǎng)的使用還不普及,這會(huì)對(duì)實(shí)際操作帶來(lái)一定困難。但這些并不妨礙我們繼續(xù)探索,因?yàn)榛赪eb2.0的自規(guī)范可以提高名稱規(guī)范維護(hù)工作的效率,提升名稱規(guī)范數(shù)據(jù)質(zhì)量,甚至可以改變未來(lái)名稱規(guī)范的使命。

      1 GILES J. Internet Encyclopaedias Go Head to Head[J]. Nature, 2005, 438(7070):900-901.

      2 What is ORCID[EB/OL].[2015-06-18]. http:

      //orcid.org/content/initiative.

      3 Dan B, Libby M. FOAF Vocabulary Specification 0.99[EB/OL].[2015-05-23]. http://xmlns.com/foaf/spec/1#term_name.

      4 Dumbill E.Finding Friends with XML and RDF[EB/OL]. [2015-06-18]. IBM’s XML Watch,2002. http://www-106.ibm.com/developerworks/xml/library/x-foaf.html.

      5 Wikipedia’s Contents: People and Self [EB/OL]. [2015-07-02]. http://en.wikipedia.org/wiki/Portal:Contents/People_and_self.

      6 Fenner M. Author Identifier Overview[J]. Library Ideas, 2011(18):24-29.

      7 Funders[EB/OL].[2015-07-10].http://orcid.org/organizations/funders.

      8 Research Organizations[EB/OL].[2015-07-10]. http://orcid.org/organizations/institutions.

      (郝嘉樹(shù)館員國(guó)家圖書(shū)館中文采編部)

      Self-Authority in Web2.0 Environment and its Implication for the Maintenance of Personal Name Authority

      Hao Jiashu

      There are problems in the maintenance work of name authority in China. Based on the relevant causes and studying on related applications like ORCID, FOAF and Wikipedia, the paper gets some revelations: improving maintenance mode of name authority by self-authority, using open semantic resources to enrich personal name authority data, and expanding the function of name authority data. 1 tab. 8 refs.

      Self-Authority; ORCID; FOAF; Maintenance Model of Name Authority; RDF Data

      2015-08-18

      猜你喜歡
      標(biāo)識(shí)符字段名稱
      淺析5G V2X 通信應(yīng)用現(xiàn)狀及其側(cè)鏈路標(biāo)識(shí)符更新技術(shù)
      基于底層虛擬機(jī)的標(biāo)識(shí)符混淆方法
      圖書(shū)館中文圖書(shū)編目外包數(shù)據(jù)質(zhì)量控制分析
      基于區(qū)塊鏈的持久標(biāo)識(shí)符系統(tǒng)①
      數(shù)字美術(shù)館“數(shù)字對(duì)象唯一標(biāo)識(shí)符系統(tǒng)”建設(shè)需求淺議
      滬港通一周成交概況
      滬港通一周成交概況
      滬港通一周成交概況
      滬港通一周成交概況
      CNMARC304字段和314字段責(zé)任附注方式解析
      莱芜市| 新密市| 岱山县| 新津县| 上犹县| 蕉岭县| 永登县| 旅游| 靖江市| 临高县| 沙坪坝区| 沁阳市| 郑州市| 昌平区| 苍南县| 丹东市| 陵水| 马关县| 沙河市| 开阳县| 莱州市| 北宁市| 土默特左旗| 拉萨市| 嫩江县| 扬中市| 达拉特旗| 成安县| 万山特区| 景东| 桂阳县| 城固县| 金华市| 罗田县| 即墨市| 甘肃省| 曲阳县| 陵川县| 梨树县| 扶沟县| 镇江市|