程穎
856字段的網(wǎng)址管理探索
——以武漢大學(xué)圖書(shū)館為例*
程穎
文章針對(duì)MARC記錄856$u子字段的網(wǎng)址失效問(wèn)題,從網(wǎng)址來(lái)源及圖書(shū)館管理的角度分析856字段網(wǎng)址管理的復(fù)雜性;探討符合需求的856字段網(wǎng)址應(yīng)具有的特性;闡述網(wǎng)址管理應(yīng)遵循的原則及策略;介紹武漢大學(xué)圖書(shū)館西文書(shū)目庫(kù)856字段的網(wǎng)址管理實(shí)踐。
856字段網(wǎng)址管理SFXURL武漢大學(xué)圖書(shū)館
引用本文格式 程穎.856字段的網(wǎng)址管理探索——以武漢大學(xué)圖書(shū)館為例[J].圖書(shū)館論壇,2016(10):102-106.
AbstractFor the invalid URI in subfield 856$u,this paper analyzes the complexity of network address management in field 856 from the view of website sources and library management,and discusses the essential characteristics of valid network address in field 856.Then it states the principles and strategies of network address management,taking the management practice of western language bibliographic database in Wuhan University Library as an example.
Keywords856 field;network address management;SFX;URI;Wuhan University Library
隨著網(wǎng)絡(luò)技術(shù)和數(shù)字技術(shù)發(fā)展,開(kāi)放存取觀念深入人心,越來(lái)越多的信息資源可從網(wǎng)上獲取,于是越來(lái)越多的MARC記錄著錄了856$u子字段。856$u子字段是統(tǒng)一資源標(biāo)識(shí)(Uniform Resource Identification,URI)[1],最普遍的形式為統(tǒng)一資源定位符,它最大的缺點(diǎn)為當(dāng)信息資源的網(wǎng)址發(fā)生變更時(shí),原網(wǎng)址就變成無(wú)效網(wǎng)址。由于信息資源的網(wǎng)址有時(shí)會(huì)發(fā)生改變,因此,856 $u子字段的網(wǎng)址失效問(wèn)題頻現(xiàn)。由于圖書(shū)館受網(wǎng)速、網(wǎng)絡(luò)技術(shù)及人力資源等局限,難以對(duì)856字段網(wǎng)址進(jìn)行有效管理。目前相對(duì)856字段的網(wǎng)址研究較少,少數(shù)幾篇文章只針對(duì)某種類型的資源,如清華大學(xué)圖書(shū)館將電子期刊856$u子字段全部采用SFX(SFX為Exlibris公司推出的鏈接系統(tǒng))網(wǎng)址[2],蘭州理工大學(xué)圖書(shū)館將紙本資源856 $u子字段采用電子資源的網(wǎng)址[3],但均未對(duì)所有資源856字段的網(wǎng)址失效問(wèn)題給出系統(tǒng)性的解決方案。武漢大學(xué)圖書(shū)館致力于清理和維護(hù)所有資源856字段的失效網(wǎng)址,探索856字段的網(wǎng)址管理方案,以便更穩(wěn)定、有效地為用戶揭示信息資源的網(wǎng)上信息,為此,筆者以武漢大學(xué)圖書(shū)館西文書(shū)目庫(kù)為例討論856字段的網(wǎng)址管理實(shí)踐。
1.1網(wǎng)址管理的復(fù)雜性分析
1.1.1網(wǎng)址來(lái)源角度
856$u子字段的網(wǎng)址來(lái)源繁雜,主要有以下幾種:(1)商業(yè)數(shù)據(jù)庫(kù)。比如Springer、EBSCO、Elsevier等商業(yè)數(shù)據(jù)庫(kù)。當(dāng)套錄的MARC數(shù)據(jù)856字段為商業(yè)數(shù)據(jù)庫(kù)網(wǎng)址而本地沒(méi)有訂購(gòu)該資源時(shí),該網(wǎng)址失效。(2)免費(fèi)及開(kāi)放存取資源。比如聯(lián)合國(guó)文件、世界銀行金融報(bào)告、Google圖書(shū)。隨著開(kāi)放存取運(yùn)動(dòng)發(fā)展,網(wǎng)上免費(fèi)的及開(kāi)放存取的資源越來(lái)越多,它們與商業(yè)數(shù)據(jù)庫(kù)相比,資源更新更加快捷,但存放目錄易發(fā)生變化,且不易監(jiān)控與管理。(3)公共服務(wù)機(jī)構(gòu)。比如聯(lián)機(jī)計(jì)算機(jī)圖書(shū)館中心、中國(guó)高等教育文獻(xiàn)保障系統(tǒng)。這類機(jī)構(gòu)的網(wǎng)址有時(shí)也會(huì)出現(xiàn)失效的情況。(4)本地或區(qū)域性的網(wǎng)絡(luò)服務(wù)。本地或區(qū)域協(xié)作開(kāi)發(fā)的網(wǎng)絡(luò)信息資源服務(wù)往往只對(duì)本地或某區(qū)域有效,若該類網(wǎng)址被上傳到聯(lián)機(jī)合作編目中心并被其它機(jī)構(gòu)下載,則會(huì)變?yōu)槭У木W(wǎng)址。(5)零散的網(wǎng)站。零散網(wǎng)址來(lái)源于各種不同的獨(dú)立網(wǎng)站,各網(wǎng)站的特性及網(wǎng)址組成結(jié)構(gòu)存在差異,難以提取其共同特征,往往必須對(duì)各網(wǎng)址進(jìn)行逐條分析及逐條維護(hù),管理更加復(fù)雜。
1.1.2圖書(shū)館管理角度
由于856字段與網(wǎng)絡(luò)技術(shù)緊密聯(lián)系,因此,它與MARC記錄的常規(guī)字段不同,難以用傳統(tǒng)的編目模式進(jìn)行管理。另外,856字段的網(wǎng)址數(shù)量不斷增長(zhǎng),如武漢大學(xué)圖書(shū)館西文書(shū)目庫(kù)中的856字段網(wǎng)址數(shù)量達(dá)47萬(wàn)余條,受網(wǎng)速局限,檢測(cè)這些網(wǎng)址需耗費(fèi)較多時(shí)間,特別是網(wǎng)址指向國(guó)外網(wǎng)站或資源全文,因此,逐條維護(hù)如此多的網(wǎng)址是一個(gè)耗時(shí)很長(zhǎng)的工程。由于編目員往往有日工作量壓力,難以逐條維護(hù)856字段的網(wǎng)址。少數(shù)圖書(shū)館對(duì)856$u子字段采用穩(wěn)定的SFX網(wǎng)址,但由于SFX中央知識(shí)庫(kù)主要面向西文電子圖書(shū)和電子期刊,不可能給所有資源提供SFX網(wǎng)址,因此不能完全依靠SFX來(lái)解決網(wǎng)址失效問(wèn)題。
1.2網(wǎng)址需求分析
1.2.1不符合需求網(wǎng)址的原因
856字段的網(wǎng)址管理應(yīng)不限于管理失效的網(wǎng)址,理由是有些網(wǎng)址雖然有效,但并不符合用戶需求,如網(wǎng)址指向另一個(gè)不相關(guān)的資源,因此將網(wǎng)址管理歸結(jié)于管理不符合需求的網(wǎng)址。網(wǎng)址不符合需求的主要原因如下:
(1)受限。原因是MARC數(shù)據(jù)上傳時(shí)未濾掉適用于本地的網(wǎng)址,而編目員從書(shū)目中心套錄這些MARC數(shù)據(jù)時(shí)未刪除這些網(wǎng)址。針對(duì)這類問(wèn)題,CALIS聯(lián)合目錄中心曾規(guī)定本地系統(tǒng)電子資源的檢索網(wǎng)址不在聯(lián)合目錄中反映[4]。受限主要分為三種情況:一是IP地址受限,即訪問(wèn)資源的用戶IP地址不在允許訪問(wèn)的IP范圍之內(nèi);二是登錄受限,即需要輸入用戶名和密碼登錄才能訪問(wèn)資源;三是服務(wù)受限,指某種網(wǎng)絡(luò)資源的服務(wù)在某個(gè)區(qū)域內(nèi)暫停,如中國(guó)大陸地區(qū)不能獲得Google圖書(shū)的服務(wù)。
(2)網(wǎng)址改變。瀏覽這類網(wǎng)址時(shí)網(wǎng)頁(yè)通常顯示“page not found”。網(wǎng)址改變主要有三種情況:一是服務(wù)器關(guān)閉或網(wǎng)址改變;二是資源的存放路徑改變,如世界銀行金融報(bào)告的存取目錄曾發(fā)生變化;三是文件改名。
(3)拼寫(xiě)錯(cuò)誤。這是由于鍵入網(wǎng)址時(shí)疏忽大意,造成字符串拼寫(xiě)錯(cuò)誤或符號(hào)錯(cuò)誤,如網(wǎng)址“http://govinfo.library.unt.edu/ota/Ota_4/DATA/1985/8509.PDF.”的末尾多了句點(diǎn),去掉句點(diǎn)則可正常訪問(wèn)。
(4)數(shù)據(jù)庫(kù)商及出版商的調(diào)整。主要有三種情況:一是由于數(shù)據(jù)庫(kù)商間的收購(gòu)、重組以及數(shù)據(jù)庫(kù)平臺(tái)的轉(zhuǎn)換與升級(jí)而造成服務(wù)器地址的改變;二是由于資源的版權(quán)及出版商發(fā)展策略的調(diào)整而造成資源被移除或替換,如Edward Elgar、Ashgate、Gower出版社調(diào)整電子書(shū)發(fā)展策略而退出MyiLibrary聯(lián)盟,造成MyiLibrary數(shù)據(jù)庫(kù)中的一些電子書(shū)被下架;三是數(shù)據(jù)庫(kù)商正在整合資源,造成網(wǎng)址不穩(wěn)定,如施普林格科學(xué)與商業(yè)媒體集團(tuán)與麥克米倫科學(xué)與教育出版集團(tuán)合并,Palgrave Connect的電子書(shū)被整合到Springer電子書(shū)數(shù)據(jù)庫(kù)的過(guò)程中出現(xiàn)少數(shù)資源的DOI網(wǎng)址失效。
(5)網(wǎng)址指向不符。有兩種情況:一是網(wǎng)址指向與MARC記錄所揭示的資源不對(duì)應(yīng),如網(wǎng)址雖然可正常訪問(wèn),但其指向數(shù)據(jù)庫(kù)主站或檢索界面,并沒(méi)有提供對(duì)應(yīng)資源的任何信息;二是網(wǎng)址指向與對(duì)應(yīng)的$3、$y及$z等子字段的描述不匹配,如$3子字段描述為書(shū)評(píng),網(wǎng)址卻指向訂購(gòu)信息。
1.2.2符合需求網(wǎng)址的特性
(1)有效性。指網(wǎng)址不能失效或受限訪問(wèn),電子資源不像紙本資源可獲得物理紙質(zhì)的文獻(xiàn),當(dāng)電子資源的856字段網(wǎng)址無(wú)效時(shí),可認(rèn)定該MARC記錄為無(wú)效記錄,需將其刪除或屏蔽。
(2)對(duì)應(yīng)性。指網(wǎng)址應(yīng)指向MARC記錄所揭示的資源,不能指向不相關(guān)的資源或無(wú)關(guān)頁(yè)面。
(3)精準(zhǔn)性。當(dāng)MARC記錄對(duì)應(yīng)的資源有多個(gè)相關(guān)頁(yè)面時(shí),則網(wǎng)址指向應(yīng)與$3、$y及$z等子字段的描述相匹配,并指向最切合的頁(yè)面。
(4)集成性。為完整揭示資源,應(yīng)盡可能提供所揭示資源的信息集成化網(wǎng)頁(yè),如對(duì)連續(xù)出版物可提供各卷期的集成展示頁(yè)面,便于查看各卷期的信息。
以上特性中,前3個(gè)是必備特性,第4個(gè)為有則必備。據(jù)此,符合需求的網(wǎng)址應(yīng)為如下組合式:有效性AND對(duì)應(yīng)性AND精準(zhǔn)性O(shè)R集成性。若856字段的網(wǎng)址不符合該組合式,則需進(jìn)行維護(hù)。
2.1指導(dǎo)原則
(1)主動(dòng)管理。運(yùn)用網(wǎng)絡(luò)技術(shù)和鏈接技術(shù),將以用戶反饋為主的被動(dòng)管理模式變革為以提前預(yù)防、定期清理和加強(qiáng)網(wǎng)址穩(wěn)定性為主、用戶反饋為輔的主動(dòng)管理模式。
(2)高效管理。采取批量檢測(cè)與人工維護(hù)相結(jié)合的辦法,先利用軟件、工具、服務(wù)、平臺(tái)及編寫(xiě)程序代碼,高效地批量過(guò)濾出不符合需求的網(wǎng)址,再由人工進(jìn)行維護(hù),以提高網(wǎng)址管理的效率。
(3)保留原始信息。當(dāng)856字段原始網(wǎng)址不符合需求時(shí),先不要立即刪除,或用其它網(wǎng)址代替,而應(yīng)盡可能地從原服務(wù)器的網(wǎng)站上找到正確網(wǎng)址并予以修正,以保留原始信息。
(4)針對(duì)性管理。根據(jù)網(wǎng)址來(lái)源、網(wǎng)頁(yè)的HTTP返回代碼、網(wǎng)址的組成結(jié)構(gòu)及服務(wù)器主站的特性等因素制定針對(duì)性的網(wǎng)址管理方案,如對(duì)免費(fèi)及開(kāi)放存取資源,因其易變換資源的存放路徑,需回主站重新檢索以找到正確網(wǎng)址。
(5)穩(wěn)定性管理。盡可能采用OpenURL及DOI等穩(wěn)定網(wǎng)址,以保障網(wǎng)址的長(zhǎng)期有效性;若無(wú)法提供穩(wěn)定網(wǎng)址,則需加強(qiáng)網(wǎng)址監(jiān)控,定期清理和維護(hù)不符合需求的網(wǎng)址。
(6)預(yù)防性管理。不能僅維護(hù)書(shū)目庫(kù)中的網(wǎng)址,在MARC數(shù)據(jù)入本地書(shū)目庫(kù)前應(yīng)提前規(guī)范不符合需求的網(wǎng)址。
(7)聚類管理。隸屬同一主站的網(wǎng)址往往具有共同特征及相似的網(wǎng)址組成形式,因此可一并進(jìn)行管理。
(8)關(guān)聯(lián)性管理。可參考相關(guān)資源及信息而獲得符合需求的網(wǎng)址,如紙本資源與其對(duì)應(yīng)的電子資源網(wǎng)址可相互參考。
2.2管理策略
(1)套錄數(shù)據(jù)時(shí)預(yù)篩選網(wǎng)址。編目員手工套錄MARC數(shù)據(jù)時(shí),可在不檢測(cè)網(wǎng)址的情況下預(yù)篩選網(wǎng)址。預(yù)篩選可采取3種方式:一是當(dāng)856的$3、$y及$z等子字段有IP地址限制、需用戶名和密碼登錄及服務(wù)受限等描述時(shí),可直接刪除該856字段;二是若同一主站的所有網(wǎng)址均失效,則將該主站的網(wǎng)址加入網(wǎng)址黑名單,如Springer數(shù)據(jù)庫(kù)的清華鏡像站在本地早已失效,則將其主站網(wǎng)址“http://springer.lib.tsinghua.edu.cn”加入黑名單,這樣編目員套錄數(shù)據(jù)時(shí)碰到黑名單中的網(wǎng)址可直接刪除;三是將一些公共服務(wù)網(wǎng)站、免費(fèi)及開(kāi)放存取資源的網(wǎng)站列入白名單,提醒編目員注意保留這些網(wǎng)址,如將LC、OCLC、CALIS、WorldBank及聯(lián)合國(guó)等機(jī)構(gòu)的網(wǎng)址列入白名單。不論是白名單還是黑名單,都需不斷地維護(hù),以保障名單中網(wǎng)址的完整性和可靠性。
(2)MARC數(shù)據(jù)批導(dǎo)入前檢測(cè)網(wǎng)址。對(duì)數(shù)據(jù)庫(kù)商提供的電子資源MARC數(shù)據(jù),在其導(dǎo)入書(shū)目數(shù)據(jù)庫(kù)前需批量檢測(cè)其856字段網(wǎng)址的有效性,并將無(wú)效網(wǎng)址反饋數(shù)據(jù)商修改后,才能將MARC數(shù)據(jù)導(dǎo)入圖書(shū)館集成系統(tǒng)中。
(3)定期清理和維護(hù)書(shū)目庫(kù)中的網(wǎng)址。書(shū)目庫(kù)中的網(wǎng)址管理周期越長(zhǎng),不符合需求的網(wǎng)址就會(huì)積累得越多,因此,需綜合考慮書(shū)目庫(kù)中的網(wǎng)址總量、網(wǎng)址穩(wěn)定性的差異、人力及技術(shù)條件等因素,以確定符合本地實(shí)際情況的網(wǎng)址維護(hù)周期,對(duì)零散網(wǎng)址、免費(fèi)及開(kāi)放存取資源的網(wǎng)址則需縮短維護(hù)周期。
(4)管理SFX系統(tǒng)。SFX是ExLibris公司推出的基于OpenURL一站式開(kāi)放鏈接服務(wù)系統(tǒng)[5]。由于OpenURL為穩(wěn)定網(wǎng)址,可用來(lái)替換856字段不符合需求和不穩(wěn)定的網(wǎng)址,因此需管理好SFX系統(tǒng):第一,保障資源的完備性。SFX中激活的資源不能僅局限于本館訂購(gòu)的資源,而應(yīng)為本館可訪問(wèn)的資源,包括贈(zèng)送資源、免費(fèi)及開(kāi)放存取資源、紙本期刊的捆綁電子版,以便為盡可能多的資源提供穩(wěn)定的網(wǎng)址鏈接及更齊全的資源服務(wù)。第二,保障資源的精確性。嚴(yán)格按照數(shù)據(jù)庫(kù)商提供的資源清單來(lái)激活資源,若某資源的實(shí)際訪問(wèn)情況與資源清單有所出入,應(yīng)及時(shí)與數(shù)據(jù)庫(kù)商核實(shí)。第三,保障資源的及時(shí)性。一方面要求數(shù)據(jù)庫(kù)商及時(shí)告知資源的日常變化情況,以進(jìn)行SFX日常更新與維護(hù);另一方面,要求各數(shù)據(jù)庫(kù)商在每年年初提供資源的年度變化清單,包括新贈(zèng)資源、刪除及替換的資源,并在SFX中進(jìn)行年度大規(guī)模的更新。
3.1網(wǎng)址維護(hù)流程
步驟1:提取856字段。將書(shū)目庫(kù)中所有MARC記錄的856字段下載到一個(gè)文本文件中。
步驟2:批量檢測(cè)網(wǎng)址。Xenu死鏈接檢測(cè)工具和ALEPH系統(tǒng)的URL檢查服務(wù)提供網(wǎng)址檢測(cè)功能,其中ALEPH的URL檢查服務(wù)以文件形式返回856$u子字段的網(wǎng)頁(yè)HTTP錯(cuò)誤代碼,可清楚了解該網(wǎng)址無(wú)效的原因,選用它來(lái)初步檢測(cè)步驟1得到的856字段文件,以提取HTTP錯(cuò)誤代碼的網(wǎng)址。
步驟3:分析HTTP錯(cuò)誤代碼的網(wǎng)址。分析步驟2得到的HTTP錯(cuò)誤代碼的網(wǎng)址,對(duì)因請(qǐng)求參數(shù)有誤、語(yǔ)義有誤或服務(wù)器暫時(shí)停止響應(yīng)等原因而誤報(bào)的網(wǎng)址,需提取共同特征,如ECCO(Eighteenth Century Collections Online,18世紀(jì)作品在線)數(shù)據(jù)庫(kù)電子書(shū)因服務(wù)器不理解網(wǎng)頁(yè)請(qǐng)求語(yǔ)法而誤報(bào)為HTTP錯(cuò)誤代碼400,而該庫(kù)實(shí)際上均可正常訪問(wèn),該庫(kù)網(wǎng)址共有的字符串為“http://find.galegroup.com”。
步驟4:過(guò)濾有效網(wǎng)址。根據(jù)誤報(bào)網(wǎng)址的共同特征編寫(xiě)腳本程序?qū)⑵渑刻蕹?,以得到更精?zhǔn)的HTTP錯(cuò)誤代碼網(wǎng)址,并減少后續(xù)人工維護(hù)的工作量,如ECCO數(shù)據(jù)庫(kù)可通過(guò)匹配共有的字符串“http://find.galegroup.com”,以批量濾掉有效的ECCO庫(kù)網(wǎng)址。
步驟5:制定網(wǎng)址處理方案。分析步驟4得到的最終HTTP錯(cuò)誤代碼網(wǎng)址,查看其網(wǎng)頁(yè)錯(cuò)誤的顯示說(shuō)明,制定各種類型、各種來(lái)源網(wǎng)址的處理方案。
步驟6:維護(hù)網(wǎng)址。對(duì)HTTP錯(cuò)誤代碼網(wǎng)址不能立即刪除,需根據(jù)各網(wǎng)址的實(shí)際情況逐條進(jìn)行人工處理。
3.2HTTP錯(cuò)誤代碼分析
HTTP狀態(tài)碼為RFC2616規(guī)范定義的3位數(shù)字表示的網(wǎng)頁(yè)服務(wù)器響應(yīng)狀態(tài)碼,其中錯(cuò)誤代碼以數(shù)字4和5開(kāi)頭,4字頭代碼表示請(qǐng)求錯(cuò)誤,5字頭代碼表示服務(wù)器錯(cuò)誤[6]。根據(jù)對(duì)武漢大學(xué)圖書(shū)館西文書(shū)目庫(kù)中856$u子字段的HTTP返回錯(cuò)誤代碼的統(tǒng)計(jì)和分析(見(jiàn)表1),制定處理方案:(1)403代碼通常為IP地址受限,可刪除該代碼的網(wǎng)址。(2)404代碼往往因資源改變了存放路徑而顯示找不到網(wǎng)頁(yè),需找到檢索入口重新檢索。(3)500代碼占錯(cuò)誤代碼的大部分,500代碼的網(wǎng)址情況較繁雜,部分網(wǎng)址無(wú)法顯示網(wǎng)頁(yè),部分網(wǎng)址卻有效,因此需重點(diǎn)清理此代碼的網(wǎng)址。
表1 HTTP返回錯(cuò)誤代碼的統(tǒng)計(jì)
3.3網(wǎng)址處理
人工逐條處理856$u子字段的HTTP返回錯(cuò)誤代碼的網(wǎng)址,可采取以下方法處理:
(1)修正拼寫(xiě)錯(cuò)誤。對(duì)明顯的網(wǎng)址拼寫(xiě)錯(cuò)誤,如多出的標(biāo)點(diǎn)符號(hào),可直接修改。
(2)重新檢索。一些不符合需求的網(wǎng)址往往可通過(guò)在原庫(kù)中找到檢索入口重新檢索而找到正確網(wǎng)址,重檢適用于以下情況:一是原網(wǎng)址指向錯(cuò)誤,如指向服務(wù)器主站、檢索主頁(yè)或同一主站的另一資源,如一些聯(lián)合國(guó)文檔的856字段網(wǎng)址指向聯(lián)合國(guó)文檔系統(tǒng)的檢索主頁(yè),則需在檢索主頁(yè)中重新檢索;二是服務(wù)器主站網(wǎng)址改變,如H-NET(Humanities&Social Sciences Online)庫(kù)主站網(wǎng)址由“http://www.h-net.org”改為“https://networks.h-net.org/”,則需在新網(wǎng)站中重新檢索;三是資源的存放路徑改變,如世界銀行Worldbank的一些免費(fèi)文檔;四是存放資源的文件改名。重檢的先決條件是必須找到檢索入口,當(dāng)原網(wǎng)頁(yè)未提供檢索入口時(shí),可采取兩種方法找到檢索入口:(1)從同一主站且可正常訪問(wèn)的另一資源的網(wǎng)頁(yè)中找到檢索入口;(2)用逐層刪除法找到檢索入口。網(wǎng)址的組成形式通常為“http://服務(wù)器地址:端口號(hào)/目錄1/目錄2/目錄3/....../目錄N/文件名”,逐層刪除法以“/”符號(hào)將網(wǎng)址分層,再?gòu)木W(wǎng)址尾部從后往前刪除一層,然后檢查網(wǎng)址是否有檢索入口,若沒(méi)有則再?gòu)暮笸皠h除一層,直至刪到服務(wù)器地址為止。
(3)試探正確網(wǎng)址。當(dāng)無(wú)法找到重檢入口時(shí),可試探正確網(wǎng)址,如網(wǎng)址“http://firstsearch. global.oclc.org/dbname=WILSONSELECTPLUS;FSIP”顯示找不到網(wǎng)頁(yè),也找不到重檢入口,但隸屬同一個(gè)數(shù)據(jù)庫(kù)的另一資源可正常訪問(wèn),其網(wǎng)址為“http://firstsearch.oclc.org/journal=0033-5606;screen=info;ECOIP”,分析該網(wǎng)址組成形式,將該網(wǎng)址中區(qū)分不同資源個(gè)體的特征項(xiàng)“journal=”后的ISSN號(hào)替換為找不到網(wǎng)頁(yè)期刊的ISSN號(hào),則可試探出正確網(wǎng)址。
(4)刪除網(wǎng)址。刪除網(wǎng)址應(yīng)謹(jǐn)慎,刪除不符合需求的網(wǎng)址有5種情況:一是服務(wù)器拒絕用戶的請(qǐng)求;二是受限訪問(wèn),包括IP受限、登錄受限及服務(wù)受限;三是資源被移除或下架;四是網(wǎng)址拼寫(xiě)明顯錯(cuò)誤且無(wú)法改正,如網(wǎng)址為“792614. htm”;五是運(yùn)用各種方法都無(wú)法在原庫(kù)中找到正確網(wǎng)址。
(5)替換網(wǎng)址。若MARC數(shù)據(jù)揭示的資源在SFX中已激活,且其856$u子字段的網(wǎng)址包含在SFX來(lái)源之中,則以SFX網(wǎng)址代替該856$u子字段的網(wǎng)址。
(6)補(bǔ)充網(wǎng)址。若刪除856$u子字段的網(wǎng)址后該MARC記錄再無(wú)856$u子字段,為更好地揭示資源,應(yīng)盡可能地補(bǔ)充有效網(wǎng)址,若MARC記錄揭示的資源在SFX中已激活,則在856$u子字段添加SFX網(wǎng)址;若MARC記錄揭示的資源在SFX中未激活,則紙本資源與其對(duì)應(yīng)電子資源的網(wǎng)址可相互復(fù)制。
[1][4]CALIS聯(lián)機(jī)合作編目中心.CALIS西文圖書(shū)編目業(yè)務(wù)培訓(xùn)教材(普通班)[Z].北京:CALIS聯(lián)機(jī)合作編目中心,2009:150-152.
[2]賈延霞,呂肖華,楊慧,等.電子期刊編目方法新嘗試——以清華大學(xué)圖書(shū)館的實(shí)踐為例[J].圖書(shū)館建設(shè),2011(4):43-46,50.
[3]李征.856字段對(duì)館藏紙本資源與電子資源的雙向有效揭示[J].圖書(shū)館建設(shè),2010(2):43-46.
[5]黃美君,姜愛(ài)蓉.合適的鏈接最佳的服務(wù)——SFX與CrossRef/DOI交互作用探討[J].圖書(shū)情報(bào)工作,2006,50(3):91-94.
[6]David Gourley,Brian Totty,Marjorie Sayer,et al. HTTP權(quán)威指南[M].陳涓,趙振平,譯.北京:人民郵電出版社,2012:10,62-70.
(責(zé)任編輯:鄺玥)
Exploration on the Management of Network Address in Field 856——Taking Wuhan University Library as an Example
CHENG Ying
程穎,女,碩士,武漢大學(xué)圖書(shū)館館員。
2016-06-07
*本文系湖北省高校圖書(shū)情報(bào)工作委員會(huì)科研基金研究項(xiàng)目“數(shù)字資源的元數(shù)據(jù)管理知識(shí)體系”(項(xiàng)目編號(hào):2013YB08)研究成果之一