• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      三大中文期刊全文庫收錄年限相符度探究

      2010-09-05 09:57:12楊魯捷
      大學圖書館學報 2010年4期
      關鍵詞:種數(shù)創(chuàng)刊年限

      □楊魯捷

      1 引 言

      在讀者對期刊全文數(shù)據(jù)庫依賴程度越來越高的大背景下,期刊全文數(shù)據(jù)庫收錄年限相符度的問題應引起圖書館工作者的關注。根據(jù)數(shù)據(jù)庫官方網(wǎng)站提供的信息:清華大學主辦的“中國學術期刊網(wǎng)絡出版總庫”(簡稱清華庫)所收最早的期刊為1915年出版,部分期刊回溯到創(chuàng)刊[1];維普資訊的“中文科技期刊數(shù)據(jù)庫”(簡稱維普庫)從 1989年起收[2];萬方數(shù)據(jù)的“萬方學術期刊數(shù)據(jù)庫”(簡稱萬方庫)從1998年開始收錄[3]。使用“收錄年限”、“收錄期刊年限”作為檢索詞,在上述三庫中檢索得到 20篇左右的相關文獻,這些論文[4-8]提到數(shù)據(jù)庫收錄年限問題時,除石光 2008年在《中文期刊全文數(shù)據(jù)庫收錄圖書情報學期刊的比較研究》一文涉及收錄年限完整性的問題外,其他文獻總是直接引用數(shù)據(jù)庫供應商的宣傳,沒有對數(shù)據(jù)庫實際收錄期刊年限進行調(diào)查,但石光的研究僅限于對圖書情報類期刊收錄完整性的比較,并不掌握期刊全文庫收錄年限相符度的整體情況。

      僅根據(jù)數(shù)據(jù)庫供應商提供的信息,往往會給很多用戶造成這樣一種印象——這些期刊全文數(shù)據(jù)庫收錄的成千上萬種期刊,都是從某某年開始收錄,非常完整,有了這些數(shù)據(jù)庫就等于擁有了從某某年開始至今的全部期刊,一年都不會缺漏,印本期刊的管理就可以放松要求了……。但是一個眾所周知的事實是——并非所有的期刊都是從1915年或 1989年創(chuàng)刊并一直存在,數(shù)據(jù)庫收錄某刊也未必能從該刊的創(chuàng)刊年開始收錄。甚至還存在一種情況,某刊存在,同時也在數(shù)據(jù)庫設定的收錄范圍內(nèi),但數(shù)據(jù)庫卻未收錄。例如,1981年創(chuàng)刊的《大學圖書館學報》,清華、維普、萬方三庫分別從 1983年、1989年、1998年起收,而1992年創(chuàng)刊的《國家圖書館學刊》,清華、維普、萬方三庫實際起收年則為1992年、2000年和2001年。由此二例即可看出,期刊全文數(shù)據(jù)庫的實際收錄年限與其官方網(wǎng)站上提供的收錄年限未必相符,在數(shù)據(jù)庫中,與宣稱的收錄年限不符的期刊有多少,占收錄期刊的多大比例,尚未有人作過統(tǒng)計,這正是本文研究的問題。

      2 方法和過程

      2.1 方法

      為了檢驗數(shù)據(jù)庫收錄年限的相符程度,筆者提出了“收錄年限相符度”的概念,“收錄年限相符度”(Indexed Year Match Degree)縮寫為“IYMD” ,是指數(shù)據(jù)庫收錄期刊中與數(shù)據(jù)庫公布的收錄年限相符的刊種數(shù)(n)與數(shù)據(jù)庫收錄的全部刊種數(shù)(N)之比。后文均以“IYMD”代表該概念。“IYMD”需要實際統(tǒng)計才能獲得,不可想當然地認為IYMD=100%。對于收錄期刊種數(shù)眾多的綜合型數(shù)據(jù)庫而言,更要使用抽樣統(tǒng)計的方法進行計算。本文以三大中文期刊全文數(shù)據(jù)庫為例對數(shù)據(jù)庫的“IYMD”問題進行研究,并以實例演示“IYMD”的計算方法。

      根據(jù)2009年10月份獲得的三庫期刊導航的數(shù)據(jù),清華庫收錄期刊7531種[9],維普庫收錄期刊15870種[10],萬方庫收錄期刊 6414種[11],由于涉及期刊種數(shù)眾多,故本文采用了抽樣統(tǒng)計的方法計算三庫的“IYMD”,并對影響“IYMD”的重要因素進行分析。

      圖1 樣本數(shù)量計算公式

      上圖所示公式是不重復抽樣時,計算整體成數(shù)應抽樣本數(shù)量的計算公式。成數(shù)是指一數(shù)為另一數(shù)的幾成,泛指比例[12]。公式中:“n”為在一定的極限誤差和置信度要求下,應抽取的樣本數(shù)量,本次統(tǒng)計中極限誤差設定為±5%,置信度要求是95%;“N”是總體數(shù)量;“Δ p”是統(tǒng)計項目允許的抽樣誤差范圍;“z”是標準正態(tài)分布雙側(cè)臨界值,該值與統(tǒng)計項目要求的概率置信度對應,在95%的置信度要求下 ,“z”值為 1.96;“ P” 是總體成 數(shù),根據(jù)統(tǒng)計學 知識,如果過去進行過此方面調(diào)查,可取最大值,如果沒有進行此方面調(diào)查 ,取 p=0.5;“Q”=1-P。

      按該公式計算得到,考察三庫“IYMD”需要抽取期刊的種數(shù)分別為:清華庫366種,維普庫376種,萬方庫362種。

      2.2 過程簡介

      具體的選刊和統(tǒng)計過程中分為三個階段:階段一,構(gòu)建三庫收錄期刊數(shù)據(jù)表;階段二,根據(jù)“成數(shù)樣本容量計算公式”計算得到應抽取樣本刊的種數(shù),對三庫收錄期刊按刊名排序后進行等間隔抽樣;階段三,對抽樣選取的期刊,逐刊檢索并記錄其在相應數(shù)據(jù)庫中實際收錄年限,記錄完成后進行“IYMD”計算。

      2.2.1 構(gòu)建三庫收錄期刊數(shù)據(jù)庫

      根據(jù)三庫期刊導航信息,將三庫收錄期刊目錄導入數(shù)據(jù)庫程序,可以構(gòu)建三庫收錄期刊的數(shù)據(jù)表。由于涉及數(shù)據(jù)多,本文僅將三庫收錄期刊數(shù)據(jù)表的截圖放在文中,如圖2。本文采集數(shù)據(jù)的時間是2009年10月。

      2.2.2 選擇期刊、獲取期刊收錄年限數(shù)據(jù)

      在數(shù)據(jù)庫收錄期刊表整理完畢后,先按期刊刊名首字母字順排列,再按照一定的間隔選取期刊、核對其實際收錄年份。間隔確定依據(jù)的公式是s=INT(N/n)-1,其中“s”代表間隔 ,“N”代表“數(shù)據(jù)庫收錄期刊種數(shù)”,“n”代表“應抽取期刊種數(shù)”,“INT”為將數(shù)值向下取整為最接近的整數(shù)。以清華庫為例,清華庫收錄期刊按刊名拼音首字母排序后,等距選取期刊的間隔為19(19=INT(7531/366)-1)。將三庫收錄期刊均按此法選取對應種數(shù)的期刊后,逐一在數(shù)據(jù)庫中檢索并記錄其實際收錄年限,得到圖3。

      圖2 三庫收錄期刊表截圖

      圖3 三庫選取期刊及收錄年限記錄表截圖

      3 結(jié)果及討論

      3.1 三庫的“IYMD”

      經(jīng)檢索得到三庫收錄期刊的實際年限信息后,即可通過計算得到三庫的“IYMD”,計算結(jié)果記錄在表1中??膭?chuàng)刊年的檢索、記錄,比較三方面的關系,得到如圖4所示三個數(shù)據(jù)表,以表中數(shù)據(jù)為依據(jù),對各種關系類型的期刊比例進行統(tǒng)計,結(jié)果記錄在表2中。

      表1 數(shù)據(jù)庫收錄期刊年限相符度記錄表

      圖4 三庫收錄年限、實際收錄年、期刊創(chuàng)刊年關系比較過程截圖

      根據(jù)統(tǒng)計,可以得到如下結(jié)果:按照三庫公布的收錄時限,清華庫的“IYMD”是 73.8%,維普庫的“IYMD”是 31.7%。萬方庫如果按1998年為收錄起始年,“IYMD”僅為7.5%,即使將萬方庫的起始年定為1999年,其“IYMD”也僅僅達到23.8%。

      3.2 “IYMD”主要影響因素分析

      影響“IYMD”的主要因素有:①數(shù)據(jù)庫收錄年限、實際收錄年份與期刊創(chuàng)刊年的關系;②數(shù)據(jù)庫對更名刊的處理方式;③建庫依據(jù)的印本資源;④其他可能因素。因素③是指建庫過程中使用紙本期刊資源的完整性,由于三庫分別以清華大學圖書館、中國科技情報所重慶分所、中國科學技術信息研究所的紙本期刊資源為依據(jù),且三庫均可使用國內(nèi)開展的文獻傳遞服務,因此三庫可使用的印本期刊資源實際上是相同的,本文不作深究。其他可能的影響因素待后續(xù)工作進行研究,本文重點對第 1、第2兩個因素進行研究。

      3.2.1 數(shù)據(jù)庫收錄年限標準、實際收錄年份、期刊創(chuàng)刊年關系比較

      根據(jù)統(tǒng)計學的定義,統(tǒng)計數(shù)據(jù)庫“收錄年限”、“實際收錄年份”與“期刊創(chuàng)刊時間”三方面各類型關系的比例也屬于計算“成數(shù)”的范疇,因此獲取三庫三方面各關系類型信息所需抽取的期刊種數(shù)仍為366種、376種與 362種,本文仍使用統(tǒng)計“IYMD”時抽取的期刊為樣本進行統(tǒng)計。通過對三庫選取期

      在獲取了三庫選定期刊的創(chuàng)刊時間、實際收錄年限后,對比三庫收錄期刊的公示年限,本文對三庫中不在公示年限的期刊,也就是“起收年晚于收錄標準”的期刊作進一步分析。結(jié)果匯總在表3中。

      通過對“收錄年限”、“實際收錄年份”與“期刊創(chuàng)刊年”三者關系的比較,發(fā)現(xiàn)三庫都存在一定比例的“應收未收”的期刊,也就是期刊已經(jīng)創(chuàng)刊并發(fā)行,在數(shù)據(jù)庫應收錄年限范圍內(nèi),但數(shù)據(jù)庫未收錄的期刊。三庫存在這種現(xiàn)象的期刊所占比例分別為9.8%、23.1%、80.1%。

      表2 三庫收錄年限、實際收錄年、期刊創(chuàng)刊年關系記錄表

      表3 不在收錄公示年限的期刊比例

      3.2.2 更名刊處理方式對收錄年限的影響

      為探討數(shù)據(jù)庫對更名刊處理方式的不同是否會對收錄年限造成影響,筆者按統(tǒng)計學的要求,對三庫共收的更名刊的處理方式以及不同處理方式所占的比例進行了統(tǒng)計,統(tǒng)計結(jié)果匯總在表4

      表4 三庫對更名刊的處理方式匯總表

      總結(jié)三庫對更名刊的處理方式,得到的結(jié)果是:清華庫 93.9%的期刊使用了自動跳轉(zhuǎn)功能,新、老刊名的檢索結(jié)果指向的是同一條記錄。維普庫中能檢索到的老刊名雖不自動跳轉(zhuǎn)到新刊名,但新老刊名原文鏈接使用相同的記錄。萬方庫收錄年限較短,65.6%的更名刊僅收錄了期刊更名后的部分,另外32.8%的期刊能跳轉(zhuǎn)到新刊名,老刊名不獨立列出。維普庫和萬方庫均有個別期刊更名前后使用兩條記錄表示,但比例很小,均小于 1%。綜合而言,更名刊處理方式對數(shù)據(jù)庫判斷期刊收錄年限相符度影響不大。

      4 結(jié)論

      (1)現(xiàn)有的中文期刊全文數(shù)據(jù)庫收錄年限相符度偏低的現(xiàn)象應引起圖書館工作者、尤其是期刊工作者的重視,萬萬不可主觀地認為使用了期刊全文數(shù)據(jù)庫就擁有了全部期刊文獻,更不能因為購買了全文數(shù)據(jù)庫就放松對印本期刊的收藏和管理,只有在可靠的經(jīng)濟、技術、法律保障前提下,才能考慮用數(shù)字化期刊完全替代印本期刊。

      (2)圖書館用戶對期刊全文數(shù)據(jù)庫的依賴程度越來越高,因此提高數(shù)據(jù)庫質(zhì)量的要求日益緊迫,數(shù)據(jù)庫開發(fā)商應義不容辭地對“應收未收”的期刊進行補全,以提高期刊全文數(shù)據(jù)庫的收錄質(zhì)量。

      (3)在本文研究過程中筆者注意到,不僅存在收錄年限相符度問題,收錄期刊的連續(xù)性也存在問題。也就說數(shù)據(jù)庫中存在漏年、漏期現(xiàn)象,應引起重視。

      1 中國學術期刊(光盤版)電子雜志社.“中國學術期刊網(wǎng)絡出版總庫”簡介.[2009-10-01].http://epub.cnki.net/grid2008/jianjie/introduction.ashx?dbprefix=CJFQ

      2 維普資訊.中文科技期刊數(shù)據(jù)庫機構(gòu)鏡像版首頁.[2009-10-01].http://202.197.191.202/index.asp

      3 萬方數(shù)據(jù)有限公司.萬方數(shù)據(jù)知識服務平臺——幫助中心.[2009-10-01].http://www.wanfangdata.com.cn/help/index.html

      4 石光.中文期刊全文數(shù)據(jù)庫收錄圖書情報學期刊的比較研究.農(nóng)業(yè)圖書情報學刊,2008(3):121-124

      5 彭曉慶等.中國期刊網(wǎng)、萬方數(shù)字化期刊與中文科技期刊數(shù)據(jù)庫內(nèi)容性能之比較.中國索引,2007(1):48-52

      6 李樹民,許靜.中國三大全文數(shù)據(jù)庫收錄醫(yī)藥類專業(yè)期刊比較分析.農(nóng)業(yè)圖書情報學刊,2007(7):162-165

      7 杜云祥等.國內(nèi)5大中文生物醫(yī)學期刊數(shù)據(jù)庫文獻收錄比較研究.預防醫(yī)學情報雜志,2006(2):162-166

      8 顧立茵.網(wǎng)上三大中文期刊數(shù)據(jù)庫特點功能比較.現(xiàn)代情報,2005(1):135-137

      9 中國學術期刊(光盤版)電子雜志社.中國學術期刊網(wǎng)絡出版總庫期刊導航.[2009-10-02].http://acad.cnki.net/Kns55/oldnavi/n_Navi.aspx?NaviID=100

      10 維普資訊.中文科技期刊數(shù)據(jù)庫期刊導航.[2009-10-02].http://202.197.191.202/Visitnew.asp

      11 萬方數(shù)據(jù)有限公司.萬方數(shù)據(jù)學術期刊期刊導航.[2009-10-02].http://c.wanfangdata.com.cn/periodical.aspx

      12 范秀榮,蘇繼偉.統(tǒng)計學.成都:西南財經(jīng)大學出版社,2007:206-209

      猜你喜歡
      種數(shù)創(chuàng)刊年限
      影響種公牛使用年限的幾個因素與解決辦法
      創(chuàng)刊40周年抒懷
      1994:創(chuàng)刊
      商界(2019年12期)2019-01-03 06:59:05
      請“球”入“盒”問題八例
      請“球”入“盒”問題八例
      不同產(chǎn)地、生長年限銀杏葉總多酚含量比較
      中成藥(2017年6期)2017-06-13 07:30:35
      創(chuàng)刊寄語
      體外發(fā)酵法評定不同茬次和生長年限苜蓿的營養(yǎng)價值
      全國少數(shù)民族文字期刊分類種數(shù)、印數(shù)、總印張、總金額
      全國各地區(qū)少兒期刊、畫刊出版的種數(shù)、印數(shù)、總印張、總金額
      九龙城区| 玉门市| 罗山县| 临漳县| 满城县| 宁陵县| 邢台市| 保亭| 长岭县| 修水县| 信丰县| 巴东县| 台湾省| 东海县| 闸北区| 吴江市| 额济纳旗| 普安县| 绥化市| 甘南县| 辉南县| 土默特右旗| 介休市| 迭部县| 琼结县| 和平县| 翁源县| 通渭县| 祁东县| 墨江| 高陵县| 临朐县| 河西区| 团风县| 厦门市| 漾濞| 平定县| 随州市| 松潘县| 西城区| 黄山市|