昌建納
〔摘 要〕以VIP和CNKI為數(shù)據(jù)源,運(yùn)用關(guān)鍵詞統(tǒng)計(jì)方法分析我國(guó)圖書(shū)情報(bào)界關(guān)于數(shù)據(jù)庫(kù)建設(shè)研究論文的主題內(nèi)容和研究特征。結(jié)果表明:研究主題集中于各類(lèi)型數(shù)據(jù)庫(kù)的建設(shè)實(shí)踐方面,注重建庫(kù)資料來(lái)源、質(zhì)量控制和現(xiàn)代科學(xué)技術(shù)的應(yīng)用研究,網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、知識(shí)產(chǎn)權(quán)是近期研究的熱點(diǎn)和難點(diǎn)??傮w研究特征,微觀層面的經(jīng)驗(yàn)總結(jié)性探索居多,宏觀層面理論指導(dǎo)性研究偏少,數(shù)據(jù)庫(kù)建設(shè)研究?jī)?nèi)容隨時(shí)代發(fā)展變化而變化。
〔關(guān)鍵詞〕關(guān)鍵詞統(tǒng)計(jì);圖書(shū)情報(bào)界;數(shù)據(jù)庫(kù)建設(shè)研究
〔中圖分類(lèi)號(hào)〕G350 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2009)09-0143-05
Study on Construction Database in Library and Information
Science in China from Keyword StatisticsChang Jianna
(Library,Yunna University,Kunming 650091,China)
〔Abstract〕Taking VIP & CNKI as the statistical source,this paper made a statistic and analysis about contents and trends of research papers of construction database in library and information science in china by applying keyword statistics.The results showed that:focus on various types of construction database,database origins,quality control and the application of modem science and technology,and net word database and intellectual property rights were the hotspots and tough issues.Study on overall characteristic display the macro-level study of theory was not more as micro-level experience and exploration,and this study content of development with time change.
〔Key words〕keyword statistics;library and information science;construction database research
我國(guó)數(shù)據(jù)庫(kù)建設(shè)已有30余年歷史,經(jīng)過(guò)引進(jìn)、學(xué)習(xí)、借鑒國(guó)外數(shù)據(jù)庫(kù)理論成果的起步階段(1975-1979年),研究和自建中文數(shù)據(jù)庫(kù)的發(fā)展階段(1980-1993年),以1993年2月我國(guó)第一家專(zhuān)業(yè)數(shù)據(jù)庫(kù)公司——“萬(wàn)方數(shù)據(jù)庫(kù)公司”的成立為標(biāo)志,進(jìn)入了成熟實(shí)用及飛速發(fā)展階段(1993年-至今)[1]。目前代表性數(shù)據(jù)庫(kù)有:國(guó)家圖書(shū)館的《中國(guó)國(guó)家書(shū)目數(shù)據(jù)庫(kù)》、中國(guó)科學(xué)院的《西文期刊聯(lián)合目錄庫(kù)》、清華同方的《中國(guó)期刊全文數(shù)據(jù)庫(kù)》等。此外,國(guó)內(nèi)各行業(yè)根據(jù)科學(xué)發(fā)展和研究的需要建立了大批專(zhuān)業(yè)數(shù)據(jù)庫(kù),各圖書(shū)情報(bào)機(jī)構(gòu)也根據(jù)自身需求建立了各種內(nèi)容的書(shū)目、文摘、全文、多媒體等類(lèi)型數(shù)據(jù)庫(kù)。與此同時(shí),關(guān)于數(shù)據(jù)庫(kù)建設(shè)的研究也隨之興起,為了解國(guó)內(nèi)圖書(shū)情報(bào)界關(guān)于數(shù)據(jù)庫(kù)建設(shè)研究的發(fā)展脈絡(luò)和研究的總體特征。本文借助網(wǎng)絡(luò)資源數(shù)據(jù)進(jìn)行統(tǒng)計(jì),分析這一研究領(lǐng)域的主題內(nèi)容和發(fā)展趨勢(shì),展示當(dāng)前研究的特點(diǎn),以利于今后的繼續(xù)研究。
1 數(shù)據(jù)獲取與處理
采用《中文科技期刊數(shù)據(jù)庫(kù)》和《中國(guó)學(xué)術(shù)期刊全文數(shù)據(jù)庫(kù)》為數(shù)據(jù)來(lái)源庫(kù),考慮到數(shù)據(jù)庫(kù)的建設(shè)還可以用構(gòu)建、建立、創(chuàng)建、自建等詞匯表述,以T=數(shù)據(jù)庫(kù)*T=建*U=(圖書(shū)+情報(bào))為檢索式,在《中文科技期刊數(shù)據(jù)庫(kù)》中檢出論文1 570篇,再以數(shù)據(jù)庫(kù)and建and(圖書(shū)or情報(bào))進(jìn)行主題檢索,在《中國(guó)學(xué)術(shù)學(xué)術(shù)期刊全文數(shù)據(jù)庫(kù)》中檢出1 211篇(檢索時(shí)間為2008年月10月)。將檢出的論文下載,合并后剔除重復(fù)以及無(wú)關(guān)論文,共1 556篇。
關(guān)鍵詞是表達(dá)文獻(xiàn)主題概念的自然語(yǔ)言詞匯,某學(xué)科相關(guān)文獻(xiàn)關(guān)鍵詞的分布頻次與特征能顯示該學(xué)科的總體內(nèi)容特征,研究?jī)?nèi)容之間的內(nèi)在聯(lián)系,學(xué)術(shù)研究的發(fā)展脈絡(luò)與發(fā)展方向,學(xué)術(shù)研究的重點(diǎn)與熱點(diǎn)等[2]。本文選用單關(guān)鍵詞統(tǒng)計(jì)。把論文關(guān)鍵詞導(dǎo)入Excel工作表,利用表格查找功能查關(guān)鍵詞,將出現(xiàn)頻率>10次的詞匯按頻次的高低列表。以高頻關(guān)鍵詞和研究論文內(nèi)容相結(jié)合方式進(jìn)行論文研究主題的分析,考查我國(guó)圖書(shū)情報(bào)界關(guān)于數(shù)據(jù)庫(kù)建設(shè)研究的現(xiàn)狀、研究特點(diǎn)和發(fā)展變化,為今后的繼續(xù)研究提供參考。
2 研究論文的關(guān)鍵詞統(tǒng)計(jì)分析
關(guān)于我國(guó)圖書(shū)情報(bào)界數(shù)據(jù)庫(kù)建設(shè)這一專(zhuān)題研究,從其研究論文的關(guān)鍵詞詞頻統(tǒng)計(jì)表中可見(jiàn),出現(xiàn)頻率最高的關(guān)鍵詞是數(shù)據(jù)庫(kù),其次為建設(shè),表明高頻關(guān)鍵詞與研究主題相吻合。具體研究?jī)?nèi)容可分為下述方面:
2.1 數(shù)據(jù)庫(kù)類(lèi)型研究
由表1可見(jiàn),特色數(shù)據(jù)庫(kù)和書(shū)目數(shù)據(jù)庫(kù)是被研究最多的2種數(shù)據(jù)庫(kù)類(lèi)型。特色文獻(xiàn)數(shù)據(jù)庫(kù)是建庫(kù)單位根據(jù)自身特色文獻(xiàn)資源和用戶(hù)特定需求開(kāi)發(fā)、有著獨(dú)特內(nèi)容的數(shù)據(jù)庫(kù),具有專(zhuān)業(yè)學(xué)科、區(qū)域特征、地方文化、館藏特色等諸多特點(diǎn)。特色文獻(xiàn)數(shù)據(jù)庫(kù)的建立是建庫(kù)單位深層次開(kāi)發(fā)文獻(xiàn)資源,為用戶(hù)提供特色服務(wù)的重要手段,也是資源共享的基礎(chǔ),因而是數(shù)據(jù)庫(kù)建設(shè)研究極為關(guān)注的問(wèn)題。關(guān)鍵詞出現(xiàn)頻率十分高,尤其是進(jìn)入21世紀(jì)以來(lái)增多;統(tǒng)計(jì)還發(fā)現(xiàn)關(guān)于書(shū)目數(shù)據(jù)庫(kù)的建設(shè)研究主要集中在上世紀(jì)80~90年代,書(shū)目數(shù)據(jù)庫(kù)的建立對(duì)于充分揭示館藏,為用戶(hù)快捷查找所需資料提供便利,也是圖書(shū)館實(shí)現(xiàn)自動(dòng)化管理的前提和保障。為滿足自動(dòng)化系統(tǒng)對(duì)目錄數(shù)據(jù)的要求,1980年北京成立了MARC協(xié)作組為制定中國(guó)的機(jī)讀目錄探索經(jīng)驗(yàn),1990年正式發(fā)行中國(guó)機(jī)讀目錄,高校和省市圖書(shū)館分別開(kāi)始了中文書(shū)目的建設(shè)[3]。書(shū)目數(shù)據(jù)庫(kù)建設(shè)的研究也隨之興起,所以關(guān)鍵詞詞頻也較高。與之相關(guān)的高頻關(guān)鍵詞還有:機(jī)讀目錄、聯(lián)合目錄、回溯書(shū)目、目錄數(shù)據(jù)庫(kù)、計(jì)算機(jī)編目、MARC等等;全文數(shù)據(jù)庫(kù)也是高頻關(guān)鍵詞之一,全文數(shù)據(jù)庫(kù)的建成可以滿足用戶(hù)獲取文獻(xiàn)資料原文的需求,是數(shù)據(jù)庫(kù)建設(shè)追求的完美目標(biāo),近年來(lái)與之相對(duì)應(yīng)的研究增多;專(zhuān)題數(shù)據(jù)庫(kù)指關(guān)于某一特定學(xué)科、特定主題或某一專(zhuān)門(mén)問(wèn)題的數(shù)據(jù)集合,專(zhuān)題數(shù)據(jù)庫(kù)建設(shè)可提供專(zhuān)業(yè)性、專(zhuān)題性服務(wù),是圖書(shū)館開(kāi)展專(zhuān)題信息服務(wù)的最佳體現(xiàn)。關(guān)于專(zhuān)題研究的內(nèi)容十分廣泛,可從數(shù)據(jù)庫(kù)資料來(lái)源研究中窺見(jiàn)一斑,專(zhuān)題數(shù)據(jù)庫(kù)出現(xiàn)的頻率也高。此外,還有下述幾種數(shù)據(jù)庫(kù)建設(shè)的研究較多。
學(xué)位論文是高校圖書(shū)館的特色館藏,不公開(kāi)出版,與學(xué)校的學(xué)科密切結(jié)合,反映學(xué)校各專(zhuān)業(yè)領(lǐng)域發(fā)展水平、研究進(jìn)展,具有很高的學(xué)術(shù)價(jià)值和情報(bào)價(jià)值。關(guān)于學(xué)位論文庫(kù)建設(shè)研究的內(nèi)容有:學(xué)位論文庫(kù)建設(shè)的總體設(shè)計(jì)、元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)庫(kù)功能、建設(shè)流程和實(shí)現(xiàn)方法、闡述建庫(kù)實(shí)踐過(guò)程和經(jīng)驗(yàn)、探討建庫(kù)引發(fā)的種種問(wèn)題、進(jìn)行國(guó)內(nèi)外學(xué)位論文庫(kù)的比較研究等等。
我國(guó)古籍記錄了中華民族五千年的歷史進(jìn)程,是中華各民族文化積淀的載體,是研究傳統(tǒng)文化的信息資源寶庫(kù),品種和數(shù)量極為豐富。古籍?dāng)?shù)據(jù)庫(kù)建設(shè)研究包括了反映館藏或古籍善本的特藏庫(kù)、突出地方特色的書(shū)目庫(kù)、專(zhuān)題庫(kù)和全文庫(kù)的建庫(kù)實(shí)踐,以及在數(shù)據(jù)庫(kù)建設(shè)中關(guān)于古籍收錄的范圍、分類(lèi)與主題標(biāo)引、著錄標(biāo)準(zhǔn)、數(shù)據(jù)庫(kù)建設(shè)方案、數(shù)據(jù)庫(kù)系統(tǒng)結(jié)構(gòu)、建庫(kù)質(zhì)量控制等內(nèi)容。
期刊主要登載學(xué)術(shù)論文,由于其內(nèi)容具有新穎、有獨(dú)創(chuàng)性、學(xué)術(shù)性強(qiáng)、時(shí)效快等特點(diǎn),成為用戶(hù)尤其是研究型用戶(hù)需求的文獻(xiàn)資料。針對(duì)外文期刊價(jià)格昂貴、收藏不易等特點(diǎn),期刊數(shù)據(jù)庫(kù)建設(shè)的研究主要涉及外文刊,中文刊次之,目錄庫(kù)較多,尤其是聯(lián)合目錄,而全文庫(kù)少。許多建庫(kù)單位開(kāi)展了建立外刊聯(lián)合目錄數(shù)據(jù)庫(kù)的研究,探討合作建庫(kù)等問(wèn)題。
在我國(guó)55個(gè)少數(shù)民族中,有古文字或現(xiàn)存文字的少數(shù)民族不在少數(shù),更有大量歷代關(guān)于少數(shù)民族的研究資料,所以民族文獻(xiàn)數(shù)據(jù)庫(kù)建設(shè)研究也引起了關(guān)注,具體包括:西北、西南、湘西等地區(qū)的少數(shù)民族文獻(xiàn),以及畬、黎、滿、赫哲等民族文獻(xiàn)數(shù)據(jù)庫(kù)建設(shè)研究。
2.2 數(shù)據(jù)庫(kù)建設(shè)的資料來(lái)源研究
表1數(shù)據(jù)顯示,數(shù)據(jù)庫(kù)建設(shè)的資料來(lái)源包括各種文獻(xiàn)資源、信息資源、各地方文獻(xiàn)、古籍、民族文獻(xiàn)、學(xué)位論文、特色文獻(xiàn)、專(zhuān)題文獻(xiàn)、特色館藏、數(shù)字資源、網(wǎng)絡(luò)資源等等。實(shí)際上這些高頻關(guān)鍵詞涵蓋的內(nèi)容和范圍十分廣泛,具體包括了諸如:張騫研究、西夏文獻(xiàn)、宋代文獻(xiàn)、清史圖錄、民族研究文獻(xiàn)、族譜、客家文獻(xiàn)、華僑華人文獻(xiàn)信息、農(nóng)業(yè)信息、林業(yè)文獻(xiàn)、海洋資源、水產(chǎn)科技、食品古籍、中醫(yī)藥典籍、民族古籍、藏文古籍、白族文獻(xiàn)、青藏高原、石油地質(zhì)學(xué)、枸杞文獻(xiàn)、苗族醫(yī)藥、抗戰(zhàn)文化、姑蘇橋文化、臨川文化、茶文化、地方特色文化、貨幣圖片等等。資料來(lái)源種類(lèi)繁多,不勝枚舉,說(shuō)明我國(guó)文獻(xiàn)資源浩瀚、學(xué)科種類(lèi)繁多、文獻(xiàn)類(lèi)型復(fù)雜、分布面極廣、歷史積淀深厚,數(shù)據(jù)庫(kù)建設(shè)資料來(lái)源的研究題材十分豐富,囊括了歷史、地理、文化、專(zhuān)業(yè)學(xué)科等各類(lèi)資源。由于建庫(kù)資料來(lái)源的選擇關(guān)系到數(shù)據(jù)庫(kù)建設(shè)的質(zhì)量和應(yīng)用效果,各圖書(shū)情報(bào)機(jī)構(gòu)分別就各種文獻(xiàn)信息資源的內(nèi)容范圍、資源特色、資源價(jià)值判斷、收集方式等問(wèn)題展開(kāi)了廣泛而深入研究。
2.3 關(guān)于數(shù)據(jù)庫(kù)建設(shè)機(jī)構(gòu)
統(tǒng)計(jì)表明,與數(shù)據(jù)庫(kù)建設(shè)研究最多的相關(guān)機(jī)構(gòu)是高校圖書(shū)館。數(shù)字資源建設(shè)歷來(lái)是高校圖書(shū)館資源開(kāi)發(fā)與信息服務(wù)的目標(biāo),尤其是近十年。1998年中國(guó)高等教育文獻(xiàn)保障體系(CALIS)建成啟動(dòng)以來(lái),高校圖書(shū)館的數(shù)字化建設(shè)也同步快速發(fā)展,CALIS于1999年7月設(shè)立CALIS特色數(shù)據(jù)庫(kù)和導(dǎo)航建設(shè)項(xiàng)目組以來(lái),高校自建特色專(zhuān)題數(shù)據(jù)庫(kù)明顯增多。以學(xué)位論文庫(kù)為例,經(jīng)過(guò)“九五”建設(shè)CALIS學(xué)位論文文獻(xiàn)數(shù)據(jù)庫(kù)數(shù)量累計(jì)達(dá)10萬(wàn)余條[4]。2003年9月CALIS“學(xué)位論文全文數(shù)據(jù)庫(kù)”項(xiàng)目正式啟動(dòng)后,學(xué)位論文數(shù)據(jù)庫(kù)建設(shè)更是突飛猛進(jìn),相應(yīng)的研究也大量涌現(xiàn);公共圖書(shū)館這一關(guān)鍵詞檢出頻率不高,與論文關(guān)鍵詞的選詞有關(guān),如北京圖書(shū)館、上海圖書(shū)館、中山圖書(shū)館、遼寧省圖書(shū)館等用公共圖書(shū)館作為關(guān)鍵詞檢不出來(lái),實(shí)際上公共圖書(shū)館對(duì)于數(shù)據(jù)庫(kù)建設(shè)的研究也很多;與高校圖書(shū)館不同,情報(bào)機(jī)構(gòu)在早期的數(shù)據(jù)庫(kù)建設(shè)中發(fā)揮很大了作用。上世紀(jì)70年代末到80年代中期,計(jì)算機(jī)在情報(bào)機(jī)構(gòu)中應(yīng)用開(kāi)始了中文文獻(xiàn)數(shù)據(jù)庫(kù)的建設(shè),有了中國(guó)科學(xué)技術(shù)信息研究所的萬(wàn)方數(shù)據(jù)庫(kù)和國(guó)家科委西南信息中心的維普數(shù)據(jù)庫(kù)[5]。從文獻(xiàn)綜述中也可看到情報(bào)機(jī)構(gòu)的數(shù)據(jù)庫(kù)建設(shè)成果[6]。足見(jiàn)情報(bào)機(jī)構(gòu)對(duì)數(shù)據(jù)庫(kù)建設(shè)和研究的重視。
2.4 數(shù)據(jù)庫(kù)建設(shè)目的和意義研究
從表1中列出的關(guān)鍵詞:自動(dòng)化、資源共享、共建共享、資源建設(shè)、資源開(kāi)發(fā)、數(shù)字化、數(shù)字圖書(shū)館、情報(bào)檢索、信息服務(wù)、信息檢索等等,說(shuō)明了數(shù)據(jù)庫(kù)建設(shè)目的和意義的研究?jī)?nèi)容。即利用現(xiàn)代化技術(shù)手段開(kāi)發(fā)各種文獻(xiàn)信息資源,進(jìn)行資源的數(shù)字化轉(zhuǎn)換處理,建成各類(lèi)型數(shù)據(jù)庫(kù)或數(shù)字圖書(shū)館,提高圖書(shū)館自動(dòng)化管理水平,利用網(wǎng)絡(luò)以便不受時(shí)間空間的限制向用戶(hù)提供更好的情報(bào)檢索和信息服務(wù)。數(shù)據(jù)庫(kù)建設(shè)離不開(kāi)文獻(xiàn)資源的數(shù)字化,數(shù)據(jù)庫(kù)建設(shè)的終極目標(biāo)就是實(shí)現(xiàn)資源的共建共享。大多數(shù)論文都涉及到了數(shù)據(jù)庫(kù)建設(shè)目的和意義的研究,但缺乏深入系統(tǒng)的探討。
2.5 數(shù)據(jù)庫(kù)質(zhì)量控制研究
與數(shù)據(jù)庫(kù)質(zhì)量控制相關(guān)的高頻關(guān)鍵詞有:標(biāo)準(zhǔn)化、規(guī)范化、質(zhì)量控制、標(biāo)引、元數(shù)據(jù)、MARC、數(shù)據(jù)質(zhì)量、數(shù)據(jù)庫(kù)管理等等。其中標(biāo)準(zhǔn)化居首位,表明文獻(xiàn)的標(biāo)準(zhǔn)化是數(shù)據(jù)庫(kù)建成后資源共享的前提和基礎(chǔ),缺乏建庫(kù)的標(biāo)準(zhǔn)和規(guī)范,就不可能有協(xié)作建設(shè)和資源共享,標(biāo)準(zhǔn)和規(guī)范是數(shù)據(jù)庫(kù)建設(shè)質(zhì)量控制的核心。標(biāo)引是深入揭示文獻(xiàn)內(nèi)容,提供多途徑檢索的重要手段,標(biāo)引質(zhì)量高低與檢索查準(zhǔn)率密切相關(guān),關(guān)于標(biāo)引的研究較多,如:主題標(biāo)引、關(guān)鍵詞標(biāo)引、分類(lèi)標(biāo)引等。元數(shù)據(jù)是關(guān)于數(shù)據(jù)的內(nèi)容質(zhì)量、狀況和其他信息的描述,為各種形態(tài)的數(shù)字化信息單元和資源集合提供規(guī)范、普遍的描述方法和檢索工具,對(duì)促進(jìn)數(shù)據(jù)的規(guī)范管理、使用和共享均有重要作用。圖書(shū)館在文獻(xiàn)數(shù)據(jù)庫(kù)建設(shè)中對(duì)元數(shù)據(jù)標(biāo)準(zhǔn)的應(yīng)用比較廣泛,目前應(yīng)用最普遍的是MARC標(biāo)準(zhǔn),主要用于書(shū)目庫(kù)的書(shū)目記錄數(shù)據(jù)。在圖書(shū)館對(duì)網(wǎng)絡(luò)資源的整合中采用了DC元數(shù)據(jù)標(biāo)準(zhǔn)。伴隨著數(shù)據(jù)庫(kù)建設(shè)文獻(xiàn)類(lèi)型的變化和數(shù)據(jù)庫(kù)的擴(kuò)展,將開(kāi)始選用其他元數(shù)據(jù)標(biāo)準(zhǔn)。由于標(biāo)準(zhǔn)化和規(guī)范化保證數(shù)據(jù)庫(kù)運(yùn)行的可靠、系統(tǒng)、兼容性,因此許多論文對(duì)數(shù)據(jù)庫(kù)建設(shè)中描述語(yǔ)言和標(biāo)引語(yǔ)言的應(yīng)用,以及國(guó)際國(guó)內(nèi)通用標(biāo)準(zhǔn)的采用進(jìn)行了大量的深入研究。
2.6 現(xiàn)代化技術(shù)應(yīng)用與數(shù)據(jù)庫(kù)管理研究
隨著現(xiàn)代化技術(shù)在圖書(shū)情報(bào)領(lǐng)域內(nèi)廣泛深入的應(yīng)用。網(wǎng)絡(luò)環(huán)境、WEB、網(wǎng)絡(luò)化、網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、計(jì)算機(jī)應(yīng)用、ILAS等關(guān)鍵詞數(shù)量增加?;ヂ?lián)網(wǎng)從形成到今天,廣泛而深刻地影響和改造著我們的社會(huì),圖書(shū)情報(bào)界也不例外,網(wǎng)絡(luò)成為現(xiàn)代信息資源存貯、交流和利用的主要載體,網(wǎng)絡(luò)為數(shù)據(jù)庫(kù)發(fā)展提供獨(dú)特的優(yōu)勢(shì)和無(wú)窮的潛力,數(shù)據(jù)庫(kù)通過(guò)網(wǎng)絡(luò)傳播使用,在網(wǎng)絡(luò)環(huán)境下實(shí)現(xiàn)其價(jià)值,為用戶(hù)提供遠(yuǎn)程信息檢索服務(wù)。上世紀(jì)末以來(lái)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的建設(shè)升溫,與之相應(yīng)的研究也隨之增加,成為研究的熱點(diǎn)。同樣,計(jì)算機(jī)在圖書(shū)館內(nèi)的應(yīng)用,使數(shù)據(jù)庫(kù)的建設(shè)和發(fā)展成為可能,相應(yīng)的研究也伴隨出現(xiàn)。深圳圖書(shū)館自動(dòng)化集成系統(tǒng)ILAS在1991年8月正式開(kāi)通并全面運(yùn)行后,在全國(guó)各類(lèi)型圖書(shū)館中使用,許多圖書(shū)館利用該系統(tǒng)提供的自建數(shù)據(jù)庫(kù)功能建立古籍、學(xué)位論文、會(huì)議論文題錄等數(shù)據(jù)庫(kù),并分別撰文探討利用ILAS的建庫(kù)研究工作。
數(shù)據(jù)庫(kù)管理研究主要集中在數(shù)據(jù)庫(kù)制作管理、操作系統(tǒng)軟硬件選用等方面,關(guān)鍵詞包括軟件、TPI、管理系統(tǒng)、數(shù)據(jù)庫(kù)管理、圖書(shū)館管理、計(jì)算機(jī)管理等等。軟件是數(shù)據(jù)庫(kù)管理的工具,指利用數(shù)據(jù)庫(kù)技術(shù)對(duì)數(shù)據(jù)進(jìn)行存貯、追加、置換、刪除、檢索等操作。這方面的研究包括Micro CDS/ISIS軟件、CALIS中心的建庫(kù)軟件、丹誠(chéng)軟件、Ztrans軟件在各種數(shù)據(jù)庫(kù)建設(shè)中的應(yīng)用等等。數(shù)據(jù)庫(kù)制作研究還包括:論述研發(fā)學(xué)位論文數(shù)據(jù)庫(kù)管理系統(tǒng)的設(shè)計(jì)方案和技術(shù)路線。探討基于TPI的數(shù)據(jù)庫(kù)管理平臺(tái)設(shè)計(jì)的專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)建庫(kù)中遇到的技術(shù)難題,以及TPI在學(xué)位論文庫(kù)建設(shè)中的應(yīng)用。探討TPS面向文本數(shù)據(jù)庫(kù)管理系統(tǒng)為平臺(tái)的數(shù)據(jù)庫(kù)建設(shè)問(wèn)題。以PDF文件自動(dòng)構(gòu)建全文數(shù)據(jù)庫(kù)的設(shè)計(jì)。利用Word的VBA合并不同結(jié)構(gòu)數(shù)據(jù)庫(kù)的方法和Word Perfect字處理軟件在英文文摘數(shù)據(jù)庫(kù)建設(shè)中的應(yīng)用介紹。在WEB中采用ASP建立數(shù)據(jù)庫(kù)查詢(xún)。利用CGI建造WEB數(shù)據(jù)庫(kù)系統(tǒng)的中間件技術(shù)以及Java技術(shù)建立專(zhuān)題數(shù)據(jù)庫(kù)。基于XML的web挖掘技術(shù)在特色數(shù)據(jù)庫(kù)建設(shè)中的應(yīng)用等研究。
2.7 知識(shí)產(chǎn)權(quán)研究
伴隨著文獻(xiàn)資源的數(shù)字化進(jìn)程的推進(jìn),知識(shí)產(chǎn)權(quán)問(wèn)題已成為數(shù)據(jù)庫(kù)建設(shè)中值得關(guān)注的研究熱點(diǎn),因而增強(qiáng)知識(shí)產(chǎn)權(quán)的保護(hù)意識(shí),完善相應(yīng)的法律法規(guī),在遵循現(xiàn)有法律的前提下,合法解決版權(quán)、著作權(quán)問(wèn)題是數(shù)據(jù)庫(kù)建設(shè)中的難點(diǎn)。相應(yīng)的關(guān)鍵詞有:知識(shí)產(chǎn)權(quán)、版權(quán)、著作權(quán)。研究?jī)?nèi)容包括:針對(duì)數(shù)據(jù)庫(kù)建設(shè)及使用中涉及的版權(quán)問(wèn)題進(jìn)行分析研究,提出規(guī)避版權(quán)風(fēng)險(xiǎn)和解決問(wèn)題的策略。闡述特色數(shù)據(jù)庫(kù)建設(shè)中涉及的著作權(quán)問(wèn)題及解決途徑。探討建設(shè)學(xué)位論文全文數(shù)據(jù)庫(kù)中易引發(fā)的著作權(quán)問(wèn)題,及在實(shí)踐中克服著作權(quán)的困擾。研究利用著作權(quán)法對(duì)著作權(quán)的限制性規(guī)定來(lái)進(jìn)行數(shù)據(jù)庫(kù)建設(shè)。提出數(shù)據(jù)庫(kù)建設(shè)不僅涉及著作權(quán)保護(hù)問(wèn)題,同時(shí)也要做好數(shù)據(jù)庫(kù)本身的著作權(quán)保護(hù)。對(duì)國(guó)內(nèi)影響較大的中文圖書(shū)數(shù)據(jù)庫(kù)的版權(quán)建設(shè)進(jìn)行比較研究,論述自建數(shù)據(jù)庫(kù)和服務(wù)中涉及的知識(shí)產(chǎn)權(quán)問(wèn)題,提出利用法律保護(hù)自建數(shù)據(jù)庫(kù)自主知識(shí)產(chǎn)權(quán)的建議等等。
3 小 結(jié)
3.1 數(shù)據(jù)庫(kù)建設(shè)研究的總體特征
我國(guó)數(shù)據(jù)庫(kù)建設(shè)事業(yè)從自發(fā)、分割狀態(tài)下起步,國(guó)家調(diào)控不力,數(shù)據(jù)庫(kù)建設(shè)各自為政,建庫(kù)規(guī)模小、全國(guó)性大型數(shù)據(jù)庫(kù)少、專(zhuān)業(yè)面窄、結(jié)構(gòu)單一、標(biāo)準(zhǔn)不統(tǒng)一、橫向聯(lián)系少、整體諧調(diào)差、重復(fù)建設(shè)多、自用數(shù)據(jù)庫(kù)多、共享性差。數(shù)據(jù)庫(kù)建設(shè)研究也真實(shí)地反映了數(shù)據(jù)庫(kù)建設(shè)的工作情況。綜觀我國(guó)圖書(shū)情報(bào)界數(shù)據(jù)庫(kù)建設(shè)研究,大量的研究論文只立足本系統(tǒng)、本行業(yè)、本地區(qū)、本單位的資源和需求進(jìn)行數(shù)據(jù)庫(kù)建設(shè)的目的、意義、必要性、可行性、規(guī)范和方法、建庫(kù)步驟、技術(shù)以及出現(xiàn)問(wèn)題和解決對(duì)策的探討,大多為經(jīng)驗(yàn)總結(jié)性探索,屬于微觀層面的研究。從宏觀層面探討我國(guó)數(shù)據(jù)庫(kù)建設(shè)的理論思想、指導(dǎo)原則、戰(zhàn)略規(guī)劃、建設(shè)目標(biāo)、管理體制、建庫(kù)模式、運(yùn)作方式、發(fā)展?fàn)顩r的研究不足。雖然數(shù)據(jù)庫(kù)建設(shè)研究?jī)?nèi)容多種多樣,體現(xiàn)了圖書(shū)情報(bào)工作鮮明的實(shí)踐性特征,但完整的理論體系未能產(chǎn)生,導(dǎo)致不能有效指導(dǎo)實(shí)踐、更好的促進(jìn)數(shù)據(jù)庫(kù)建設(shè)研究的發(fā)展。總體特征為應(yīng)用研究居多,理論研究偏少。
3.2 數(shù)據(jù)庫(kù)建設(shè)研究特點(diǎn)
我國(guó)數(shù)據(jù)庫(kù)建設(shè)歷經(jīng)30余年發(fā)展,建設(shè)成果引起眾多研究者的關(guān)注。在圖書(shū)情報(bào)界,研究的重點(diǎn)主要集中于數(shù)據(jù)庫(kù)各種資料來(lái)源的范圍、價(jià)值、特點(diǎn)和收集方式,特色庫(kù)、書(shū)目庫(kù)、專(zhuān)題庫(kù)、古籍庫(kù)和學(xué)位論文庫(kù)等各類(lèi)型數(shù)據(jù)庫(kù)的建設(shè)實(shí)踐。注重?cái)?shù)據(jù)庫(kù)建設(shè)過(guò)程中的質(zhì)量控制和現(xiàn)代技術(shù)在建庫(kù)中的應(yīng)用等研究。
隨著我國(guó)信息基礎(chǔ)設(shè)施的建設(shè)和完善,文獻(xiàn)資源數(shù)字化進(jìn)程的加快,資源共建共享意識(shí)增強(qiáng),網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、數(shù)字圖書(shū)館成為近期的研究熱點(diǎn)。
在數(shù)據(jù)庫(kù)建設(shè)和服務(wù)中涉及的知識(shí)產(chǎn)權(quán)保護(hù)是一個(gè)較為復(fù)雜的問(wèn)題,因而成為數(shù)據(jù)庫(kù)建設(shè)研究的難點(diǎn)。
弱勢(shì)論題有下述方面:對(duì)數(shù)據(jù)庫(kù)建設(shè)的評(píng)價(jià)研究開(kāi)展極少,僅有《期刊數(shù)據(jù)庫(kù)建設(shè)工作與質(zhì)量評(píng)價(jià)》、《特色數(shù)據(jù)庫(kù)系統(tǒng)建設(shè)評(píng)價(jià)指標(biāo)分析》等有限的幾篇論文探討這一主題。從用戶(hù)需求出發(fā)建好數(shù)據(jù)庫(kù)應(yīng)該是數(shù)據(jù)庫(kù)建設(shè)的立足點(diǎn),滿足用戶(hù)需求的數(shù)據(jù)庫(kù)才具有存在價(jià)值,但這一專(zhuān)題研究有所欠缺。通過(guò)與國(guó)外數(shù)據(jù)庫(kù)的比較研究來(lái)透視我國(guó)數(shù)據(jù)庫(kù)建設(shè)存在問(wèn)題的研究同樣不足??茖W(xué)評(píng)價(jià)性文獻(xiàn)數(shù)據(jù)庫(kù)如科學(xué)引文數(shù)據(jù)庫(kù)建設(shè)研究偏少。
3.3 數(shù)據(jù)庫(kù)建設(shè)研究變化趨勢(shì)
伴隨現(xiàn)代科學(xué)技術(shù)發(fā)展和網(wǎng)絡(luò)環(huán)境成熟,數(shù)據(jù)庫(kù)建設(shè)研究從早期的書(shū)目數(shù)據(jù)庫(kù)、文摘數(shù)據(jù)庫(kù)向全文數(shù)據(jù)庫(kù)轉(zhuǎn)化,從光盤(pán)數(shù)據(jù)庫(kù)建設(shè)向網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、多媒體數(shù)據(jù)庫(kù)建設(shè)轉(zhuǎn)化。建庫(kù)過(guò)程中元數(shù)據(jù)的選用由單一變?yōu)槎喾N。隨著數(shù)字資源建設(shè)工作在高校圖書(shū)館的開(kāi)展,越來(lái)越多的高校圖書(shū)館加入到數(shù)據(jù)庫(kù)建設(shè)研究工作中。1992年國(guó)家科委把“科技情報(bào)”改為“科技信息”,情報(bào)檢索這一術(shù)語(yǔ)逐漸被信息服務(wù)取代。隨著我國(guó)法律制度的健全,“知識(shí)產(chǎn)權(quán)”、“版權(quán)”、“著作權(quán)”等詞匯逐漸增加。數(shù)據(jù)庫(kù)建設(shè)中現(xiàn)代化技術(shù)應(yīng)用與日俱增,新概念和新技術(shù)的引入,新關(guān)鍵詞出現(xiàn),老關(guān)鍵詞的減少,反映了數(shù)據(jù)庫(kù)建設(shè)研究?jī)?nèi)容隨時(shí)代發(fā)展變化而變化,并將繼續(xù)發(fā)生變化。
參考文獻(xiàn)
[1]黃俊貴.數(shù)據(jù)庫(kù)資源建設(shè)述略[J].北京圖書(shū)館館刊,1998,(1):97-103.
[2]邱均平,等.國(guó)內(nèi)外情報(bào)學(xué)研究研究重點(diǎn)及其演進(jìn)[J].圖書(shū)館論壇,2005,(6):71-76.
[3]查成泰.中文書(shū)目數(shù)據(jù)庫(kù)建設(shè)概論[J].高校文獻(xiàn)信息學(xué)刊,1994,(3):28-31.
[4]趙陽(yáng),姜愛(ài)蓉.“CALIS學(xué)位論文全文數(shù)據(jù)庫(kù)”的建設(shè)實(shí)踐[J].大學(xué)圖書(shū)館學(xué)報(bào),2006,(4):48-52.
[5]孟連生.簡(jiǎn)評(píng)90年代中國(guó)文獻(xiàn)數(shù)據(jù)庫(kù)建設(shè)[J].情報(bào)科學(xué),1999,(3):306-310.
[6]卓香棖.我國(guó)自建計(jì)算機(jī)情報(bào)檢索系統(tǒng)數(shù)據(jù)庫(kù)綜述[J].情報(bào)學(xué)刊,1990,(2):118-124.