戴建新
(廣東培正學(xué)院 圖書館,廣東 廣州 510830)
民辦高校特色文獻(xiàn)資源數(shù)據(jù)庫建設(shè)探討
——以基于DIPS平臺(tái)建設(shè)民辦高等教育特色資源數(shù)據(jù)庫為例
戴建新
(廣東培正學(xué)院 圖書館,廣東 廣州 510830)
特色資源數(shù)據(jù)庫便捷地實(shí)現(xiàn)了學(xué)科資源集中化,有利于提高信息資源的獲取效率,推動(dòng)高校教學(xué)和科研的發(fā)展。以基于DIPS平臺(tái)建設(shè)民辦高等教育特色資源數(shù)據(jù)庫為例,探討和總結(jié)如何建設(shè)特色文獻(xiàn)資源數(shù)據(jù)庫,對(duì)民辦高校特色資源數(shù)據(jù)庫建設(shè)具有重要借鑒作用。
民辦高校;特色數(shù)據(jù)庫;數(shù)據(jù)庫建設(shè);數(shù)字資源
中國民辦高等教育事業(yè)飛速發(fā)展,以民辦高等教育為主題的各種類型的數(shù)字化文獻(xiàn)資源不斷增加,形成數(shù)字資源的多樣化。一方面,結(jié)構(gòu)不同,來源不同,提供方式不同的各類數(shù)字化文獻(xiàn)資源給數(shù)字資源的使用、資源的整合、統(tǒng)一管理和訪問服務(wù)帶來諸多困難;另一方面,民辦高校普遍存在經(jīng)費(fèi)緊缺問題,無力購買大量的數(shù)字化資源。因此,如何將多樣化的異構(gòu)資源整合成一個(gè)有機(jī)的整體,建立民辦高等教育特色文獻(xiàn)數(shù)據(jù)庫,解決民辦高等教育研究日益突出的信息孤島現(xiàn)象,為民辦高等教育研究提供良好的信息服務(wù),推進(jìn)民辦高等教育事業(yè)的發(fā)展具有重要的實(shí)用價(jià)值。
建立民辦高等教育特色數(shù)據(jù)庫的目標(biāo)是充分開發(fā)和整合館藏資源和網(wǎng)絡(luò)信息資源,全面收錄國內(nèi)外民辦高等教育紙質(zhì)版、電子版、聲像版、圖片、網(wǎng)絡(luò)版等各類數(shù)字化資源,使文獻(xiàn)信息資源數(shù)字化和網(wǎng)絡(luò)化,為研究人員提供全面、系統(tǒng)、高質(zhì)量的文獻(xiàn)資源和便捷高效的獲取途徑。數(shù)據(jù)庫建設(shè)采用元數(shù)據(jù)收割協(xié)議,方便用戶收割元數(shù)據(jù),有利于文獻(xiàn)資源共享。
圍繞民辦高等教育研究的實(shí)際應(yīng)用需求,把應(yīng)用、開發(fā)和研究三者緊密結(jié)合。重視原始信息的利用和管理,加強(qiáng)信息資源的重組導(dǎo)航和集成整合,通過現(xiàn)代信息技術(shù),使數(shù)據(jù)庫建設(shè)的局部建設(shè)與整體規(guī)劃有機(jī)結(jié)合,更好地發(fā)揮規(guī)模效益和整體優(yōu)勢(shì)的建設(shè)原則,具體實(shí)施體現(xiàn)在以下幾個(gè)方面。
1.先進(jìn)性。先進(jìn)性不僅是效率的保證,更是長(zhǎng)期投資的保障。首先要內(nèi)容新穎、功能突出。數(shù)據(jù)庫內(nèi)容能夠滿足特定信息需求,豐富多樣、覆蓋面廣,并有一定深度,足以反映學(xué)科前沿、水平和熱點(diǎn)。信息數(shù)據(jù)可檢索性強(qiáng),能適應(yīng)脫機(jī)、聯(lián)機(jī)和網(wǎng)絡(luò)檢索,直接獲取一次文獻(xiàn)。其次要技術(shù)先進(jìn)。采用先進(jìn)的國際元數(shù)據(jù)標(biāo)準(zhǔn)和XML技術(shù),對(duì)數(shù)字資源進(jìn)行收集、加工、整理,達(dá)到統(tǒng)一規(guī)劃與管理。支持對(duì)文獻(xiàn)資源、光盤資源、音視頻、各種數(shù)據(jù)庫資源的加工、管理及利用,從多角度、全面揭示資源。對(duì)有價(jià)值的圖像、文本、語音、影像、影視、軟件和科學(xué)數(shù)據(jù)等多媒體信息進(jìn)行搜集,組織規(guī)范性的加工,進(jìn)行高質(zhì)量保存和管理。
2.開放性。開放性是資源共建共享的基礎(chǔ)和首要條件。它既要保證資源的共享,得到授權(quán)的用戶在任何時(shí)間任何地點(diǎn)通過網(wǎng)絡(luò)都可得到各種服務(wù),又要保證資源的統(tǒng)一,各個(gè)資源建設(shè)單位必須服從整體協(xié)議。
3.安全性。通過對(duì)數(shù)字資源訪問權(quán)限管理,用戶訪問權(quán)限設(shè)置,網(wǎng)絡(luò)訪問地址限制,加工、管理權(quán)限設(shè)置,從而確保內(nèi)部數(shù)據(jù)的安全性和保密性。
4.標(biāo)準(zhǔn)化。數(shù)據(jù)庫的建設(shè)應(yīng)遵循相應(yīng)的國際、國內(nèi)業(yè)界標(biāo)準(zhǔn),如Calis的標(biāo)準(zhǔn)。采用標(biāo)準(zhǔn)的元數(shù)據(jù)標(biāo)準(zhǔn)、中文核心元數(shù)據(jù)標(biāo)準(zhǔn)和MARC數(shù)據(jù)格式,符合中國信息資源建設(shè)的規(guī)范與標(biāo)準(zhǔn),使資源大范圍地共建共享成為可能。
5.兼容性。不但能與已有的數(shù)據(jù)庫系統(tǒng)兼容,具備強(qiáng)大的擴(kuò)充性和升級(jí)能力,而且能實(shí)現(xiàn)跨庫檢索,跨網(wǎng)站檢索。
6.開放接口。提供具有開放性的接口,具備擴(kuò)展性和可移植性??梢苑奖愕馗鶕?jù)項(xiàng)目具體需求進(jìn)行二次開發(fā),滿足個(gè)性化的需求,或?qū)崿F(xiàn)應(yīng)用集成和相互操作。
1.數(shù)據(jù)庫系統(tǒng)開發(fā)平臺(tái)和硬件系統(tǒng)的確定。
特色數(shù)據(jù)庫的建設(shè)過程是通過軟硬件平臺(tái)實(shí)現(xiàn)的,其中軟件平臺(tái)一般指的是各種數(shù)據(jù)資源平臺(tái)。常見的數(shù)據(jù)資源平臺(tái)有清華同方的TPI系統(tǒng)、北大方正的德賽(DESi)系統(tǒng)、北京拓爾思的TRS平臺(tái)、中國數(shù)圖公司的DIPS系統(tǒng)等。這些系統(tǒng)雖然均可以完成數(shù)據(jù)加工、管理、發(fā)布等工作,但又具有各自的特色功能。我院數(shù)據(jù)庫建設(shè)系統(tǒng)平臺(tái)選用“DIPS高校特色資源庫建設(shè)與發(fā)布系統(tǒng)”。DIPS系統(tǒng)是一套以全文檢索技術(shù)為基礎(chǔ),互聯(lián)網(wǎng)內(nèi)容管理為核心,集資源數(shù)字化加工、數(shù)字內(nèi)容管理、信息情報(bào)發(fā)布檢索利用于一體的互聯(lián)網(wǎng)內(nèi)容建設(shè)基礎(chǔ)平臺(tái)軟件。它能夠滿足大容量數(shù)據(jù)及多并發(fā)用戶的要求,是新一代集文檔影像的數(shù)字化加工、存儲(chǔ)和全文檢索的信息管理支撐平臺(tái)。使用DIPS及其相應(yīng)的輔助工具,可以將圖書館及文獻(xiàn)機(jī)構(gòu)中已有的各種海量信息資源,快速構(gòu)建起基于互聯(lián)網(wǎng)的信息資源庫,并對(duì)這些資源進(jìn)行統(tǒng)一管理和維護(hù)。利用DIPS提供的強(qiáng)大的全文檢索技術(shù),為使用者提供簡(jiǎn)便、快捷、準(zhǔn)確的信息服務(wù)。同時(shí),可以利用DIPS提供的收費(fèi)管理功能,向社會(huì)提供有償?shù)奶厣畔⒎?wù),讓信息資源發(fā)揮更大的應(yīng)用價(jià)值。
數(shù)據(jù)庫硬件系統(tǒng)由服務(wù)端和客戶端兩部分組成,服務(wù)端由一臺(tái)服務(wù)器、一臺(tái)磁盤陣列和幾臺(tái)管理錄入計(jì)算機(jī)組成。服務(wù)器用于數(shù)據(jù)庫的索引庫和全文數(shù)據(jù)庫,并負(fù)責(zé)數(shù)據(jù)的管理和發(fā)布, 提供按照字段查詢和全文檢索服務(wù),并提供Web 服務(wù)和資源共享服務(wù)。磁盤陣列主要存放論文、電子圖書、圖片、視頻等數(shù)字資源。管理錄入計(jì)算機(jī)用于收集、加工數(shù)據(jù)和數(shù)據(jù)入庫,如數(shù)字化處理、標(biāo)引分類和相關(guān)管理。
服務(wù)器配置要求為:P4以上CPU,內(nèi)存不少于512MB,一個(gè)可用空間足夠大的獨(dú)立硬盤或分區(qū)。操作系統(tǒng)可使用的對(duì)換空間最好在100MB以上,局域網(wǎng)連接設(shè)備。DIPS系統(tǒng)的軟件運(yùn)行環(huán)境要求并不高,當(dāng)前主流的服務(wù)器以及計(jì)算機(jī)足以符合要求。通過對(duì)初期計(jì)劃的資源存儲(chǔ)情況調(diào)查,結(jié)合未來數(shù)據(jù)擴(kuò)充的需要,選擇了HP ProLiant DL388 G7服務(wù)器和HP MSA 2012磁盤陣列,MSA 2012放置有12個(gè)1TB的HP SATA硬盤,為確保數(shù)據(jù)安全,建立了RAID6陣列。
在局域網(wǎng)上,通過安裝PDF 文檔閱讀工具、DIPS 文檔閱讀工具和其它多媒體播放器工具等, 可以對(duì)數(shù)據(jù)庫的所有數(shù)據(jù)進(jìn)行瀏覽檢索。
2.數(shù)據(jù)庫系統(tǒng)設(shè)計(jì)及實(shí)現(xiàn)。
(1)確定子庫及字段。按照Calis數(shù)據(jù)庫的建庫標(biāo)準(zhǔn)和“民辦高等教育文獻(xiàn)資料數(shù)據(jù)庫”的結(jié)構(gòu)模塊,創(chuàng)建了14個(gè)子庫,包括民校概況、民校圖庫、辦學(xué)規(guī)模、專業(yè)概況、專家學(xué)者、期刊論文、學(xué)位論文、圖書著作、國外政策法規(guī)、國內(nèi)政策法規(guī)、師資力量、招生就業(yè)、科研成果、文獻(xiàn)保障。再根據(jù)每個(gè)子庫的特點(diǎn)定義各庫的字段,從而完成數(shù)據(jù)庫字段的設(shè)定工作。
(2)獲取和收集數(shù)據(jù)。數(shù)據(jù)的收集是數(shù)據(jù)庫建設(shè)過程中十分重要的環(huán)節(jié)。為了保證收集信息的權(quán)威性和完整性,特別要注意以下幾方面:① 確定合理的收集范圍,包括時(shí)限范圍、文種范圍、地域范圍、學(xué)科范圍等。② 確定信息源的種類,包括期刊、圖書、專利文獻(xiàn)、學(xué)位論文、論文集、報(bào)告及網(wǎng)絡(luò)信息等;③ 確定收錄信息的形式,包括文字、圖片、表格、音樂、動(dòng)畫及其它多媒體信息。④ 確定獲取信息的途徑。紙質(zhì)文獻(xiàn)獲取資料的途徑包括:期刊目錄、綜合性書目、著作目錄、民辦高等教育研究論文索引、論文集、資料匯編、學(xué)報(bào)和一些綜合性普通教育期刊常設(shè)的高等教育專欄或固定欄目。電子文獻(xiàn)獲取途徑包括:本館已購買的電子數(shù)據(jù)庫、互聯(lián)網(wǎng)上主要民辦教育文獻(xiàn)信息源的網(wǎng)址、利用搜索引擎進(jìn)行信息檢索、利用專門教育文獻(xiàn)數(shù)據(jù)庫檢索、登錄各民辦高校網(wǎng)站及其圖書館網(wǎng)站等。
(3)數(shù)據(jù)加工及入庫。DIPS系統(tǒng)數(shù)據(jù)加工子系統(tǒng)采用C/S結(jié)構(gòu),一個(gè)或多個(gè)客戶端用戶能夠獨(dú)立或協(xié)同完成紙質(zhì)資源的數(shù)字化加工。為了避免數(shù)據(jù)加工混亂,按照模塊進(jìn)行任務(wù)分配,即每個(gè)人員負(fù)責(zé)一個(gè)或幾個(gè)模塊,完成對(duì)象數(shù)據(jù)加工和元數(shù)據(jù)加工,對(duì)各種已有的電子資源(如:PDF、DOC、HTML等格式化文本,TXT純文本,MARC數(shù)據(jù),ODBC關(guān)系型數(shù)據(jù),MP3、MPG、WMA、WMV、SWF、RM等多媒體數(shù)據(jù),JPEG、BMP、TIF等圖像數(shù)據(jù),各種資料光盤數(shù)據(jù)及其它自定義格式等)進(jìn)行批量處理、轉(zhuǎn)換和導(dǎo)入等獲取系統(tǒng)原始數(shù)據(jù),再經(jīng)過數(shù)據(jù)審核、裝訂、校對(duì)、標(biāo)引等深加工處理,形成數(shù)據(jù)庫的入庫文件,最后形成數(shù)據(jù)庫的源數(shù)據(jù)。數(shù)據(jù)入庫時(shí)采用“SQL轉(zhuǎn)Dips批量裝訂工具”,將加工好的數(shù)據(jù)批量入庫。
(4)數(shù)據(jù)庫網(wǎng)頁設(shè)計(jì)與資源發(fā)布。DIPS網(wǎng)絡(luò)發(fā)布與管理子系統(tǒng)采用B/S結(jié)構(gòu),通過標(biāo)準(zhǔn)IE瀏覽,完成DIPS數(shù)據(jù)庫的網(wǎng)上發(fā)布、檢索和應(yīng)用服務(wù)。網(wǎng)絡(luò)發(fā)布與管理系統(tǒng)遵循相關(guān)國內(nèi)外標(biāo)準(zhǔn)、CALIS標(biāo)準(zhǔn)規(guī)范。如:XML語言編寫發(fā)布界面、CALIS特色庫本地網(wǎng)站基本服務(wù)規(guī)范、網(wǎng)站功能元素服務(wù)規(guī)范等。網(wǎng)頁提供包括欄目檢索、全文檢索、二次檢索和跨庫檢索等多種多樣的檢索方法,滿足訪問者“快而準(zhǔn)”查找所需信息和資源的要求,方便用戶操作。
1.數(shù)據(jù)庫的質(zhì)量。在數(shù)據(jù)庫的建設(shè)過程中必須嚴(yán)把質(zhì)量關(guān),要及時(shí)修正錯(cuò)誤數(shù)據(jù),確保數(shù)據(jù)的準(zhǔn)確性、完整性和權(quán)威性。標(biāo)準(zhǔn)化是數(shù)據(jù)庫建設(shè)的生命,是建設(shè)高質(zhì)量特色數(shù)據(jù)庫的根本保證。數(shù)據(jù)庫建設(shè)應(yīng)遵循相應(yīng)的國際、國內(nèi)業(yè)界標(biāo)準(zhǔn)。它不僅保證了數(shù)據(jù)庫的可靠性、系統(tǒng)性、連續(xù)性、完整性和兼容性,而且有利于實(shí)現(xiàn)真正意義上的網(wǎng)絡(luò)信息資源共享。
2.系統(tǒng)更新和維護(hù)。數(shù)據(jù)庫的內(nèi)容是動(dòng)態(tài)的,數(shù)據(jù)要及時(shí)更新,保持?jǐn)?shù)據(jù)的新穎性和有效性。由于應(yīng)用環(huán)境的不斷變化,數(shù)據(jù)庫運(yùn)行過程中物理存儲(chǔ)會(huì)不斷變化。因此,對(duì)數(shù)據(jù)庫進(jìn)行評(píng)價(jià)、調(diào)整、修改等維護(hù)工作是一個(gè)長(zhǎng)期的任務(wù),要保證和提高數(shù)據(jù)庫系統(tǒng)運(yùn)行的可靠性、安全性、協(xié)調(diào)性和運(yùn)行效率。
3.尊重知識(shí)產(chǎn)權(quán)。在收集資料時(shí)應(yīng)嚴(yán)格遵守有關(guān)法律法規(guī),充分尊重并保護(hù)原作者的相關(guān)權(quán)利, 高度重視知識(shí)產(chǎn)權(quán),在法律及協(xié)議許可范圍內(nèi)使用相關(guān)資源。
4.人才隊(duì)伍建設(shè)。高素質(zhì)人才隊(duì)伍是建設(shè)特色數(shù)據(jù)庫的核心和關(guān)鍵。特色數(shù)據(jù)庫建設(shè)不僅需要圖書館專業(yè)人才,也需要計(jì)算機(jī)專業(yè)人才,以及與數(shù)據(jù)庫學(xué)科相關(guān)的專業(yè)技術(shù)人才。因此,要想建設(shè)高水平的特色數(shù)據(jù)庫,必須有一支專業(yè)配置合理的人才隊(duì)伍。
[1]趙永強(qiáng),曹歡增,馮軍.高校圖書館特色數(shù)據(jù)庫建設(shè)流程的研究——以基于DESi平臺(tái)的制鹽特色數(shù)據(jù)庫為例[J].電腦知識(shí)與技術(shù),2011(3):1477-1480.
[2]陳曉.基于DIPS 的高校圖書館特色數(shù)據(jù)庫建設(shè)[J].情報(bào)探索,2008(7):50-51.
[3]代根興,吳旭.高等教育教學(xué)成果相關(guān)文獻(xiàn)數(shù)據(jù)庫建設(shè)研究[J].情報(bào)科學(xué),2003(11):1201-1203.
[4]李三鳳.論高校圖書館特色數(shù)據(jù)庫的建設(shè)[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2005(5):41.
ClassNo.:G250.73DocumentMark:A
(責(zé)任編輯:鄭英玲)
DiscussionofConstructionofLiteratureResourcesDatabasewithCharacteristicinPrivateUniversities
Dai Jianxin
The construction of resource database with characteristic materialized the centralization of disciplinary resources, and improve the efficiency to obtain the information resources ,it also promote the development of college teaching and scientific research. Based on DIPS private higher education platform, this paper discusses how to construct the literature resources database with the characteristics, which is used for reference for the construction of the resource database with characteristic.
private universities;database with characteristics;database construction;digitalized resources
戴建新,助理工程師,廣東培正學(xué)院圖書館。
1672-6758(2012)11-0155-2
G250.73
A
黑龍江工業(yè)學(xué)院學(xué)報(bào)(綜合版)2012年11期