危志明
(東華理工大學(xué)圖書館,江西 撫州344000)
隨著計算機與網(wǎng)絡(luò)科學(xué)技術(shù)的飛速發(fā)展,數(shù)字化的信息服務(wù)已深入社會生活的方方面面,計算機、網(wǎng)絡(luò)已成為科研人員獲取信息的基本手段,便捷的網(wǎng)絡(luò)電話、平板電腦等已成為科研人員獲取信息的有效補充,獲取信息的平臺也越來越多樣,在此大背景之下,越來越多的高校開始注重數(shù)字科研信息的整合與共享。
東華理工大學(xué)是一所以核科學(xué)與地學(xué)為特色的高校,自成立63年來,為國家培養(yǎng)和輸送了大量的核能源方面的專業(yè)人才。作為東華理工大學(xué)重點學(xué)科的核科學(xué)各專業(yè)在發(fā)展中,各學(xué)院、實驗室產(chǎn)生了許多各種各樣格式的核科學(xué)相關(guān)科研資料,但因各學(xué)院、實驗室之間相互獨立,交流較少,而發(fā)表后的科學(xué)研究成果受版權(quán)保護等影響,無法充分共享,這對科學(xué)研究產(chǎn)生不利影響。因此,有必要建立一個信息平臺供核科學(xué)研究人員存儲與發(fā)布自己的相關(guān)資料和學(xué)術(shù)成果,該系統(tǒng)要求能夠永久保存科研資料同時支持訪問者進行檢索、查看等功能,這種系統(tǒng)稱為機構(gòu)倉儲系統(tǒng)。目前,機構(gòu)倉儲軟件主要有DSpace、Fedora、Archimede、Bepress 等[1]。
DSpace 系統(tǒng)是由麻省理工學(xué)院與惠普公司合作開發(fā)的一套數(shù)字資源存儲系統(tǒng),可以收集存儲各種格式的數(shù)字資源并進行發(fā)布。該系統(tǒng)是一個開源系統(tǒng),用戶可以根據(jù)工作特點和實際需要對該系統(tǒng)進行定制和擴展[2]。該系統(tǒng)在我國使用比較廣泛。
①開放源代碼。DSpace 是一個開源軟件平臺,用戶從其官網(wǎng)免費下載后可以自由進行修改與使用。該系統(tǒng)使用的其他軟件也是開放的源代碼,如PostgreSQL、JDK、Apache 等[3]。②支持各種文件類型。DSpace 可以管理和保存各種形式的數(shù)字對象,包括論文、報告、聲頻、視頻、科學(xué)圖表、地理信息數(shù)據(jù)、數(shù)學(xué)等,方便處理核科學(xué)中各種格式的資料。③檢索功能比較強大。DSpace 的檢索和索引通過API 接口,允許在指定范圍內(nèi)進行檢索、重建索引等,并提供許多檢索特色。④界面簡潔友好。DSpace 用戶界面是基于Web 的,提供上傳、搜索、管理以及審核等界面。 ⑤用戶群多。全球許多機構(gòu)應(yīng)用DSpace 來進行保存分享作品文件與研究資料,高校圖書館中利用最多是利用DSpace 建立各種機構(gòu)知識庫,如清華大學(xué)、廈門大學(xué)等。⑥使用簡便。DSpace 系統(tǒng)支持Linux 和Windows 環(huán)境,利用瀏覽器即可配置管理,使用非常方便。
根據(jù)DSpace 的上述特點與核科學(xué)產(chǎn)生的資料的特殊性,本文基于DSpace 建設(shè)核科學(xué)資料的機構(gòu)倉儲系統(tǒng),系統(tǒng)采用DSpace 的三層體系結(jié)構(gòu)。按照從上而下的順序這三層依次為應(yīng)用層、業(yè)務(wù)層與存儲層。上層通過DSpace 所提供的應(yīng)用程序編程接口(API)調(diào)用下層,從而實現(xiàn)相關(guān)功能。該系統(tǒng)的體系機構(gòu)如圖1所示。
圖1 系統(tǒng)體系結(jié)構(gòu)
應(yīng)用層是系統(tǒng)與用戶之間進行交互的層,科研人員可以通過該層上傳科研資料,用戶可以通過該層實現(xiàn)信息服務(wù)。系統(tǒng)所有的功能都是通過應(yīng)用層與用戶實現(xiàn)交互,為用戶提供服務(wù)。應(yīng)用層由Web 界面、數(shù)據(jù)導(dǎo)入與導(dǎo)出及統(tǒng)計工具等模塊組成:①Web 界面。系統(tǒng)采用B/S 模式,用戶只能通過瀏覽器對系統(tǒng)進行訪問。 ②數(shù)據(jù)導(dǎo)入與導(dǎo)出??蒲腥藛T不管上傳的數(shù)字資源是什么格式,都能通過主動文檔開放協(xié)議來進行轉(zhuǎn)化,轉(zhuǎn)成統(tǒng)一的格式存儲于系統(tǒng)中。 ③統(tǒng)計工具。利用DSpace 系統(tǒng)原有統(tǒng)計源碼可以實現(xiàn)訪問次數(shù)、瀏覽次數(shù)、檢索詞等信息進行統(tǒng)計展示。
業(yè)務(wù)層主要負(fù)責(zé)系統(tǒng)用戶管理、權(quán)限管理、已上傳資源管理及其他系統(tǒng)管理等功能。主要功能如下所示:①資源命名。為了實現(xiàn)資源的長期保存與共享,系統(tǒng)通過使用句柄為每個資源條目創(chuàng)建永久的URL,可以保證該資源名稱的獨一無二性。②工作流管理。指用戶開始上傳到資源發(fā)布整個過程。每一個工作流包括選擇要提交資源歸屬、提交資源信息與全文、審核員審核等步驟工作流。
信息提交功能是本系統(tǒng)的核心功能。本系統(tǒng)增加了外部數(shù)據(jù)提交和館間數(shù)據(jù)提交兩種工作流,使得核科學(xué)資料的共享方式變得更加靈活多樣,提交流程如圖2所示。
圖2 信息提交流程
外部數(shù)據(jù)提交者為各學(xué)院、實驗室在系統(tǒng)中注冊的科研工作者,提交員按照系統(tǒng)要求對資料進行著錄后將資料提交到工作流中等待審核員審核。若審核員在審核過程中發(fā)現(xiàn)資料不完整,如鈾礦地質(zhì)資料文字不完整、地質(zhì)圖缺失、勘查許可證沒有復(fù)印件等情況時,將資料駁回并附駁回意見供提交者修改。修改后若資料審核合格后進入編輯元數(shù)據(jù)工作流,最終成為本地倉儲的數(shù)據(jù)條目。館內(nèi)數(shù)據(jù)提交為圖書館信息采集人員將收集的核科學(xué)資料直接進行元數(shù)據(jù)編輯。本系統(tǒng)支持各種格式資料的采集,包括常用的文本格式如doc、txt、pdf等,常見的圖片資源格式j(luò)pg、png、bmp 等和常見的媒體資源格式mp3、wav 等。
③索引、檢索和瀏覽。系統(tǒng)利用DSpace 系統(tǒng)的API 可以按照不同的分類創(chuàng)建索引,利用免費的Lucene 可以實現(xiàn)對字段、全文檢索的支持。④用戶、用戶組與授權(quán)、認(rèn)證。DSpace 系統(tǒng)原有的注冊方式允許任意用戶注冊,不符合核科學(xué)資料管理的安全性要求。因此,將系統(tǒng)原有的注冊方式改為審核注冊,只有認(rèn)證審核過的用戶才能使用系統(tǒng)。
本系統(tǒng)采用分級權(quán)限,由權(quán)限分配模塊完成。普通用戶僅能瀏覽、搜索和下載本系統(tǒng)中保存的數(shù)字資料;科研工作者,除瀏覽等權(quán)限外,還有上傳資源的權(quán)限;質(zhì)量審核工作人員,具有審核上傳數(shù)字資源的能力;超級管理員具有全部操作與管理的權(quán)限。
存儲層管理后臺數(shù)據(jù)庫,組織管理存儲數(shù)據(jù)資源,是系統(tǒng)的基礎(chǔ)支持層。
本系統(tǒng)采用關(guān)系型數(shù)據(jù)庫管理系統(tǒng)PostgreSQL 作為后臺存儲庫。PostgreSQL 是一款開源數(shù)據(jù)庫管理軟件,可以利用SQL 語言實現(xiàn)數(shù)據(jù)的插入、查詢及修改等操作。系統(tǒng)存儲的數(shù)據(jù)資源則包括科研人員上傳的數(shù)字資源、各模塊的工作流、用戶個人信息、檢索的索引信息等。
核科學(xué)資料的機構(gòu)倉儲系統(tǒng)是在DSpace 系統(tǒng)基礎(chǔ)之上進行二次開發(fā),針對東華理工大學(xué)具體情況和核科學(xué)資料特點,對該系統(tǒng)的功能進行了擴展和優(yōu)化。該系統(tǒng)能實現(xiàn)對東華理工大學(xué)各學(xué)院、教研室及實驗室在科研中產(chǎn)出的學(xué)術(shù)論文、圖表、地理信息數(shù)據(jù)、實驗數(shù)據(jù)等資料的長期儲存,并以此構(gòu)建同行科研人員之間進行資源共享與學(xué)術(shù)交流,促進東華理工大學(xué)科研成果的傳播,提高科研人員學(xué)術(shù)知名度,為進一步提高東華理工大學(xué)核科學(xué)特色辦學(xué)提供積極探索的一步。