肖海龍
(遼寧師范大圖書館,遼寧 大連 116029)
數(shù)字圖書館是新興的,涉及互聯(lián)網(wǎng)、多媒體、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、版權(quán)保護等諸多技術(shù)應(yīng)用領(lǐng)域的建設(shè)。一個理想的數(shù)字圖書館系統(tǒng),從內(nèi)部看,要很好地實現(xiàn)內(nèi)部管理人員對信息加工、處理、存儲、提供檢索等一系列功能;從外部看,要最好地滿足外部終端用戶對信息獲取的需求。綜合國內(nèi)外數(shù)字圖書館建設(shè)的要求,筆者所設(shè)想的數(shù)字圖書館系統(tǒng)包括5個基本子系統(tǒng):數(shù)字化內(nèi)容采編創(chuàng)建系統(tǒng)、數(shù)字化內(nèi)容存儲與管理系統(tǒng)、數(shù)字化內(nèi)容發(fā)布與檢索系統(tǒng)、數(shù)字圖書館用戶管理系統(tǒng)、數(shù)字版權(quán)保護與電子商務(wù)系統(tǒng),這些系統(tǒng)分別滿足了信息資源的數(shù)字化采編整序與元數(shù)據(jù)提取標引、數(shù)字化信息的存儲與管理、信息發(fā)布檢索與增值服務(wù)、數(shù)字圖書館的用戶管理、數(shù)字版權(quán)保護和系統(tǒng)安全分發(fā)這5個層次的需求。
該多層次數(shù)字圖書館系統(tǒng)設(shè)計開發(fā)過程中應(yīng)遵循如下幾個原則:
2.1 先進性。系統(tǒng)在體系結(jié)構(gòu)、功能、性能等方面要具有業(yè)界先進水平,反映相關(guān)技術(shù)領(lǐng)域的當(dāng)前發(fā)展水平,同時要具有前瞻性,為后續(xù)開發(fā)打下良好基礎(chǔ)。
2.2 開放性。在知識資源描述、存儲管理、資源調(diào)度、資源服務(wù)等方面盡可能采用相關(guān)的國際標準,系統(tǒng)設(shè)計應(yīng)具有較優(yōu)的開放能力與良好的互操作能力。
2.3 敏捷性。系統(tǒng)可以方便地裁剪與擴展,滿足系統(tǒng)長期持續(xù)發(fā)展的要求。
2.4 安全性。系統(tǒng)應(yīng)充分重視數(shù)據(jù)安全性要求。
2.5 自主知識產(chǎn)權(quán)。立足自主,形成自由知識產(chǎn)權(quán)系統(tǒng),但不排除采用國際先進技術(shù)。
3.1 數(shù)字化內(nèi)容采編創(chuàng)建系統(tǒng)
數(shù)字圖書館內(nèi)容的創(chuàng)建和獲取是資源的采集和數(shù)字化,是數(shù)字圖書館資源建設(shè)的一項最基礎(chǔ)的工作。數(shù)字化內(nèi)容采編創(chuàng)建系統(tǒng)的功能需求:要實現(xiàn)對文本、圖像、音頻和視頻等信息及知識的數(shù)字化采編、加工、處理。實現(xiàn)對各種信息資源的一次加工、多次使用,適應(yīng)應(yīng)用系統(tǒng)今后的擴展需要。
數(shù)字化內(nèi)容采編創(chuàng)建系統(tǒng)應(yīng)根據(jù)圖書館業(yè)務(wù)運作的實際需要,提供一整套靈活多樣的資源數(shù)字化手段,主要包括:數(shù)據(jù)錄入與接收,即用計算機輸入文字的方法采集和接收各種新聞報道、辦公文書、會議錄、報紙印刷、書刊出版等電子排版信息,經(jīng)剪裁、加工、整合后形成電子文獻資源庫。圖像掃描采用光學(xué)掃描儀、數(shù)碼相機等,將現(xiàn)有的紙質(zhì)文獻進行掃描后存儲,對已取得版權(quán)許可的館藏文獻進行數(shù)字化時,即采取此種方法建庫。光學(xué)字符識別,即利用計算機設(shè)備和軟件技術(shù)把掃描文本轉(zhuǎn)換成字符型文件進行存儲。視、音頻捕捉,即通過聲卡、幀捕獲器或影視影像數(shù)字卡將模擬的音頻、視頻材料轉(zhuǎn)換成數(shù)字方式存儲,形成電子文檔。網(wǎng)上下載,根據(jù)需要擬定文獻收集范圍,從網(wǎng)上下載沒有版權(quán)爭議的數(shù)據(jù)資源,再按專題進行整理、分類、歸檔、數(shù)據(jù)轉(zhuǎn)換和裝庫。建立門戶網(wǎng)站,跟蹤和搜集相關(guān)網(wǎng)站內(nèi)容,加以分門別類,予以鏈接,并建立網(wǎng)上搜索引擎。
數(shù)字化內(nèi)容采編創(chuàng)建系統(tǒng)過程中還要考慮到異構(gòu)資源庫的整合。在數(shù)字圖書館建設(shè)前期,各文獻擁有單位已經(jīng)建設(shè)一批高質(zhì)量的數(shù)據(jù)庫,把這些數(shù)據(jù)庫整合到數(shù)字圖書館系統(tǒng)中,將極大地豐富數(shù)字圖書館的內(nèi)容。數(shù)字圖書館異構(gòu)資源的整合模式可以分為基于數(shù)據(jù)源的整合和基于系統(tǒng)的整合,具體可以采用XML封裝技術(shù)對現(xiàn)有數(shù)據(jù)庫統(tǒng)一進行封裝,將其與數(shù)字圖書館系統(tǒng)連接,使這些數(shù)據(jù)庫作為數(shù)字圖書館的資源得到有效利用。
3.2 數(shù)字化內(nèi)容存儲與管理系統(tǒng)
一個完整的數(shù)字圖書館系統(tǒng)應(yīng)包括通訊體系、應(yīng)用體系和多媒體數(shù)據(jù)庫體系等,數(shù)字圖書館要求系統(tǒng)支持并行機制,以加速系統(tǒng)運行,支持可擴展的海量數(shù)據(jù)資源存儲,支持海量資源快速搜索和調(diào)度。在支撐整個體系的硬件平臺中,存儲系統(tǒng)是最為核心的部分,它必須能夠滿足不斷增長的海量存儲空間的需求,提供高速的數(shù)據(jù)傳輸能力和對于復(fù)雜的異構(gòu)數(shù)據(jù)存儲環(huán)境的管理、備份等能力。
數(shù)字化內(nèi)容存儲系統(tǒng)功能需要:①海量存儲。海量的電子圖書資源和多媒體資源是數(shù)字圖書館存儲的主要內(nèi)容。而這些數(shù)據(jù)每年都在增長,所以必須擁有一套或多套大容量的存儲系統(tǒng)來滿足海量存儲的要求。這不僅要求存儲系統(tǒng)具有超大容量,而且要求硬件具有可靠性。②傳輸速度快。數(shù)字圖書館為讀者提供了豐富的電子信息資源服務(wù),但由于讀者訪問量多,相對數(shù)據(jù)流量大,所以對整個系統(tǒng)的網(wǎng)絡(luò)傳輸性能有著較高的要求。③數(shù)據(jù)備份功能。數(shù)字圖書館數(shù)據(jù)量巨大,且有些數(shù)據(jù)如書目數(shù)據(jù)十分重要,因而數(shù)據(jù)備份功能是保證系統(tǒng)安全運行的前提。
數(shù)字化內(nèi)容存儲與管理系統(tǒng)設(shè)計的要求:①安全性。存儲管理系統(tǒng)必須保證數(shù)據(jù)的安全,防止任何情況下的數(shù)據(jù)丟失。對數(shù)字圖書館而言,數(shù)據(jù)的丟失等于是傳統(tǒng)圖書館書籍的丟失,代價非常大。所以,數(shù)字圖書館的存儲系統(tǒng)必須具有快速備份及恢復(fù)能力。存儲系統(tǒng)不只是磁盤陣列,而是完整的高可用性存儲架構(gòu)。②擴充性。數(shù)字圖書館電子信息資源每年都在增長,這就要求系統(tǒng)必須具有良好的擴充性,在需要時可方便地增加存儲設(shè)備。③穩(wěn)定性。圖書館數(shù)據(jù)穩(wěn)定性是非常重要的,因而存儲系統(tǒng)應(yīng)具備冗余配置,減少單點故障,從而能夠支持圖書館所有應(yīng)用服務(wù)器全天候服務(wù)。④實用性。能使用可靠、便捷、功能強大的管理軟件,實現(xiàn)自動化數(shù)據(jù)存儲,減少對人工干預(yù)的依賴。
目前圖書館普遍采用DAS(直接連接存儲)和NAS(網(wǎng)絡(luò)附加存儲)存儲結(jié)構(gòu),但無論是DAS還是NAS的存儲結(jié)構(gòu),由于其維護、擴充費用高,可靠性低,存取速度慢,系統(tǒng)備份、恢復(fù)難,給數(shù)字圖書館的發(fā)展帶來了越來越多的煩惱。SAN存儲區(qū)域網(wǎng)絡(luò))可以為我們提供可靠性更高、存取速度更快、擴展更加方便的數(shù)字化圖書館存儲系統(tǒng)解決方案。
3.3 數(shù)字化內(nèi)容發(fā)布與檢索系統(tǒng)
數(shù)字化內(nèi)容發(fā)布與檢索系統(tǒng)是基于網(wǎng)絡(luò)平臺,為用戶提供圖書、報刊、資料等各種信息的閱讀、檢索、下載及付費功能。數(shù)字化內(nèi)容發(fā)布管理應(yīng)包括如下幾個部分:通過站點設(shè)計生成系統(tǒng),完成數(shù)字圖書館整個站點主頁、頻道欄目、信息資源分類及動態(tài)頁面的自動生成,并提供預(yù)定義模塊實現(xiàn)對數(shù)據(jù)顯示和維護界面、樣式的自定制能力;采用數(shù)據(jù)庫和模板技術(shù),允許各種數(shù)據(jù)來源及使用多種方式完成信息發(fā)布,所有資源自動上傳生成網(wǎng)頁,不需要人工干預(yù),實現(xiàn)網(wǎng)站內(nèi)容的動態(tài)發(fā)布和自動及時更新;基于內(nèi)容采編發(fā)布工作流程,支持多級審核功能,確保只有通過審核后的信息資源才能對外發(fā)表,實現(xiàn)信息資源發(fā)布的審批管理;內(nèi)外網(wǎng)可同時發(fā)布,支持內(nèi)容的多重定向,可為不同定位的用戶提供及時、精確、個性化的動態(tài)內(nèi)容。
數(shù)字圖書館檢索系統(tǒng)設(shè)計要求:檢索點全面、檢索方式多樣。檢索系統(tǒng)應(yīng)該既支持字段限定檢索、布爾邏輯檢索、前方一致檢索、相鄰檢索等多種檢索方式,又支持全文檢索;提供簡單檢索、高級檢索、專家檢索和瀏覽4種信息獲取界面;整合不同數(shù)字圖書館的檢索結(jié)果,針對檢索結(jié)果進行后續(xù)處理,如過濾、排序。檢索結(jié)果不僅可聯(lián)機打印、下載,也可以發(fā)送;檢索結(jié)果提供詳細書目信息和館藏信息。書目信息中的出版者、責(zé)任者、叢書名、主題詞等自動設(shè)為檢索熱點,方便讀者進行連續(xù)追蹤查找。
3.4 數(shù)字圖書館用戶管理系統(tǒng)
為了確保系統(tǒng)運行安全,確保各類知識資源為各種層次人員高速取用,數(shù)字圖書館需要做好用戶管理。數(shù)字圖書館用戶管理系統(tǒng)應(yīng)該包括:①安全認證管理。提供系統(tǒng)級、數(shù)據(jù)庫級、記錄級、字段級4級安全控制,可對系統(tǒng)所有的事件和任務(wù)進行有效監(jiān)控,提供運行日志、WEB訪問等分析功能;同時可對允許訪問和拒絕訪問的INTERNET IP地址進行設(shè)置,保證系統(tǒng)信息的合法訪問和免受非法攻擊;門禁系統(tǒng)。②統(tǒng)計進出圖書館人員的計數(shù)系統(tǒng)。此外還具有用戶身份識別、工作人員考勤、控制非法使用圖書館等作用。③權(quán)限管理。根據(jù)用戶角色,設(shè)置不同權(quán)限,定義不同的工作流程,確保只有授權(quán)用戶才能訪問相關(guān)資源。④計費管理系統(tǒng)。提供基于管理策略的計費管理機制,按會員制或者按流量、按檢索查詢資源數(shù)量等方式計費,并能根據(jù)付費方式對用戶進行控制。
3.5 版權(quán)保護與電子商務(wù)系統(tǒng)
保證數(shù)字圖書館能夠持續(xù)有效地發(fā)展,需對部分資源使用進行有償服務(wù),在技術(shù)體系中,需要對數(shù)字圖書館分布式資源跨單位跨庫服務(wù)模式下的版權(quán)保護與電子商務(wù)系統(tǒng)給予支持。
數(shù)字版權(quán)保護系統(tǒng)的設(shè)計要求:一般的數(shù)字版權(quán)保護系統(tǒng),包括數(shù)字內(nèi)容擁有者、數(shù)字內(nèi)容授權(quán)中心、數(shù)字內(nèi)容分發(fā)服務(wù)器和授權(quán)用戶4部分。在服務(wù)器端,首先對數(shù)字內(nèi)容用對稱密鑰加密算法加密,然后將內(nèi)容密鑰放入用XML描述的內(nèi)容許可證中,在獲取用戶的公鑰后,使用用戶公鑰加密內(nèi)容許可證,最后將加密的數(shù)字內(nèi)容和內(nèi)容許可證傳送給用戶。在用戶端,授權(quán)用戶在獲得加密的數(shù)字內(nèi)容和用自己的公鑰加密的內(nèi)容許可證后,用自己的私鑰對內(nèi)容許可證進行解密,從而獲得內(nèi)容密鑰。有了內(nèi)容密鑰,用戶就可以使用它對數(shù)字內(nèi)容進行解密觀看。版權(quán)保護的核心是數(shù)字內(nèi)容授權(quán)中心,它采用密碼學(xué)技術(shù),經(jīng)過加密、授權(quán)和認證3個階段來獲得對數(shù)字內(nèi)容版權(quán)的保護。
數(shù)字內(nèi)容版權(quán)保護的主要措施:軟件和數(shù)據(jù)加密技術(shù)、水印加載技術(shù)、數(shù)字簽名技術(shù)、數(shù)據(jù)保密和數(shù)據(jù)完整性、CA認證技術(shù)、入侵檢測技術(shù)等。
數(shù)字圖書館電子商務(wù)模式可以分為B2B和B2C兩種模式。B2B電子商務(wù)模式主要體現(xiàn)在:①印刷型圖書采購。在電子商務(wù)采購平臺的支持下,采購人員可以直接在網(wǎng)上瀏覽書商發(fā)布的各種征訂目錄,并且可以將標準格式的采購數(shù)據(jù)如MARC格式下載到本地采購數(shù)據(jù)庫中,然后根據(jù)本館情況和需要進行篩選,通過WEB頁填寫訂單,上傳給書商。②在線銷售,這里的在線銷售既指數(shù)字圖書館通過網(wǎng)絡(luò)向出版商、書店及發(fā)行機構(gòu)出售本館印刷型或電子出版物的出版權(quán)或發(fā)行權(quán),也指數(shù)字圖書館通過網(wǎng)絡(luò)向其他數(shù)字圖書館和信息機構(gòu)出售或出租本館電子出版物、自建數(shù)據(jù)庫的鏡像權(quán)、使用權(quán)和復(fù)制權(quán)等,當(dāng)然也包括向個別用戶提供的書籍、音像制品、電子雜志、聯(lián)機出版物的在線銷售和訂閱。③在線訂購,與在線銷售相對應(yīng),在線訂購指數(shù)字圖書館通過網(wǎng)絡(luò)向出版商和發(fā)行機構(gòu)購買的電子出版物、電子報刊,向其他數(shù)字圖書館和信息機構(gòu)購買或租用的電子出版物、光盤數(shù)據(jù)庫及數(shù)字化館藏的鏡像權(quán)和使用權(quán)。B2C電子商務(wù)模式具體體現(xiàn)在辦理借閱卡、付費瀏覽和提供信息服務(wù)方面。
網(wǎng)絡(luò)技術(shù)日新月異的發(fā)展給數(shù)字圖書館帶來機遇的同時,也帶來嚴峻挑戰(zhàn)。筆者所構(gòu)建的數(shù)字圖書館系統(tǒng)從內(nèi)外兩方面出發(fā),充分考慮其先進性、開放性、敏捷性、安全性以及自主知識產(chǎn)權(quán),從而能更好地迎接這種新形勢下的挑戰(zhàn)。
[1]夏立新.數(shù)字圖書館導(dǎo)論.武漢:湖北人民出版社,2004.
[2]李培.數(shù)字圖書館原理及應(yīng)用.北京:高等教育出版社,2004.
[3]黃如花.數(shù)字圖書館原理與技術(shù).武漢:武漢大學(xué)出版社,2005.
[4]李爽.數(shù)字圖書館的體系結(jié)構(gòu)的設(shè)計原則與系統(tǒng)構(gòu)成.圖書情報知識,2004(2).
[5]雷濤.利用SAN技術(shù)構(gòu)建數(shù)字圖書館存儲系統(tǒng).麗水學(xué)院學(xué)報,2008(2).
[6]蔡偉鴻,彭思喜,胡斯捷.基于版權(quán)保護的數(shù)字內(nèi)容安全交易系統(tǒng)的設(shè)計與實現(xiàn).計算機工程與設(shè)計,2005(9).
[7]何雄.數(shù)字圖書館實現(xiàn)電子商務(wù)模式研究.圖書館學(xué)研究,2004(8).