曹 嵐,陳建梅
(浙江省電力試驗(yàn)研究院, 杭州 310014)
電力信息化
浙江電力數(shù)字圖書館建設(shè)
曹 嵐,陳建梅
(浙江省電力試驗(yàn)研究院, 杭州 310014)
數(shù)字圖書館的開發(fā)與應(yīng)用為電力行業(yè)信息資源的全面整合與共享提供了平臺。介紹了浙江電力數(shù)字圖書館的建設(shè)情況,針對其功能模塊、關(guān)鍵技術(shù)、發(fā)展方向進(jìn)行了探討。
數(shù)字圖書館;資源整合;異構(gòu)數(shù)據(jù)庫;統(tǒng)一檢索
浙江電力科技信息網(wǎng)站始建于 2003 年, 是省內(nèi)最大的電力科技資訊網(wǎng),為廣大電力企業(yè)、用戶提供快捷、方便、全方位的電力信息服務(wù)。截至 2009 年底, 網(wǎng)站擁有各類期刊、 會議論文1119.3 萬篇 , 博 /碩士論文 近 20 萬 篇 , 電 力科 技信息近 2 萬條, 國內(nèi)外技術(shù) 標(biāo)準(zhǔn)全文 1.6 萬 條,全國電力科技成果信息3萬余條。
隨著時(shí)間的推移和信息化技術(shù)的飛速發(fā)展,該網(wǎng)站也暴露出一些問題,制約了科技信息資源的有效利用,如:資源管理平臺已經(jīng)落后,不能實(shí)現(xiàn)一站式檢索;行業(yè)數(shù)字資源不足,難以滿足電力科技人員對國內(nèi)外高層次專業(yè)信息資源的需求等。為此,提出了升級電力科技信息網(wǎng),建設(shè)浙江電力數(shù)字圖書館的設(shè)想,以進(jìn)一步拓展本省電力企業(yè)數(shù)字信息資源的層次和覆蓋面。
數(shù)字圖書館是 20 世紀(jì) 90 年代伴隨著互聯(lián)網(wǎng)發(fā)展而產(chǎn)生的,是以信息資源為基礎(chǔ),以分布式計(jì)算機(jī)為操作手段,由遠(yuǎn)程通信系統(tǒng)連接的、結(jié)構(gòu)有序的集成化信息網(wǎng)絡(luò)系統(tǒng)[1]。 數(shù)字圖書館憑借其資源豐富、使用便捷的巨大優(yōu)勢而得到迅猛發(fā)展。
電力數(shù)字圖書館大多以行業(yè)專業(yè)數(shù)字資源和讀者服務(wù)為主要信息模塊。經(jīng)過多年的建設(shè)和積累,電力行業(yè)已擁有數(shù)量可觀且類型多樣的數(shù)字圖書館,并在此平臺上建設(shè)了大量特色數(shù)據(jù)庫。其中影響最大的是集中體現(xiàn)行業(yè)資源優(yōu)勢的國家電網(wǎng)公司數(shù)字圖書館,資源涵蓋電力動態(tài)、電力期刊、會議文集、技術(shù)標(biāo)準(zhǔn)、法律法規(guī)、科技報(bào)告、考察報(bào)告、科技成果、圖書手冊等,數(shù)據(jù)量達(dá) 860 萬頁, 其應(yīng)用軟件系統(tǒng)、 數(shù)字化系統(tǒng)、 信息防擴(kuò)散系統(tǒng)的設(shè)計(jì)也十分先進(jìn),信息資源分類編碼體系的設(shè)計(jì)符合電力行業(yè)特點(diǎn)。
近年來,為了構(gòu)建以總部為核心的公共信息資源共享體系,進(jìn)一步推廣應(yīng)用國家電網(wǎng)數(shù)字資源,提高行業(yè)資源利用率,各地網(wǎng)省電力公司紛紛新建、改造數(shù)字圖書館系統(tǒng)。據(jù)了解,這一輪數(shù)字圖書館建設(shè)大致有以下幾種模式:
(1)直接引入國家電網(wǎng)數(shù)字圖書館方式, 包括軟件平臺和數(shù)字資源,僅對主頁面進(jìn)行修改。頁面風(fēng)格、欄目設(shè)置基本與國家電網(wǎng)數(shù)字圖書館一致。
(2)一般已有網(wǎng)絡(luò)化科技信息服務(wù)基礎(chǔ), 購置過一些外部數(shù)字資源,或自建有特色數(shù)據(jù)庫。采用的模式為:在引入國家電網(wǎng)數(shù)字圖書館的基礎(chǔ)上,利用其檢索管理平臺,對原有信息資源進(jìn)行統(tǒng)一管理。這種模式構(gòu)建的數(shù)字圖書館延續(xù)國家電網(wǎng)數(shù)字圖書館風(fēng)格,功能以提供數(shù)字化資源和數(shù)據(jù)庫檢索為主。
(3)開發(fā)自成特色的科技信息服務(wù)平臺或知識管理平臺,將國家電網(wǎng)數(shù)字資源和其它數(shù)字資源進(jìn)行整合。這種模式構(gòu)建的數(shù)字圖書館,除了提供數(shù)字化的資源庫外,還為讀者提供電力行業(yè)動態(tài)資訊,進(jìn)行個(gè)性化服務(wù),實(shí)現(xiàn)知識管理等功能。浙江電力數(shù)字圖書館采用的就是該模式。
浙江電力數(shù)字圖書館的建設(shè)目標(biāo)是:開發(fā)構(gòu)建一個(gè)高穩(wěn)定性和先進(jìn)性的電力科技信息資源服務(wù)平臺。實(shí)時(shí)跟蹤、采集國內(nèi)外電力科技動態(tài)資訊;及時(shí)發(fā)布最新電力科技、標(biāo)準(zhǔn)信息;展示本省電力科技信息服務(wù)產(chǎn)品,如信息專遞、安全生產(chǎn)信息等;對用戶提交的各種信息需求進(jìn)行處理,包括科技查新管理、信息咨詢管理、刊物投稿管理等。
在數(shù)字資源方面,保留原有的維普中文期刊、萬方學(xué)位論文、萬方學(xué)術(shù)會議論文、中電海山國際標(biāo)準(zhǔn)、書生數(shù)字圖書等公共信息資源,增加同方數(shù)字資源(包括期刊、 博/碩士論文、 會議論文等);引入國家電網(wǎng)公司數(shù)字圖書館的電力行業(yè)信息資源;補(bǔ)充完善浙江省電力試驗(yàn)研究院自建的特色資源,如技術(shù)標(biāo)準(zhǔn)、電網(wǎng)科技成果、國際大電網(wǎng)會議論文、館藏文獻(xiàn)等。建成后的數(shù)字圖書館將涵蓋國內(nèi)外電力動態(tài)、全國電力科技成果、 中/外文期刊、博/碩士學(xué)位論文、學(xué)術(shù)會議論文、科技報(bào)告、國家電網(wǎng)考察報(bào)告、國際大電網(wǎng)會議論文、國內(nèi)外電力技術(shù)標(biāo)準(zhǔn)、 IEC 標(biāo)準(zhǔn)、ISO 標(biāo)準(zhǔn)、 電子圖書手冊、 法律法規(guī)等全文數(shù)據(jù)資源。
在上述海量數(shù)字資源基礎(chǔ)上建設(shè)的浙江電力數(shù)字圖書館,必須具有強(qiáng)大的信息搜索功能,能同時(shí)滿足上百并發(fā)用戶的檢索和瀏覽。對來自不同服務(wù)商的異構(gòu)數(shù)據(jù)資源,必須通過數(shù)據(jù)庫平臺整合技術(shù),將基于不同平臺的數(shù)據(jù)庫集成到統(tǒng)一的平臺上,為用戶提供異構(gòu)資源統(tǒng)一檢索,實(shí)現(xiàn)跨數(shù)據(jù)庫查詢、跨數(shù)據(jù)庫鏈接全文,并在此基礎(chǔ)上開發(fā)個(gè)性化的延伸服務(wù)。
最終構(gòu)建完成的浙江電力數(shù)字圖書館將是兼具海量資源和便捷檢索優(yōu)勢的行業(yè)數(shù)據(jù)中心與科技信息服務(wù)平臺,為全省電力科技進(jìn)步工作奠定系統(tǒng)化、專業(yè)化的信息資源基礎(chǔ)。
3.1 網(wǎng)站架構(gòu)
浙江電力數(shù)字圖書館采用 B/S(Browse/Server, 瀏覽器 /服務(wù)器)架構(gòu)進(jìn)行數(shù)據(jù)瀏覽并結(jié)合 C/ S(Clent/Server, 客 戶端 /服務(wù)器)加工管 理數(shù)據(jù) ,能夠同時(shí)管理文字、圖片、多媒體等信息,并提供全文檢索服務(wù),支持網(wǎng)頁的動態(tài)發(fā)布。
系統(tǒng)平臺涵蓋了數(shù)據(jù)獲取、數(shù)據(jù)管理、數(shù)據(jù)共享、數(shù)據(jù)服務(wù)以及網(wǎng)站安全保障體系和運(yùn)營維護(hù)體系等多方面內(nèi)容,總體構(gòu)架如圖1所示。
圖1 網(wǎng)站總體架構(gòu)
(1)系統(tǒng)支撐層
包括支撐各類應(yīng)用運(yùn)行的網(wǎng)絡(luò)環(huán)境、網(wǎng)絡(luò)設(shè)備和主機(jī)設(shè)備、各類操作系統(tǒng)、基礎(chǔ)數(shù)據(jù)庫在內(nèi)的基礎(chǔ)系統(tǒng)軟件等。
(2)數(shù)據(jù)層
信息網(wǎng)展現(xiàn)出的數(shù)據(jù)來源主要包括各類技術(shù)標(biāo)準(zhǔn)、期刊全文、會議論文、學(xué)位論文,《浙江電力》期刊和安全生產(chǎn)信息,以及一些其他數(shù)據(jù)。
(3)技術(shù)支撐層
技術(shù)支撐層主要包括數(shù)據(jù)抽取、數(shù)據(jù)交換、數(shù)據(jù)遷移、數(shù)據(jù)集成及數(shù)據(jù)發(fā)布等應(yīng)用服務(wù)的技術(shù)支 撐 , 支 持 OAI, Web Service 等 協(xié) 議 , 以 及 海量非結(jié)構(gòu)化數(shù)據(jù)管理、結(jié)構(gòu)化數(shù)據(jù)管理、全文檢索、整合檢索、知識挖掘、日志統(tǒng)計(jì)分析、任務(wù)調(diào)度和流程驅(qū)動等核心服務(wù)支撐。
(4)表現(xiàn)層
表現(xiàn)層借助數(shù)據(jù)層和技術(shù)支撐層向用戶提供網(wǎng)絡(luò)化、集成化和個(gè)性化知識服務(wù),具備良好的信息導(dǎo)航、用戶管理和信息服務(wù)等功能,同時(shí)提供交互性強(qiáng)、表現(xiàn)形式多樣、簡捷方便的用戶訪問界面。
(5)安全體系
安全體系指涉及系統(tǒng)各個(gè)層面的完整的安全技術(shù)和措施。安全保障體系為整個(gè)系統(tǒng)提供鑒別、訪問控制、抗抵賴和數(shù)據(jù)機(jī)密性、完整性、可用性、可控性等安全服務(wù),形成集防護(hù)、檢測、響應(yīng)、恢復(fù)于一體的安全防護(hù)體系,實(shí)現(xiàn)實(shí)體安全、應(yīng)用安全、系統(tǒng)安全、網(wǎng)絡(luò)安全、管理安全,以滿足整個(gè)系統(tǒng)各層次的安全需求。
(6)標(biāo)準(zhǔn)和規(guī)范
網(wǎng)站遵循 J2EE, XML, JDBC, EJB, SNMP,HTTP, TCP/IP, SSL 等業(yè)界主流標(biāo)準(zhǔn)。
3.2 異構(gòu)資源整合解決方案
異構(gòu)資源整合平臺以 DC元數(shù)據(jù)標(biāo)準(zhǔn)為基礎(chǔ),支持元數(shù)據(jù)倉儲和異構(gòu)資源實(shí)時(shí)整合兩種模式,采用以元數(shù)據(jù)倉儲為主、標(biāo)準(zhǔn)協(xié)議整合為輔、頁面分析為補(bǔ)充的技術(shù)路線。元數(shù)據(jù)倉儲可提供高質(zhì)量、高效率整合檢索服務(wù),同時(shí)利用元數(shù)據(jù)信息挖掘知識服務(wù),是目前最好的一種整合方式。
如圖2所示,資源整合解決方案是從后臺數(shù)據(jù)層的資源組織配置、數(shù)據(jù)采集存儲,到中間業(yè)務(wù)邏輯系統(tǒng)的信息加工、數(shù)據(jù)集成,再到前臺展示系統(tǒng)的知識服務(wù)和信息分析的一個(gè)有機(jī)整體。
針對浙江電力數(shù)字圖書館中的各類異構(gòu)數(shù)字資源,異構(gòu)統(tǒng)一檢索系統(tǒng)通過以下3個(gè)方案滿足需求:
圖2 異構(gòu)資源整合技術(shù)原理圖
(1)應(yīng)用各種成熟先進(jìn)的資源整合模式和技術(shù)路線,結(jié)合資源特點(diǎn),研發(fā)具有廣泛資源適應(yīng)性的資源整合引擎,提供穩(wěn)定、高效、統(tǒng)一的檢索服務(wù)。
(2)解決文摘資源與全文資源關(guān)聯(lián)、 本地資源與互聯(lián)網(wǎng)資源互補(bǔ)、電子資源統(tǒng)一檢索與軟件業(yè)務(wù)系統(tǒng)對接等問題,并形成新的資源開放的系統(tǒng)開發(fā)服務(wù)平臺。
(3)提供包括統(tǒng)一導(dǎo)航、 統(tǒng)一認(rèn)證、 統(tǒng)一檢索、統(tǒng)一瀏覽、全文下載、鏈接整合、服務(wù)集成、開放平臺、個(gè)性化服務(wù)等功能的服務(wù)網(wǎng)站,方便用戶快速查找信息,并提供個(gè)性化服務(wù)。
3.3 異構(gòu)平臺部署
異構(gòu)統(tǒng)一檢索平臺支持多層次分布式異構(gòu)部署。 將 Web服務(wù)器、 應(yīng)用服務(wù)器、 負(fù)載均衡服務(wù)器、檢索服務(wù)器隔離,系統(tǒng)可擴(kuò)展性強(qiáng),可根據(jù)負(fù)載動態(tài)增加檢索服務(wù)器, 其中,Web服務(wù)器性能要求較高, 其他則可采用普通 PC 機(jī)。 采用多檢索服務(wù)器后,可以在提高檢索響應(yīng)速度的同時(shí)避免出現(xiàn)單臺主機(jī)超量訪問。
平 臺 前 后 臺 通 訊采 用 面 向 服 務(wù) 的 XML Gateway 集成,可方便部署到多種有安全限制的工作環(huán)境中。 異構(gòu)平臺系統(tǒng)拓?fù)湟妶D3。
4.1 專業(yè)、 海量的數(shù)據(jù)資源
圖3 異構(gòu)平臺系統(tǒng)拓?fù)鋱D
建設(shè)完成的浙江電力數(shù)字圖書館配置了專業(yè)、海量的全文數(shù)據(jù)資源?,F(xiàn)已擁有各類中文期刊、 會議論文超過 2254 萬篇, 博/碩士論文近 78萬篇,外文期刊文獻(xiàn) 16萬篇,國內(nèi)外技術(shù)標(biāo)準(zhǔn)36 萬項(xiàng), 法律法規(guī) 40 余萬項(xiàng), 國內(nèi)外電力動態(tài)信息近 60 萬條, 電子圖書手冊近 12 萬冊,全國電力科技成果信息4萬余項(xiàng)。
4.2 異構(gòu)資源統(tǒng)一檢索
浙江電力數(shù)字圖書館實(shí)現(xiàn)了異構(gòu)資源的統(tǒng)一檢索功能, 目前已整合了來自不同數(shù)據(jù)商的 26個(gè)數(shù)據(jù)庫。用戶可以通過網(wǎng)站首頁的統(tǒng)一檢索區(qū)對期刊、標(biāo)準(zhǔn)、論文、網(wǎng)站新聞等異構(gòu)資源進(jìn)行分類快速檢索,實(shí)現(xiàn)跨越多種數(shù)據(jù)庫、多種信息的聯(lián)合檢索。 也可從導(dǎo)航條上的“數(shù)字圖書館”進(jìn)入異構(gòu)資源列表,選擇目標(biāo)數(shù)據(jù)庫進(jìn)行個(gè)性化檢索,實(shí)現(xiàn)各類數(shù)據(jù)的一站式檢索,并鏈接全文。系統(tǒng)為用戶提供統(tǒng)一的檢索結(jié)果展示界面。
4.3 安全性
浙江省電力數(shù)字圖書館的安全性滿足 GB/T 22239-2008《信息系統(tǒng)安全等級保護(hù)基本要求》和《國家電網(wǎng)公司“SG186”工程信息系統(tǒng)安全等級保護(hù)驗(yàn)收標(biāo)準(zhǔn)》中對二級應(yīng)用的有關(guān)要求。 系統(tǒng)實(shí)現(xiàn)模塊身份驗(yàn)證,保證用戶的唯一性;利用密碼技術(shù)進(jìn)行會話初始化驗(yàn)證,限制用戶訪問的最大并發(fā)會話數(shù)。同時(shí)跟蹤和統(tǒng)計(jì)用戶的操作及系統(tǒng)功能的執(zhí)行,避免統(tǒng)計(jì)信息被刪除和修改。使用 IP 限制以控制用戶的訪問。 通過后臺代碼控制,提高了網(wǎng)站整體安全級別,實(shí)現(xiàn)防止 SQL 注入、跨站腳本漏洞、上傳腳本或可執(zhí)行文件、用戶繞過權(quán)限直接訪問、重要文件泄漏等,保證整個(gè)網(wǎng)站系統(tǒng)的安全性。
目前,浙江電力數(shù)字圖書館系統(tǒng)已基本建設(shè)完成。專業(yè)性更強(qiáng),信息量更大,外購資源更豐富,學(xué)科覆蓋面更廣,是兼具海量資源和便捷檢索優(yōu)勢的行業(yè)數(shù)據(jù)中心與科技信息服務(wù)平臺,也將成為全省電力系統(tǒng)職工的知識庫和資源庫。
如何使資源優(yōu)勢轉(zhuǎn)化為服務(wù)優(yōu)勢,構(gòu)建網(wǎng)絡(luò)環(huán)境下電力科技信息服務(wù)的新模式,是數(shù)字圖書館未來的發(fā)展方向。初步考慮可以從以下方面加強(qiáng)建設(shè):
(1)在信息服務(wù)流程管理方面, 在數(shù)字圖書館平臺上構(gòu)建查新自助委托管理系統(tǒng)、《浙江電力》網(wǎng)上投稿系統(tǒng)等;建立網(wǎng)上咨詢臺等在線客服機(jī)制,更好地為讀者做好網(wǎng)絡(luò)化信息服務(wù)。
(2)從個(gè)性化服務(wù)入手, 向個(gè)人網(wǎng)上數(shù)字圖書館推進(jìn)。如通過建立電子書架等方式讓讀者自主收藏感興趣的電子資源; 由讀者定制 “專題”,系統(tǒng)進(jìn)行多種方式的信息推送服務(wù)。
[1]徐魯.對電力企業(yè)數(shù)字圖書館模式的探討[J].華東電力, 2003(12)∶18-20.
[2]呂 云 , 趙 道 標(biāo).福 建 省 電 力 數(shù) 字 圖 書 館 的 設(shè) 計(jì) 與 開 發(fā)[J].福建電力與電工,2005(1)∶32-33.
[3]李 圓 ,沈 志 朝.論 電 力 行 業(yè) 數(shù) 字 圖 書 館 的 特 色 建 設(shè)[J].河南電力,2008(2)∶39-42.
[4]郭梅.圖書館的新模式——個(gè)人數(shù)字圖書館[J].西安電力高等??茖W(xué)校學(xué)報(bào),2009(34)∶156-157.
[5]周 育 忠.電 力 企 業(yè) 數(shù) 字 圖 書 館 建 設(shè) 的 探 討 [J].廣 東 電力,2009,22(9)∶66-68.
(本文編輯:龔 皓)
Construction of Zhejiang Electric Power Digital Library
CAO Lan, CHEN Jian-mei
(Zhejiang Electric Power Test and Research Institute, Hangzhou 310014, China)
The development and application of digital library provides a platform for integrating and sharing information resources in electric power industry.This paper introduces the construction of Zhejiang Electric Power Digital Library and discusses the functionmodule,key technology and development target.
digital library; resources integration; heterogeneous database; unified retrieval
TP392
: A
: 1007-1881(2011)02-0053-04
2010-11-16
曹 嵐(1969-), 女, 浙江嘉興人, 高級工程師,主要從事電力科技信息服務(wù)及管理工作。