張海波 林培發(fā) 張穎 張曉萌 張澤堃
摘要: 隨著高校信息化的發(fā)展,多種不同功能的信息系統(tǒng)建設(shè)帶來了“數(shù)據(jù)孤島”的問題。為了杜絕或減少系統(tǒng)之間的“數(shù)據(jù)孤島”,信息系統(tǒng)之間的數(shù)據(jù)交換和共享是一個行之有效的方法。該文以圖書信息系統(tǒng)為例,利用先進(jìn)的數(shù)據(jù)共享中心和數(shù)據(jù)清洗與整合系統(tǒng)平臺,結(jié)合高校的實(shí)際需求,實(shí)現(xiàn)了圖書信息系統(tǒng)和共享數(shù)據(jù)中心之間的數(shù)據(jù)交換,以及數(shù)據(jù)共享,在實(shí)際應(yīng)用中獲得了較好的應(yīng)用效果。
關(guān)鍵詞:高校信息化;圖書信息系統(tǒng);共享數(shù)據(jù)中心;數(shù)據(jù)交換
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)26-0001-04
Abstract: With the rapid development of informationization in colleges and universities, colleges and universities establish a lot of information systems, these different information systems with many various functions bring the problem of "data island". Data exchange and sharing between information systems is an effective method to eliminate or reduce the "data island". This paper takes the library information system as an example, and uses advanced data cleaning and integration platform to realize the exchange between the system and the shared data center according to the actual needs of the colleges and universities. In practice, good results have been achieved.
Key words:University information; Library information system; Shared data center; Data exchange
大數(shù)據(jù)時代的到來,使得高校對數(shù)據(jù)整合和共享的需求十分強(qiáng)烈[1]。這是因?yàn)?,高校不但有種類繁多的業(yè)務(wù)信息系統(tǒng),而且這些業(yè)務(wù)信息系統(tǒng)經(jīng)過多年運(yùn)行后,積累了大量的數(shù)據(jù)。一方面,這些數(shù)據(jù)由于分散在不同的業(yè)務(wù)系統(tǒng)中,數(shù)據(jù)的一致性、完整性、準(zhǔn)確性得不到保證[2],造成的結(jié)果就是信息系統(tǒng)的可靠性受到懷疑;二是隨著信息系統(tǒng)應(yīng)用的不斷深入,大量的數(shù)據(jù)采集和數(shù)據(jù)交換工作成為常態(tài),原有的應(yīng)用系統(tǒng)卻沒有提供這樣的功能,學(xué)校不得不采用手工方式或定制開發(fā)的方式應(yīng)付不斷出現(xiàn)的數(shù)據(jù)采集和交換的需求,成本高并且效率低下[3];三是這些數(shù)據(jù)本來是學(xué)校寶貴的財(cái)富,但由于沒有合適的數(shù)據(jù)整合和共享的平臺以及工具,數(shù)據(jù)得不到有效的利用,反而因日益膨脹的存儲需求而變成了負(fù)擔(dān)。
針對高校圖書信息系統(tǒng)來說,它本身是一個獨(dú)立的信息系統(tǒng),擁有自己獨(dú)立的數(shù)據(jù)庫系統(tǒng),和高校的其他信息系統(tǒng)不存在數(shù)據(jù)交換和共享的關(guān)系,成為了名副其實(shí)的“數(shù)據(jù)孤島”。比如教師和學(xué)生的信息需要圖書信息系統(tǒng)的管理員經(jīng)常性的手動添加、刪除、導(dǎo)入;師生登錄圖書信息系統(tǒng)需要單獨(dú)的賬號和密碼;圖書信息系統(tǒng)管理員對師生登錄賬號單獨(dú)進(jìn)行管理和維護(hù);師生的借閱信息在高校的其他信息系統(tǒng)里不能瀏覽或查詢,等等。
為解決以上的問題,從學(xué)校的層面上,應(yīng)該建設(shè)數(shù)據(jù)共享中心[4],各個業(yè)務(wù)信息系統(tǒng)(包括圖書信息系統(tǒng))可以按數(shù)據(jù)標(biāo)準(zhǔn)給數(shù)據(jù)共享中心提供所需的數(shù)據(jù),這個數(shù)據(jù)流程可以稱之為“上行數(shù)據(jù)”;從業(yè)務(wù)層面上,比如圖書信息系統(tǒng),也可以從共享數(shù)據(jù)中心獲得所需的數(shù)據(jù),比如教師、學(xué)生的信息,這個數(shù)據(jù)流程可以稱之為“下行數(shù)據(jù)”。所有的上行和下行的數(shù)據(jù)流程構(gòu)成了高校信息系統(tǒng)之間的數(shù)據(jù)交換和共享。
1 背景分析
共享數(shù)據(jù)中心是高校信息化的核心支撐平臺之一,設(shè)計(jì)科學(xué)合理的數(shù)據(jù)架構(gòu)對產(chǎn)品性能及應(yīng)用格局具有導(dǎo)向性作用[5]。共享數(shù)據(jù)中心為各業(yè)務(wù)系統(tǒng)提供一個集成的數(shù)據(jù)中心,它把重要的、通用的業(yè)務(wù)數(shù)據(jù)集成到中心數(shù)據(jù)庫中,為其它所有的業(yè)務(wù)信息系統(tǒng)提供準(zhǔn)確的、一致的數(shù)據(jù);從而便于數(shù)據(jù)在高校各個部門之間有效的流通、共享與利用,解決“數(shù)據(jù)孤島”問題;還可以減少重復(fù)的數(shù)據(jù)收集整理工作,從而減輕工作量和減少費(fèi)用的支出;還便于進(jìn)行數(shù)據(jù)分析,為各項(xiàng)決策提供強(qiáng)有力的支持,最終為實(shí)現(xiàn)信息集成提供一個可靠的、統(tǒng)一的數(shù)據(jù)支撐平臺。
共享數(shù)據(jù)中心可以對外提供統(tǒng)一的標(biāo)準(zhǔn)接口,不依賴于具體的應(yīng)用系統(tǒng),在不對現(xiàn)有系統(tǒng)進(jìn)行大的改變的基礎(chǔ)上完成分布式異構(gòu)系統(tǒng)之問的信息交換,實(shí)現(xiàn)一個具有可擴(kuò)展性、可定制性及與平臺無關(guān)性的異構(gòu)數(shù)據(jù)交換系統(tǒng),能很好地消除數(shù)據(jù)在結(jié)構(gòu)和語義上的差異,為數(shù)據(jù)集成、共享和交換提供支持。
我校圖書信息系統(tǒng)采用的是北京創(chuàng)訊未來軟件技術(shù)有限公司的圖書信息系統(tǒng)——現(xiàn)代電子化圖書館信息網(wǎng)絡(luò)系統(tǒng)(Modem Electronic Library Information and Nets System,MELINETS),整個系統(tǒng)包括三大部分:1)圖書館業(yè)務(wù)應(yīng)用部分:① 采訪子系統(tǒng);② 典藏流通子系統(tǒng);③ 連續(xù)出版物子系統(tǒng);④ 公共檢索子系統(tǒng);2)區(qū)域資源合作共享應(yīng)用系統(tǒng):① Z39.50公共檢索子系統(tǒng);② 館際互借子系統(tǒng);③ 編目中心子系統(tǒng);3)行政業(yè)務(wù)管理系統(tǒng):① 人事管理子系統(tǒng);② 設(shè)備管理子系統(tǒng)[6]。
MELINETS采用C/S或B/S應(yīng)用服務(wù)器/數(shù)據(jù)庫服務(wù)器體系結(jié)構(gòu),數(shù)據(jù)庫平臺采用大型關(guān)系數(shù)據(jù)庫管理系統(tǒng),可支持SYBASE、ORACLE等數(shù)據(jù)庫,采用POWERBUILDER、JAVA、C等多種語言開發(fā),增強(qiáng)系統(tǒng)的持續(xù)性和穩(wěn)定性。服務(wù)器端的設(shè)備可選用高檔微機(jī)、專用服務(wù)器以及中、小型計(jì)算機(jī),操作系統(tǒng)可選用UNIX、PCUNIX、LINUX、WIN2000/2008/2012等,適用于大、中、小各種類型的圖書館[6]。
在共享數(shù)據(jù)中心建設(shè)和數(shù)據(jù)交換方面,采用的是成都康賽信息技術(shù)有限公司(下稱康賽公司)的企業(yè)級數(shù)據(jù)清洗與整合系統(tǒng)(Comsys Data Cleaning and Integration Software,簡稱DCI)。DCI是以數(shù)據(jù)為核心,高效、穩(wěn)定、安全的中間件,可以結(jié)合應(yīng)用系統(tǒng)中的實(shí)際場景,完成整個數(shù)據(jù)清洗與整合的全過程,將分散的、孤立的、異構(gòu)的數(shù)據(jù)集中化、標(biāo)準(zhǔn)化和結(jié)構(gòu)化??梢哉蠈W(xué)校各部門的業(yè)務(wù)系統(tǒng)對外共享數(shù)據(jù),形成共享數(shù)據(jù)中心的基礎(chǔ)數(shù)據(jù)庫;系統(tǒng)可對基礎(chǔ)數(shù)據(jù)庫進(jìn)行綜合加工處理,形成公共共享交換數(shù)據(jù)庫;系統(tǒng)可根據(jù)需要自動從主題數(shù)據(jù)庫分別計(jì)算生成各種綜合報(bào)表數(shù)據(jù),形成統(tǒng)計(jì)報(bào)表數(shù)據(jù)庫等等。
2 系統(tǒng)設(shè)計(jì)
圖書信息系統(tǒng)與共享數(shù)據(jù)中心之間實(shí)現(xiàn)數(shù)據(jù)交換和共享,是圖書信息系統(tǒng)與信息門戶之間實(shí)現(xiàn)單點(diǎn)登錄的基礎(chǔ)。另外,在信息門戶中,師生用戶可以查看個人的圖書借閱信息以及圖書館的圖書資料信息。本文主要討論圖書信息系統(tǒng)的數(shù)據(jù)交換與共享。在圖書信息系統(tǒng)與共享數(shù)據(jù)中心之間主要解決以下問題:
1) 解決圖書信息系統(tǒng)的“數(shù)據(jù)孤島”問題,把圖書信息系統(tǒng)需要的數(shù)據(jù)交換過來。
2) 把圖書信息系統(tǒng)的數(shù)據(jù)交換到共享數(shù)據(jù)中心,以實(shí)現(xiàn)與其他信息系統(tǒng)的共享。
3) 實(shí)現(xiàn)信息系統(tǒng)間的數(shù)據(jù)同步交換,保證不同系統(tǒng)關(guān)聯(lián)數(shù)據(jù)的自動同步,準(zhǔn)確一致。
4) 實(shí)現(xiàn)高校跨部門、跨業(yè)務(wù)、跨應(yīng)用的管理流程集成和全校數(shù)據(jù)信息共享,解決高校管理漏洞,減少重復(fù)工作等問題。
5) 實(shí)現(xiàn)所有數(shù)據(jù)的全面集成和智能分析。
6) 實(shí)現(xiàn)快速、準(zhǔn)確的獲取高校中人、財(cái)、物和學(xué)、研、管業(yè)務(wù)過程中的信息。
針對圖書信息系統(tǒng)的數(shù)據(jù)交換和共享,具體功能主要體現(xiàn)在:
整合圖書館管理系統(tǒng)的借閱數(shù)據(jù),能夠獲取學(xué)生的圖書借閱情況,為學(xué)校的管理工作開展提供支持。整合后的圖書館管理系統(tǒng)能夠從共享數(shù)據(jù)中心直接獲取學(xué)生和教職工信息的基礎(chǔ)數(shù)據(jù),利于辦理圖書館相關(guān)業(yè)務(wù)。實(shí)時獲取學(xué)生圖書借閱情況,學(xué)生管理人員在辦理離校手續(xù)時,能夠直觀的查看相關(guān)學(xué)生的圖書館手續(xù)辦理狀態(tài)。學(xué)生欠書提示將通過系統(tǒng)直接同步到學(xué)生或?qū)W生管理人員的個人門戶界面。基于數(shù)據(jù)共享業(yè)務(wù),無需單獨(dú)辦理借書證,學(xué)生和教職工僅攜帶自己的一卡通即可借閱圖書。
數(shù)據(jù)交換主要包含共享數(shù)據(jù)中心從圖書信息系統(tǒng)抽取數(shù)據(jù)(上行數(shù)據(jù))和圖書信息系統(tǒng)從共享數(shù)據(jù)中心訂閱數(shù)據(jù)兩個方面(下行數(shù)據(jù))。
下行的數(shù)據(jù)流程圖可見圖1所示。
從圖1中可知,圖書信息系統(tǒng)所需共享數(shù)據(jù)中心的數(shù)據(jù)通過DCI的數(shù)據(jù)抽取、清洗和轉(zhuǎn)換等流程到達(dá)中間庫,然后圖書信息系統(tǒng)的數(shù)據(jù)庫系統(tǒng)從中間庫取走所需的數(shù)據(jù)。在上行數(shù)據(jù)時,圖書信息系統(tǒng)把共享數(shù)據(jù)中心所需的數(shù)據(jù)放在中間庫后,通過DCI的數(shù)據(jù)抽取、清洗和轉(zhuǎn)換可以提交給中心庫,供共享數(shù)據(jù)中心及其他業(yè)務(wù)信息系統(tǒng)使用。從而實(shí)現(xiàn)圖書信息系統(tǒng)與共享數(shù)據(jù)中心之間需要同步的數(shù)據(jù)全部通過數(shù)據(jù)交換平臺DCI中間件實(shí)現(xiàn)數(shù)據(jù)同步。
3 數(shù)據(jù)交換和共享方案
3.1 上行數(shù)據(jù)方案
根據(jù)學(xué)校的實(shí)際情況,進(jìn)行了需求分析,最終確定12張表作為上行數(shù)據(jù)。其中圖書基本數(shù)據(jù)(V_TSG_ TSJBSJZLB)表的結(jié)構(gòu)見表1。
讀者當(dāng)前借閱數(shù)據(jù)(V_TSG_ TSJYSJZLB)表結(jié)構(gòu)見表2。
讀者基本數(shù)據(jù)(V_TSG_ DZSJZLB)表結(jié)構(gòu)見表3。
除了以上3張表以外,還有借閱歷史數(shù)據(jù)(V_TSG_ JYLSSJZLB)、預(yù)約通知數(shù)據(jù)(V_TSG_ YYTZSJ)、購書推薦數(shù)據(jù)(V_TSG_ GSTJSJ)、已回復(fù)的留言數(shù)據(jù)(V_TSG_ YHFLYSJ)、新書通報(bào)數(shù)據(jù)(V_TSG_ XSTBSJ)、借閱排行(V_TSG_ JYSJPH)、收藏排行(V_TSG_ SCPH)、查看排行(V_TSG_ CKPH)、書評排行(V_TSG_ SPPH)等表,由于篇幅所限,不再一一贅述。
這12張表所需的數(shù)據(jù)由圖書信息系統(tǒng)提供,其字段為參考字段,在實(shí)際編寫數(shù)據(jù)接口時可以以圖書信息系統(tǒng)實(shí)際字段為準(zhǔn),并盡可能提供全部相關(guān)字段。
圖書信息系統(tǒng)管理方參照本節(jié)的表編寫數(shù)據(jù)接口,并將數(shù)據(jù)接口相關(guān)參數(shù)提供給數(shù)據(jù)集成方,數(shù)據(jù)集成方按照學(xué)校需求對數(shù)據(jù)進(jìn)行采集,數(shù)據(jù)抽取具體時間及頻率等由學(xué)校共享數(shù)據(jù)中心管理員自行控制,圖書信息系統(tǒng)管理方需提供的數(shù)據(jù)接口內(nèi)容:數(shù)據(jù)庫類型、數(shù)據(jù)庫版本、IP地址、數(shù)據(jù)庫名稱、端口號、用戶名、密碼。當(dāng)然上行數(shù)據(jù)僅需數(shù)據(jù)庫用戶讀權(quán)限。
3.2 下行數(shù)據(jù)方案
圖書信息系統(tǒng)需要共享數(shù)據(jù)中心推送教師和學(xué)生的信息,用于結(jié)合學(xué)校的一卡通系統(tǒng),辦理圖書借閱、逾期扣款等業(yè)務(wù)。所以需要教師的基礎(chǔ)數(shù)據(jù)、學(xué)生的基礎(chǔ)數(shù)據(jù)以及學(xué)籍?dāng)?shù)據(jù)等。表4是教師的基礎(chǔ)數(shù)據(jù)(JZGJCSJZLB)表結(jié)構(gòu),其他的表不再一一贅述。
同樣道理,數(shù)據(jù)集成方參照本節(jié)的表編寫數(shù)據(jù)接口,并將數(shù)據(jù)接口相關(guān)參數(shù)提供給圖書信息系統(tǒng)管理方,圖書信息管理方按照圖書館的需求對數(shù)據(jù)進(jìn)行采集,數(shù)據(jù)抽取具體時間及頻率等由學(xué)校共享數(shù)據(jù)中心管理員自行控制,數(shù)據(jù)集成方需提供的數(shù)據(jù)接口內(nèi)容:數(shù)據(jù)庫類型、數(shù)據(jù)庫版本、IP地址、數(shù)據(jù)庫名稱、端口號、用戶名、密碼。
4 功能實(shí)現(xiàn)
在實(shí)際工作中,我校采用了康賽公司的共享數(shù)據(jù)中心系統(tǒng)與DCI系統(tǒng)。
共享數(shù)據(jù)中心包括信息標(biāo)準(zhǔn)管理工具、共享中心庫管理工具、數(shù)據(jù)服務(wù)管理工具,它與數(shù)據(jù)清洗轉(zhuǎn)換中間件DCI一起協(xié)作實(shí)現(xiàn)各類應(yīng)用管理系統(tǒng)間數(shù)據(jù)共享,形成全校權(quán)威數(shù)據(jù)中心庫,是為學(xué)校提供全面權(quán)威信息查詢統(tǒng)計(jì)和數(shù)據(jù)挖掘分析的重要基礎(chǔ)。
高校建立統(tǒng)一共享數(shù)據(jù)中心作為校內(nèi)基本數(shù)據(jù)的唯一共享平臺,集中整理各個業(yè)務(wù)部門的基本數(shù)據(jù),實(shí)現(xiàn)統(tǒng)一管理,保證數(shù)據(jù)的權(quán)威和準(zhǔn)確,為各個業(yè)務(wù)應(yīng)用系統(tǒng)和各類服務(wù)系統(tǒng)提供數(shù)據(jù)支持。
圖2是共享數(shù)據(jù)中心的一個頁面的功能截圖,該頁面主要可以完成圖書資料方面的信息標(biāo)準(zhǔn)化。
DCI產(chǎn)品實(shí)現(xiàn)了針對于數(shù)據(jù)的清洗與整合處理。它分別由數(shù)據(jù)整合管理系統(tǒng)(DCI-MS)、數(shù)據(jù)整合客戶端作業(yè)設(shè)計(jì)器(DCI-Studio)和數(shù)據(jù)整合執(zhí)行引擎(DCI-Engine)三個子系統(tǒng)組成,三個子系統(tǒng)在DCI產(chǎn)品中各司其職,扮演著不同的角色,完成各自的業(yè)務(wù)功能。圖3是數(shù)據(jù)交換的一個頁面的功能截圖,該頁面主要可以實(shí)現(xiàn)圖書信息中的讀者信息的數(shù)據(jù)交換。
5 結(jié)束語
本文基于康賽公司的共享數(shù)據(jù)中心和數(shù)據(jù)清洗與整合系統(tǒng)(DCI)產(chǎn)品,以高校圖書信息系統(tǒng)為例,論述了如何實(shí)現(xiàn)高校信息系統(tǒng)與高校共享數(shù)據(jù)中心之間的數(shù)據(jù)交換,同時,通過數(shù)據(jù)共享中心也可以把數(shù)據(jù)分享到相應(yīng)的信息系統(tǒng)中去,實(shí)現(xiàn)了高校信息系統(tǒng)數(shù)據(jù)的共享和交換。在保障數(shù)據(jù)交換的前提下實(shí)現(xiàn)高校信息數(shù)據(jù)的共享,從技術(shù)層面不僅可以杜絕或加減少高校信息系統(tǒng)之間的“數(shù)據(jù)孤島”問題,而且還可以為以后的智慧校園建設(shè)提供有力的支撐;從管理的層面不僅可以減少信息管理的工作,而且還可以提高全校信息化、自動化的管理水平。
參考文獻(xiàn):
[1] 張燕南. 大數(shù)據(jù)的教育領(lǐng)域應(yīng)用之研究[D]. 華東師范大學(xué),2016.
[2] 周宏廣. 異構(gòu)數(shù)據(jù)源集成中清洗策略的研究及應(yīng)用[D]. 中南大學(xué),2004.
[3] 林祿水. 高校數(shù)字化校園的數(shù)據(jù)集成設(shè)計(jì)與實(shí)現(xiàn)[D]. 湖南大學(xué),2015.
[4] 楊永濤; 佟連剛. 高校信息化建設(shè)中的數(shù)據(jù)共享研究[J].電子技術(shù),2014,1(43 ):20-22.
[5] 冉照海. 數(shù)字化校園規(guī)劃與實(shí)踐[D].長安大學(xué),2013.
[6] 龔紀(jì)文. MELINETS使用技巧[EB/OL].[2017-9-6].http://www.paper.edu.cn/releasepaper/content/200606-487.
[通聯(lián)編輯:唐一東]