摘要:伴隨大數(shù)據(jù)的應(yīng)用,高校在信息化建設(shè)方面對于多源異構(gòu)的問題亟待解決。高校應(yīng)用系統(tǒng)多,導(dǎo)致異構(gòu)數(shù)據(jù)存放分散,缺點是側(cè)重具體業(yè)務(wù)、分散建設(shè)、集成性差及可用性低?;谝陨蠁栴},以及主數(shù)據(jù)建設(shè)關(guān)鍵性和長期有效的特征,提出建設(shè)主數(shù)據(jù)平臺,通過建設(shè)符合高校信息規(guī)范的數(shù)據(jù)管理體系和主數(shù)據(jù)平臺,提供標準化統(tǒng)一的數(shù)據(jù)管理,解決數(shù)據(jù)冗余和各個業(yè)務(wù)系統(tǒng)數(shù)據(jù)不一致問題,實現(xiàn)系統(tǒng)的集成及數(shù)據(jù)在系統(tǒng)之間的共享,以此促進大數(shù)據(jù)技術(shù)在教育行業(yè)的應(yīng)用及研究。
關(guān)鍵詞:主數(shù)據(jù);數(shù)據(jù)交換;數(shù)據(jù)集成;服務(wù)接口;編碼標準;數(shù)據(jù)庫注冊
中圖分類號:TN302.7文獻標志碼:A文章編號:1008-1739(2019)18-70-4
0引言
數(shù)據(jù)已經(jīng)是企業(yè)的一種資產(chǎn),主數(shù)據(jù)建設(shè)屬于數(shù)據(jù)治理的內(nèi)容之一,國內(nèi)數(shù)據(jù)治理方面先后印發(fā)了《政務(wù)信息資源共享管理暫行辦法》《政務(wù)信息系統(tǒng)整合共享實施方案》。數(shù)據(jù)是信息的載體,信息和數(shù)據(jù)互相依存,信息技術(shù)是新型高等學校的支撐。主數(shù)據(jù)管理概念于21世紀初在國外被提出,國外在ERP系統(tǒng)中提出主數(shù)據(jù)管理,旨在實現(xiàn)企業(yè)業(yè)務(wù)系統(tǒng)互聯(lián)互通[1],打破信息孤島[2-3]。文獻[4-6]在企業(yè)和高校主數(shù)據(jù)的建設(shè)及應(yīng)用可以通過面向服務(wù)的架構(gòu)(SoA)和企業(yè)服務(wù)總線(ESB)技術(shù)實現(xiàn),主數(shù)據(jù)平臺建設(shè)是實現(xiàn)數(shù)據(jù)共享、規(guī)范化和流程化管理的基礎(chǔ)。為了確保系統(tǒng)數(shù)據(jù)正確、一致和可控,保證數(shù)據(jù)分析結(jié)果和質(zhì)量,高校數(shù)據(jù)治理和主數(shù)據(jù)平臺建設(shè)方面的工作將大有可為[7]。
1編碼
1.1編碼原則、標準和集成方案
編碼是主數(shù)據(jù)平臺建設(shè)的一項基礎(chǔ)工作,編碼要具有唯一性、可擴展性、簡單性、規(guī)范性、實用性及合理性,結(jié)構(gòu)、類型以及編寫格式必須統(tǒng)一,要盡可能地反映分類對象的特點,便于記憶。另外,編碼結(jié)構(gòu)要與分類體系相適應(yīng)。
數(shù)據(jù)標準管理是數(shù)據(jù)治理范疇的一個重要環(huán)節(jié),依據(jù)標準及相應(yīng)數(shù)據(jù)管理技術(shù)實現(xiàn)數(shù)據(jù)治理的過程。為了規(guī)范定義業(yè)務(wù)系統(tǒng)元數(shù)據(jù),使高校在信息建模、信息加工采集、資源共享等信息化建設(shè)方面具有統(tǒng)一的標準,需研究信息標準編碼標準體系的建設(shè)。西安某高校在利用主數(shù)據(jù)平臺建設(shè)解決多源融合的問題,實現(xiàn)數(shù)據(jù)編碼規(guī)范化方面取得了良好成效[8]。
編碼標準總體維護方案及編碼標準集成共享方案如圖1所示,編碼規(guī)范體系如圖2所示。
1.2編碼集成
以學工系統(tǒng)為例闡述信息標準編碼規(guī)范,編碼規(guī)范分為2部分:第1部分是學工管理自定義編碼規(guī)范,為業(yè)務(wù)系統(tǒng)建設(shè)過程中應(yīng)用到的自定義部分的編碼;第2部分是引用代碼規(guī)范,為學工系統(tǒng)建設(shè)過程中會引用到的國家標準編碼。此部分不需要編碼,后期在使用到相關(guān)編碼時作為標準直接引用。編碼標準集成及共享方案如圖3所示。
2主數(shù)據(jù)管理平臺設(shè)計
2.1數(shù)據(jù)拓撲設(shè)計
有文獻提及主數(shù)據(jù)建設(shè)支撐大數(shù)據(jù)分析,主數(shù)據(jù)標準化是行業(yè)展開大數(shù)據(jù)應(yīng)用的基礎(chǔ)和前提[9-11]。主數(shù)據(jù)管理平臺建設(shè)以學校信息化建設(shè)業(yè)務(wù)和主數(shù)據(jù)編碼的需求為起點,遵循應(yīng)用驅(qū)動原則,在學校解決具體教育教學管理的問題,實現(xiàn)信息化建設(shè)的低投入高產(chǎn)出。
主數(shù)據(jù)管理平臺對學校的學生、老師和組織機構(gòu)等基礎(chǔ)數(shù)據(jù)及主數(shù)據(jù)的產(chǎn)生和發(fā)布進行管理。主數(shù)據(jù)管理平臺具體負責學校辦公系統(tǒng)、學工系統(tǒng)、人事系統(tǒng)、教務(wù)系統(tǒng)和科研系統(tǒng)等編碼的維護和管理,提供數(shù)據(jù)集成接口,實現(xiàn)各個業(yè)務(wù)系統(tǒng)的數(shù)據(jù)集成,為各業(yè)務(wù)系統(tǒng)提供高質(zhì)量的主數(shù)據(jù)服務(wù)。提供定制功能實現(xiàn)主數(shù)據(jù)編碼規(guī)則及流程的支持。
主數(shù)據(jù)管理控制臺主要是校內(nèi)管理員使用,不對外開放。主數(shù)據(jù)平臺建設(shè)對數(shù)據(jù)庫環(huán)境、服務(wù)器的軟硬件及數(shù)據(jù)集成服務(wù)器有一定要求。數(shù)據(jù)庫類型建設(shè)要求為Oracle RDBMS。依據(jù)實際需求,設(shè)計的系統(tǒng)數(shù)據(jù)拓撲如圖4所示。
2.2服務(wù)器資源規(guī)劃
基礎(chǔ)平臺是主數(shù)據(jù)建設(shè)的基礎(chǔ)[12],主數(shù)據(jù)管理平臺基于SOA實現(xiàn)和其他業(yè)務(wù)系統(tǒng)的數(shù)據(jù)共享,依據(jù)需求部分資源規(guī)劃如表1所示。
2.3 WebLogic Server構(gòu)建
開發(fā)過程運用Web Service技術(shù),依據(jù)Web Service技術(shù)規(guī)范實施開發(fā),使應(yīng)用之間的數(shù)據(jù)交換得以實現(xiàn)。構(gòu)建WebLogic Server管理控制臺,實現(xiàn)對WebLogic Server域的管理。通過管理控制臺的Web應(yīng)用程序執(zhí)行的主要操作有8項:①配置、啟動和停止WebLogic Server實例;②配置WebLogic Server集群;③配置WebLogic Server服務(wù);④如數(shù)據(jù)庫連接(JDBC)和消息傳送(JMS);⑤配置安全參數(shù);⑥包括管理用戶、組和角色;⑦編輯選定的運行時應(yīng)用程序;⑧描述符元素、配置和部署應(yīng)用程序。
2.4數(shù)據(jù)源管理
主數(shù)據(jù)管理平臺數(shù)據(jù)源的管理需要實現(xiàn)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)源注冊。注冊信息有:系統(tǒng)名、Oracle的數(shù)據(jù)集成類工具(ODI)數(shù)據(jù)源名稱、數(shù)據(jù)庫管理系統(tǒng)類型(SQL Server 2008,Sybase,Oracal,Infornix,DB2等)、數(shù)據(jù)庫驅(qū)動、數(shù)據(jù)庫連接字符串、數(shù)據(jù)庫連接用戶名、數(shù)據(jù)庫連接用戶密碼、數(shù)據(jù)庫對象所有者和注冊系統(tǒng)描述信息。
2.5數(shù)據(jù)采集樣表及表的設(shè)計
主數(shù)據(jù)平臺數(shù)據(jù)對象管理實現(xiàn)對數(shù)據(jù)對象基本信息、字段屬性、引用關(guān)系和實體關(guān)系ER圖的操作。數(shù)據(jù)對象基本信息包含的操作:數(shù)據(jù)對象命名、修改人、修改時間和數(shù)據(jù)對象描述等信息。字段屬性包含的操作:字段名、中文簡稱、字段類型、是否主鍵和是否唯一等操作。引用關(guān)系包含:引用對象、引用對象中文簡稱和引用代碼表字段等信息。ER圖實現(xiàn)實體之間的關(guān)系模型,實現(xiàn)一對一關(guān)系、一對多關(guān)系、多對多關(guān)系及無任何約束的表的關(guān)系。
依據(jù)實際對系統(tǒng)表和業(yè)務(wù)表設(shè)計,系統(tǒng)表設(shè)計為綜合服務(wù)提供相關(guān)的接口服務(wù)數(shù)據(jù)表,數(shù)據(jù)通過接口調(diào)用自動寫入。設(shè)計的系統(tǒng)表和業(yè)務(wù)表如表2和表3所示。
建成學工系統(tǒng)測試庫如圖5所示。
2.6數(shù)據(jù)庫注冊及注冊實例
開發(fā)Web Service服務(wù)接口通過搭建Web Service服務(wù),獲取工廠實例,生成針對指定服務(wù)接口(URL)的客戶端,調(diào)用指定的方法實現(xiàn)。服務(wù)總線提供服務(wù)的注冊與申請授權(quán)流程、服務(wù)的查詢與分類功能、方便快捷的線上流量控制與緩存設(shè)置功能。將建好的數(shù)據(jù)庫注冊,注冊的主數(shù)據(jù)管理平臺信息如表4所示。
3應(yīng)用及網(wǎng)絡(luò)安全
學工方面應(yīng)用服務(wù)情況是解決對所有在籍在校學生基礎(chǔ)信息的收集,通過已掌握的學生基礎(chǔ)信息可進一步統(tǒng)計出有效數(shù)據(jù),作為學校開展全校策略和規(guī)劃工作的依據(jù)。學校管理老師可以設(shè)置基礎(chǔ)信息批次,設(shè)置開放時間、學生范圍、修改范圍以及審核流程等。學生在修改時間的范圍內(nèi)對個人基本信息進行完善或修改。按照審核流程,由班主任或輔導(dǎo)員進行學生基礎(chǔ)信息初審,再由院系負責人進行復(fù)審,最后由學校管理老師進行最終審核。班級信息與學生基礎(chǔ)信息從教務(wù)系統(tǒng)中獲取,并一起初始化到基礎(chǔ)信息中。接入應(yīng)用程序(APP)時,云端通過HTTP協(xié)議調(diào)用校內(nèi)應(yīng)用管理平臺的接口寫入應(yīng)用APP的注冊信息,同時生成應(yīng)用APP的安裝包,安裝包只能在本校使用。
整個平臺只有相關(guān)應(yīng)用服務(wù)器對公網(wǎng)開放某些端口,其他服務(wù)器公網(wǎng)都不能直接訪問,應(yīng)用程序統(tǒng)一通過代理出去。每臺服務(wù)器都開啟防火墻并在防火墻上限制開放的端口及限定訪問的IP,所有軟件安裝采用非root用戶,并限制root用戶直接連接服務(wù)器。定期修改服務(wù)器密碼確保安全。應(yīng)用程序安全采用Web應(yīng)用防火墻,做安全防護數(shù)據(jù)庫安全采用數(shù)據(jù)庫防火墻。平臺上線運行前做漏洞安全掃描。在網(wǎng)絡(luò)安全方面,應(yīng)用程序采用HTTPS。SSL VPN保證管理員遠程接入,出口采用核心防火墻。
4結(jié)束語
高校主數(shù)據(jù)平臺建設(shè)解決各個業(yè)務(wù)部門信息不一致問題,以主數(shù)據(jù)的編碼原則及其規(guī)范進行編碼設(shè)計。通過對服務(wù)器資源規(guī)劃部署,對WebLogic Server的構(gòu)建,對基礎(chǔ)數(shù)據(jù)的采集、整理及清洗工作,對業(yè)務(wù)系統(tǒng)表的設(shè)計,對整個平臺應(yīng)用安全的設(shè)置等工作,實現(xiàn)學校元數(shù)據(jù)管理、代碼標準管理、主數(shù)據(jù)管理和數(shù)據(jù)集成等。針對應(yīng)用實現(xiàn)了教務(wù)系統(tǒng)、學工系統(tǒng)、一卡通系統(tǒng)和招就系統(tǒng)等異構(gòu)數(shù)據(jù)源的整合。接下來將要完善各業(yè)務(wù)部門業(yè)務(wù)系統(tǒng)實時數(shù)據(jù)的采集及數(shù)據(jù)的深度融合,以此確保平臺建設(shè)的有效性和持續(xù)性,也為大數(shù)據(jù)應(yīng)用打下良好基礎(chǔ)。
參考文獻
[1]楊現(xiàn)民,王榴卉,唐斯斯.教育大數(shù)據(jù)的應(yīng)用模式與政策建議[J] .電化教育研究,2015,36(9):54-61.
[2] Singh S,Singh J.SSMDM: An Approach of Big Data for Semantically Master Data Management[C]// International ConferenceonComputingforSustainableGlobalDevelopment, IEEE,2015.
[3] Putro B L,Surendro K,Siregar H.Leadership and Culture of Data Governance for the Achievement of Higher Education Goals (Case study: Indonesia University of Education) [J].AIP Conference Proceedings,2016, 1708(1):1
[4]查永軍.大數(shù)據(jù)與高校院系治理[J].中國電化教育,2018,372(1):59-63.
[5] Druker D,Rich R.Master Data Management[J].DB2 Management,2015,10(3):33-36.
[6]張閃閃,顧立平,蓋曉良.國外信息服務(wù)機構(gòu)的數(shù)據(jù)管理政策調(diào)研與分析[J].圖書情報知識,2015,167(5):99-109.
[7]宋姣姣.神東主數(shù)據(jù)平臺系統(tǒng)的設(shè)計與實現(xiàn)[J].陜西煤炭, 2018,37(S1):105-108,145.
[8]鎖志海.西安交通大學教育大數(shù)據(jù)分析驅(qū)動智慧教育[J].中國教育網(wǎng)絡(luò),2017(10):20-21..
[9]陳君.主數(shù)據(jù)管理平臺建設(shè)研究[J].鐵道工程學報,2016,33(5):134-136.
[10]南旭光,張培.智能化時代我國高等教育治理變革研究[J].中國電教化教育,2018(6):1-7.
[11]李智蓉.數(shù)據(jù)管理信息系統(tǒng)接口集成設(shè)計方案[J].辦公自動化,2018,23(4):29-31.
[12]蔣遠輝,呂忠亭,任浩然.數(shù)據(jù)服務(wù)平臺在高校的建設(shè)與應(yīng)用[J].信息通信,2018(12):187-190.