陳升暉 戚睿
(海南職業(yè)技術(shù)學(xué)院資源信息中心 海南省海口市 570216)
智慧化校園起源于數(shù)字化校園的概念。國外數(shù)字化校園建設(shè)起源于1990年美國克萊蒙特大學(xué)教授凱尼斯·格林(Kenneth Green)發(fā)起并主持的一項名為“信息化校園計劃”的大型科研項目。我國的數(shù)字化校園向智慧化校園過渡的理論依據(jù)為《智慧校園總體框架》、《教育信息化2.0行動計劃》、《中國教育現(xiàn)代化2035》、《加快推進教育現(xiàn)代化實施方案(2018-2022年)》等文件。
數(shù)字化校園、智慧化校園的建設(shè)促進了校園信息化的發(fā)展。當(dāng)前很多高校能夠?qū)崿F(xiàn)“大數(shù)據(jù)”展示;有的學(xué)校建設(shè)了“智慧教室”,實現(xiàn)了對教學(xué)設(shè)備的管理和監(jiān)控;有的學(xué)校進行“大教務(wù)”、“大學(xué)工”等集成性系統(tǒng)建設(shè),在一定程度上解決了數(shù)據(jù)孤島、數(shù)據(jù)共享、數(shù)據(jù)一致的問題;有的學(xué)校實現(xiàn)了教學(xué)資源網(wǎng)上平臺,能夠?qū)崿F(xiàn)網(wǎng)上教學(xué)授課和教學(xué)資源共享。但是,智慧化校園建設(shè)依然存在諸多問題,數(shù)據(jù)共享依然不徹底,新的數(shù)據(jù)孤島不斷產(chǎn)生,經(jīng)過多次系統(tǒng)整合后似乎數(shù)據(jù)不一致現(xiàn)象依然存在,平臺間的數(shù)據(jù)似乎總還要依托電子表格導(dǎo)入、導(dǎo)出,電子表格還要反復(fù)填寫……可見,當(dāng)前高校的信息化建設(shè)水平距智慧校園目標(biāo)還有較大差距。
智慧校園的建設(shè)總體目標(biāo)是否需要分解,如何分解,智慧校園應(yīng)該通過幾個階段實現(xiàn),不同階段的衡量標(biāo)準(zhǔn)和階段性建設(shè)目標(biāo)是什么;以及處在在線聯(lián)機OLTP(On-Line Transaction Processing System)系統(tǒng)階段的高校如何實現(xiàn)數(shù)字化轉(zhuǎn)型,從而實現(xiàn)智慧化所需的數(shù)字基礎(chǔ),是本文研究的主要問題。
關(guān)于信息化發(fā)展進程,美國哈佛大學(xué)教授查理·諾蘭(Richard L Nolan)提出了經(jīng)典諾蘭階段模型(如圖1所示),該模型認(rèn)為,信息化發(fā)展必須經(jīng)過初始、推廣、控制、集成、數(shù)據(jù)管理和成熟6個階段,各個階段之間互相聯(lián)系,以實際應(yīng)用需求和技術(shù)發(fā)展逐步推動信息化不斷向更高階段深入,階段之間不能隔斷或超越。
圖1:諾蘭階段模型圖
信息系統(tǒng)的發(fā)展基本遵守了諾蘭六階段模型的發(fā)展,特別是該模型敏銳的指出了“數(shù)據(jù)”的重要性,非常前瞻性的將數(shù)據(jù)管理作為高級信息系統(tǒng)的第一步。這也與當(dāng)前各行各業(yè)進行的數(shù)字化轉(zhuǎn)型大潮相吻合,“成熟階段”更是與國標(biāo)“智慧校園”的總體建設(shè)目標(biāo)吻合。但是由于時代限制,諾蘭階段模型并沒有預(yù)測到互聯(lián)網(wǎng)對信息系統(tǒng)的影響,以及數(shù)據(jù)大爆炸后的大數(shù)據(jù)分析技術(shù)、AI技術(shù)、物聯(lián)網(wǎng)技術(shù)的技術(shù)變革。
根據(jù)高校信息化建設(shè)進程,結(jié)合諾蘭六階段模型思想,借鑒電商行業(yè)實踐,本文提出高校信息化階段模型,如圖2所示。
圖2:智慧化校園階段模型圖
硬件階段:上世紀(jì) 80年代中后期,美國計算機開始進入中國,對高校而言,費用是制約信息化進程的關(guān)鍵因素。
應(yīng)用普及階段:90年代高校觀念開始轉(zhuǎn)變,除了大量購買計算機硬件,還注重軟件應(yīng)用和教學(xué),這一階段軟硬件應(yīng)用及教學(xué)同時爆發(fā)。這一時期代表性建設(shè)成果是,計算機機房建設(shè),和各種開發(fā)語言和應(yīng)用軟件教學(xué)。
管理信息系統(tǒng) MIS(Management Information System)建設(shè)階段:上世紀(jì)末本世紀(jì)初,數(shù)據(jù)庫技術(shù)、軟件開發(fā)、軟件工程技術(shù)不斷完善,高校開始引入各種信息管理系統(tǒng),高校MIS時代開始了。這個階段代表性成果是各管理信息系統(tǒng)建設(shè)如:教務(wù)系統(tǒng)、學(xué)工系統(tǒng)、高校行政辦公系統(tǒng)、后勤管理系統(tǒng)等等。該階段信息系統(tǒng)的建設(shè)通常需要由業(yè)務(wù)部門提出需求,由軟件廠家根據(jù)行業(yè)經(jīng)驗、開發(fā)經(jīng)驗將各種規(guī)則與信息系統(tǒng)建設(shè)相結(jié)合,完成特定的功能。MIS能夠提供大量信息甚至報告,但其目標(biāo)是實現(xiàn)某一領(lǐng)域的管理,因為這些信息通常并非決策所需,MIS的主要作用還是使各項工作管理工作的規(guī)范化流程化。
OLTP應(yīng)用階段:隨著網(wǎng)絡(luò)技術(shù)的成熟和發(fā)展,MIS系統(tǒng)間需要各種協(xié)同和數(shù)據(jù)交換。聯(lián)機事務(wù)處理系統(tǒng)將各個系統(tǒng)鏈接在一起實現(xiàn)數(shù)據(jù)同步。這一階段的典型應(yīng)用為各種集成系統(tǒng)如“大學(xué)工”、“大后勤”以及脫胎于企業(yè)資源計劃管理系統(tǒng)的“校園資源計劃管理系統(tǒng)”CRM (Campus Resource Planning);依附于MIS系統(tǒng)群的數(shù)據(jù)交換系統(tǒng)“數(shù)據(jù)交換中心”、“一站式服務(wù)平臺”、“統(tǒng)一身份管理”等系統(tǒng),這一階段的主要是特點是實現(xiàn)了局部數(shù)據(jù)集成和數(shù)據(jù)交換,解決的主要問題是信息的跨域、跨系統(tǒng)流動。OLTP階段,消除了部分“信息孤島”,但大部分信息還是散亂在各系統(tǒng)中,不能根據(jù)決策需要,快速的組織數(shù)據(jù)、呈現(xiàn)靈活的信息報表呈現(xiàn)。
數(shù)據(jù)治理DG(Data Governance)階段:該階段是高校實現(xiàn)數(shù)據(jù)轉(zhuǎn)型的重要階段也是智慧校園的畢竟之路,在各高校信息化建設(shè)過程中,還處在探索階段,本階段的建設(shè)目標(biāo)是實現(xiàn)校園內(nèi)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的集中統(tǒng)一管理,具體包括:主數(shù)據(jù)和參考數(shù)據(jù)管理、數(shù)據(jù)操作管理、數(shù)據(jù)結(jié)構(gòu)管理、數(shù)據(jù)質(zhì)量管理、元數(shù)據(jù)管理、文檔和內(nèi)容管理、數(shù)據(jù)安全管理、以及數(shù)據(jù)開發(fā)10個專題。通過該階段的建設(shè)能夠高效把信息需求,轉(zhuǎn)化為數(shù)字需求,并能快速反饋數(shù)據(jù)資源是否能夠滿足信息需求,對已有數(shù)據(jù)能夠快速住址和展現(xiàn)、反饋出缺失數(shù)據(jù),能偶將數(shù)據(jù)作為資產(chǎn)有效管理。
數(shù)據(jù)發(fā)掘與分析階段:在數(shù)據(jù)實現(xiàn)有效管理的前提下,借助不斷發(fā)展的人工智能、高性能網(wǎng)絡(luò)技術(shù)和大數(shù)據(jù)技術(shù)、能夠高效的、不斷為校園師生提供各種便捷服務(wù),不斷促進校園“智慧化”。
高校信息化發(fā)展整體上與其他行業(yè)同步,但是相比先進制造、大型電商平臺相比還是相對落后。目前高校信息化程度主要集在前文所述的“聯(lián)機事務(wù)處理系統(tǒng)”階段,該階段的主要目標(biāo)是實現(xiàn)智慧校園所需的數(shù)據(jù)支撐,需要解決4方面問題:
(1)數(shù)據(jù)規(guī)則及管理問題。主要包括數(shù)據(jù)的定義,數(shù)據(jù)操作規(guī)則,數(shù)據(jù)的表示形式、親緣關(guān)系問題。
(2)數(shù)據(jù)組織及呈現(xiàn)問題??焖俚膶⒕唧w數(shù)據(jù)根據(jù)相關(guān)規(guī)則、途徑組織快速、高效、結(jié)構(gòu)化的方式組織并呈現(xiàn)出來。
(3)計算擴展問題。預(yù)留數(shù)據(jù)接口,為專用或通用的數(shù)據(jù)計算模塊對接,為計算組件或模塊提供有組織的數(shù)據(jù)。
(4)數(shù)據(jù)二次存儲問題。對非結(jié)構(gòu)數(shù)據(jù)的結(jié)構(gòu)化存儲,對已有的結(jié)構(gòu)化數(shù)據(jù)進行定義重構(gòu)重新組合。
以上4個方面問題通過數(shù)據(jù)中心平臺的數(shù)據(jù)治理模塊、數(shù)據(jù)處理模塊、主題數(shù)據(jù)庫、數(shù)據(jù)倉庫和數(shù)據(jù)服務(wù)引擎接口等4個模塊分別實現(xiàn):
數(shù)據(jù)治理模塊:該模塊解決數(shù)據(jù)規(guī)則及管理,包括數(shù)據(jù)的定義、數(shù)據(jù)操作規(guī)則、數(shù)據(jù)親緣關(guān)系。本模塊將數(shù)據(jù)作為專門資產(chǎn)應(yīng)用信息系統(tǒng)技術(shù)進行管理,用信息技術(shù)處理信息問題。通過該模塊建立全局?jǐn)?shù)據(jù)字典建立增、刪、改、查的規(guī)則,建立全局?jǐn)?shù)據(jù)字典的改動一致性規(guī)則,并能遇見更改后可能出現(xiàn)的程序故障范圍。用戶能夠?qū)?shù)據(jù)臺賬的管理實現(xiàn)自動或半自動的數(shù)據(jù)維護及優(yōu)化。通過該系統(tǒng)對規(guī)范接入校園的新系統(tǒng)新設(shè)備的新數(shù)據(jù)標(biāo)準(zhǔn)和規(guī)范。保證新系統(tǒng)、新設(shè)備接入校園所產(chǎn)生的數(shù)據(jù)有序增長、數(shù)據(jù)規(guī)范并持續(xù)可用。
數(shù)據(jù)處理模塊:解決數(shù)據(jù)組織和再現(xiàn)問題,接受數(shù)據(jù)需求,該模塊對需求進行數(shù)據(jù)分解并進行重新組織、加工再現(xiàn)。
主題數(shù)據(jù)庫、數(shù)據(jù)倉庫:處理解決數(shù)據(jù)二次存儲問題。為了提高數(shù)據(jù)檢索效率對于非實時數(shù)據(jù),對于常用的非實時性數(shù)據(jù)可經(jīng)過數(shù)據(jù)處理后存入響應(yīng)的主題數(shù)據(jù)庫備查。對于非結(jié)構(gòu)化數(shù)據(jù)可以先經(jīng)過數(shù)據(jù)處理后存入結(jié)構(gòu)化主題庫或數(shù)據(jù)倉庫中。
數(shù)據(jù)服務(wù)引擎接口:處理系統(tǒng)算力擴展問題,為數(shù)據(jù)服務(wù)引擎提供標(biāo)準(zhǔn)數(shù)據(jù)接口,可調(diào)用數(shù)據(jù)處理模塊。由數(shù)據(jù)需求驅(qū)動,數(shù)據(jù)需求經(jīng)過全局?jǐn)?shù)據(jù)系統(tǒng)標(biāo)定、優(yōu)化數(shù)據(jù)目標(biāo),并將處理結(jié)果傳遞給數(shù)據(jù)調(diào)度系統(tǒng),根據(jù)數(shù)據(jù)目標(biāo)生成查詢計劃,獲得數(shù)據(jù)結(jié)果,生成相應(yīng)的報表形成相應(yīng)的知識。全局?jǐn)?shù)據(jù)臺賬、全局?jǐn)?shù)據(jù)調(diào)度可通過Spark、Hadoop開源工具實現(xiàn),達到自建低成本的目標(biāo)。也可通過其他數(shù)據(jù)處理引擎來實現(xiàn),如阿里巴巴的數(shù)據(jù)中臺、數(shù)據(jù)湖泊概念下的系列工具等等,數(shù)據(jù)中心平臺及基礎(chǔ)數(shù)據(jù)整體模型如圖3所示。
圖3:數(shù)據(jù)中心平臺及基礎(chǔ)數(shù)據(jù)整體模型圖
圖3中另外2層為數(shù)據(jù)中心平臺的數(shù)據(jù)支撐,詳細(xì)說明如下:
第一層主要是數(shù)據(jù)來源層,有非結(jié)構(gòu)化數(shù)據(jù)如關(guān)物聯(lián)網(wǎng)設(shè)備采集的信息、各種電子文檔的采集的信息需要首先將信息的價值密度進行提純,然后存儲到數(shù)據(jù)主題庫中,數(shù)據(jù)主題庫的信息定期存入數(shù)據(jù)倉庫;也有結(jié)構(gòu)化數(shù)據(jù)的采集,如教務(wù)系統(tǒng)數(shù)據(jù)、學(xué)工系統(tǒng)數(shù)據(jù)、收費系統(tǒng)數(shù)據(jù)、人事系統(tǒng)數(shù)據(jù)、后勤等系統(tǒng)數(shù)據(jù),分別存入主題數(shù)據(jù)庫,并定時存入數(shù)據(jù)倉庫。
第二層主要是數(shù)據(jù)交換的各種技術(shù)、技術(shù)標(biāo)準(zhǔn)和接口的集成,作用是使異構(gòu)數(shù)據(jù)能夠在數(shù)據(jù)存儲結(jié)構(gòu)中流動。地數(shù)據(jù)密度價值的文檔信息、物聯(lián)網(wǎng)等信息一般到主題庫是單向的。業(yè)務(wù)系統(tǒng)間為了完成跨操作,往往需要數(shù)據(jù)穿透,系統(tǒng)間的數(shù)據(jù)交換通常是雙向的。業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫中的表和數(shù)據(jù)可分為CREATER(數(shù)據(jù)的來源)和USER(數(shù)據(jù)引用)兩種類別,不能確定來源關(guān)系的一律視為CREATER。ETL技術(shù)(萃取傳輸裝載技術(shù)Extract-Transform-Load)從非結(jié)構(gòu)數(shù)據(jù)源、異構(gòu)數(shù)據(jù)源抽取有價值、有需要的數(shù)據(jù)并向目的數(shù)據(jù)庫、數(shù)據(jù)倉庫進行存儲的過程,ETL策略就是該過程運行的策略,要想實現(xiàn)這一過程通常還需要第三方工具。
數(shù)據(jù)中心平臺整體框架的各部分建設(shè)應(yīng)有序、穩(wěn)步推進。數(shù)據(jù)的分類、清洗,數(shù)據(jù)詞典的確定,主題數(shù)據(jù)庫、數(shù)據(jù)倉庫的建立,是托管數(shù)據(jù)展現(xiàn)和應(yīng)用的基礎(chǔ)。
(1)數(shù)據(jù)倉庫建設(shè) 為了實現(xiàn)對數(shù)據(jù)資產(chǎn)的有效管理,首先要將數(shù)據(jù)生成數(shù)據(jù)庫存,本文參照維度建模為理論基礎(chǔ),進行數(shù)據(jù)倉庫設(shè)計。第一步,生成業(yè)務(wù)板塊,考慮到OLTP系統(tǒng)處理業(yè)務(wù)的專用性,首先以現(xiàn)有業(yè)務(wù)系統(tǒng)生成業(yè)務(wù)板塊。第二步,對業(yè)務(wù)板塊的中的業(yè)務(wù)過程整合成若干數(shù)據(jù)域、原子指標(biāo)、派生指標(biāo)和抽象維度指標(biāo)體系的設(shè)立。第三步,確定分析指標(biāo);第四步,根據(jù)分析指標(biāo),為數(shù)據(jù)倉庫設(shè)計維度表、明細(xì)事實表和匯總事實表,形成統(tǒng)一規(guī)范的標(biāo)準(zhǔn)業(yè)務(wù)數(shù)據(jù)體系。第五步,根據(jù)業(yè)務(wù)特點,以相應(yīng)的周期定時生成相關(guān)業(yè)務(wù)表,建立統(tǒng)一的數(shù)據(jù)倉庫。
(2)數(shù)據(jù)治理系統(tǒng)建設(shè) 數(shù)據(jù)資產(chǎn)管理系統(tǒng),把數(shù)據(jù)作為資產(chǎn)獨立管理,建立和管理“數(shù)據(jù)”臺賬的,研究數(shù)據(jù)庫元數(shù)據(jù)采集引擎,通過用戶定義數(shù)據(jù)來源配置、權(quán)限配置、定時獲取數(shù)據(jù)庫的元數(shù)據(jù)和日志,實現(xiàn)對系統(tǒng)數(shù)據(jù)字典的采集,采集內(nèi)容應(yīng)包括數(shù)據(jù)字段、字段注釋、表視圖、存儲過程等信息,采集信息形數(shù)據(jù)臺賬基礎(chǔ)。采集完成數(shù)據(jù)后建立數(shù)據(jù)清洗規(guī)則,對于臟數(shù)據(jù)要能夠自動處理,不能處理的給予提示,可人工批量處理。
(3)數(shù)據(jù)處理模塊建設(shè) 數(shù)據(jù)處理模塊建設(shè)先建設(shè)結(jié)構(gòu)化數(shù)據(jù)處理部分,非結(jié)構(gòu)化數(shù)據(jù)在完成數(shù)據(jù)清晰和格式化后可調(diào)用結(jié)構(gòu)化處理模塊。
在數(shù)據(jù)中心平臺建成后,對全校的結(jié)構(gòu)化數(shù)據(jù)進行了配置,獲得了元數(shù)據(jù)管理權(quán)限,實現(xiàn)了結(jié)構(gòu)化數(shù)據(jù)跨系統(tǒng)提取。目前數(shù)據(jù)中心平臺共接入全校教務(wù)、OA辦公管理系統(tǒng)、財務(wù)收費、等21個主要系統(tǒng),完成了教師域、學(xué)生域、課程域的主題庫建設(shè),跨系統(tǒng)可有效管理1243個數(shù)據(jù)字段,如圖4所示。
圖4:數(shù)據(jù)中心平臺關(guān)鍵字段統(tǒng)計圖
數(shù)據(jù)中心平臺建成后,對跨平臺數(shù)據(jù)檢索效果較好,效率較高。以查詢學(xué)生欠費請款為例,在數(shù)據(jù)中心平臺建成前查詢學(xué)生欠費明細(xì),需要查詢財務(wù)系統(tǒng)學(xué)費實收費用(以財務(wù)系統(tǒng)專業(yè)名區(qū)分),查詢教務(wù)系統(tǒng)應(yīng)收費用(以教務(wù)系統(tǒng)的專業(yè)名區(qū)分),需查詢后勤住宿費用。財務(wù)系統(tǒng)按年匯總變更數(shù)據(jù)。學(xué)生調(diào)整專業(yè)、或者教務(wù)處更改專業(yè)名稱,都會造成財務(wù)欠費表賬目不平。建立數(shù)據(jù)主題庫后,根據(jù)同一學(xué)生ID可以在相應(yīng)主題庫追蹤到專業(yè)調(diào)整、寢室調(diào)整、教材變更情況,每月可生成較為準(zhǔn)確的報表。業(yè)務(wù)數(shù)據(jù)結(jié)構(gòu)如圖5所示。
圖5:業(yè)務(wù)數(shù)據(jù)結(jié)構(gòu)圖
本文通過對諾蘭模型的改造,對智慧校園目標(biāo)進行了分解。明確了數(shù)據(jù)、以及有效的數(shù)據(jù)管理是實現(xiàn)智慧校園的關(guān)鍵,明確了當(dāng)前主要目標(biāo)需要通過數(shù)據(jù)中心平臺完成對數(shù)據(jù)的有效管理。經(jīng)過實際數(shù)據(jù)的檢驗和測試,數(shù)據(jù)中心平臺有效實現(xiàn)了結(jié)構(gòu)化數(shù)據(jù)的跨平臺查詢,數(shù)據(jù)中心平臺也實現(xiàn)了對數(shù)據(jù)的有效管理,極大提高了跨庫查詢的效率和準(zhǔn)確度。但數(shù)據(jù)中心平臺對非結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)萃取、數(shù)據(jù)清洗能力還較差,非結(jié)構(gòu)數(shù)據(jù)轉(zhuǎn)化成結(jié)構(gòu)數(shù)據(jù)后的質(zhì)量也需要進一步提升,針對上述問題,立足于學(xué)校中長期學(xué)科和專業(yè)發(fā)展,進行全校業(yè)務(wù)全生命周期和跨部門協(xié)同管理的規(guī)劃設(shè)計,加強對數(shù)據(jù)治理、大數(shù)據(jù)分析應(yīng)用場景、數(shù)據(jù)服務(wù)接口方面的研究,不斷促進校園智慧化建設(shè)水平提升。