文/趙澤宇 陳翼 張凱 宓詠
復旦大學:大數(shù)據(jù)促進服務模式轉變
文/趙澤宇 陳翼 張凱 宓詠
一脈傳承的歷史數(shù)據(jù)則能體現(xiàn)出數(shù)據(jù)對象在一定條件下的發(fā)展變化趨勢,這對于發(fā)現(xiàn)問題,優(yōu)化服務起到至關重要的作用。
復旦大學的校園信息化建設從2002年開始,至今已經(jīng)經(jīng)歷了IT基礎設施建設、信息化應用推進階段,進入信息化服務優(yōu)化階段。隨著業(yè)務與服務的發(fā)展,學校積累了大量教學、科研、管理方面的數(shù)據(jù)成為寶貴的資源,對這些資源的積累和有效利用將使得信息化向更深層次的服務模式轉變。
復旦大學從信息化建設初期就開始著手建設U-IDC校園數(shù)據(jù)中心,是國內最早建設校園數(shù)據(jù)中心的高校之一。經(jīng)過十余年發(fā)展,中心擁有由小型機、多組虛擬化集群支撐的400多個虛擬化應用的運行環(huán)境,存儲集群提供超過1.2PB的存儲空間。
共享數(shù)據(jù)庫系統(tǒng)作為數(shù)據(jù)中心的業(yè)務數(shù)據(jù)核心平臺,不僅為業(yè)務系統(tǒng)建立和管理數(shù)據(jù)庫,還針對人、財、物、事、文等大類建立了不同主題的專題和歷史數(shù)據(jù)庫,使得數(shù)據(jù)的組織和管理具有專業(yè)性和延續(xù)性。
在數(shù)據(jù)服務設計方面,根據(jù)服務的受眾不同,實施不同的規(guī)劃:綜合利用包括基礎數(shù)據(jù)在內的各類資源,逐步實現(xiàn)學校精細化管理,為學校提供決策支持;為各職能部門提供精準的數(shù)據(jù)查詢、統(tǒng)計和展示服務,為真正實現(xiàn)學校、院系兩級管理打下堅實基礎;建設個人數(shù)據(jù)中心直接服務于師生,提高數(shù)據(jù)展示度和師生滿意度等。
數(shù)據(jù)共享服務面向各應用系統(tǒng),通過數(shù)據(jù)的清洗、集中和交換、提供權威數(shù)據(jù)源和實時數(shù)據(jù)檢索服務,在數(shù)據(jù)共享的基礎上進行業(yè)務調整與融合。復旦大學從信息化建設開始就面臨著各個業(yè)務系統(tǒng)間的數(shù)據(jù)共享問題,通過UC權限圖表、星形共享庫模型的建設等技術手段,建立了全校范圍內的標準數(shù)據(jù)結構、統(tǒng)一數(shù)據(jù)編碼規(guī)范、清晰的數(shù)據(jù)維護—使用體系。在共享數(shù)據(jù)庫穩(wěn)定運行的基礎上,進行業(yè)務系統(tǒng)的功能調整和融合,在共享庫基礎上建設一站式信息服務門戶和統(tǒng)一數(shù)據(jù)檢索查詢統(tǒng)計服務。
數(shù)據(jù)共享能夠保證數(shù)據(jù)的一致性,但是對于歷史數(shù)據(jù)并沒有記錄下來,而一些日常業(yè)務的流水數(shù)據(jù)對于決策支持分析有非常大的幫助,但是對于其他業(yè)務卻意義不大,也沒有共享的必要,而這些數(shù)據(jù)的量級是非常大的,因此需要針對數(shù)據(jù)挖掘與決策支持建立專門的數(shù)據(jù)倉庫和大規(guī)模數(shù)據(jù)處理架構。復旦大學從2012年開始建立和逐步完善校級統(tǒng)一數(shù)據(jù)倉庫,著重存儲每天一個版本的業(yè)務數(shù)據(jù)、一卡通日常消費流水、日常網(wǎng)絡行為日志等大流量數(shù)據(jù),并通過分布式數(shù)據(jù)采集、分布式計算、虛擬化、內存計算等方式,建立一整套從采集、存儲、分析、計算、展現(xiàn)的架構。
在數(shù)據(jù)倉庫的基礎上,復旦大學建立了包含面向學生和教師對象在內的6大類17小類的主題數(shù)據(jù)展示系統(tǒng),主要包括人員信息類(教職工信息統(tǒng)計、學生信息統(tǒng)計、本??粕拘畔⒉樵儭⒔搪毠せ拘畔⒉樵?、研究生基本信息查詢)、科研類(文科科研數(shù)據(jù)分析、教師學術表現(xiàn))、教學類(研究生成績分析、招生數(shù)據(jù)分析、本科生生命周期數(shù)據(jù)分析)、綜合服務(一卡通分析、圖書館客流分析、綜合校情展示、其他信息)、學生工作(宿舍數(shù)據(jù)統(tǒng)計、宿舍使用情況統(tǒng)計)、報表類(教育部高基報表)等。
數(shù)據(jù)展示利用的服務主體是校領導和各職能部處,業(yè)務人員登錄系統(tǒng)選擇不同的數(shù)據(jù)主題和條件,定制符合自身需要的數(shù)據(jù)展示圖表。復旦大學從2012年開始推行此項服務,此舉解決了很多部門在日常工作中經(jīng)常會碰到的獲取學校業(yè)務數(shù)據(jù)難、實時性不高和準確性低的問題,受到業(yè)務部門的廣泛歡迎。在此基礎上,復旦大學信息化部門連續(xù)2年為學校高等教育研究所、本科生院、研究生院和發(fā)展規(guī)劃處等部門編撰年度的本科教學質量報告、研究生教育質量報告以及高等教育基層統(tǒng)計報表等提供數(shù)據(jù)材料,并支持數(shù)學學院、醫(yī)學院、招生辦等機構開展專項的教學、招生情況分析工作。
將信息化過程中積累的大數(shù)據(jù)進行分類和整合,抽取與“人”相關的各類信息,建立個人數(shù)據(jù)中心,為師生提供區(qū)別于管理視角的集中數(shù)據(jù)展示、數(shù)據(jù)填報、數(shù)據(jù)下載等服務,同時也簡化以“人”為對象的數(shù)據(jù)化過程。在個人數(shù)據(jù)中心基礎之上建立校級的統(tǒng)一填報中心,將填報服務與管理流程分離,使所有基礎數(shù)據(jù)對師生可見,減少重復上報,實現(xiàn)數(shù)據(jù)的高效利用。通過上述服務的提供,個人數(shù)據(jù)中心形成“學校-院系-個人”的逐級開放模式,以數(shù)據(jù)的充分利用為目標,激發(fā)用戶對數(shù)據(jù)維護的積極性和主動性,以此建立實時準確的個人數(shù)據(jù)交換平臺,融入學校核心數(shù)據(jù)庫。
個人數(shù)據(jù)中心服務產(chǎn)生的數(shù)據(jù)對推動教育教學改革能起到明顯的作用。通過個人數(shù)據(jù)中心,院系可以獲取到管理范圍內的非常全面的與個體相關的數(shù)據(jù),并且還可以按照教學、科研、管理等類別進行綜合查詢、統(tǒng)計及分析,通過為院系量身定做一些具有共性需求的報表,從而減輕院系的數(shù)據(jù)上報工作壓力,也更利于促進院系的管理水平的提升。
隨著校園信息化的推進,新的業(yè)務系統(tǒng)和服務系統(tǒng)的出現(xiàn)容易制造出新的“數(shù)據(jù)孤島”,因此要建立適宜的數(shù)據(jù)管理機制,促進大數(shù)據(jù)管理和利用的良性發(fā)展。根據(jù)復旦大學數(shù)據(jù)服務和管理的經(jīng)驗來看,良好的數(shù)據(jù)管理機制包括加強數(shù)據(jù)標準建設、重視歷史數(shù)據(jù)積累、健全數(shù)據(jù)管理隊伍,以需求主導服務方向,建立互助互利的數(shù)據(jù)交流模式。
增強數(shù)據(jù)標準化建設應堅持在全校業(yè)務系統(tǒng)和服務系統(tǒng)推行統(tǒng)一編碼,去除阻礙數(shù)據(jù)整合和流通的潛在隱患。在業(yè)務管理層面,建立以用戶角色在校活動的階段和身份為主線,將“招生-迎新-教學-培養(yǎng)-學工-就業(yè)-離校-校友”全系列數(shù)據(jù)依據(jù)先后關系組織到一起,形成條理清晰的業(yè)務數(shù)據(jù)鏈結構;在教學資源層面,建立以知識化的資源管理結構,將異構的資源媒體統(tǒng)一管理;在網(wǎng)絡行為層面,以數(shù)據(jù)化為著眼點,建立以“人”為中心的數(shù)據(jù)索引和存儲模式。
歷史數(shù)據(jù)積累強調關注數(shù)據(jù)的變化體現(xiàn)出來的規(guī)律。大部分的傳統(tǒng)業(yè)務系統(tǒng)和服務系統(tǒng)注重短期、實時數(shù)據(jù)對業(yè)務運作的支持,強調數(shù)據(jù)單體的精確度、及時性,而并不關注分析數(shù)據(jù)相互之間的聯(lián)系。而一脈傳承的歷史數(shù)據(jù)則能體現(xiàn)出數(shù)據(jù)對象在一定條件下的發(fā)展變化趨勢,這對于發(fā)現(xiàn)問題,優(yōu)化服務起到至關重要的作用。
大量數(shù)據(jù)的堆積并不能直接產(chǎn)生效益,其分析過程需要創(chuàng)新的思路和對業(yè)務的深入理解。研究表明,數(shù)據(jù)挖掘通常只能解決20%~30%的問題,真正復雜、重要的問題要靠數(shù)據(jù)處理、數(shù)據(jù)集成和數(shù)據(jù)質量來解決。這就要求校園信息化中做數(shù)據(jù)分析的人員需要具備既懂得數(shù)據(jù)、又懂得業(yè)務的復合能力,能將業(yè)務帶入到數(shù)據(jù)剖析過程、將技術傳遞給業(yè)務人員;同時也要求IT人員要熟悉業(yè)務、逐步向數(shù)據(jù)分析員角色轉換。
表1 個人數(shù)據(jù)中心服務
以決策需求主導數(shù)據(jù)服務方向應重視數(shù)據(jù)分析與挖掘對學校管理改革的支撐,有的放矢、真正為學校決策支持提供數(shù)據(jù)服務;信息化部門應主動出擊、拋磚引玉,為學校、業(yè)務部門等不同層次的用戶提供定制的主題數(shù)據(jù)分析,形成常態(tài)化工作,并逐步使行為主體從信息化部門轉變?yōu)楣芾砺毮懿块T;讓學校和業(yè)務部門切實體會到信息化帶來的變化與好處,信息化部門也因此會成為學校管理和教育教學改革的真正推手。
所有信息化業(yè)務的運行都是建立在相對精確的數(shù)據(jù)基礎之上,數(shù)據(jù)質量問題不是僅僅通過IT等部門的技術手段就能解決的;數(shù)據(jù)只有在流轉中才能體現(xiàn)其價值,有價值的數(shù)據(jù)才能引起使用者的關注,使數(shù)據(jù)權威生產(chǎn)者變被動為主動地去維護數(shù)據(jù),以保證數(shù)據(jù)有效性;通過在IT部門和職能部門間形成互助互利的數(shù)據(jù)交流模式,提高職能部門提供業(yè)務數(shù)據(jù)的積極性。IT部門通過對數(shù)據(jù)的收集和整理,反過來為學校和業(yè)務部門反饋數(shù)據(jù)的統(tǒng)計和分析結果,相互推動工作的發(fā)展,建立“個人-院系-學?!弊韵露系臄?shù)據(jù)監(jiān)督與管理機制,形成內需拉動的信息化發(fā)展良性循環(huán)機制。
建立如上所述的數(shù)據(jù)管理良性生態(tài)環(huán)境,會對正在進行的高校信息化建設起到至關重要的作用,同時也必將成為正在走來的“大數(shù)據(jù)時代”的重要基礎。大數(shù)據(jù)的成功應用,也將進一步促進良性生態(tài)環(huán)境的不斷發(fā)展,為高校發(fā)展的長遠戰(zhàn)略目標提供有力支持。
(作者單位為復旦大學信息辦)