文/周晶晶 付愛英 魯
一卡通變身校務決策“情報員”
南昌大學一卡通每月僅交易記錄就達到500萬條左右,一年就有6000萬條記錄,這些數(shù)據(jù)蘊含著巨大的資源信息。如果對系統(tǒng)中累積起來的數(shù)據(jù)進行統(tǒng)計、分析、挖掘、整合,就可以對一卡通用戶所有用卡活動的整體狀況、規(guī)律有一個量化的概念,這不僅可以作為今后一卡通系統(tǒng)更新升級的參照標準,也可以為校務決策提供數(shù)據(jù)“情報”來源。
南昌大學校園一卡通系統(tǒng)自2003年投入運行至今已有8年之久,產(chǎn)生了豐富而龐大的一卡通數(shù)據(jù),據(jù)統(tǒng)計,我校一卡通每月僅交易記錄就達到500萬條左右,一年就有6000萬條記錄,文件數(shù)據(jù)量一年達到了幾個Gbit。這些數(shù)據(jù)蘊含著巨大的資源信息,如果對系統(tǒng)中累積起來的數(shù)據(jù)進行統(tǒng)計、分析、挖掘、整合,就可以對一卡通用戶所有用卡活動的整體狀況、規(guī)律有一個量化的概念,這不僅可以作為今后一卡通系統(tǒng)更新升級的參照標準,也可以為校務決策提供數(shù)據(jù)“情報”來源。
然而,挖掘、分析、整合如此巨大的數(shù)據(jù),對計算機性能要求很高。所以,我校構(gòu)建了一套數(shù)據(jù)統(tǒng)計分析平臺,專門針對一卡通數(shù)據(jù)庫中的數(shù)據(jù)進行統(tǒng)計。我們采用Dell 的PowerEdgeC6145服務器,采用英特爾至強5000系列的Westmere-EP處理器,借助英特爾至強系列4核和6核處理器,能夠獲得比當前至強5600處理器最多提高33.92%的整數(shù)計算吞吐量,在性能上比上代系列提高67.3%,該款服務器能夠應對最高的數(shù)據(jù)庫與計算機工作負載。
通過一卡通,對圖書館的借閱記錄進行統(tǒng)計,將各類圖書的借閱次數(shù)做個曲線對比圖,可以分析出哪些種類的書籍是經(jīng)常被借閱的,哪些書籍借閱率不高,這樣圖書館下次定購書籍時就可以加強借閱率高的書籍的購買。
南昌大學校園一卡通平臺采用三層架構(gòu),實現(xiàn)中心數(shù)據(jù)庫和應用層的隔離,屏蔽用戶對數(shù)據(jù)庫的直接操作,在保證數(shù)據(jù)安全的前提下,通過這些接口對中心數(shù)據(jù)庫進行間接訪問;支持多數(shù)據(jù)庫操作系統(tǒng),多操作系統(tǒng)支持的數(shù)據(jù)訪問層具有標準的接口定義,當后臺數(shù)據(jù)庫操作系統(tǒng)發(fā)生變化時,前臺的應用系統(tǒng)無需變化;在應用層面,所有的子系統(tǒng)經(jīng)過管理中心的授權(quán),可以方便地接入一卡通中心平臺,接受系統(tǒng)集控平臺的統(tǒng)一管理。
與第三方系統(tǒng)對接時,傳輸基于TCP/IP網(wǎng)絡實現(xiàn),系統(tǒng)軟件分別從Web Service接口層、應用程序?qū)?、卡片讀寫層提供多種接口實現(xiàn);靈活的組網(wǎng)方式,接口的多樣化和標準化,為第三方系統(tǒng)接入提供堅實的基礎。
對一卡通數(shù)據(jù)庫海量數(shù)據(jù)的提取以及分析統(tǒng)計,對服務器的響應性能提出了很高的要求,所以應該新建數(shù)據(jù)庫,使之與一卡通數(shù)據(jù)庫形成主從關(guān)系,將專門分析數(shù)據(jù)的數(shù)據(jù)庫作為從數(shù)據(jù)庫,與一卡通數(shù)據(jù)庫連接。這樣可以避免使一卡通數(shù)據(jù)庫增加不必要的負擔,另外,采用新的數(shù)據(jù)庫專門進行數(shù)據(jù)統(tǒng)計也會大大提供工作效率。
南昌大學一卡通數(shù)據(jù)庫采用的是Oracle10g,配置主從庫如下所示:
拷貝主庫C:oraclecontrol01.ctl到從庫C:oracleoradataporamals目錄下。
配置主庫listener.ora和tnsnames.ora文件,可以用net manager配置或者直接編輯c:oracleora92etworkadminlistener.ora和tnsname.ora文件,也即正常為主庫配置偵聽和連接到主庫(primary)、主庫到從庫(standby)的網(wǎng)絡服務名。啟動主從庫的listener,分別在主從數(shù)據(jù)庫上執(zhí)行如下命令:
在主庫上創(chuàng)建pfile,因為10g缺省使用spfile:
拷貝剛才創(chuàng)建的C:oracleora92database.orainitpormals.ora到從庫相應目錄,修改從庫剛才拷貝的initpormals.ora文件。
圖 數(shù)據(jù)的提取和分析過程
配置完成后,主數(shù)據(jù)庫每天將系統(tǒng)產(chǎn)生的數(shù)據(jù)定時提取后轉(zhuǎn)存入從數(shù)據(jù)庫進行分析,數(shù)據(jù)處理過程以日志的形式寫入日志文件,不影響服務器的其他應用。根據(jù)選擇的模版和日期向數(shù)據(jù)庫請求數(shù)據(jù),并將接收到的數(shù)據(jù)輸出到Excel表格上,使用程序提供的各種模版來進行分析。設計框圖如圖所示。
對食堂消費數(shù)據(jù)的統(tǒng)計分析
在系統(tǒng)的消費記錄中,食堂的消費數(shù)據(jù)占絕大部分。一卡通系統(tǒng)為每個食堂設立獨立的工作站,我們可以在中心庫中以食堂的原始就餐數(shù)據(jù)為基礎,以各個食堂工作站為方向?qū)ζ溥M行統(tǒng)計分析。
對每個食堂一日三餐的消費總次數(shù)和分餐總次數(shù)做一個統(tǒng)計分析對比,由系統(tǒng)自動產(chǎn)生當天或當月的就餐營業(yè)量曲線圖,也可以按照時間段進行查詢,這樣可以一目了然地對比出各個食堂的營業(yè)量。因為學校新校區(qū)的占地面積很大,當需要新增食堂時,各個食堂營業(yè)量對比曲線圖可以作為新食堂選址的一個參考。
對食堂一日三餐每餐分時間段進行消費次數(shù)的統(tǒng)計,由系統(tǒng)自動產(chǎn)生每個時間段消費次數(shù)的高峰期和低谷期。因為食堂每天的銷售總份額都是基本固定的,師生數(shù)量并不固定,這就需要臨時增減份額,如果對食堂的高峰期和低谷期進行大概的了解,排除學校的假期時間,就可以提前準備增減所需的食材。
學生是食堂消費的主力軍,每個學生的消費能力參差不齊,所以食堂的價格一直是敏感話題。如果對所有食堂每天每餐的消費總額做一個曲線圖進行對比,可以對各個食堂的價格有個大致的了解,這樣也能遏制某些食堂亂漲價的現(xiàn)象。
對學生在食堂的消費額進行統(tǒng)計,例如設定消費金額范圍,統(tǒng)計各個范圍區(qū)的學生,如果長期在低消費區(qū)的學生,可能就是需要領(lǐng)取補助的困難學生,所以這個統(tǒng)計可以作為領(lǐng)取助學貸款的一個參考。
對學生行為數(shù)據(jù)的統(tǒng)計分析
在校園中,一卡通的功能不僅僅是消費,而且還包括門禁、圖書館、用電。在這幾個方面進行系統(tǒng)數(shù)據(jù)的統(tǒng)計,也是了解學生在校生活的一個手段。
首先,可以對學生門禁數(shù)據(jù)統(tǒng)計,以某個時間點為臨界值,超過該臨界值的門禁記錄即為晚歸學生的記錄,這樣就知道哪些學生經(jīng)常晚歸,可以督促班主任查明原因,加大監(jiān)管力度。
其次,通過一卡通,對圖書館的借閱記錄進行統(tǒng)計,將各類圖書的借閱次數(shù)做個曲線對比圖,可以分析出哪些種類的書籍是經(jīng)常被借閱的,哪些書籍借閱率不高,這樣圖書館下次定購書籍時就可以加強借閱率高的書籍的購買。
其三,對宿舍的用電量數(shù)據(jù)進行分析,因為消防安全是學校的重中之重,用電不當會導致火災。很多學生會購置學校禁用的用電設備并私下使用,這樣用電量就會明顯增加。對用電數(shù)據(jù)進行統(tǒng)計,就能檢查出哪些宿舍的用電量居高不下,可以作為檢查宿舍違規(guī)用電的一個依據(jù)。
對系統(tǒng)數(shù)據(jù)量的統(tǒng)計分析
對系統(tǒng)數(shù)據(jù)庫每天都定時備份。因為數(shù)據(jù)庫數(shù)據(jù)不斷增加,日志不斷增加,每天的備份量也基本成比例增長,所以截取數(shù)據(jù)庫中的數(shù)據(jù)是必要的工作??墒墙厝《嗌贁?shù)據(jù)?多長時間截取一次?這就可以通過系統(tǒng)數(shù)據(jù)量增長的曲線圖來判定。將每天備份的數(shù)據(jù)量畫出一個曲線圖,每天增長多少,磁盤空間還剩多少,然后制定出定時截取數(shù)據(jù)量的計劃。
校園一卡通是數(shù)字化校園的有機組成部分,對一卡通系統(tǒng)累積起來的各種數(shù)據(jù)進行統(tǒng)計分析,不僅為決策層提供有用的參考信息,也為將來構(gòu)建完整的數(shù)字化校園提供經(jīng)驗和實現(xiàn)方法。
(作者單位為南昌大學網(wǎng)絡中心)