劉 鵬,李 丹,孫思邈,黃 新,閆朝升
(1.黑龍江中醫(yī)藥大學(xué)人事處,黑龍江哈爾濱 150040;2.黑龍江中醫(yī)藥大學(xué)現(xiàn)代教育技術(shù)與信息中心,黑龍江哈爾濱 150040;3.黑龍江中醫(yī)藥大學(xué)醫(yī)學(xué)信息工程學(xué)院,黑龍江哈爾濱 150040)
教育大計(jì),教師為本。全面加強(qiáng)教師隊(duì)伍建設(shè)已成為一項(xiàng)重大政治任務(wù)和根本性民生工程[1]。高校師資管理工作在教師隊(duì)伍建設(shè)中占有極其重要的地位。面對(duì)知識(shí)經(jīng)濟(jì)時(shí)代,對(duì)于高校師資管理,應(yīng)積極運(yùn)用現(xiàn)代信息技術(shù),探尋師資管理決策支持的有效實(shí)現(xiàn)途徑,為教師隊(duì)伍建設(shè)提供科學(xué)依據(jù)。隨著數(shù)據(jù)分析、數(shù)據(jù)挖掘、大數(shù)據(jù)等前沿信息技術(shù)的飛速發(fā)展及其應(yīng)用日趨廣泛,我國(guó)加大了師資管理信息化的重視度,為師資的管理工作及其隊(duì)伍建設(shè)提出了更高要求[2]。目前,高校紛紛開展了人事管理信息化建設(shè),應(yīng)用了人事管理信息系統(tǒng),提高了師資隊(duì)伍管理工作水平,積累了大量歷史性、細(xì)節(jié)性的師資建設(shè)數(shù)據(jù)[3-8]。在此基礎(chǔ)上,面對(duì)師資管理決策支持需求,將數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘等前沿信息技術(shù)應(yīng)用于高校師資管理工作,旨在發(fā)現(xiàn)隱藏的、有價(jià)值的師資隊(duì)伍信息,為科學(xué)決策提供可靠依據(jù)[9-12]。
聯(lián)機(jī)分析處理(On-Line Analytical Processing,OLAP)利用上卷、下鉆、切片、切塊、旋轉(zhuǎn)等操作,從數(shù)據(jù)倉(cāng)庫(kù)(或數(shù)據(jù)集市)中,快速、一致和交互地獲取多維度、多層次的觀測(cè)指標(biāo)(即度量)數(shù)值,為用戶提供隱藏的、有價(jià)值的信息,進(jìn)一步為數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等過(guò)程提供數(shù)據(jù)預(yù)處理結(jié)果,以便發(fā)現(xiàn)更深層次、更有價(jià)值的知識(shí)[13]。目前,一些研究者已將OLAP 技術(shù)應(yīng)用到教學(xué)質(zhì)量、學(xué)生行為、教學(xué)狀況、招生就業(yè)等領(lǐng)域,驗(yàn)證了基于OLAP 數(shù)據(jù)分析處理的快速性、便捷性和互動(dòng)性[13-18]。如何有效地利用OLAP 技術(shù),從大量的師資管理事務(wù)數(shù)據(jù)中,快速、便捷地發(fā)現(xiàn)隱藏的、有價(jià)值的師資隊(duì)伍信息,深度、全面、準(zhǔn)確地把握師資隊(duì)伍建設(shè)狀況,支持科學(xué)、及時(shí)、準(zhǔn)確的師資隊(duì)伍建設(shè)決策,成為高校師資管理工作的重要任務(wù)。因此,文中提出了基于OLAP 的高校師資數(shù)據(jù)分析處理系統(tǒng)。該系統(tǒng)具有開發(fā)周期短、開發(fā)成本低、運(yùn)行維護(hù)便捷等特點(diǎn),為其他職能部門的OLAP 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)提供一種可行高效的方案與途徑。
該系統(tǒng)采用C/S(客戶機(jī)/服務(wù)器,Client/Server)模式,設(shè)計(jì)了高校師資數(shù)據(jù)聯(lián)機(jī)分析處理系統(tǒng)的體系結(jié)構(gòu),如圖1 所示。選擇C/S 模式的原因主要包括四方面。其一,系統(tǒng)用戶范疇主要界定為校領(lǐng)導(dǎo)、人事管理部門領(lǐng)導(dǎo)以及師資管理干事等三類人員,重點(diǎn)解決師資數(shù)據(jù)的多維分析需求。其二,基于C/S 模式的系統(tǒng)具有開發(fā)周期短、調(diào)試容易、網(wǎng)絡(luò)依賴度低等優(yōu)勢(shì)。其三,系統(tǒng)的數(shù)據(jù)存儲(chǔ)環(huán)境易在局域網(wǎng)內(nèi)進(jìn)行部署。其四,系統(tǒng)屬于分析型系統(tǒng),其使用的頻繁度低于操作型事務(wù)系統(tǒng)。
圖1 系統(tǒng)體系結(jié)構(gòu)
由圖1 可知,系統(tǒng)的體系結(jié)構(gòu)包括3 個(gè)層次,即客戶端、應(yīng)用服務(wù)端和數(shù)據(jù)服務(wù)端。作為用戶與系統(tǒng)交互的前臺(tái)接口,客戶端提供前端界面,調(diào)用應(yīng)用服務(wù)端的功能模塊。其中,多維分析界面用于生成和發(fā)送多維分析要求以及顯示分析結(jié)果信息,主要包括分析要求生成和分析結(jié)果顯示兩個(gè)子區(qū)域。上述兩個(gè)子區(qū)域分別對(duì)應(yīng)著“維度和度量”選擇區(qū)和“多維數(shù)據(jù)表”顯示區(qū)。用戶利用多維分析要求生成子區(qū)域,選定維度、層次和度量,生成分析要求并將其發(fā)送給應(yīng)用服務(wù)端。分析結(jié)果顯示子區(qū)域能夠多維多層地顯示應(yīng)用服務(wù)端返回的結(jié)果信息,并進(jìn)一步生成和發(fā)送分析要求(即用戶可以在分析結(jié)果顯示子區(qū)域中,通過(guò)鼠標(biāo)的單擊操作,快速生成新的分析要求)。應(yīng)用服務(wù)端是后臺(tái)數(shù)據(jù)服務(wù)端和前端界面之間的溝通橋梁,主要包括多維分析、結(jié)果輸出、數(shù)據(jù)加載和系統(tǒng)維護(hù)等功能模塊。作為系統(tǒng)的后臺(tái)數(shù)據(jù)存儲(chǔ)環(huán)境,數(shù)據(jù)服務(wù)端存儲(chǔ)著數(shù)據(jù)集市,為應(yīng)用服務(wù)端提供多維度、綜合、緊湊的數(shù)據(jù)源。另外,為了支持系統(tǒng)管理,數(shù)據(jù)集市存儲(chǔ)著系統(tǒng)維護(hù)的相關(guān)數(shù)據(jù),如用戶基本信息、數(shù)據(jù)加載日志等。
系統(tǒng)功能模塊主要包括多維分析模塊、結(jié)果輸出模塊、數(shù)據(jù)加載模塊和系統(tǒng)維護(hù)模塊等。
1)多維分析模塊:用于接收客戶端的分析要求,調(diào)用上卷、下鉆、切片、切塊、旋轉(zhuǎn)等OLAP 操作子模塊,生成查詢要求并將其發(fā)送給數(shù)據(jù)服務(wù)端,以及接收數(shù)據(jù)服務(wù)端返回的結(jié)果(即多維數(shù)據(jù)集)并將其發(fā)送至客戶端,顯示多維分析結(jié)果。
2)數(shù)據(jù)加載模塊:用于將外部數(shù)據(jù)源(如人事管理系統(tǒng)的后臺(tái)數(shù)據(jù)庫(kù)、Excel 數(shù)據(jù)文件等)的數(shù)據(jù),通過(guò)抽取、轉(zhuǎn)換和載入(Extract-Transform-Load,ETL)過(guò)程,生成多維度、多層次的聚合數(shù)據(jù),存入數(shù)據(jù)服務(wù)端的數(shù)據(jù)集市,生成數(shù)據(jù)加載日志。
3)結(jié)果輸出模塊:用于接收客戶端的輸出要求,生成Excel 文件,導(dǎo)出分析結(jié)果。
4)系統(tǒng)維護(hù)模塊:用于管理用戶基本信息、查閱數(shù)據(jù)加載日志、備份與恢復(fù)后臺(tái)數(shù)據(jù)等。
作為決策支持后臺(tái)的兩類數(shù)據(jù)存儲(chǔ)環(huán)境,數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse)和數(shù)據(jù)集市(Data Mart)在信息需求和開發(fā)方法等方面存在著區(qū)別[13]。文中采用獨(dú)立數(shù)據(jù)集市,構(gòu)建系統(tǒng)的后臺(tái)數(shù)據(jù)環(huán)境。上述選擇的主要原因在于:一方面,數(shù)據(jù)集市的多維結(jié)構(gòu)能夠保證OLAP 操作與后臺(tái)數(shù)據(jù)存儲(chǔ)環(huán)境之間的有效銜接[19];另一方面,獨(dú)立數(shù)據(jù)集市可以由特定部門直接創(chuàng)建,而無(wú)需以數(shù)據(jù)倉(cāng)庫(kù)為前提,降低了數(shù)據(jù)存儲(chǔ)環(huán)境構(gòu)建費(fèi)用,縮短了系統(tǒng)開發(fā)周期,有助于快速、高效地構(gòu)建后臺(tái)數(shù)據(jù)存儲(chǔ)環(huán)境。
為了保障師資(尤其專任教師)隊(duì)伍建設(shè)決策的科學(xué)性、合理性和可行性,高校師資管理決策者所需進(jìn)行的多維分析主要包括以專任教師數(shù)量和比例為目標(biāo)值(即度量值),在年齡、學(xué)歷、職稱、學(xué)緣等基本要素維度上的分布情況分析以及多維組合分析,在教師狀態(tài)、學(xué)科、系列、性別等開放性維度上的變化情況分析以及多維組合分析,在時(shí)間維度上的多層次(如近1 年、3 年、5 年等)變化情況分析以及基于基本要素維度、開放性維度和時(shí)間維度的組合分析。依據(jù)上述的高校師資管理決策多維分析特點(diǎn),文中設(shè)計(jì)了3 類維度,如表1 所示。
表1 高校師資數(shù)據(jù)分析的維度設(shè)計(jì)表
在上述的維度設(shè)計(jì)基礎(chǔ)上,該系統(tǒng)設(shè)計(jì)了基于星形模型的師資數(shù)據(jù)集市多維數(shù)據(jù)結(jié)構(gòu),如圖2 所示。該模型以事實(shí)表為中心,包含職稱、學(xué)歷、系列、學(xué)緣、年齡、學(xué)科、狀態(tài)、性別、時(shí)間9 個(gè)維度表。每一個(gè)維度表對(duì)應(yīng)一個(gè)維度。事實(shí)表由每個(gè)維度表的外鍵(包括職稱碼、學(xué)歷碼、系列碼、學(xué)緣碼、年齡碼、學(xué)科碼、狀態(tài)碼、性別碼、時(shí)間碼等)和度量(包括人數(shù)和百分比)組成,支撐師資數(shù)據(jù)分析的多維性、多層性和快速性。其中,外鍵能夠連接維度表和事實(shí)表,支撐多維度、多層次的師資數(shù)據(jù)訪問(wèn)。
圖2 數(shù)據(jù)集市的星形模型
圖3 給出了部分維度的層次設(shè)計(jì)情況。以“學(xué)科”維度為例,該維度分為三層,依次為頂層(即學(xué)科維度)、學(xué)科門類層和一級(jí)學(xué)科層?!跋盗小?、“性別”和“時(shí)間”維度未進(jìn)行分層處理。其中,“系列”維度具體包括教師、衛(wèi)生、研究、實(shí)驗(yàn)技術(shù)、工程技術(shù)、圖書資料、出版、檔案、會(huì)計(jì)、審計(jì)、統(tǒng)計(jì)等成員;“性別”維度包括男和女兩個(gè)成員;“時(shí)間”維度包括近10 年的具體年份。
圖3 部分維度的層次設(shè)計(jì)
通過(guò)上述設(shè)計(jì),師資數(shù)據(jù)集市能夠支持9 個(gè)維度及其不同層次的度量值存儲(chǔ)和訪問(wèn),滿足多維度、多層次的數(shù)據(jù)分析需求。
為降低系統(tǒng)存儲(chǔ)空間消耗和系統(tǒng)維護(hù)復(fù)雜度,數(shù)據(jù)服務(wù)端不負(fù)責(zé)存儲(chǔ)細(xì)節(jié)性師資歷史數(shù)據(jù)。根據(jù)數(shù)據(jù)集市的多維數(shù)據(jù)模型,該系統(tǒng)利用人事管理系統(tǒng)的后臺(tái)數(shù)據(jù)庫(kù)、Excel 數(shù)據(jù)文件等外部數(shù)據(jù)源,通過(guò)數(shù)據(jù)抽取、轉(zhuǎn)換和載入,完成數(shù)據(jù)集市的數(shù)據(jù)加載。
針對(duì)職稱、學(xué)歷、系列、學(xué)緣、年齡、學(xué)科、狀態(tài)、性別、時(shí)間9 個(gè)維度,該系統(tǒng)調(diào)用與人事管理系統(tǒng)之間的接口程序,訪問(wèn)人事管理系統(tǒng)的后臺(tái)數(shù)據(jù)庫(kù),獲取相應(yīng)字段的師資數(shù)據(jù)(見(jiàn)表2),生成細(xì)節(jié)性數(shù)據(jù)集,完成數(shù)據(jù)抽取。之后,根據(jù)維度表的內(nèi)容以及事實(shí)表的外鍵和度量,聚合細(xì)節(jié)性數(shù)據(jù),生成多維度、多層次的匯總性數(shù)據(jù)集,完成數(shù)據(jù)轉(zhuǎn)換。最后,將上述匯總性數(shù)據(jù)集存入數(shù)據(jù)集市的事實(shí)表,完成數(shù)據(jù)載入。
表2 維度與源字段的對(duì)應(yīng)關(guān)系表
上述數(shù)據(jù)加載可以采用定期增量加載和事件觸發(fā)加載兩種模式。前者是指在特定時(shí)間(如一年)自動(dòng)(或管理員手動(dòng))調(diào)用數(shù)據(jù)加載功能,利用外部數(shù)據(jù)源生成匯總性數(shù)據(jù),并載入數(shù)據(jù)集市。后者是指通過(guò)在人事管理系統(tǒng)后臺(tái)數(shù)據(jù)庫(kù)的關(guān)系上定義觸發(fā)器,針對(duì)數(shù)據(jù)更新和插入操作(分別對(duì)應(yīng)著更新觸發(fā)器和插入觸發(fā)器),在職稱晉升、新教師入職等事務(wù)發(fā)生時(shí),執(zhí)行數(shù)據(jù)加載,更新數(shù)據(jù)集市。后一種模式需要完善現(xiàn)有人事管理系統(tǒng)。因此,該系統(tǒng)采用定期增量加載模式。
該系統(tǒng)的實(shí)現(xiàn)采用了Visual Basic 6.0和Microsoft SQL Server 2008。
圖4 給出了“師資數(shù)據(jù)多維分析”界面,包含“維度和度量”選擇區(qū)和“多維數(shù)據(jù)表”顯示區(qū)。用戶在“維度和度量”選擇區(qū),選定維度層次以及度量,并單擊【分析】按鈕。之后,系統(tǒng)將調(diào)用“維度顯示順序設(shè)置”界面,用于確定所選維度在多維數(shù)據(jù)表中的先后次序,如圖5 所示。根據(jù)顯示順序的選定情況,多維數(shù)據(jù)表將依次顯示學(xué)歷維、職稱維以及人數(shù)、百分比。最后,用戶單擊【確定】按鈕,獲取多維分析結(jié)果,詳見(jiàn)圖4 所示的多維數(shù)據(jù)表。該多維數(shù)據(jù)表呈現(xiàn)了“學(xué)歷維的一級(jí)層次→職稱維的二級(jí)層次”、近1年的專任教師人數(shù)和百分比情況。其中,在多維數(shù)據(jù)表的度量值中,“—”用于表示0 和0%狀態(tài)下的人數(shù)和百分比。通過(guò)圖4 所示的多維數(shù)據(jù)表,用戶可以獲取“研究生學(xué)歷→具體職稱級(jí)”的人數(shù)與百分比情況,如近1 年的“研究生→正高”和“研究生→副高”專任教師人數(shù)226 和326 以及百分比20.58%和29.69%。
圖4 系統(tǒng)多維分析界面(1)
圖5 維度顯示順序設(shè)置界面
在多維數(shù)據(jù)表中,維度項(xiàng)前面的“+”和“-”表征用戶可以在該維度項(xiàng)上進(jìn)行下鉆和上卷操作,獲取更為豐富的分析結(jié)果。例如,在圖4 所示的多維數(shù)據(jù)表中,用戶可以分別單擊“+研究生”和“+非研究生”項(xiàng),進(jìn)行“學(xué)歷”維的下鉆操作,獲取“學(xué)位→具體職稱”的人數(shù)和百分比結(jié)果,如圖6 所示;或者用戶可以分別單擊“-高級(jí)”和“-非高級(jí)”,進(jìn)行“職稱”維的上卷操作,獲取“研究生”和“非研究生”學(xué)歷維度層次上的“高級(jí)”和“非高級(jí)”職稱的人數(shù)與百分比匯總情況。
圖6 系統(tǒng)多維分析界面(2)
通過(guò)圖4 和圖6 對(duì)比,用戶可以根據(jù)近1 年的“研究生→正高”專任教師人數(shù)226 進(jìn)一步發(fā)現(xiàn),近1年的“博士→正高”、“碩士→正高”專任教師人數(shù)分別為158 和68,且前者是后者的兩倍以上。借助圖6 用戶可以發(fā)現(xiàn),百分比居前三的分別是“博士→副高”(22.22%)、“碩士→中級(jí)”(21.31%)、“博士→正高”(14.39%)。
另外,“維度顯示順序設(shè)置”界面可以用于實(shí)現(xiàn)旋轉(zhuǎn)操作。在“維度和度量”選擇區(qū)結(jié)果未變化情況下,用戶可以利用“維度顯示順序設(shè)置”界面,調(diào)整維度先后次序,形成旋轉(zhuǎn)要求。例如,針對(duì)圖6 的多維數(shù)據(jù)表,用戶能夠發(fā)現(xiàn)“博士→正高”、“碩士→正高”、“學(xué)士→正高”的專任教師人數(shù)分布差異。鑒于上述的多維分析順序?qū)е氯?xiàng)度量值過(guò)于分散而不利于結(jié)果的觀察,用戶可以利用“維度顯示順序設(shè)置”界面,調(diào)整維度顯示順序(即“職稱→學(xué)歷”),集中“正高→博士”、“正高→碩士”、“正高→學(xué)士”的度量值,提高多維度、多層次分析結(jié)果觀察的便捷性,有助于發(fā)現(xiàn)更有價(jià)值的師資隊(duì)伍信息。
師資隊(duì)伍建設(shè)是高校高質(zhì)量發(fā)展的基石。文中針對(duì)高校師資管理決策支持工作,提出了基于C/S 模式和獨(dú)立數(shù)據(jù)集市的高校師資數(shù)據(jù)聯(lián)機(jī)分析處理系統(tǒng)設(shè)計(jì)方案,形成了實(shí)現(xiàn)途徑。該系統(tǒng)能夠快速、便捷地發(fā)現(xiàn)隱藏的、有價(jià)值的師資隊(duì)伍信息,為高校師資隊(duì)伍建設(shè)提供可靠的科學(xué)決策依據(jù),并為部門級(jí)的聯(lián)機(jī)分析處理系統(tǒng)及其分析型數(shù)據(jù)環(huán)境的構(gòu)建提供有益借鑒。