方豪彪
摘要:數(shù)據(jù)挖掘是從大量信息中發(fā)現(xiàn)有用的知識(shí),利用已有的數(shù)據(jù)進(jìn)行數(shù)據(jù)處理和分析。高校后勤信息系統(tǒng)的廣泛應(yīng)用產(chǎn)生了大量的師生消費(fèi)、客戶關(guān)系和員工管理等數(shù)據(jù)庫(kù),本文介紹了數(shù)據(jù)挖掘的流程和功能,對(duì)高校后勤信息系統(tǒng)導(dǎo)入數(shù)據(jù)挖掘系統(tǒng)的設(shè)計(jì)目標(biāo)、功能要求、開發(fā)模式和系統(tǒng)結(jié)構(gòu)進(jìn)行分析與設(shè)計(jì),探討了數(shù)據(jù)挖掘在公寓管理、飲食管理、人力資源管理和客戶關(guān)系管理模塊的應(yīng)用,基于數(shù)據(jù)挖掘的信息系統(tǒng)具有較強(qiáng)的信息處理能力和分析功能,并獲得有效的決策支持信息,提高后勤服務(wù)質(zhì)量和保障能力。
關(guān)鍵詞:數(shù)據(jù)挖掘 高校后勤 信息系統(tǒng)
中圖分類號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1673-8454(2009)11-0075-03
一、引言
后勤是高校教學(xué)科研的保障部門。學(xué)?;A(chǔ)設(shè)施不斷完善,校園擴(kuò)大或多校區(qū)辦學(xué),對(duì)我國(guó)高校后勤信息系統(tǒng)提出了更高的要求。我國(guó)高校后勤信息系統(tǒng)一般是基于客戶端/服務(wù)器(Client/Server,簡(jiǎn)稱C/S)和瀏覽器/服務(wù)器(Browser/Server,簡(jiǎn)稱B/S)模式的管理系統(tǒng),具有易維護(hù)、易擴(kuò)展、開發(fā)效率高、運(yùn)行環(huán)境要求不高、安全穩(wěn)定等優(yōu)點(diǎn)。
高校后勤信息系統(tǒng)的應(yīng)用使數(shù)據(jù)庫(kù)的規(guī)模不斷擴(kuò)大,產(chǎn)生了巨大的數(shù)據(jù)流,管理部門很難對(duì)這些數(shù)據(jù)進(jìn)行準(zhǔn)確、高效的處理,為經(jīng)營(yíng)服務(wù)管理者提供快速、準(zhǔn)確的決策幫助,實(shí)現(xiàn)為師生提供個(gè)性化的服務(wù),降低經(jīng)營(yíng)服務(wù)成本。數(shù)據(jù)挖掘(Data Mining,簡(jiǎn)稱DM)是從大量數(shù)據(jù)中提取或“挖掘”知識(shí)。[1] 數(shù)據(jù)挖掘核心是利用已有的數(shù)據(jù)進(jìn)行數(shù)據(jù)處理和分析,發(fā)現(xiàn)重要的數(shù)據(jù)模式,提取“有趣”的知識(shí)、規(guī)律或高層信息,為科學(xué)決策及措施的實(shí)施做出貢獻(xiàn)。[2] 隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘?qū)楦咝:笄诮?jīng)營(yíng)服務(wù)提供越來(lái)越強(qiáng)大的支持功能,減輕低層次信息處理和分析的負(fù)擔(dān),提高管理與決策水平。
二、數(shù)據(jù)挖掘
1.數(shù)據(jù)挖掘流程
數(shù)據(jù)挖掘一般要經(jīng)過(guò)數(shù)據(jù)采集、預(yù)處理、數(shù)據(jù)分析、結(jié)果分析、知識(shí)的同化等過(guò)程,主要常用關(guān)聯(lián)規(guī)則、決策樹方法、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、粗糙集方法、模糊論方法、貝葉斯模式等方法。數(shù)據(jù)挖掘的知識(shí)是以概念、規(guī)則、規(guī)律、模式、可視化等形式提供給管理決策者,以輔助決策過(guò)程。[3] 數(shù)據(jù)挖掘流程如圖1所示。
2.數(shù)據(jù)挖掘功能
數(shù)據(jù)挖掘功能是在大型數(shù)據(jù)庫(kù)中挖掘預(yù)測(cè)性的信息并得出結(jié)論。關(guān)聯(lián)分析找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)規(guī)則,這些規(guī)則揭示屬性與屬性值在數(shù)據(jù)集中一起出現(xiàn)的條件,可分為簡(jiǎn)單、時(shí)序、因果等關(guān)聯(lián)。聚類是在數(shù)據(jù)庫(kù)中的記錄,聚類增強(qiáng)了人們對(duì)客觀現(xiàn)實(shí)的認(rèn)識(shí),是概念描述和偏差分析的先決條件。聚類技術(shù)主要包括傳統(tǒng)的模式識(shí)別方法和數(shù)學(xué)分類學(xué)。概念描述就是對(duì)某類對(duì)象的內(nèi)涵進(jìn)行描述,并概括這類對(duì)象的有關(guān)特征。概念描述分為特征性描述和區(qū)別性描述。
三、高校后勤信息系統(tǒng)的設(shè)計(jì)
1.設(shè)計(jì)目標(biāo)
高校后勤信息系統(tǒng)應(yīng)用范圍十分寬泛,本文主要根據(jù)信息系統(tǒng)中模塊數(shù)據(jù)的特點(diǎn)采用數(shù)據(jù)挖掘技術(shù),參考數(shù)據(jù)挖掘理論與其他挖掘工具使高校后勤信息系統(tǒng)達(dá)到挖掘過(guò)程的簡(jiǎn)單性與結(jié)果的易讀性,高效的數(shù)據(jù)處理能力與處理過(guò)程簡(jiǎn)潔有效,提供與其他工具相集成的簡(jiǎn)單路徑。
2.功能要求
高校后勤信息系統(tǒng)應(yīng)能使重復(fù)繁雜工作進(jìn)行電腦管理,實(shí)現(xiàn)辦公自動(dòng)化,降低人力物力成本,提高工作質(zhì)量;較好地保證數(shù)據(jù)準(zhǔn)確一致,實(shí)時(shí)完整提供信息資源;信息收集處理分工合理、責(zé)任明確、便捷高效、開放管理,操作人員根據(jù)不同的權(quán)限在網(wǎng)上實(shí)時(shí)交互操作完成各自的工作任務(wù)。信息系統(tǒng)以管理需要為核心,以完善重點(diǎn)突出的管理功能實(shí)現(xiàn)為主要目標(biāo),保證各方面管理的質(zhì)量,為高校后勤提供高度數(shù)字化、規(guī)范化、科學(xué)化的管理信息處理平臺(tái),為領(lǐng)導(dǎo)決策提供準(zhǔn)確依據(jù)。
3.開發(fā)模式
信息系統(tǒng)采用面向?qū)ο蟮母拍钸M(jìn)行設(shè)計(jì)和開發(fā)是當(dāng)前軟件開發(fā)的熱點(diǎn)和追求的目標(biāo)。高校后勤信息系統(tǒng)實(shí)現(xiàn)的核心內(nèi)容是Web數(shù)據(jù)庫(kù)系統(tǒng)的集成及安全性設(shè)計(jì),采用成熟、穩(wěn)定、易用的系統(tǒng)平臺(tái)和開發(fā)工具,服務(wù)器端使用Windows Server、SQL Server,利用這個(gè)平臺(tái)的各級(jí)特性和安全機(jī)制,使系統(tǒng)穩(wěn)定、安全可靠;采用Struts結(jié)構(gòu)實(shí)現(xiàn)模型-視圖-控制器,使得表現(xiàn)邏輯和業(yè)務(wù)邏輯分離,以便于整個(gè)系統(tǒng)的協(xié)作開發(fā)和維護(hù),客戶端則采用目前最為常用的Internet Explorer瀏覽器。
4.系統(tǒng)結(jié)構(gòu)
數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)挖掘的基礎(chǔ),主要存儲(chǔ)涉及高校后勤管理的各種數(shù)據(jù),具有面向主題、集成以及隨時(shí)間變化的特性。數(shù)據(jù)處理是把收集到的信息匯總到數(shù)據(jù)倉(cāng)庫(kù),再根據(jù)數(shù)據(jù)挖掘所得信息為管理決策者提供最新的信息,幫助其快速準(zhǔn)確地做出決策。數(shù)據(jù)挖掘根據(jù)管理決策者提出的問(wèn)題確定挖掘的任務(wù),對(duì)數(shù)據(jù)倉(cāng)庫(kù)的相關(guān)信息進(jìn)行篩選和預(yù)處理,再?gòu)奶幚砗蟮男畔⒅型诰虺鲂碌挠行畔⑻峁┙o管理決策者。知識(shí)庫(kù)包括基于高校后勤各個(gè)部門的數(shù)據(jù)倉(cāng)庫(kù)的組成結(jié)構(gòu)、隸屬函數(shù)等知識(shí)。模式評(píng)估是識(shí)別表示知識(shí)的真正有效的模式?;跀?shù)據(jù)挖掘的信息系統(tǒng)結(jié)構(gòu)如圖2所示。
四、高校后勤信息系統(tǒng)的數(shù)據(jù)挖掘
高校后勤信息系統(tǒng)主要包括系統(tǒng)管理、商店管理、公寓管理、飲食管理、水電管理、財(cái)務(wù)管理、采購(gòu)管理、人力資源管理、客戶關(guān)系管理等幾大功能,系統(tǒng)模塊如圖3所示。本文主要就公寓管理、飲食管理、人力資源管理和客戶關(guān)系管理CRM模塊的數(shù)據(jù)挖掘進(jìn)行探討。
1.公寓管理
學(xué)生公寓管理主要有住宿管理、學(xué)生教育、學(xué)生服務(wù)、宿舍資源、服務(wù)人員、門禁系統(tǒng)等功能。學(xué)生教育是寢室衛(wèi)生成績(jī)、學(xué)生個(gè)人記實(shí)考評(píng)、獎(jiǎng)懲情況等管理;學(xué)生服務(wù)是實(shí)現(xiàn)對(duì)計(jì)算機(jī)、有線電視申請(qǐng)、大功率電器使用以及其他可能新增服務(wù)的信息管理。公寓管理的學(xué)生教育與服務(wù)過(guò)程中積累了大量學(xué)生日常行為信息,公寓管理人員可以采用關(guān)聯(lián)規(guī)則了解學(xué)生行為之間的關(guān)聯(lián)關(guān)系,測(cè)算相關(guān)學(xué)生行為信息頻繁出現(xiàn)數(shù)據(jù)庫(kù),預(yù)測(cè)學(xué)生行為之間關(guān)系和可能會(huì)發(fā)生的行為,做出合理的管理決策。
管理者可以通過(guò)公寓管理模塊預(yù)測(cè)學(xué)生未來(lái)的可能發(fā)生的行為,當(dāng)知道學(xué)生有A、B表現(xiàn)時(shí),公寓管理者想知道學(xué)生可能會(huì)發(fā)生C行為,采用關(guān)聯(lián)分析的數(shù)據(jù)挖掘。利用學(xué)生教育數(shù)據(jù)庫(kù),運(yùn)用Apriori等算法進(jìn)行信息處理,然后利用關(guān)聯(lián)規(guī)則產(chǎn)生行為關(guān)聯(lián)規(guī)則。假設(shè)公寓管理人員采集的學(xué)生在校期間發(fā)生行為的信息記錄形成事務(wù)數(shù)據(jù)庫(kù)運(yùn)用關(guān)聯(lián)規(guī)則進(jìn)行分析,可以通過(guò)信息系統(tǒng)導(dǎo)出相應(yīng)的關(guān)聯(lián)規(guī)則,如:學(xué)生如果道德素質(zhì)好,且遵守紀(jì)律好,則該學(xué)生工作能力強(qiáng)等。[5] 數(shù)據(jù)挖掘技術(shù)的應(yīng)用能促進(jìn)公寓管理模式的創(chuàng)新。
2.飲食管理
生源地的不同使得師生的飲食習(xí)慣有所不同,信息系統(tǒng)中的飲食管理模塊可以提取師生的特征屬性,在數(shù)據(jù)挖掘中通過(guò)對(duì)已知類別的個(gè)體進(jìn)行歸類,找出各類飲食客戶的特征屬性,飲食客戶分類包括師生飲食消費(fèi)的分類、屬性和特征分析、師生滿意度分析、飲食喜好及消費(fèi)需求預(yù)測(cè)等,食堂可以對(duì)師生按照年級(jí)、專業(yè)、生源地等因素進(jìn)行分類,細(xì)分消費(fèi)群體。
此外,信息系統(tǒng)還可以利用飲食消費(fèi)的歷史數(shù)據(jù)預(yù)測(cè)未來(lái)趨勢(shì),將線性回歸方法應(yīng)用于飲食客戶需求分析,結(jié)合數(shù)據(jù)挖掘技術(shù),飲食管理者利用數(shù)據(jù)倉(cāng)庫(kù)的信息進(jìn)行分析,并根據(jù)分析結(jié)果找出客戶需求中出現(xiàn)的經(jīng)營(yíng)管理不善、觀念滯后、品種單調(diào)、原料缺失、色香味等內(nèi)部因素引起服務(wù)質(zhì)量與食堂生存構(gòu)成威脅的問(wèn)題,以便及時(shí)做出準(zhǔn)確的決策,調(diào)整策略,滿足不斷變化的客戶需求。