• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      普通高校招生信息處理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用探索

      2016-03-25 01:08:38劉峰王玉吉周克復(fù)馬英杰
      科學(xué)與財富 2016年7期
      關(guān)鍵詞:決策樹生源數(shù)據(jù)挖掘

      劉峰 王玉吉 周克復(fù) 馬英杰

      摘 要:隨著信息技術(shù)在高校教學(xué)管理、學(xué)生管理工作中日益廣泛而深入的應(yīng)用,高校招生管理系統(tǒng)與教學(xué)管理、學(xué)生管理系統(tǒng)的信息對接顯得尤為重要,只有對招生管理系統(tǒng)中的信息進(jìn)行深度的挖掘,才能使教學(xué)、學(xué)生管理系統(tǒng)獲得高質(zhì)量的數(shù)據(jù)輸入。高校招生信息的充分有效利用將有效促進(jìn)高校教學(xué)、學(xué)生、招生管理工作的規(guī)范化、信息化、自動化水平,本研究對數(shù)據(jù)挖掘技術(shù)在高校招生數(shù)據(jù)中的運(yùn)用進(jìn)行了有益探索。

      關(guān)鍵詞:數(shù)據(jù)挖掘;招生信息

      隨著高校間生源競爭的日趨激烈,招生宣傳工作越來越受到高校管理者的重視,而科學(xué)、深入地挖掘招生數(shù)據(jù)中潛在的、隱藏的規(guī)律,能夠大大提高招生宣傳工作的針對性,從而增強(qiáng)宣傳效果。通過數(shù)據(jù)挖掘技術(shù),可以對招生系統(tǒng)積累的海量招生數(shù)據(jù)進(jìn)行挖掘和提煉,對簡單的數(shù)據(jù)進(jìn)行多維分析、合并歸類和高度集成,從而挖掘出隱藏于數(shù)據(jù)間的潛在聯(lián)系,獲取有價值的信息?;谕诰蚪Y(jié)果,高校教學(xué)管理、學(xué)生管理、招生管理工作者可以透視數(shù)據(jù)間的各種特征和關(guān)系,大大提高決策水平和管理水平,有效增強(qiáng)學(xué)校競爭力。

      1、數(shù)據(jù)挖掘技術(shù)

      數(shù)據(jù)庫規(guī)模日益擴(kuò)大產(chǎn)生了繁雜的海量數(shù)據(jù),要從這些海量數(shù)據(jù)中發(fā)現(xiàn)潛在的、有用的信息,成為一項(xiàng)重要而艱巨的任務(wù),而數(shù)據(jù)挖掘技術(shù)正是在這種需求的背景下應(yīng)運(yùn)而生。數(shù)據(jù)挖掘是指從海量數(shù)據(jù)中自動搜索隱藏的、潛在的、有用的信息的過程。數(shù)據(jù)挖掘的結(jié)果一般以概念、規(guī)則、規(guī)律、模式、約束、可視化圖表等形式表現(xiàn),通過決策支持工具提供給決策者使用。

      數(shù)據(jù)挖掘的主要任務(wù)包括關(guān)聯(lián)分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析等等,數(shù)據(jù)挖掘的主要任務(wù)可以分為預(yù)測性任務(wù)和描述性任務(wù)兩大類。數(shù)據(jù)挖掘的主要過程包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘和知識表示,數(shù)據(jù)準(zhǔn)備包括對數(shù)據(jù)的集成和選擇,數(shù)據(jù)挖掘階段是最核心的環(huán)節(jié),需要確定挖掘模式并選擇合適的算法工具,知識表示是數(shù)據(jù)挖掘的最后也是最重要階段,決定了信息最終將以何種形式呈現(xiàn)給用戶。數(shù)據(jù)挖掘技術(shù)中常見的算法包括聚類算法、關(guān)聯(lián)算法和歸類算法等,聚類算法將樣本點(diǎn)按照屬性特征進(jìn)行無指定標(biāo)簽歸類,確保同類樣本點(diǎn)的極大相似和不同類樣本點(diǎn)的極大差異,關(guān)聯(lián)規(guī)則算法則用于發(fā)現(xiàn)隱藏在大型數(shù)據(jù)集中令人感興趣的關(guān)聯(lián),分類算法則通過一定的訓(xùn)練算法來學(xué)習(xí)分類知識,然后將分類知識用于樣本集。

      2、分析普通高校招生信息處理存在的問題

      我國普通高等學(xué)校的主要生源來自普通高考,普通高考錄取工作通過教育部組織開發(fā)的高等院校招生錄取系統(tǒng)進(jìn)行,該系統(tǒng)導(dǎo)出的數(shù)據(jù)規(guī)范、豐富、詳細(xì),但其功能僅限于網(wǎng)上錄取工作,如何利用好系統(tǒng)導(dǎo)出數(shù)據(jù)卻成為錄取后續(xù)相關(guān)工作的軟肋。按照現(xiàn)有管理模式,招生系統(tǒng)數(shù)據(jù)僅僅是在校內(nèi)經(jīng)過簡單的傳送、轉(zhuǎn)發(fā)后流向相關(guān)職能部門,對于數(shù)據(jù)的利用也僅僅限于簡單的查詢、統(tǒng)計、備份,并沒有充分發(fā)揮出其作用,現(xiàn)代化、信息化的高校教學(xué)和學(xué)生管理工作也迫切需要更有價值的信息作為系統(tǒng)輸入,而數(shù)據(jù)挖掘技術(shù)恰恰能夠較好地滿足高校信息處理需求。將數(shù)據(jù)挖掘技術(shù)用于高校招生數(shù)據(jù)處理,是高校管理信息化、自動化、現(xiàn)代化的必然選擇。

      3、功能的實(shí)現(xiàn)

      可以建立招生信息管理系統(tǒng)來對海量招生數(shù)據(jù)進(jìn)行挖掘。招生信息管理系統(tǒng)的目的是承接全國網(wǎng)上招生系統(tǒng)數(shù)據(jù)輸出,整合高校教學(xué)和學(xué)生管理部門數(shù)據(jù)積累,在海量數(shù)據(jù)的基礎(chǔ)上,形成全校數(shù)據(jù)整合、集成、處理平臺,向高校相關(guān)職能部門提供信息查詢和決策支持。招生信息管理系統(tǒng)包含信息維護(hù)模塊、信息查詢模塊、入校管理模塊、決策支持模塊四個基本功能模塊組成,其中決策支持模塊是實(shí)現(xiàn)數(shù)據(jù)挖掘算法的主要模塊,該系統(tǒng)基于三層構(gòu)架,挖掘算法邏輯運(yùn)行于JugarCTS中間組件,可以大大提高運(yùn)行效率。在數(shù)據(jù)挖掘的實(shí)現(xiàn)上,使用微軟的SQLServer2000 AnalysisServices,該系統(tǒng)能夠提供數(shù)據(jù)挖掘中間服務(wù),對決策樹、聚類算法等數(shù)據(jù)挖掘算法均能提供較好的支持。

      4、普通高校招生信息處理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用

      4.1挖掘的過程

      數(shù)據(jù)準(zhǔn)備階段的主要工作包括將來自招生、教務(wù)、學(xué)生管理系統(tǒng)中的數(shù)據(jù)進(jìn)行集成,然后根據(jù)實(shí)際需要對集成數(shù)據(jù)進(jìn)行選擇,以縮小處理數(shù)據(jù)量。實(shí)施挖掘階段先采用發(fā)現(xiàn)型數(shù)據(jù)挖掘,為用戶提出預(yù)先假設(shè),然后選擇合適的算法工具,在本文中主要采用了聚類算法、決策樹歸納算法和頻繁項(xiàng)集關(guān)聯(lián)規(guī)則算法,進(jìn)而由招生信息管理系統(tǒng)實(shí)現(xiàn)算法邏輯,最后依靠決策支持技術(shù)對挖掘結(jié)果進(jìn)行整理后呈現(xiàn)給用戶。在整個挖掘過程中,數(shù)據(jù)準(zhǔn)備是十分重要的基礎(chǔ)性工作,數(shù)據(jù)準(zhǔn)備質(zhì)量的高低,直接決定了挖掘工作能否達(dá)到預(yù)設(shè)目的。數(shù)據(jù)準(zhǔn)備工作主要包括聚集、抽樣、維歸約、特征子集選擇、特征創(chuàng)建、離散化和二元化、變量變換,聚集工作是數(shù)據(jù)對象合并過程,抽樣工作將使挖掘工作集中于有意義的、感興趣的數(shù)據(jù)范圍內(nèi),維歸約可以刪除數(shù)據(jù)中不相關(guān)的特征并降低數(shù)據(jù)噪聲從而避免維災(zāi)難,特征子集的選擇去除了冗余特征和不相關(guān)特征,特征創(chuàng)建可以選擇性地開發(fā)新的數(shù)據(jù)特征,最后,連續(xù)屬性可以通過離散化來轉(zhuǎn)換成適合數(shù)據(jù)挖掘算法的離散屬性。

      4.2生源關(guān)聯(lián)分析和生源前景預(yù)測

      使用關(guān)聯(lián)規(guī)則對歷年積累的生源信息進(jìn)行深入挖掘,發(fā)現(xiàn)生源層次、專業(yè)、地域、畢業(yè)高中、科類間的潛在聯(lián)系和規(guī)律,從而為招生宣傳工作提供決策支持。使用Apriori頻繁項(xiàng)集算法對學(xué)生數(shù)據(jù)進(jìn)行挖掘并生成關(guān)聯(lián)規(guī)則,可以發(fā)現(xiàn)和預(yù)測生源信息屬性間存在的關(guān)聯(lián)規(guī)律,從而支持教學(xué)管理工作中的生源特征分析和招生管理工作生源結(jié)構(gòu)預(yù)測。使用決策樹作為分類器,用信息增益度作為屬性測試條件選擇的度量依據(jù),運(yùn)用決策樹算法構(gòu)造決策樹,在海量招生數(shù)據(jù)中提取知識,以預(yù)測可能的生源變化,發(fā)現(xiàn)測試屬性對制定招生來源計劃的影響,在此基礎(chǔ)上,對專業(yè)設(shè)置和分省分專業(yè)招生計劃作出合理調(diào)整。

      4.3學(xué)生分班管理

      使用聚類算法,綜合新生高考總成績、單科成績、政治面貌、性別、地域等信息進(jìn)行分析,在分班過程中注重屬于不同組類學(xué)生之間的平衡,防止具有相同綜合特征的學(xué)生過于集中于一個或某幾個班級。由于新生數(shù)據(jù)屬于低維數(shù)據(jù),因此可以使用自下而上的聚合層次聚類算法,通過樹狀圖對作為原子聚類的新生數(shù)據(jù)對象進(jìn)行逐層聚合,直至聚合終止條件被激活。聚類算法對于分班管理具有重要意義,使用傳統(tǒng)的分班方式容易導(dǎo)致“以偏概全”,即偏重于單項(xiàng)指標(biāo)而難以達(dá)到整體指標(biāo)的平衡,從而給后續(xù)教學(xué)、學(xué)生管理帶來諸多問題。

      4.4人才選拔管理

      可以從系統(tǒng)數(shù)據(jù)和電子檔案中抽取反映新生個性特征、興趣志向、認(rèn)知能力的數(shù)據(jù)字段,使用聚類算法對信息進(jìn)行提取、分析、歸納、總結(jié),從而發(fā)現(xiàn)符合特定特征標(biāo)準(zhǔn)的群體,在入校一段時間以后,還可以對學(xué)生日常成績信息進(jìn)行篩選、融合,對學(xué)生成長定位進(jìn)行傾向性預(yù)測,達(dá)到增強(qiáng)人才培養(yǎng)工作針對性的目的。使用ID3決策樹歸納算法對學(xué)生成績信息、日常評價信息進(jìn)行深入分析,并訓(xùn)練出學(xué)生發(fā)展定位前景分類器,根據(jù)此分類器可以對學(xué)生的發(fā)展定位特征做出預(yù)測,并在此基礎(chǔ)上增強(qiáng)人才培養(yǎng)工作的針對性。ID3算法以決策樹作為分析工具,將信息增益度作為條件測試屬性選擇的依據(jù)(決策樹節(jié)點(diǎn)),該算法理論清晰,算法簡單,具有較好的總預(yù)測準(zhǔn)確率。

      綜上所述,數(shù)據(jù)挖掘作為將傳統(tǒng)數(shù)據(jù)分析方法與處理大量數(shù)據(jù)的復(fù)雜算法相結(jié)合的新手段,已經(jīng)成為信息管理和決策支持領(lǐng)域的前沿研究方向之一,應(yīng)用將越來越廣泛。高等院校招生數(shù)據(jù)積累量大,格式規(guī)范,因此非常適用于現(xiàn)有數(shù)據(jù)挖掘算法的使用,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到高校招生信息處理工作中,必將為高校教學(xué)管理、學(xué)生管理、招生管理提供有價值的決策依據(jù)信息,對于提高高校管理規(guī)范化、信息化水平,提高生源數(shù)量和質(zhì)量具有顯著意義,值得普遍推廣應(yīng)用。

      參考文獻(xiàn):

      [1] 許碩. 數(shù)據(jù)挖掘技術(shù)在民辦高校招生中的探索[J]. 遼寧師專學(xué)報(社會科學(xué)版). 2013(04)

      [2] 孫曉瑩,郭飛燕. 數(shù)據(jù)挖掘在高校招生預(yù)測中的應(yīng)用研究[J]. 計算機(jī)仿真. 2012(04)

      猜你喜歡
      決策樹生源數(shù)據(jù)挖掘
      長洲怡生源記貨單考論
      廣州文博(2023年0期)2023-12-21 07:23:28
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      農(nóng)村生源不是“搖錢樹”
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      基于決策樹的出租車乘客出行目的識別
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
      高校生源危機(jī):“狼真來了”
      巴彦淖尔市| 兴海县| 逊克县| 乌鲁木齐市| 米脂县| 天台县| 璧山县| 紫金县| 新疆| 信宜市| 湖北省| 兴宁市| 渝北区| 宜兰县| 河北省| 石阡县| 扎赉特旗| 遂川县| 安丘市| 黄骅市| 都匀市| 兖州市| 安陆市| 蓬莱市| 巴塘县| 阿克苏市| 洛宁县| 六枝特区| 东乡| 原阳县| 平利县| 铁岭县| 尼木县| 高陵县| 修文县| 哈巴河县| 晋宁县| 泸水县| 龙陵县| 石楼县| 木里|