• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)挖掘軟件Clementine在干部培訓(xùn)教學(xué)評估中的應(yīng)用

      2015-06-27 00:42:51潘峰
      常州工學(xué)院學(xué)報 2015年6期
      關(guān)鍵詞:教學(xué)評估項集結(jié)點

      潘峰

      (國家稅務(wù)總局稅務(wù)干部進修學(xué)院,江蘇揚州225007)

      數(shù)據(jù)挖掘軟件Clementine在干部培訓(xùn)教學(xué)評估中的應(yīng)用

      潘峰

      (國家稅務(wù)總局稅務(wù)干部進修學(xué)院,江蘇揚州225007)

      關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘技術(shù)可以有效分析干部培訓(xùn)院校教學(xué)評估數(shù)據(jù),發(fā)現(xiàn)評估指標之間的關(guān)聯(lián),為教學(xué)工作和教師發(fā)展提供良好的建議。介紹了關(guān)聯(lián)規(guī)則挖掘的概念、算法、工具,并使用Clementine工具對實際數(shù)據(jù)進行分析而產(chǎn)生出強關(guān)聯(lián)規(guī)則,驗證了在教師培養(yǎng)和管理中,應(yīng)著眼改進教學(xué)方法以及提高理論聯(lián)系實際的程度。

      數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Clementine;教學(xué)評估

      Abstract:Association rule mining technology can effectively analyze evaluation data in cadre training institutes,find out the association among evaluation rules and provide valuable suggestions for teaching and teachers′ development.The paper introduces the concept,algorithms and tools of association rule mining.Clementine tools are used to analyze actual data set and strong association rules are thus generated.The paper proves that it is necessary to improve teaching methods and focus more on integrating theory with practice in teacher training and management.

      Key words:data mining;association rule;Clementine;teaching evaluation

      1 干部培訓(xùn)教學(xué)評估

      教學(xué)評估有廣義與狹義之分。狹義的教學(xué)評估是根據(jù)一定的評估標準,對教師的教學(xué)活動進行檢測,并評定其價值及優(yōu)缺點,以求改進的過程。

      干部教育培訓(xùn)尤其強調(diào)理論聯(lián)系實際。從實踐層面看,參加培訓(xùn)的干部大多具有一定的工作經(jīng)驗,在實際工作中面臨著不少需要解決的問題,參加培訓(xùn)學(xué)習(xí)的目的旨在找到解決這些實際問題的方法。干部培訓(xùn)要提高教學(xué)質(zhì)量,必須開展教學(xué)評估,使教學(xué)指標可以量化、測評、評比,在比較中發(fā)現(xiàn)問題[1]。干部培訓(xùn)教學(xué)評估和一般的教學(xué)評估存在明顯差異,尤其體現(xiàn)在評估指標的迥異,干部培訓(xùn)尤其注重教學(xué)中聯(lián)系實際的程度和教學(xué)結(jié)果對實際工作的指導(dǎo)性。

      2 關(guān)聯(lián)規(guī)則與算法

      2.1 關(guān)聯(lián)規(guī)則挖掘

      關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫中數(shù)據(jù)項之間存在的潛在關(guān)系[2]。關(guān)聯(lián)規(guī)則挖掘是從事務(wù)集合中挖掘出這樣的關(guān)聯(lián)規(guī)則:它的支持度和置信度大于等于用戶指定的最低閾值(minSup,minConf)。

      給定一存在的事物集D={d1,d2,…,di,…,dn},di(i=1,2,…,n)是一事物,ti={t1,t2,…,tk,…,ts},其中tk(k=1,2,…,s)是事物的項。假設(shè)I={i1,i2,…,ik,…,is}是事物集D的所有數(shù)據(jù)項的集合,X和Y是I的子集,Sup(X)=(D中包含項集X的事物數(shù)/D的事物總數(shù))×100%。

      若項集X和Y滿足X∩Y=?,則稱X?Y為關(guān)聯(lián)規(guī)則,項集X∩Y的支持度稱為關(guān)聯(lián)規(guī)則X?Y的支持度,標記為Sup(X?Y)=Sup(X∪Y),關(guān)聯(lián)規(guī)則X?Y的置信度Conf(X?Y)=(Sup(X∪Y)/Sup(X))×100%,如果置信度越高,則Y就越可能包含在X的事物集中。

      在關(guān)聯(lián)規(guī)則挖掘初始化時,先預(yù)設(shè)minSup和minConf的值,如Sup(X?Y)≥minSup且Conf(X?Y)≥minConf,則該關(guān)聯(lián)規(guī)則X?Y是強關(guān)聯(lián)規(guī)則。

      2.2 Apriori算法

      Apriori是一種著名的關(guān)聯(lián)規(guī)則挖掘算法,這是一種基于兩階段頻集思想的遞推算法。該算法的基本思想是:找出所有的頻繁性不低于預(yù)定義的最小支持度的項集,再由這些頻繁項集產(chǎn)生不低于預(yù)置的最小支持度、不低于預(yù)置的最小可信度的強關(guān)聯(lián)規(guī)則。

      算法利用了Apriori的一條性質(zhì):任一頻繁項集的所有非空子集也必須是頻繁的。就是說,生成一個k-項集的候選項時,如果這個候選項有子集不在頻繁(k-1)-項集中,那么這個候選項就不用去比對支持度了,而是直接刪除。Apriori算法過程可分解為以下2個步驟。

      1)挖掘事物數(shù)據(jù)庫中所有的頻繁項集。首先,挖掘頻繁1-項集(L1);其次,遞歸挖掘頻繁k-項集(Lk)(k>1),其中每次挖掘出候選頻繁k-項集(Ck)之后都要根據(jù)比對最小置信度(minSup)來篩選,得到Lk;最后,合并全部的Lk(k>0)。

      2)基于挖掘到的頻繁項集,繼續(xù)挖掘出全部的強關(guān)聯(lián)規(guī)則。先挖掘出全部的關(guān)聯(lián)規(guī)則(候選關(guān)聯(lián)規(guī)則),再比對minConf來得到強關(guān)聯(lián)規(guī)則。

      3 Clementine在干部培訓(xùn)教學(xué)評估中的應(yīng)用

      在各種數(shù)據(jù)挖掘工具評估中,Clementine在技術(shù)創(chuàng)新方面遙遙領(lǐng)先。研究人員可以借助Clementine快速建立預(yù)測性模型的功能,幫助改進決策過程。Clementine廣泛支持Apriori模型、GRI模型、可視化網(wǎng)絡(luò)圖、決策樹、神經(jīng)網(wǎng)絡(luò)等各種數(shù)據(jù)分析預(yù)測模型。

      本文研究的數(shù)據(jù)來源于某干部學(xué)院2014年3—8月間的“教學(xué)評估系統(tǒng)”。該系統(tǒng)用于在校學(xué)員對授課教師進行評估,具體評估指標包括儀態(tài)儀表、語言表達(包括普通話水平)、教學(xué)信息量、對工作的指導(dǎo)性、知識深度與前瞻性、教學(xué)方法、聯(lián)系實際的程度等。數(shù)據(jù)格式為Effect表,操作系統(tǒng)為Windows 7 professional 32 B,內(nèi)存4GB,軟件工具為SPSS Clementine 12.0。

      Clementine 12.0軟件在干部培訓(xùn)教學(xué)評估的具體應(yīng)用過程如下說明。

      1)添加本地數(shù)據(jù)源(ODBC)。打開Windows 7“管理工具”,打開“數(shù)據(jù)源(ODBC)”,在“用戶DSN”中點擊“添加”,選擇“microsoft access driver(*.mdb,*.accdb)”,選擇數(shù)據(jù)庫文件“C:〗***vote2014.mdb”,命名“數(shù)據(jù)源名”為“pinggu”。

      2)添加數(shù)據(jù)庫結(jié)點。打開Clementine 12.0軟件,在數(shù)據(jù)流程區(qū)添加“數(shù)據(jù)庫”結(jié)點,具體添加方法:在主界面下方選項面板中的“源”中雙擊“數(shù)據(jù)庫”或選中“數(shù)據(jù)庫”拖拽至數(shù)據(jù)流程區(qū);鼠標右鍵移至數(shù)據(jù)庫結(jié)點,點擊“編輯”,命名結(jié)點為“pinggu”,提取所需的數(shù)據(jù)集合(表),這里是Effect,該表是學(xué)員對教學(xué)評價意見的數(shù)據(jù)。

      Effect表中對應(yīng)字段為effect_id、project_id、class_id、user_id、appearance、language、content_info、content_direct、content_depth、method、practice,id為數(shù)值型,評估指標選值為“優(yōu)+”“優(yōu)”“優(yōu)-”“良+”“良”“良-”“中”“差”(如表1所示),記錄數(shù)共8 429條。在Clementine中編輯“pinggu”結(jié)點的“過濾”設(shè)置,刪除不必要的字段,如project_id,class_id,user_id等,這樣就刪除了表1中的3個字段(注:effect_id字段用于數(shù)據(jù)處理前后的對比,實際操作時也將刪除)。

      表1 教學(xué)評估意見原始數(shù)據(jù)表

      3)添加類型結(jié)點。在數(shù)據(jù)流程區(qū)添加選項面板“字段選項”中的“類型”結(jié)點,并與之前的“pinggu”結(jié)點連接,具體操作:使用鼠標選中起始節(jié)點“pinggu”,用鼠標滑輪將其拖拽至目標結(jié)點“類型”(下同);鼠標右擊“類型”,選“編輯”,點擊“讀取值”讀取各字段數(shù)據(jù),將各字段的“數(shù)據(jù)類型”設(shè)置成“集”(如自動形成,則不用設(shè)置),將“方向”設(shè)置成“兩者”。

      4)添加預(yù)處理結(jié)點。在數(shù)據(jù)流程區(qū)添加選項面板“記錄選項”中的“選擇”結(jié)點,編輯命名為“預(yù)處理”,并與之前的“類型”結(jié)點連接;在“丟棄”選項中鍵入“(appearance=language)and(language=content_info)and(content_info=content_direct)and(content_direct=content_depth)and(content_depth=method)and(method=practice)or appearance=″″or language=″″or content_info=″″or content_direct=″″or content_depth=″″or method=″″or practice=″″”,刪除評價意見均為同一值的、不完整、有缺項的不合格數(shù)據(jù)。預(yù)處理后的總數(shù)據(jù)記錄數(shù)為1 786(見表2)。

      表2 數(shù)據(jù)處理后的教學(xué)評估意見表

      5)添加表結(jié)點(可選)?!氨怼苯Y(jié)點可以預(yù)覽數(shù)據(jù)預(yù)處理后的情況,如圖1所示。在數(shù)據(jù)流程區(qū)添加選項面板“輸出”中的“表”結(jié)點,并與之前的“預(yù)處理”結(jié)點連接。此時可以鼠標右擊“表”結(jié)點,選擇“執(zhí)行”,可以看到數(shù)據(jù)篩選后的結(jié)果。

      圖1 數(shù)據(jù)預(yù)處理結(jié)果

      6)添加模型結(jié)點。在數(shù)據(jù)流程區(qū)添加選項面板“建模”中的“Apriori”結(jié)點,命名為“多前項”,并與之前的“預(yù)處理”結(jié)點連接;鼠標右擊模型結(jié)點,選“編輯”,“字段”中的前項和后項均選擇全部字段,“模型”中設(shè)置最小支持度30%,最小置信度80%,最大前項數(shù)5。執(zhí)行該字段后,Clementine管理器“模型”中會顯示“多前項”圖標,鼠標右擊,選“瀏覽”可以看到計算結(jié)果。

      7)添加圖形結(jié)點(可選)。將管理器“模型”中“多前項”圖標拖拽至數(shù)據(jù)流程區(qū),并和“預(yù)處理”結(jié)點連接;在數(shù)據(jù)流程區(qū)添加“圖”結(jié)點,設(shè)置二維或三維字段名稱,并與“多前項”圖標連接。執(zhí)行該節(jié)點,可以直觀顯示數(shù)據(jù)分析結(jié)果。

      綜上,Clementine提供了可視化和功能強大且易用的數(shù)據(jù)挖掘平臺[3],數(shù)據(jù)挖掘的過程和結(jié)果都在數(shù)據(jù)流程區(qū)內(nèi)圖形化地顯示(見圖2)。箭頭表示數(shù)據(jù)的流向,每一個結(jié)點定義了對數(shù)據(jù)的不同操作,各種操作組合在一起便形成了通向目標的路徑。

      圖2 Clementine數(shù)據(jù)流程區(qū)

      按上述步驟進行關(guān)聯(lián)規(guī)則發(fā)現(xiàn),生成了強關(guān)聯(lián)規(guī)則。根據(jù)預(yù)先設(shè)置minSup=30%,minConf=80%,最終關(guān)聯(lián)規(guī)則挖掘結(jié)果如圖3所示。

      圖3 關(guān)聯(lián)規(guī)則挖掘結(jié)果

      4 關(guān)聯(lián)性結(jié)果分析

      通過對篩選出的強關(guān)聯(lián)規(guī)則進行分析,可以發(fā)現(xiàn)教學(xué)評估意見指標之間的關(guān)聯(lián)。例如:由method?practice可知,教學(xué)方法優(yōu)秀的教師,其授課聯(lián)系實際程度的可能性是82.73%,如果要提高學(xué)員對教師“理論聯(lián)系實際”評估水平,則應(yīng)該在提升教學(xué)方法方面下功夫;同理,由method∧practice?content_direct可知,如果教學(xué)方法和理論聯(lián)系實際都優(yōu)秀的教師,對工作的指導(dǎo)性也最強的可能性為80.22%,如果要提高對實際工作的指導(dǎo)性,則應(yīng)該提升教學(xué)方法和加強理論聯(lián)系實際的程度。

      因此,教師培養(yǎng)和管理中應(yīng)該重點著眼于改進教學(xué)方法及提高聯(lián)系實際的程度,這也完全符合干部教育培訓(xùn)的“實踐性”這一根本特點和要求。

      5 結(jié)語

      當前,各級各類干部培訓(xùn)院校積累了海量的教學(xué)評估數(shù)據(jù),如何針對存量的評估數(shù)據(jù)進行數(shù)挖掘分析,是一項需要持續(xù)關(guān)注的工作。靈活應(yīng)用包括Clementine在內(nèi)的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘工具,發(fā)現(xiàn)隱藏于其中的關(guān)聯(lián)規(guī)則,可以更好地指導(dǎo)干部培訓(xùn)教學(xué)工作和促進教師個人發(fā)展。

      [1]潘民.加強教學(xué)評估,提高督導(dǎo)質(zhì)量[J].考試周刊,2014(75):163-164.

      [2]何楚,宋健,卓桐.基于頻繁模式譜聚類的課程關(guān)聯(lián)分類模型和學(xué)生成績預(yù)測算法研究[J].計算機應(yīng)用研究,2015,32(10):2930-2933.

      [3]李陽,許培揚.如何使用數(shù)據(jù)挖掘工具Clementine:以我國圖書情報類期刊學(xué)術(shù)影響力評價為例[J].現(xiàn)代情報,2012,32(1):146-149.

      責(zé)任編輯:陳 亮

      Application of Clementine in Data Analysis for Evaluating Cadre Training

      PAN Feng

      (Cadres Training Institutes of State Administration of Taxation,Yangzhou 225007)

      10.3969/j.issn.1671- 0436.2015.06.015

      2015-11-27

      潘峰(1981— ),男,碩士,高級工程師。

      TP311

      A

      1671- 0436(2015)06- 0067- 04

      猜你喜歡
      教學(xué)評估項集結(jié)點
      中等職業(yè)學(xué)校英語教學(xué)評估存在的問題及對策
      甘肅教育(2020年14期)2020-09-11 07:58:24
      基于教學(xué)評估及反饋的住院醫(yī)師規(guī)范化培訓(xùn)晨課改進
      高校教學(xué)評估成績影響因素的分析
      Ladyzhenskaya流體力學(xué)方程組的確定模與確定結(jié)點個數(shù)估計
      “五個度”見證我國高等教育
      民生周刊(2016年8期)2016-05-04 09:49:42
      關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
      卷宗(2014年5期)2014-07-15 07:47:08
      一種頻繁核心項集的快速挖掘算法
      計算機工程(2014年6期)2014-02-28 01:26:12
      基于Raspberry PI為結(jié)點的天氣云測量網(wǎng)絡(luò)實現(xiàn)
      一種新的改進Apriori算法*
      基于DHT全分布式P2P-SIP網(wǎng)絡(luò)電話穩(wěn)定性研究與設(shè)計
      绥棱县| 满城县| 高邑县| 阳高县| 广平县| 高邑县| 尉犁县| 广水市| 红原县| 萨嘎县| 雅江县| 凌源市| 吉木乃县| 区。| 天等县| 阿城市| 永济市| 温州市| 乌什县| 福鼎市| 永吉县| 赣州市| 沾益县| 剑川县| 沙湾县| 荆门市| 武陟县| 沿河| 元谋县| 博客| 会同县| 湖口县| 五家渠市| 怀安县| 扶风县| 陕西省| 马鞍山市| 镇沅| 广平县| 车致| 江北区|