• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      決策樹技術(shù)在移動(dòng)學(xué)習(xí)性別差異研究中的應(yīng)用

      2009-07-16 09:33:54王慧敏陳澤宇王敏娟
      現(xiàn)代教育技術(shù) 2009年5期
      關(guān)鍵詞:性別差異移動(dòng)學(xué)習(xí)決策樹

      王慧敏 陳澤宇 王敏娟 張 弛

      【摘要】基于對近千名高等教育移動(dòng)學(xué)習(xí)者進(jìn)行大規(guī)模調(diào)查所收集到的數(shù)據(jù),研究者使用C5.0算法分別生成男女生群體關(guān)于課件使用滿意度的決策樹,然后比較從中提取的不滿意規(guī)則進(jìn)行性別差異研究。實(shí)驗(yàn)結(jié)果表明:在移動(dòng)學(xué)習(xí)中,女生對學(xué)習(xí)資料有更高的要求,女生對學(xué)習(xí)資料要求的個(gè)體差異高于男生,女生使用課件時(shí)更容易受外界因素干擾。

      【關(guān)鍵詞】移動(dòng)學(xué)習(xí);決策樹;學(xué)習(xí)者滿意度;性別差異

      【中圖分類號(hào)】G40-057 【文獻(xiàn)標(biāo)識(shí)碼】A 【論文編號(hào)】1009—8097(2009)05—0030—04

      一 引言

      移動(dòng)學(xué)習(xí)(m-learning)是繼網(wǎng)絡(luò)學(xué)習(xí)(e-learning)后出現(xiàn)的一種新的學(xué)習(xí)模式,國內(nèi)外大量研究文獻(xiàn)已經(jīng)對此進(jìn)行了諸多研究。從當(dāng)前移動(dòng)學(xué)習(xí)研究的現(xiàn)狀看,人們對它的研究已經(jīng)走過了最初的探索期,開始從早期的實(shí)驗(yàn)研究,向著融入主流學(xué)習(xí)方式的方向發(fā)展。Minjuan Wang博士[1]已進(jìn)行了一系列的移動(dòng)學(xué)習(xí)研究,階段研究結(jié)果表明“移動(dòng)學(xué)習(xí)能有效促進(jìn)學(xué)生的學(xué)習(xí)過程,使其從被動(dòng)學(xué)習(xí)者轉(zhuǎn)變?yōu)橹鲃?dòng)學(xué)習(xí)者,提高學(xué)習(xí)者的學(xué)習(xí)績效”,并明確指出“下一階段的研究重點(diǎn)在于學(xué)習(xí)資料的個(gè)性化。”由此可見,個(gè)性化研究是移動(dòng)學(xué)習(xí)的一個(gè)重要研究領(lǐng)域。個(gè)性化的內(nèi)涵非常廣泛,其中,性別差異研究可作為個(gè)性化研究的一個(gè)很好的切入點(diǎn)。與此同時(shí),學(xué)習(xí)者對學(xué)習(xí)資料的滿意度是非常關(guān)鍵的,這直接影響到移動(dòng)學(xué)習(xí)的進(jìn)一步開展。 綜上所述,本文圍繞課件使用者滿意度來研究移動(dòng)學(xué)習(xí)的性別差異是有一定研究價(jià)值和現(xiàn)實(shí)意義的。

      為了實(shí)現(xiàn)更大規(guī)模的移動(dòng)學(xué)習(xí)實(shí)踐,我們開發(fā)了智能手機(jī)插卡播放技術(shù),把課程按照知識(shí)點(diǎn)制作成移動(dòng)學(xué)習(xí)課件,學(xué)習(xí)者可以通過手機(jī)下載課件隨時(shí)隨地地進(jìn)行學(xué)習(xí)。針對移動(dòng)學(xué)習(xí)課件使用情況,我們通過在線調(diào)查,收集學(xué)習(xí)者使用課件后的反饋信息。由于收集到的數(shù)據(jù)信息規(guī)模較大,我們沒有像大部分移動(dòng)學(xué)習(xí)研究文獻(xiàn)那樣采用一般局限于小樣本數(shù)據(jù)的傳統(tǒng)統(tǒng)計(jì)分析方法,而是運(yùn)用決策樹技術(shù)進(jìn)行移動(dòng)學(xué)習(xí)的研究。我們使用C5.0即ID3的改進(jìn)算法,分別推導(dǎo)出男生、女生群體關(guān)于移動(dòng)學(xué)習(xí)課件使用滿意度的決策樹,通過比較從中提取的不滿意規(guī)則來進(jìn)行移動(dòng)學(xué)習(xí)性別差異研究,期待產(chǎn)生更豐富、更深層次的知識(shí)發(fā)現(xiàn),進(jìn)而有針對性地改進(jìn)現(xiàn)有的移動(dòng)學(xué)習(xí)資料,滿足學(xué)習(xí)者的個(gè)性化需求。

      二 決策樹與C5.0算法

      決策樹是數(shù)據(jù)挖掘領(lǐng)域數(shù)據(jù)探查、分類和預(yù)測的常用工具。按照特定算法生成的決策樹從根到每個(gè)葉子節(jié)點(diǎn)都有一條路徑,一條路徑就是一條規(guī)則,因此可以從決策樹中提取可理解的規(guī)則。決策樹各種算法都具有相同的基本過程:針對目標(biāo)變量,分割出來的子結(jié)點(diǎn)比其父結(jié)點(diǎn)具有更高的純度,通過這種方式,可將大規(guī)模數(shù)據(jù)記錄集分割為樹型結(jié)構(gòu)的彼此越來越相似的小記錄集。一般,用于評(píng)價(jià)可能拆分的度量是純度,不同的算法就在于衡量純度的度量不同。如Quinlan 于1986年提出的ID3 算法,就是使用信息論中的信息熵來評(píng)價(jià)拆分分類目標(biāo)變量的純度度量。有關(guān)決策樹原理及其應(yīng)用的更多介紹可見參考資料[2]。

      C5.0算法是Quinlan在ID3版本上演化和精修多年的最新版本。它的主要改進(jìn)是選擇能帶來最佳信息增益率的字段拆分?jǐn)?shù)據(jù)記錄集,并增加了推進(jìn)和修剪枝方法(詳見參考資料[3])。第一次拆分確定的數(shù)據(jù)記錄子集隨后再次拆分,這一過程重復(fù)直到數(shù)據(jù)記錄子集不能拆分為止。最后,重新檢查最低層次的拆分,那些對于模型值沒有貢獻(xiàn)的數(shù)據(jù)記錄子集被剔除或者修剪。

      三 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)獲取

      我們開發(fā)了智能手機(jī)插卡播放技術(shù),把課程按照知識(shí)點(diǎn)制作成移動(dòng)學(xué)習(xí)課件并發(fā)布在移動(dòng)學(xué)習(xí)資源網(wǎng)上。為了進(jìn)一步推進(jìn)移動(dòng)學(xué)習(xí)研究,我們制作了課后調(diào)查問卷,并把它整合到網(wǎng)站中供學(xué)習(xí)者使用課件后提交反饋信息(詳見圖1)。

      網(wǎng)站運(yùn)行1年多以來,我們共制作五大類的移動(dòng)學(xué)習(xí)課件,主要以語言類為主,另包括經(jīng)濟(jì)管理、計(jì)算機(jī)等,截至目前共有2887個(gè)課件放上網(wǎng),下載總次數(shù)達(dá)36581次。系統(tǒng)共收集到課后調(diào)查問卷(涉及內(nèi)容見表1)反饋信息930條,其中學(xué)習(xí)者使用課件后表示“滿意”和“不滿意”的典型數(shù)據(jù)記錄571條,我們使用這部分?jǐn)?shù)據(jù)進(jìn)行分析。

      四 運(yùn)用決策樹技術(shù)研究移動(dòng)學(xué)習(xí)的性別差異

      1 數(shù)據(jù)分析流程

      我們使用C5.0算法分別生成男女生群體關(guān)于課件使用滿意度的決策樹。在我們的實(shí)驗(yàn)中,輸出變量為學(xué)習(xí)者滿意度(“滿意”、“不滿意”),輸入變量為年齡、課件長度偏好、課件形式偏好、學(xué)習(xí)地點(diǎn)。我們把編碼預(yù)處理后的數(shù)據(jù)通過性別選擇、目標(biāo)變量均衡化、設(shè)定輸入輸出變量、劃分訓(xùn)練和測試集一系列操作后,按照不同修剪純度(pruning severity)訓(xùn)練決策樹模型,并通過測試集驗(yàn)證比較生成樹的正確率,確定最后使用的最佳決策樹。男女群體處理步驟完全相同,數(shù)據(jù)分析流程見圖2。

      2 最佳決策樹

      我們最終的目標(biāo)是分析比較從決策樹中提取出來的男女生群體關(guān)于課件使用滿意度的不滿意規(guī)則,簡潔的規(guī)則更容易理解,因此希望決策樹在正確率能夠得到保證的前提下盡量簡潔。我們主要通過調(diào)整修剪純度來達(dá)到這個(gè)目的。修剪純度決定生成決策樹被修剪的程度。提高純度值將獲得更小,更簡潔的決策樹;降低純度值將獲得更加精確的決策樹。[4]較高修剪純度還能縮短訓(xùn)練時(shí)間和避免過度訓(xùn)練。我們以最精確的決策樹(即修剪純度為0)為參照(下面稱為V樹),不斷提高修剪純度來產(chǎn)生不同的決策樹,直到最簡潔決策樹(即修剪純度為100,下面稱為S樹),通過對比決策樹收益圖和相合矩陣來判斷新生成樹的正確率是否可以接受。因?yàn)槟信后w操作過程完全相同,這里我們僅就女生群體最佳決策樹產(chǎn)生過程做詳細(xì)說明。

      我們使用收益圖(Gains chart)來快速評(píng)估和比較不同樹的優(yōu)劣。收益圖的橫坐標(biāo)通常為分位點(diǎn)(按置信度降序),縱坐標(biāo)是累計(jì)收益,定義為:分位累計(jì)命中數(shù)/總命中數(shù)×100%。通常從左端到右端以0%為起點(diǎn),以100%為終點(diǎn)。對于一個(gè)好的模型來說,收益圖表將陡峭地升到100%然后漸漸變的平緩。而一個(gè)沒有提供任何信息的模型將從較低的左端以斜對角線形狀上升到較高的右端。[4]我們從圖3中可知,S樹與V樹在收益圖上表現(xiàn)差別不大。實(shí)際上,經(jīng)過后期計(jì)算,S樹與V樹在測試集數(shù)據(jù)驗(yàn)證下正確率僅相差7%,分別為81%和74%。

      由于決策樹正確率是包含不滿意預(yù)測與滿意預(yù)測正確率的加權(quán)和,因此我們可進(jìn)一步查看它們的相合矩陣(Coincidence matrices),單獨(dú)比較兩棵樹不滿意預(yù)測的正確率。相合矩陣顯示對于符號(hào)型目標(biāo)變量的每個(gè)被生成的(被預(yù)測的)字段和它的目標(biāo)字段之間匹配的模式。它用一個(gè)表格表示,行被定義為實(shí)際值,列被定義為預(yù)測值。

      查看表2可發(fā)現(xiàn)對于不滿意預(yù)測而言,V樹正確率為98%,而S樹卻達(dá)到100%。因此我們更確定S樹即是用來提取不滿意規(guī)則的最佳樹。最終決定采用的女生決策樹見圖4。

      3 從樹中提取規(guī)則進(jìn)行比較

      根據(jù)女生群體產(chǎn)生的決策樹,我們可從0節(jié)點(diǎn)開始分別到2、4、8葉子節(jié)點(diǎn)的路徑來提取女生3條不滿意規(guī)則,同理,我們從男生決策樹提取了1條不滿意規(guī)則,見表3。

      *支持度:符合該條規(guī)則的人數(shù)占該群體總?cè)藬?shù)百分比

      首先,從“不滿意”規(guī)則數(shù)量上來看,女生有更多的不滿意規(guī)則,這說明女生對學(xué)習(xí)資料的要求更高。

      其次,每條規(guī)則的符合條件如果超過一項(xiàng)(如1、3、4號(hào)規(guī)則),實(shí)質(zhì)上反映了該群體在使用者滿意度方面的一次分化。女生分化地更嚴(yán)重,這說明女生對學(xué)習(xí)資料要求的個(gè)體差異比男生高。

      對于2號(hào)規(guī)則。男生同等條件下不會(huì)表示不滿意,這說明女生比男生在上班時(shí)對學(xué)習(xí)資料有更高要求。

      對于3號(hào)規(guī)則,在移動(dòng)交通工具上,周圍環(huán)境一般比較嘈雜,外界干擾因素多。斯坦福大學(xué)實(shí)驗(yàn)室在一項(xiàng)移動(dòng)學(xué)習(xí)實(shí)驗(yàn)中指出“研究移動(dòng)學(xué)習(xí)資料設(shè)計(jì)應(yīng)注重開發(fā)最適合零碎時(shí)間免受外界干擾的學(xué)習(xí)資料?!?[5]盡管我們按照知識(shí)點(diǎn)組織學(xué)習(xí)資料盡量克服周圍干擾,但仍有大齡女生表示不滿意,這說明大齡女生使用移動(dòng)課件時(shí)更容易受外界干擾而影響其使用課件的滿意度。

      對于1和4號(hào)規(guī)則,兩者支持度都較高。我們發(fā)現(xiàn)男女生都有“在家中”這個(gè)條件。在家中,學(xué)習(xí)者完全可以使用網(wǎng)絡(luò)課件,網(wǎng)絡(luò)課件在呈現(xiàn)視頻形式和長時(shí)間的課件上更令人滿意。這說明移動(dòng)學(xué)習(xí)尚不足以完全取代網(wǎng)絡(luò)學(xué)習(xí)。我們?nèi)匀灰獔?jiān)持兩套學(xué)習(xí)資料的開發(fā),適宜學(xué)習(xí)者不同的需要。

      五 結(jié)語

      本文基于對近千名高等教育移動(dòng)學(xué)習(xí)者進(jìn)行大規(guī)模調(diào)查所收集到的數(shù)據(jù),使用C5.0算法生成男女生群體關(guān)于課件使用滿意度的決策樹,然后比較從中提取的不滿意規(guī)則進(jìn)行性別差異研究。實(shí)驗(yàn)結(jié)果表明:在移動(dòng)學(xué)習(xí)中,女生對學(xué)習(xí)資料有更高的要求,女生對學(xué)習(xí)資料要求的個(gè)體差異高于男生,女生使用課件時(shí)更容易受外界因素干擾。研究結(jié)果提示我們在制作移動(dòng)學(xué)習(xí)資料時(shí)要更關(guān)注女性群體需求。本文所存在的問題在于對于應(yīng)用決策樹技術(shù)而言樣本數(shù)量仍顯不夠且數(shù)據(jù)中目標(biāo)變量分布不均衡。雖然經(jīng)過均衡化處理加以彌補(bǔ),但可能引入大量噪聲,這樣會(huì)導(dǎo)致產(chǎn)生的規(guī)則有偏差。盡管如此,研究過程和結(jié)果仍說明決策樹技術(shù)是研究該類問題的強(qiáng)有力工具,繼續(xù)積累數(shù)據(jù)再次重復(fù)挖掘?qū)?huì)取得更好的結(jié)果。

      移動(dòng)學(xué)習(xí)相比其它學(xué)習(xí)方式帶有更加明顯的個(gè)性化。不符合其個(gè)性化的學(xué)習(xí)資料將令學(xué)習(xí)者產(chǎn)生挫折感,破壞其對移動(dòng)學(xué)習(xí)的信任進(jìn)而減少學(xué)習(xí)。移動(dòng)學(xué)習(xí)的個(gè)性化研究是一個(gè)廣泛的研究領(lǐng)域,本文所涉及的性別差異研究只是拋磚引玉,相信隨著更多研究者的參與,我們能夠在復(fù)雜多維的個(gè)性化差異中找到更多規(guī)律,最終使得移動(dòng)學(xué)習(xí)滿足學(xué)習(xí)者的個(gè)性化需要。

      參考文獻(xiàn)

      [1] Minjuan Wang, Ruimin Shen, Daniel Novak, et al.The impact of mobile learning on students' learning behaviours and performance:Report from a large blended classroom[DB/OL].

      [2] Michael J.A.Berry,Gordon S.Linoff,別榮芳等譯.數(shù)據(jù)挖掘技術(shù):市場營銷、銷售與客戶關(guān)系管理領(lǐng)域應(yīng)用[M].北京:機(jī)械工業(yè)出版社,2006:111-131.

      [3] Quinlan, J.R.C4.5: programs for machine learning[M].San Mateo:Morgan Kaufmann Publishers,1993.

      [4] 謝邦昌.數(shù)據(jù)挖掘Clementine應(yīng)用實(shí)務(wù)[M].北京:機(jī)械工業(yè)出版社,2008:173-179,195-198.

      [5] Keegan D.The future of learning: From elearning to mLearning[EB/OL].

      猜你喜歡
      性別差異移動(dòng)學(xué)習(xí)決策樹
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      智能手機(jī)在大學(xué)生移動(dòng)學(xué)習(xí)中的應(yīng)用研究
      基于云計(jì)算的移動(dòng)學(xué)習(xí)平臺(tái)的設(shè)計(jì)
      基于移動(dòng)學(xué)習(xí)的自動(dòng)問答系統(tǒng)設(shè)計(jì)
      移動(dòng)學(xué)習(xí)方式下實(shí)驗(yàn)教學(xué)資源建設(shè)的研究
      科技視界(2016年20期)2016-09-29 12:07:51
      基于決策樹的出租車乘客出行目的識(shí)別
      性別差異對TWA的影響
      中國缺血性腦卒中急性期抑郁障礙的性別差異
      基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
      黄浦区| 腾冲县| 溧阳市| 文化| 临夏市| 莱州市| 伊金霍洛旗| 金堂县| 阳东县| 正镶白旗| 安康市| 东平县| 静乐县| 和平县| 工布江达县| 武陟县| 阳新县| 西贡区| 巫山县| 洪湖市| 调兵山市| 普安县| 内江市| 金阳县| 中卫市| 越西县| 镇赉县| 呼图壁县| 金塔县| 固安县| 彩票| 巢湖市| 隆子县| 合水县| 三门县| 会泽县| 方正县| 呼伦贝尔市| 天等县| 册亨县| 三都|