• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于聚類算法的學(xué)習(xí)風(fēng)格建模策略研究

      2020-07-30 14:04:18龍坡何晶
      科技視界 2020年18期
      關(guān)鍵詞:中心點(diǎn)聚類學(xué)習(xí)者

      龍坡 何晶

      摘 要

      傳統(tǒng)學(xué)習(xí)風(fēng)格基于調(diào)查者提前設(shè)定的問卷項(xiàng)目權(quán)重,加權(quán)后得出學(xué)習(xí)者所屬的學(xué)習(xí)風(fēng)格類型,這種方式存在很強(qiáng)的人為干預(yù)的不確定性。本文討論基于機(jī)器學(xué)習(xí)和大數(shù)據(jù)的方法,通過聚類算法,利用樣本之間客觀存在的關(guān)聯(lián)關(guān)系,自動(dòng)將大數(shù)據(jù)樣本分類成多個(gè)學(xué)習(xí)風(fēng)格分類,從而減少人為主觀因素的干擾,提高學(xué)習(xí)風(fēng)格類型判斷模型的準(zhǔn)確率。

      關(guān)鍵詞

      學(xué)習(xí)風(fēng)格;學(xué)習(xí)偏好;聚類;機(jī)器學(xué)習(xí);大數(shù)據(jù)

      中圖分類號(hào): TP18 ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A

      DOI:10.19694/j.cnki.issn2095-2457 . 2020 . 18 . 86

      0 前言

      學(xué)習(xí)風(fēng)格也稱為學(xué)習(xí)偏好,或者說是學(xué)習(xí)者更傾向的學(xué)習(xí)方式。每個(gè)人在對(duì)待問題的態(tài)度、處理和感知時(shí)都具有自己的特點(diǎn)和處理方式。傳統(tǒng)的學(xué)習(xí)風(fēng)格測(cè)試主要通過問卷調(diào)查進(jìn)行,得到問卷調(diào)查后,人工根據(jù)預(yù)先判斷的權(quán)重,進(jìn)行加權(quán)計(jì)算,得出所屬的學(xué)習(xí)風(fēng)格類型。這種方式,人為因素干預(yù)很大。如果模型設(shè)定之人對(duì)于每一項(xiàng)答案的結(jié)果認(rèn)識(shí)有偏差,則整個(gè)模型準(zhǔn)確度就會(huì)下降。本文討論基于機(jī)器學(xué)習(xí)和大數(shù)據(jù)處理技術(shù),采用聚類算法,利用特征之間的關(guān)系,自動(dòng)地將樣本數(shù)據(jù)集分成多個(gè)類,并以此樣本聚類后的結(jié)果作為算法模型,來判定一個(gè)新的樣本所屬的學(xué)習(xí)風(fēng)格類型?;诰垲愃惴ǖ膶W(xué)習(xí)風(fēng)格建模策略,能夠減少人工干預(yù)對(duì)模型造成的誤差,從而提高測(cè)試準(zhǔn)確率。

      1 常見學(xué)習(xí)風(fēng)格分類

      1.1 凱夫分類法

      關(guān)于學(xué)習(xí)風(fēng)格,一直以來都是各有一套自己的理論體系。國外學(xué)者在20世紀(jì)70年代開始就提出了學(xué)習(xí)風(fēng)格理論,并從多種角度闡述了自己的觀點(diǎn)。學(xué)習(xí)風(fēng)格論最早由美國學(xué)者哈伯特·賽倫(Herbert Thelen)提出,凱夫(Keefe)將其進(jìn)一步豐富和發(fā)展[1]。國內(nèi)著名學(xué)習(xí)風(fēng)格學(xué)者譚頂良先生也提出了自己的分類方法。目前國際上認(rèn)可度最高的學(xué)習(xí)風(fēng)格概念的體系則是凱夫?qū)W(xué)習(xí)風(fēng)格概念的界定[2]。

      (1)主動(dòng)型:主動(dòng)型風(fēng)格的人喜歡和很多人一起合作學(xué)習(xí),也就是我們常說的團(tuán)隊(duì)型選手。

      (2)反思型:這類人相對(duì)于喜歡獨(dú)立自主的去完成工作和任務(wù),具有較強(qiáng)的個(gè)人自主意識(shí),偏向獨(dú)立觀點(diǎn)。

      (3)感官型:感官型的學(xué)習(xí)者喜歡將學(xué)習(xí)內(nèi)容和實(shí)際的事物相關(guān)聯(lián),他們覺得脫離了真實(shí)世界的學(xué)習(xí)方法是不太能接受。

      (4)直覺型:這類的學(xué)習(xí)者對(duì)于知識(shí)反應(yīng)迅速,并喜歡創(chuàng)新的進(jìn)行學(xué)習(xí),不喜歡墨守成規(guī),同時(shí)發(fā)現(xiàn)能力強(qiáng),善于洞察事物間的關(guān)聯(lián)或可能性。

      (5)視覺型:視覺型顧名思義就是喜歡即見即所得,他們喜歡從可以看得見的或者實(shí)操性比較強(qiáng)的場(chǎng)景中進(jìn)行學(xué)習(xí)。

      (6)聽覺型:聽覺學(xué)習(xí)者更傾向于從口述或者文字描述中獲得知識(shí)。

      (7)循序型:這類學(xué)習(xí)者比較適合按照某些章法和規(guī)則,循序漸進(jìn)的學(xué)習(xí)。

      (8)總體型:這類的學(xué)習(xí)者,喜歡先把問題逐個(gè)理解的方式學(xué)習(xí),而且有時(shí)候是跳躍式的吸收知識(shí),很多情況下表現(xiàn)的是頓悟。

      1.2 VARK模型

      VARK模型是弗萊明(Neil Fleming)提出的學(xué)習(xí)風(fēng)格調(diào)查問卷。VARK學(xué)習(xí)風(fēng)格模型主要學(xué)習(xí)者類型如下:

      (1)視覺學(xué)習(xí)型:視覺學(xué)習(xí)者習(xí)慣通過觀察來進(jìn)行學(xué)習(xí),大多數(shù)的IT從業(yè)人員都是偏向于視覺學(xué)習(xí)者,他們喜歡看到有層次的圖文并茂的學(xué)習(xí)資源。

      (2)聽覺學(xué)習(xí)型:聽覺學(xué)習(xí)者傾向于通過與人交流獲取來獲取信息,從中學(xué)習(xí)。這種風(fēng)格的人習(xí)慣通過溝通來解決問題,并且善于記住聽過的事情。

      (3)讀寫學(xué)習(xí)型:讀寫型的學(xué)習(xí)者喜歡通過文字來表達(dá)和獲取知識(shí)。因此他們的寫作能力一般都比較好。

      (4)動(dòng)覺學(xué)習(xí)型:動(dòng)覺學(xué)習(xí)型的人比較喜歡實(shí)踐,他們堅(jiān)信實(shí)踐出真知,因此他們善于模擬演練,喜歡扮演角色,從中獲得知識(shí)和學(xué)習(xí)。

      (5)多模態(tài)學(xué)習(xí)型:多模態(tài)類型的學(xué)習(xí)者喜歡從多個(gè)角度入手學(xué)習(xí),而且可以根據(jù)自己的需求進(jìn)行學(xué)習(xí)風(fēng)格的切換。

      2 聚類算法實(shí)現(xiàn)學(xué)習(xí)風(fēng)格分類

      使用聚類算法實(shí)現(xiàn)學(xué)習(xí)風(fēng)格分類模型,相同的類別的數(shù)據(jù)一般具有比較相近的屬性或者特征,而一旦特征或者屬性差異很大,那么數(shù)據(jù)表現(xiàn)也會(huì)截然不同。通過計(jì)算學(xué)習(xí)者的特征向量之間的距離關(guān)系,經(jīng)過多次迭代后,自動(dòng)的聚成預(yù)先設(shè)定的幾個(gè)分組。自動(dòng)分組后根據(jù)每組樣本的共性,人工判斷每個(gè)組所屬的學(xué)習(xí)風(fēng)格分類,從而得到學(xué)習(xí)風(fēng)格算法模型。當(dāng)一個(gè)新的樣本需要進(jìn)行學(xué)習(xí)風(fēng)格判定時(shí),計(jì)算該樣本與每個(gè)學(xué)習(xí)風(fēng)格分類組的中心距離,距離最近的一個(gè)分組即為新樣本所屬的學(xué)習(xí)風(fēng)格。

      2.1 分類特征的選取

      機(jī)器學(xué)習(xí)領(lǐng)域里,樣本數(shù)據(jù)的特征就是能代表樣本特異性的信息。也就是信息論里面說的,有價(jià)值有信息量的數(shù)據(jù)項(xiàng),稱作為信息特征[3]。人物的特征包括外貌特征、性格特征、從事工作、家庭背景等等。其中對(duì)學(xué)習(xí)風(fēng)格影響最大的特征應(yīng)該是性格特征。性格特征又包括如下幾個(gè)方面,態(tài)度特征、意志特征、情緒特征、理智特征。以上這些特征,我們可以通過現(xiàn)在普遍適用的問卷調(diào)查的方式收集,并給予評(píng)分,于是得到多組向量:

      特征名稱:態(tài)度特征,意志特征,情緒特征,理智特征, 外貌特征,從事工作,家庭背景。

      其中,態(tài)度特征、意志特征、理智特征、情緒特征在平時(shí)生活中,表現(xiàn)出來的是一種程度,程度通過量化后可以用連續(xù)的數(shù)值進(jìn)行描述,因此我們可以根據(jù)取值情況,給每個(gè)性格特征設(shè)定一個(gè)范圍。外貌特征、從事工作、家庭背景3個(gè)特征是離散數(shù)據(jù)。針對(duì)離散數(shù)據(jù),機(jī)器學(xué)習(xí)方法中可以轉(zhuǎn)換成one-hot編碼,從而變成數(shù)值型特征,再和其他連續(xù)值的特征數(shù)組進(jìn)行合并,從而成功構(gòu)建后續(xù)模型構(gòu)建所需要的測(cè)試數(shù)據(jù)集。機(jī)器學(xué)習(xí)支持常用的數(shù)據(jù)格式CSV、SQL、XLS、JSON、HDF5等,這里建議使用HDF5作為數(shù)據(jù)集,因?yàn)樗С謮嚎s,因此即使我們收集的數(shù)據(jù)量很大,也能夠處理。

      2.2 模型的構(gòu)建

      聚類算法是機(jī)器學(xué)習(xí)里面的一種無監(jiān)督學(xué)習(xí),我們通常使用k-means聚類算法,因?yàn)樗麣v史悠久,并且應(yīng)用最為廣泛,數(shù)據(jù)分析領(lǐng)域,工業(yè)領(lǐng)域都很流行。具體聚類迭代過程:

      (1)首先,要明確分類的個(gè)數(shù)N,初始化為隨機(jī)選擇N個(gè)特征向量作為各分類的中心點(diǎn)。關(guān)于分組數(shù)量,我們可以在選擇一個(gè)學(xué)習(xí)風(fēng)格分類的時(shí)候,就能夠得到,例如我們選擇VARK理論,那么分類個(gè)數(shù)N則為5。

      (2)計(jì)算待分配點(diǎn)與每個(gè)類別中心點(diǎn)的距離,距離最近的一個(gè)中心點(diǎn)的分類,則為待分配點(diǎn)的分類,然后將這個(gè)待分配點(diǎn)歸入該分類中。

      (3)基于迭代一組數(shù)據(jù)后,計(jì)算每一類所有點(diǎn)的平均值,作為當(dāng)前類別新的中心。中心點(diǎn)的定義為距離本組所有向量之間的距離都相等的點(diǎn)。

      (4)不斷重復(fù)上述三個(gè)步驟,直到所有組的中心點(diǎn)的位置變化趨近于0的時(shí)候,或者說中心點(diǎn)位置收斂。為了保證效果的最佳,還可以重新隨機(jī)選擇N個(gè)中心點(diǎn)再次迭代,比較多次計(jì)算結(jié)果,得出最佳結(jié)論。

      假設(shè)我們選擇將學(xué)習(xí)風(fēng)格按照VARK模型劃分成5個(gè)類別,那么我們的聚類數(shù)量就是5,我們隨機(jī)選取5個(gè)基準(zhǔn)學(xué)習(xí)者的樣本,依次計(jì)算所有學(xué)習(xí)者樣本和這5個(gè)樣本之間的距離,并且把它歸類到距離最近的一個(gè)基準(zhǔn)樣本所屬的組。接下來,我們需要更新計(jì)算新加入的樣本和基準(zhǔn)樣本之間的中心點(diǎn),把這個(gè)中心點(diǎn)作為新的基準(zhǔn)樣本。依次計(jì)算完所有樣本和基準(zhǔn)樣本之間的距離,納入后再次不斷更新中心點(diǎn)。直到把所有樣本計(jì)算完成,形成5個(gè)分組,以及5個(gè)分組中心點(diǎn)。然后只需要人工審核一下5個(gè)組別分別對(duì)應(yīng)VARK模型的學(xué)習(xí)風(fēng)格的哪一個(gè)類別,進(jìn)行標(biāo)記即可。

      2.3 模型的應(yīng)用

      經(jīng)過模型的構(gòu)建和迭代后,得到了5個(gè)VARK模型的類別,以及還知道了每個(gè)類別的中心點(diǎn)樣本的特征向量,即模型的基本數(shù)據(jù)參數(shù)?;诰垲惸P偷某S脩?yīng)用流程和模型構(gòu)建迭代過程實(shí)際上是相似的。首先,根據(jù)用戶填寫的問卷調(diào)查,拿到用戶輸入的數(shù)據(jù),經(jīng)過屬于預(yù)處理,剔除噪聲數(shù)據(jù),減少對(duì)結(jié)果的干擾。第二步,根據(jù)我們的特征定義規(guī)則,提取待檢測(cè)數(shù)據(jù)的特征向量。第三步,計(jì)算該特征向量和5個(gè)聚類中心的距離,距離最近的一個(gè)聚類中心點(diǎn)所屬的學(xué)習(xí)風(fēng)格,即為待檢測(cè)數(shù)據(jù)的學(xué)習(xí)風(fēng)格,從而完成一次數(shù)據(jù)檢測(cè)應(yīng)用。

      模型的應(yīng)用可以發(fā)布成web應(yīng)用或者restful-api服務(wù),如果采用python的sklearn或者Tensorflow等機(jī)器學(xué)習(xí)框架構(gòu)建模型,可以導(dǎo)出hdf5格式,模型參數(shù)也可以保存成支持跨平臺(tái)的格式。從而方便根據(jù)需求隨時(shí)遷移到各種平臺(tái)進(jìn)行應(yīng)用。

      3 總結(jié)

      聚類算法的穩(wěn)定性和悠久的歷史,證明了其優(yōu)越性,我們將其引入到學(xué)習(xí)風(fēng)格判定和預(yù)測(cè)上面,可以提高其客觀性,從而提高其準(zhǔn)確性。實(shí)際上,在聚類算法的應(yīng)用過程中,我們可以繼續(xù)進(jìn)一步迭代算法,把新樣本的計(jì)算結(jié)果和用戶給予計(jì)算結(jié)果的評(píng)分,反饋給系統(tǒng),系統(tǒng)對(duì)模型進(jìn)行進(jìn)一步迭代,從而優(yōu)化系統(tǒng)的準(zhǔn)確率。另外,我們還可以考慮采用深度學(xué)習(xí)來進(jìn)行學(xué)習(xí)風(fēng)格的分類,基于深度神經(jīng)網(wǎng)絡(luò),我們不需要提取用戶的特征,因此進(jìn)一步減少人為因素的干預(yù),讓評(píng)價(jià)數(shù)據(jù)更加客觀。

      參考文獻(xiàn)

      [1]王蓉,李小青,劉軍蘭,等.基于大數(shù)據(jù)網(wǎng)絡(luò)用戶興趣個(gè)性化推薦模型分析[J].電子設(shè)計(jì)工程,2019,27(21):5-8.

      [2]劉路,魏源.當(dāng)代大學(xué)生學(xué)習(xí)偏好的差異性比較[J].廣西教育學(xué)院學(xué)報(bào),2014(3):119-121.

      [3]單留舉,王曉東,馬英運(yùn).基于大數(shù)據(jù)的用戶學(xué)習(xí)偏好建模及應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件,2016(1):77-80,共4頁.

      猜你喜歡
      中心點(diǎn)聚類學(xué)習(xí)者
      你是哪種類型的學(xué)習(xí)者
      Scratch 3.9更新了什么?
      十二星座是什么類型的學(xué)習(xí)者
      如何設(shè)置造型中心點(diǎn)?
      電腦報(bào)(2019年4期)2019-09-10 07:22:44
      基于DBSACN聚類算法的XML文檔聚類
      漢語學(xué)習(xí)自主學(xué)習(xí)者特征初探
      漢字藝術(shù)結(jié)構(gòu)解析(二)中心點(diǎn)處筆畫應(yīng)緊奏
      基于改進(jìn)的遺傳算法的模糊聚類算法
      尋找視覺中心點(diǎn)
      大眾攝影(2015年9期)2015-09-06 17:05:41
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      宁阳县| 旌德县| 阳东县| 苏尼特左旗| 阳信县| 桑植县| 和田市| 玉山县| 射洪县| 平南县| 曲水县| 贺兰县| 平谷区| 乌兰浩特市| 内黄县| 高青县| 辉南县| 新营市| 伽师县| 夹江县| 通州区| 竹北市| 会理县| 满城县| 安溪县| 望奎县| 乌拉特前旗| 庄河市| 尖扎县| 通城县| 龙江县| 彭阳县| 平度市| 潼南县| 凌源市| 石屏县| 江川县| 清水河县| 德州市| 彝良县| 本溪市|