• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      改進(jìn)DBA算法的眼動(dòng)模式分析

      2022-11-20 13:59:50陳子麟戰(zhàn)蔭偉
      關(guān)鍵詞:注視點(diǎn)眼動(dòng)聚類(lèi)

      陳子麟,戰(zhàn)蔭偉,楊 卓

      廣東工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,廣州 510006

      眼動(dòng)追蹤是衡量視覺(jué)注意力分布的一項(xiàng)重要技術(shù),通常用以分析參與者在視覺(jué)刺激上完成任務(wù)的表現(xiàn),目前已廣泛應(yīng)用于市場(chǎng)營(yíng)銷(xiāo)、神經(jīng)科學(xué)、人機(jī)交互和閱讀分析等領(lǐng)域。隨著眼動(dòng)追蹤技術(shù)的進(jìn)步和設(shè)備成本的降低,眼動(dòng)追蹤技術(shù)能夠以更高的速率產(chǎn)生更多的數(shù)據(jù)[1],正從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用領(lǐng)域。

      在教育領(lǐng)域,傳統(tǒng)的教學(xué)模式是教師與學(xué)生面對(duì)面教學(xué),教師受制于學(xué)生人數(shù),無(wú)法對(duì)所有學(xué)生的學(xué)習(xí)狀態(tài)進(jìn)行有效的監(jiān)測(cè),教學(xué)效率難以提高。而今網(wǎng)絡(luò)在線課程蓬勃興起,采用視頻錄播的方式進(jìn)行教學(xué)能夠合理分配教育資源,提升教學(xué)效率。然而,在線學(xué)習(xí)缺乏線下教學(xué)的氛圍,更易受環(huán)境干擾,學(xué)習(xí)者的注意力會(huì)不自覺(jué)地從與任務(wù)相關(guān)的事物轉(zhuǎn)移到與任務(wù)無(wú)關(guān)的思考中,即心理學(xué)上所謂的心智游移現(xiàn)象。大量研究已經(jīng)證明這種現(xiàn)象是普遍存在的,且與各種任務(wù)之間的效率呈負(fù)相關(guān)關(guān)系,與任務(wù)的復(fù)雜度呈正比例關(guān)系[2]。更為不幸的是,這是一種高度內(nèi)在的狀態(tài),不易從明顯的行為和表情中進(jìn)行推斷。人類(lèi)的認(rèn)知活動(dòng)和眼睛的行為有密切關(guān)聯(lián),因而利用眼動(dòng)數(shù)據(jù)來(lái)挖掘不同的眼動(dòng)模式,進(jìn)而分析學(xué)生的學(xué)習(xí)狀態(tài)成為解決這種問(wèn)題的一種途徑。

      近年來(lái),在教育領(lǐng)域,眼動(dòng)追蹤已用于探索學(xué)生的學(xué)習(xí)模式,以期把握學(xué)生的真實(shí)需求,開(kāi)展個(gè)性化教育,提升教學(xué)質(zhì)量。程時(shí)偉等人[3]基于注視點(diǎn)和眼跳等眼動(dòng)數(shù)據(jù)生成可視化批注,能夠有效幫助學(xué)生提高閱讀水平。安璐等人[4]以15名大學(xué)生為被試,利用眼動(dòng)數(shù)據(jù)分析PPT背景顏色對(duì)學(xué)生的影響。Mason等人[5]錄制專(zhuān)家閱讀時(shí)的眼動(dòng)數(shù)據(jù)并用其引導(dǎo)初學(xué)者學(xué)習(xí),該方法能有效提高學(xué)習(xí)效率。Rahman等人[6]在VR教學(xué)環(huán)境下,通過(guò)可視化技術(shù)分析學(xué)生的凝視數(shù)據(jù),識(shí)別走神的學(xué)生并給予個(gè)性化指導(dǎo)。眼動(dòng)追蹤還能夠幫助評(píng)估用戶在探索性學(xué)習(xí)環(huán)境中的行為,所收集的數(shù)據(jù)可以用來(lái)改進(jìn)學(xué)生模型[7]。

      眼動(dòng)掃描路徑是眼睛在觀察事物時(shí)隨著時(shí)間的變化而產(chǎn)生的一系列注視點(diǎn),即在視覺(jué)刺激下視線變化的位置。眼動(dòng)模式則是群體的代表性掃描路徑,是群體眼動(dòng)行為的共性抽象。相同時(shí)間內(nèi)掃描路徑的共性和差異能夠揭示不同的眼動(dòng)模式,幫助分析參與者內(nèi)在的情感認(rèn)知和閱讀策略。Frame等人[8]通過(guò)比較在復(fù)雜搜索任務(wù)中掃描路徑的相似性來(lái)區(qū)分專(zhuān)家和新手的搜索策略,以改善對(duì)新手的培訓(xùn)。Tablatin等人[9]提出STA(scanpath trend analysis)算法來(lái)分析掃描路徑的趨勢(shì),證明在計(jì)算機(jī)編程中,成績(jī)優(yōu)秀的學(xué)生具有不同的閱讀策略,但都遵循相同的邏輯方式。這類(lèi)研究表明,通過(guò)掃描路徑探索群體的眼動(dòng)行為,進(jìn)而分析潛在的認(rèn)知過(guò)程是高度可行的。

      很多學(xué)者為探索群體的閱讀策略和情感認(rèn)知進(jìn)行了研究。Eraslan等人[10]提出一種eMINE方法,結(jié)合最長(zhǎng)公共子序列算法和層次聚類(lèi)算法來(lái)獲取公共掃描路徑作為群體的眼動(dòng)模式。Ming等人[11]則根據(jù)NW(Needleman-Wunsch)算法度量掃描路徑之間的相似性,選擇與其他實(shí)例相似度最高的掃描路徑作為群體的眼動(dòng)模式。然而,上述方法都要求掃描路徑必須先轉(zhuǎn)換為字符串,再采取字符串匹配算法進(jìn)行比較,因而丟失了空間分布。Kurzhals等人[12]則另辟蹊徑,用可視化這種直觀的方式來(lái)分析掃描路徑,提出Gaze Stripes[12]將所有參與者的掃描路徑映射到圖像縮略圖的水平軸上,以時(shí)間對(duì)齊的方式分析和比較參與者隨時(shí)間變化的觀看行為。然而,隨著用戶數(shù)量的增加,視覺(jué)效果明顯降低且算法性能低下。為了解決這類(lèi)問(wèn)題,文獻(xiàn)[13-14]采用顏色編碼的鄰接矩陣來(lái)挖掘眼動(dòng)模式。先利用相似性度量算法計(jì)算成對(duì)掃描路徑的相似度,并在顏色編碼的鄰接矩陣中展示,再對(duì)矩陣排序以進(jìn)行聚類(lèi)分析。該方法利用交互技術(shù)與原始刺激鏈接,能夠通過(guò)矩陣中不同的顏色區(qū)域揭示不同的眼動(dòng)模式,算法復(fù)雜度較低且不受用戶數(shù)量限制。然而,在矩陣中采用聚類(lèi)重排序技術(shù)[15]取得的聚類(lèi)效果較差,無(wú)法很好地分離不同的眼動(dòng)模式。

      本文針對(duì)上述方法的局限性,對(duì)DBA算法進(jìn)行改進(jìn),并用來(lái)計(jì)算群體的代表性掃描路徑,識(shí)別異常的眼動(dòng)行為;同時(shí)分別利用DTW和改進(jìn)的DBA算法計(jì)算時(shí)間序列的相似度和聚類(lèi)種子,通過(guò)一種距離密度聚類(lèi)方法對(duì)時(shí)間序列進(jìn)行聚類(lèi)。最后根據(jù)聚類(lèi)個(gè)數(shù)和性能評(píng)估專(zhuān)注、走神及信息迷航三種學(xué)習(xí)狀態(tài)。

      1 數(shù)據(jù)建模與轉(zhuǎn)換

      與眼動(dòng)數(shù)據(jù)相關(guān)的基本術(shù)語(yǔ)的定義可參考文獻(xiàn)[16],這里簡(jiǎn)要介紹文中使用的幾種指標(biāo),詳見(jiàn)圖1。其中,凝視點(diǎn)是從眼動(dòng)設(shè)備中采集獲取的原始眼動(dòng)數(shù)據(jù);注視點(diǎn)是由指定區(qū)域和時(shí)間跨度的凝視點(diǎn)聚集而來(lái);掃視描述了從一個(gè)注視點(diǎn)到另一個(gè)注視點(diǎn)的快速眼動(dòng)過(guò)程;掃描路徑則表示一系列交替的注視和掃視的序列;感興趣區(qū)域(area of interest,AOI)是根據(jù)視覺(jué)刺激的語(yǔ)義信息創(chuàng)建的,通常標(biāo)記為一個(gè)對(duì)象的整體或部分。

      1.1 掃描路徑構(gòu)建

      當(dāng)人們觀察事物時(shí),注視點(diǎn)的位置是不斷發(fā)生變化的,并隨著大腦思維的變化而起伏不定。這些注視點(diǎn)位置的變化即構(gòu)成了觀察者在觀察整個(gè)事物時(shí)的眼動(dòng)行為。給定一組有序的注視點(diǎn)P={p1,p2,…,pm},pi=(xi,yi)表示時(shí)刻ti的注視點(diǎn)位置,t1<t2<…<tn。任意兩個(gè)連續(xù)注視點(diǎn)的坐標(biāo)連成一條線,表示眼睛從視覺(jué)刺激的一個(gè)位置移動(dòng)到另一個(gè)位置。

      1.2 創(chuàng)建AOI

      在自由觀看條件下,吸引觀察者注意力的不是單個(gè)像素,而是整個(gè)感興趣區(qū)域(AOI)。對(duì)于相同的目標(biāo),觀察者的注意力可能分布在不同的位置。因此,基于注視的掃描路徑無(wú)法促進(jìn)抽象的表達(dá),難以探索參與者眼動(dòng)行為的相似性。本文通過(guò)AOI序列來(lái)代替參與者的掃描路徑,采用均值漂移算法(mean-shift algorithm),把注視點(diǎn)聚類(lèi)為AOI,生成眼動(dòng)序列。均值漂移算法無(wú)需輸入聚類(lèi)個(gè)數(shù),Santella等人[17]已將其用于眼動(dòng)分析,證明比k-means算法具有更好的性能。對(duì)注視點(diǎn)執(zhí)行均值漂移聚類(lèi)算法后獲得集群個(gè)數(shù),每個(gè)集群代表一個(gè)AOI。本文將聚類(lèi)的質(zhì)心坐標(biāo)作為AOI的坐標(biāo),再根據(jù)注視點(diǎn)距AOI質(zhì)心坐標(biāo)的最小距離,將注視點(diǎn)分配在AOI中,并以AOI的質(zhì)心坐標(biāo)代替原來(lái)的注視坐標(biāo)。

      2 相關(guān)技術(shù)

      2.1 動(dòng)態(tài)時(shí)間規(guī)整

      動(dòng)態(tài)時(shí)間規(guī)整(dynamic time warping,DTW)可以用來(lái)比較具有兩個(gè)不同長(zhǎng)度的時(shí)間序列[18]。給定兩個(gè)長(zhǎng)度分別為m和n的序列X=(x1,x2,…,xi,…,xm)和Y=(y1,y2,…,yj,…,yn),構(gòu)建距離矩陣:

      其中,dij為點(diǎn)xi和點(diǎn)yj之間的歐氏距離。

      DTW算法需要從(1,1)到(m,n)找到一條最優(yōu)路徑W=來(lái)匹配序列。為確保該路徑全局最優(yōu),須同時(shí)滿足三個(gè)條件:有界性、連續(xù)性和單調(diào)性。有界性意味著路徑的起點(diǎn)為(1,1)和終點(diǎn)為(m,n);連續(xù)性指不能跨過(guò)某個(gè)點(diǎn)去匹配,路徑中的下一個(gè)點(diǎn)必須與當(dāng)前點(diǎn)相鄰,即(i,j)的下一個(gè)點(diǎn)必須是(i+1,j)、(i,j+1)或(i+1,j+1);單調(diào)性指路徑保持時(shí)間順序單調(diào)不減。滿足上述三個(gè)條件時(shí),可以將DTW定義為:

      其中,d(wk)=d(xi,yj)表示為路徑中k處對(duì)應(yīng)的i和j。路徑的累計(jì)距離可以通過(guò)遞歸計(jì)算得:

      2.2 重心平均動(dòng)態(tài)時(shí)間規(guī)整

      在許多場(chǎng)景中,通常使用時(shí)間序列集合的平均序列來(lái)代表整個(gè)集合。然而,集合中的每條時(shí)間序列長(zhǎng)度不一定相等,且其特征在時(shí)間軸上可能是錯(cuò)位的。若按照逐個(gè)時(shí)間點(diǎn)一一對(duì)應(yīng)的方式計(jì)算平均序列,無(wú)法取得很好的結(jié)果。為此,數(shù)據(jù)挖掘領(lǐng)域提出了基于DTW計(jì)算平均時(shí)間序列的方法,主要分為局部平均策略和全局平均策略。局部平均策略采用迭代計(jì)算成對(duì)時(shí)間序列的平均值,計(jì)算獲取的臨時(shí)平均序列與下一條時(shí)間序列的平均值,直到遍歷完整個(gè)集合為止[19]。PSA(prioritized shape averaging)算法[20]在此基礎(chǔ)上進(jìn)行優(yōu)化,結(jié)合層次聚類(lèi)的思想,在序列進(jìn)行成對(duì)平均之前根據(jù)序列的形狀相似性進(jìn)行排序,從相似度最高的序列開(kāi)始計(jì)算平均值,這樣能夠改善隨機(jī)選擇序列所帶來(lái)的負(fù)面影響。然而,局部平均策略導(dǎo)致每次迭代所獲取的平均序列長(zhǎng)度變長(zhǎng),不利于后續(xù)分析。為此,Petitjean等人[21]提出了DBA算法,以一種全局平均的策略計(jì)算集合的平均序列。從隨機(jī)選擇的初始平均序列開(kāi)始,對(duì)臨時(shí)平均序列進(jìn)行迭代優(yōu)化,以最小化差異距離。

      DBA是一種迭代算法,能夠?qū)δ繕?biāo)集中的平均序列進(jìn)行調(diào)整。其中每次迭代都遵循期望最大化方案,涉及兩個(gè)階段:(1)隨機(jī)選擇一條時(shí)間序列作為初始序列,計(jì)算該序列與目標(biāo)集中每個(gè)單獨(dú)序列之間的DTW距離,從而找到初始序列上時(shí)間點(diǎn)與其他序列上時(shí)間點(diǎn)之間的關(guān)聯(lián);(2)將初始序列上的每個(gè)時(shí)間點(diǎn)與其關(guān)聯(lián)的時(shí)間點(diǎn)分為一組,并計(jì)算平均值,將其結(jié)果更新為初始序列。重復(fù)此過(guò)程,直到達(dá)到收斂或最大迭代次數(shù)為止。

      3 時(shí)間序列挖掘與聚類(lèi)

      3.1 EBA-DBA:改進(jìn)的DBA

      實(shí)驗(yàn)已經(jīng)表明DBA算法是迄今為止性能最好的方法,但DBA算法仍然存在一些缺點(diǎn):(1)異常序列對(duì)其性能影響較大;(2)所得平均序列的長(zhǎng)度取決于初始序列的長(zhǎng)度,其性能對(duì)初始化高度敏感。針對(duì)以上兩個(gè)問(wèn)題,本文提出了相應(yīng)的解決方案。

      首先是去除異常序列,在一定程度上保證時(shí)間序列的一致性,提高DBA算法的性能。為了刪除明顯的異常值,使用Grubbs’Test進(jìn)行最值檢測(cè)。Grubbs’Test是一種從樣本數(shù)據(jù)中檢測(cè)異常值的方法,通常用于檢測(cè)服從近似正態(tài)分布的單變量數(shù)據(jù)中的最值。其核心思想是將最值作為可疑值計(jì)算與均值的絕對(duì)偏差,判斷是否大于臨界值。若大于臨界值,則認(rèn)定這個(gè)可疑值為異常數(shù)據(jù);否則為正常數(shù)據(jù)。臨界值可以從Grubbs提出的表中查詢(xún)獲得。詳見(jiàn)算法1。

      算法1異常值刪除

      輸入:時(shí)間序列集合S={S1,S2,…,SK},數(shù)量K,臨界值Gn。

      輸出:去除異常值后的集合S′={S1′,S2′,…,SK′}。

      1.begin

      2.aveDTWdist←new List

      3.for S∈S do

      4. temp=averageDTW(S,S)

      5. aveDTWdist.append(temp)

      6.end for

      7.for i in range(K)do

      8. (Distmax,index)=MAX(aveDTWdist)

      9. Distmin=MIN(aveDTWdist)

      10. μ=AVERAGE(aveDTWdist)

      11.σ=STDEVP(aveDTWdist)

      12.G=(Distmax-μ)/σ←suspicious value

      13. ifG>Gn

      14. S.remove(index)

      15. else

      16. break

      17. end if

      18.end for

      19.end

      接著獲取初始序列,不同于DBA算法隨機(jī)地選擇初始序列,本文從目標(biāo)集序列中創(chuàng)建一條歐式重心的平均序列,作為DBA算法的初始序列。具體如下:

      (1)對(duì)所有目標(biāo)序列集求平均長(zhǎng)度:

      其中,K表示目標(biāo)集中序列的數(shù)量,Nk表示第k條時(shí)間序列的長(zhǎng)度。

      (2)計(jì)算目標(biāo)集中每一條時(shí)間序列與剩余序列之間的DTW距離矩陣。選取一條參考序列A0,使其與所有其他序列之間的DTW距離之和最小,即:

      其中,S={S1,S2,…,SK}為序列集合。

      (3)對(duì)目標(biāo)集中的序列進(jìn)行重采樣,對(duì)齊A0與Sj,并利用它們的DTW翹曲路徑定義縮放系數(shù):

      并依據(jù)縮放系數(shù)對(duì)序列進(jìn)行拉伸或壓縮,使得所有序列長(zhǎng)度變?yōu)榧系钠骄L(zhǎng)度。

      若A0與Sj上的時(shí)間點(diǎn)一一對(duì)應(yīng),則這兩條序列匹配,λj=0。若A0上一個(gè)時(shí)間點(diǎn)與Sj上α個(gè)時(shí)間點(diǎn)對(duì)齊,則λj=α-1,需要對(duì)Sj壓縮操作。若A0上β個(gè)時(shí)間點(diǎn)與Sj上的一個(gè)時(shí)間點(diǎn)對(duì)齊,則λj=1-β,需要對(duì)Sj拉伸操作。圖2展示了兩個(gè)序列之間的縮放系數(shù),sN j是Sj時(shí)間序列上的時(shí)間點(diǎn),N表示時(shí)間序列上時(shí)間點(diǎn)數(shù)量。對(duì)于重采樣操作,若Sj的長(zhǎng)度大于L,則在λj最大值處刪除一個(gè)時(shí)間點(diǎn),更新λj,重復(fù)操作直到Sj長(zhǎng)度等于L為止;若Sj的長(zhǎng)度小于L,則在λj最小值處,相鄰的兩個(gè)時(shí)間點(diǎn)sx j與sx+1j處插入一個(gè)時(shí)間點(diǎn)

      ;更新λj,重復(fù)操作直到Sj長(zhǎng)度等于L為止;若Sj的長(zhǎng)度等于L,則無(wú)需進(jìn)行操作。

      (4)生成一個(gè)基于歐式重心平均的序列,將重采樣序列中時(shí)間點(diǎn)的關(guān)聯(lián)集取均值。對(duì)目標(biāo)集中的序列采用歐式距離一一對(duì)齊,計(jì)算每個(gè)時(shí)間點(diǎn)的平均值作為輸入DBA算法的初始序列。將該初始序列在原始目標(biāo)集中計(jì)算平均序列。

      上述對(duì)DBA算法的改進(jìn)過(guò)程,本文命名為EBA-DBA算法,其流程圖見(jiàn)圖3。

      3.2 距離密度聚類(lèi)

      DDC是一種時(shí)間序列的確定性聚類(lèi)方法,是距離聚類(lèi)和密度距離相結(jié)合的擴(kuò)展,特別適用于時(shí)間序列數(shù)據(jù)[22]。本文采用DDC聚類(lèi)算法進(jìn)行距離密度聚類(lèi)。

      DDC是一個(gè)分裂的聚類(lèi)過(guò)程,每次迭代都會(huì)引入一個(gè)新的聚類(lèi)種子。該方法首先構(gòu)建DTW距離矩陣,選取距離其他實(shí)例最遠(yuǎn)或最近的時(shí)間序列作為初始聚類(lèi)的種子。選取最遠(yuǎn)的時(shí)間序列作為初始聚類(lèi)的種子是受到k-means++算法的啟發(fā),表明此算法從稀疏區(qū)域開(kāi)始初始化,可以提高聚類(lèi)的質(zhì)量和速度。接著利用每個(gè)時(shí)間序列到簇中心的距離,模擬時(shí)間序列數(shù)據(jù)的密度。當(dāng)各時(shí)間序列與聚類(lèi)種子之間的DTW距離進(jìn)行排序后,距離增加最大處,即為時(shí)間序列組中的稀疏區(qū)域,在此處進(jìn)行分裂。為了更好地表示時(shí)間序列聚類(lèi),采用了改進(jìn)DBA算法求出每個(gè)聚類(lèi)的平均序列,并用聚類(lèi)中與其平均序列最相似的序列來(lái)作為新的聚類(lèi)種子。在獲得新的聚類(lèi)種子后,利用每個(gè)時(shí)間序列到聚類(lèi)中心的DTW距離來(lái)重新平衡聚類(lèi)。整個(gè)過(guò)程將不斷重復(fù),直到收斂或達(dá)到用戶定義的最大迭代量為止。詳細(xì)見(jiàn)算法2。

      算法2距離密度聚類(lèi)

      輸入:時(shí)間序列集合S={S1,S2,…,Sn},聚類(lèi)種子Ck-1={c1,c2,…,ck-1},種子數(shù)量k,不相同的聚類(lèi)標(biāo)簽Lk。

      輸出:更新后的聚類(lèi)種子C′k-1={c′1,c′2,…,c′k-1},對(duì)應(yīng)時(shí)間序列的聚類(lèi)標(biāo)簽Ln={l(e)|=1,2,…,n}。

      1.begin

      2.forl∈Lk-1do

      3.Lk-1←Cluster(Ck-1)

      4.arr=[1,2,…,k-1]=DTWSort(Lk-1)←calculate

      5. DTW and sort in the cluster

      6.dist[i]←max(arr[2]-arr[1],…,arr[k-1]-arr[k-2])

      7. ifarr[n]-arr[n-1]==max(dist[i])then

      8.location[i]=n

      9. end if

      10.end for

      11.ifi==max(dist[1,2,…,k-1])then

      12.l(i1,i2)←l(i),(ci1,ci2)←ci←split new

      13. cluster seeds

      14.end if

      15.Ln={1,2,…,i1,i2,…,n}←Ck={(c1,c2,…,ci1,ci2,…,ck-1)}

      16.forS∈S do

      17. (c1′,c2′,…,ck′)←DBA(c1,c2,…,ci1,ci2,…,ck-1)

      18. UpdateClusterDBA(Ck)

      19.end for

      20.end

      4 實(shí)驗(yàn)

      本文通過(guò)改進(jìn)DBA算法,并將其應(yīng)用在眼動(dòng)模式挖掘和聚類(lèi)分析上,挖掘群體的眼動(dòng)模式和不同的閱讀策略。實(shí)驗(yàn)流程見(jiàn)圖4。

      4.1 實(shí)驗(yàn)數(shù)據(jù)集

      本文采用Netzel等人[23]提供的眼動(dòng)追蹤數(shù)據(jù)集和本地采集的眼動(dòng)追蹤數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。前者是20名參與者在公共交通地圖中查找路線時(shí)的眼動(dòng)數(shù)據(jù);后者是15名計(jì)算機(jī)專(zhuān)業(yè)研究生在學(xué)習(xí)“網(wǎng)易云課堂”平臺(tái)上“機(jī)器學(xué)習(xí)”課程中的眼動(dòng)數(shù)據(jù)。本文的目標(biāo)不是要打破刺激的數(shù)量和參與者的界限,相反,是以一組受控的刺激和任務(wù)組合為目標(biāo)進(jìn)行基準(zhǔn)測(cè)試。“公共交通地圖”數(shù)據(jù)集提供靜態(tài)視覺(jué)刺激,探索參與者在任務(wù)導(dǎo)向情況下的掃描路徑共性和差異性。在任務(wù)導(dǎo)向的靜態(tài)視覺(jué)刺激下,參與者注視點(diǎn)的起始位置相同,而掃描路徑卻不盡相同,這與個(gè)體的潛在認(rèn)知過(guò)程相關(guān)。而本地采集的數(shù)據(jù)提供的是動(dòng)態(tài)視覺(jué)刺激,在注意力集中的情況下,參與者的注視點(diǎn)會(huì)跟隨視覺(jué)刺激的變化而改變。由于動(dòng)態(tài)視覺(jué)刺激的特性,參與者的眼球運(yùn)動(dòng)是趨于一致的。因此,在這個(gè)數(shù)據(jù)集上對(duì)掃描路徑進(jìn)行聚類(lèi),能夠分離離群值,對(duì)參與者的學(xué)習(xí)狀態(tài)進(jìn)行評(píng)估。表1對(duì)上述兩個(gè)數(shù)據(jù)集的特性做了詳細(xì)對(duì)比。

      表1 兩個(gè)數(shù)據(jù)集對(duì)比Table 1 Comparison of two datasets

      4.2 眼動(dòng)模式挖掘

      4.2.1 Grubbs’Test有效性

      DBA算法是一種全局的平均策略。如果時(shí)間序列集合中存在異常值,那么將會(huì)對(duì)算法性能造成一定的負(fù)面影響。本文采用Grubbs’Test檢測(cè)時(shí)間序列集合中的最值,并刪除偏離均值程度異常的最值。在兩個(gè)數(shù)據(jù)集上,比較了使用Grubbs’Test檢測(cè)并刪除異常值前后的DBA算法性能。圖5顯示了兩個(gè)數(shù)據(jù)集上的平均DTW距離。平均DTW距離用來(lái)表示DBA平均序列與實(shí)際數(shù)據(jù)之間的形狀和差異。平均DTW距離越小,性能越好,相似度越高。通過(guò)圖5可以看出,刪除異常值后,任意選擇一條時(shí)間序列初始化,DBA算法性能都有了明顯提高。因此,證明了異常序列對(duì)DBA算法具有較大的負(fù)面影響。而本文采用Grubbs’Test去除異常序列能夠在一定程度上保證時(shí)間序列的一致性,提高DBA算法的性能。

      4.2.2 EBA-DBA算法性能

      DBA算法主要目的是從時(shí)間序列集合中隨機(jī)選取一條序列作為模板,與其他序列進(jìn)行DTW計(jì)算;對(duì)模板上逐個(gè)時(shí)間點(diǎn)匹配關(guān)聯(lián)的時(shí)間點(diǎn),并進(jìn)行加權(quán)平均計(jì)算。因此,初始序列的選取對(duì)算法的性能至關(guān)重要。本文定義了一個(gè)伸縮系數(shù),并據(jù)此對(duì)時(shí)間序列集合進(jìn)行重采樣,最后從重采樣的集合中計(jì)算歐式重心平均的序列作為DBA算法的初始序列。這種方法只需對(duì)時(shí)間序列集合進(jìn)行簡(jiǎn)單的插值或刪除操作,沒(méi)有增加太多的計(jì)算量。表2比較了DBA算法和EBA-DBA算法的性能。從表中可以看出,DBA算法對(duì)初始序列的選取高度敏感。對(duì)于最好的結(jié)果和最壞結(jié)果之間平均DTW相差1 721。而本文對(duì)DBA算法進(jìn)行改進(jìn),效果比DBA算法最好情況下的效果更優(yōu)。因此,本文提出的方法能夠在不增加計(jì)算復(fù)雜度的同時(shí),提高算法性能。本文還通過(guò)圖6比較了在兩個(gè)數(shù)據(jù)集上DBA算法和EBA-DBA算法的收斂精度和速度。EBA-DBA算法不論是收斂精度,還是速度上,都高于DBA算法。

      表2 EBA-DBA和DBA性能對(duì)比Table 2 Performance comparison of EBA-DBA and DBA

      4.2.3 不同眼動(dòng)模式挖掘方法對(duì)比

      眼動(dòng)模式可以作為掃描路徑預(yù)測(cè)和分類(lèi)的研究基礎(chǔ),為有關(guān)心理學(xué)研究提供群體行為的有用知識(shí)。在之前的研究中,把最長(zhǎng)公共子序列(eMINE)[10]、掃描路徑趨勢(shì)(STA)[9]或相似度最高的實(shí)際掃描路徑(NW)[11]作為群體的眼動(dòng)模式。將本文方法(EBA-DBA)與這些方法進(jìn)行實(shí)驗(yàn)對(duì)比,如圖7所示。

      由圖7可以看出,DBA算法性能明顯優(yōu)于eMINE、STA和NW算法。DBA算法的初始序列是隨機(jī)選擇的,以迭代的方式達(dá)到最優(yōu)。而EBA-DBA算法的平均DTW距離低于DBA算法,性能更好。這是因?yàn)榕cDBA算法相比,EBA-DBA算法剔除了離群值,有效地對(duì)原始序列進(jìn)行平均,在保留掃描路徑內(nèi)部可變性的同時(shí)提供更加平滑的對(duì)齊方式。

      本文還采用Needleman-Wunsch算法[24]計(jì)算群體的實(shí)際掃描路徑與眼動(dòng)模式間的相似度得分,并進(jìn)行歸一化,即計(jì)算:

      其中,scoreNW是Needleman-Wunsch算法計(jì)算的相似度得分,lenmax是成對(duì)掃描路徑中較長(zhǎng)掃描路徑的長(zhǎng)度。Needleman-Wunsch算法被認(rèn)為是一個(gè)有意義的度量,在生物信息學(xué)中通常通過(guò)此算法找到DNA序列的同源信息。從表3中可以看出,本文方法提取的眼動(dòng)模式與實(shí)際掃描路徑之間差異最小,更能代表整個(gè)群體的眼動(dòng)行為。

      表3 平均NW得分Table 3 Average NW score

      4.3 聚類(lèi)分析

      眼動(dòng)模式的聚類(lèi)可以分析人們不同的閱讀行為,并能夠客觀地評(píng)估其潛在的認(rèn)知過(guò)程。本文比較了DDC、k-means和Hierarchical三種算法的性能。采用EBA-DBA算法計(jì)算聚類(lèi)的平均序列來(lái)確定聚類(lèi)的質(zhì)心。由于DDC算法在“公共交通地圖”數(shù)據(jù)集上聚類(lèi)個(gè)數(shù)為6的時(shí)候達(dá)到收斂,不再分裂新的聚類(lèi),因此對(duì)聚類(lèi)個(gè)數(shù)為6和7時(shí)的各種方法性能進(jìn)行對(duì)比,使用DBI(Davies-Bouldin index)來(lái)評(píng)估聚類(lèi)性能,DBI值越低,集群的分離和集群內(nèi)部的“緊密性”越好。從表4中可以看出,當(dāng)聚類(lèi)個(gè)數(shù)為6時(shí),三種聚類(lèi)算法都達(dá)到收斂,DBI值最低,證明了DDC算法的收斂是可行的。而DDC聚類(lèi)算法比k-means和Hierarchical性能更好,DBI值達(dá)到最低值1.441。

      表4 不同算法的DBI值Table 4 DBI values of different algorithms

      在本地采集的數(shù)據(jù)集中,DDC與k-means算法性能較為接近,高于Hierarchical。但是,k-means是隨機(jī)選擇初始聚類(lèi)種子,聚類(lèi)的質(zhì)量會(huì)發(fā)生波動(dòng)。相比之下,DDC是一種確定性的聚類(lèi)算法,結(jié)果是可重現(xiàn)的。同時(shí)DDC算法從密度稀疏開(kāi)始初始化,能夠提高聚類(lèi)質(zhì)量和速度。因此本文選取DDC聚類(lèi)算法,能高效分離異常掃描路徑聚類(lèi),達(dá)到更好的效果。

      5 討論與應(yīng)用

      根據(jù)聚類(lèi)結(jié)果能簡(jiǎn)單地對(duì)學(xué)習(xí)者的學(xué)習(xí)狀態(tài)進(jìn)行評(píng)估。對(duì)于包含動(dòng)態(tài)視覺(jué)刺激的數(shù)據(jù)集,不僅能夠挖掘不同的閱讀策略,更能為評(píng)估學(xué)習(xí)者學(xué)習(xí)狀態(tài)提供參考。在動(dòng)態(tài)視覺(jué)刺激下,學(xué)習(xí)者的掃描路徑是趨于一致的,表明學(xué)習(xí)者注意力集中,注視跟隨課程內(nèi)容改變而變化。本文通過(guò)聚類(lèi)的方法分離離群值,識(shí)別多類(lèi)不同的眼動(dòng)模式。將聚類(lèi)個(gè)數(shù)作為判斷依據(jù):當(dāng)聚類(lèi)個(gè)數(shù)為1~2時(shí),學(xué)生的學(xué)習(xí)狀態(tài)為專(zhuān)注;當(dāng)聚類(lèi)數(shù)為3~4時(shí),則表示走神,部分人注意力不集中;當(dāng)聚類(lèi)數(shù)大于或等于5時(shí),則表示信息迷航,注意力極度分散,無(wú)法找到課程重點(diǎn)。表4所示,在本文采集的數(shù)據(jù)集中,聚類(lèi)個(gè)數(shù)為2時(shí)達(dá)到收斂,DBI值為0.141,達(dá)到最小。因此,評(píng)估該群體的學(xué)習(xí)狀態(tài)為專(zhuān)注。

      6 結(jié)束語(yǔ)

      本文針對(duì)掃描路徑進(jìn)行分析,探索學(xué)習(xí)者眼動(dòng)行為的共性和差異性。研究了在同一任務(wù)情況下學(xué)習(xí)者掃描路徑的時(shí)間序列表示和聚類(lèi)。對(duì)DBA算法進(jìn)行改進(jìn)以獲取群體眼動(dòng)模式,并結(jié)合DDC算法對(duì)掃描路徑進(jìn)行聚類(lèi)。應(yīng)用在智能教育領(lǐng)域,評(píng)估學(xué)習(xí)者的學(xué)習(xí)狀態(tài)。實(shí)驗(yàn)結(jié)果表明,基于時(shí)間序列的眼動(dòng)模式挖掘能夠提取群體觀看模式,并根據(jù)聚類(lèi)評(píng)估學(xué)習(xí)狀態(tài)。

      猜你喜歡
      注視點(diǎn)眼動(dòng)聚類(lèi)
      眼動(dòng)儀技術(shù)在里院建筑特色分析中的應(yīng)用
      基于眼動(dòng)的駕駛員危險(xiǎn)認(rèn)知
      基于ssVEP與眼動(dòng)追蹤的混合型并行腦機(jī)接口研究
      載人航天(2021年5期)2021-11-20 06:04:32
      基于超復(fù)數(shù)小波和圖像空域的卷積網(wǎng)絡(luò)融合注視點(diǎn)預(yù)測(cè)算法
      基于DBSACN聚類(lèi)算法的XML文檔聚類(lèi)
      射擊運(yùn)動(dòng)員的反向眼跳研究
      基于中央凹圖像顯著性和掃視傾向的注視點(diǎn)轉(zhuǎn)移預(yù)測(cè)模型
      國(guó)外翻譯過(guò)程實(shí)證研究中的眼動(dòng)跟蹤方法述評(píng)
      基于改進(jìn)的遺傳算法的模糊聚類(lèi)算法
      一種層次初始的聚類(lèi)個(gè)數(shù)自適應(yīng)的聚類(lèi)方法研究
      榆树市| 台安县| 克拉玛依市| 财经| 敖汉旗| 托克托县| 黑山县| 临邑县| 苍溪县| 楚雄市| 谢通门县| 班戈县| 苍溪县| 金平| 平安县| 从江县| 桂东县| 泗洪县| 苏尼特右旗| 花莲县| 沾益县| 隆安县| 涟水县| 五峰| 梓潼县| 洪泽县| 定兴县| 巴塘县| 安图县| 金沙县| 光泽县| 谢通门县| 从江县| 三门峡市| 慈溪市| 都匀市| 台前县| 平凉市| 锦州市| 酉阳| 江山市|