陳伯倫
(淮陰工學(xué)院,江蘇 淮安 223003)
高校是培養(yǎng)人才的搖籃,如何提升學(xué)生的個性化發(fā)展相當(dāng)重要。但是目前學(xué)生從高中畢業(yè)進(jìn)入大學(xué)后,難免會出現(xiàn)一些彷徨以及對新事物的不適應(yīng),因此如何在大學(xué)生活初期能夠讓學(xué)生有一種良好的歸屬感,融入新的團(tuán)體中值得教師去研究,另外興趣小組的構(gòu)建對學(xué)生未來創(chuàng)新創(chuàng)業(yè)也提供了強(qiáng)硬的基礎(chǔ)支撐[1,2]。
信息推薦技術(shù)能夠根據(jù)學(xué)生的不同興趣,提供差異化、個性化和精準(zhǔn)化的學(xué)習(xí)服務(wù)。本文將復(fù)雜網(wǎng)絡(luò)中的信息推薦技術(shù)運用在學(xué)生的興趣小組學(xué)習(xí)中,將學(xué)生在校園生活中的各項數(shù)據(jù)構(gòu)建成多關(guān)系網(wǎng)絡(luò),以此推動高校計算機(jī)教學(xué)的課程改革。
在社交網(wǎng)絡(luò)的傳播機(jī)制中,如何合理的利用不同的信息顯得十分重要。而推薦系統(tǒng)作為社交網(wǎng)絡(luò)中的研究熱點之一,引起了大眾的廣泛關(guān)注[3-7]。目前,對于推薦系統(tǒng)的研究大多都是基于節(jié)點之間是單層鏈接的網(wǎng)絡(luò),而在真實的網(wǎng)絡(luò)環(huán)境中,不同的社交網(wǎng)絡(luò)都展現(xiàn)出了自己獨特的性質(zhì)。例如,在高校學(xué)生數(shù)據(jù)網(wǎng)絡(luò)中,學(xué)生之間可能存在共同愛好、合作等多種關(guān)系[8],另外存在著學(xué)生食堂消費記錄、圖書館書籍借閱等多層信息。將這些由多種關(guān)系類型的鏈接構(gòu)成的單個網(wǎng)絡(luò)稱為層網(wǎng)絡(luò)或者多關(guān)系網(wǎng)絡(luò)[9],網(wǎng)絡(luò)中各種關(guān)系類型之間相輔相成。
一些研究人員還提出了一些基于關(guān)聯(lián)挖掘的相關(guān)算法,他們假設(shè)節(jié)點層與層之間的相互影響關(guān)系是固定不變的并對稱的,然而在大學(xué)生校內(nèi)生活中,假設(shè)的這些條件并不合理。例如,某同學(xué)平時經(jīng)常借計算機(jī)專業(yè)課的書,是否就能確定該同學(xué)對計算機(jī)專業(yè)課的課程一直就比較感興趣呢,筆者認(rèn)為該同學(xué)的興趣可能會隨著時間逐漸地變化。雖然目前部分研究人員在推薦系統(tǒng)中考慮了時序信息,但他們都忽略了不同節(jié)點對信息傳播受益者的重要性具有差異,節(jié)點的可信度以及如何對節(jié)點之間的信任度進(jìn)行度量。另外如何利用節(jié)點之間的聯(lián)系,從而更準(zhǔn)確地識別節(jié)點的個人興趣,來進(jìn)行推薦模型的設(shè)計顯得至關(guān)重要。
隨著高校中各種社會媒介的發(fā)展,學(xué)生在網(wǎng)絡(luò)上留存了各式各樣的數(shù)據(jù)痕跡,根據(jù)獲取的相關(guān)的數(shù)據(jù)進(jìn)行行為、興趣等預(yù)測推薦的形式也越來越多。社交網(wǎng)絡(luò)中預(yù)測推薦問題近年來已經(jīng)有了很多的研究成果,并且在眾多預(yù)測推薦方法中,協(xié)同過濾是應(yīng)用最多的算法。有效利用學(xué)生或者消費產(chǎn)品之間的聯(lián)系可以豐富學(xué)生的信息,從而更準(zhǔn)確地識別學(xué)生的個人興趣。因此,將針對多關(guān)系網(wǎng)絡(luò)進(jìn)行預(yù)測模型的設(shè)計,用于對學(xué)生選擇興趣小組的過程中起到輔助作用。
在學(xué)生興趣小組模型構(gòu)建過程中,首先需要設(shè)計多關(guān)系網(wǎng)絡(luò)按照時序信息相融合的方案。假設(shè)學(xué)生在校購物、圖書館節(jié)點等環(huán)節(jié)中學(xué)生之間存在著m 種關(guān)系,在第t 天學(xué)生之間的關(guān)系矩陣分別為At1,...,Atm,學(xué)生之間第r 種關(guān)系在各個時間段里面的關(guān)系矩陣依次為:A1r,...,Atr。
學(xué)生之間的相關(guān)性隨著時間的推移有變化的趨勢,針對各個時間段內(nèi)學(xué)生之間不同類別的關(guān)系矩陣,不應(yīng)該同等地看待。因此,通常有兩種方法來衡量時間因素對網(wǎng)絡(luò)鏈接的影響。一種是通過定義一個時間衰減系數(shù)ρ∈(0,1),使得關(guān)系矩陣中的每一個元素都被賦予一個系數(shù),在T 時刻,第r 種關(guān)系矩陣Atr中元素的需要乘以一個系數(shù)ρT-t。從中可以看出,隨著時間的增長,時間越久遠(yuǎn)的學(xué)生之間的鏈接所起的作用越小,最近時間段內(nèi)形成的鏈接對節(jié)點有較高的影響。那么到T 時刻,第r 種關(guān)系的矩陣為:ATr=ATr+ρArT-1+…+ρT-1A1r。另外一種方法是通過設(shè)置滑動窗口來控制不同時間段內(nèi)節(jié)點之間的關(guān)系的。我們假設(shè)滑動窗口的大小為L,設(shè)當(dāng)前時間為T,那么在鏈接動態(tài)變化的過程中我們只需要考慮數(shù)據(jù)流中最新的L 個鏈接矩陣,即只需要考慮集合{ArT-L+1,…,ATr}。通過滑動窗口計算鏈接矩陣時,擬通過挖掘流數(shù)據(jù)中的頻繁模式,得到反映此類關(guān)系隨著時間變化的矩陣。因此,需要設(shè)置一個閾值ε∈(0,1)和正整數(shù)k∈(1,L),找出{ArT-L+1,…,ATr}中所有支持度大于ε·L 的K 階頻繁子矩陣。設(shè)該K 階頻繁子矩陣的集合為STr,其中對應(yīng)著矩陣的橫縱坐標(biāo)集合分別為X(A)和Y(A)。因此,可以得出。通過上述兩種方法,都可以獲得不同類型鏈接下的關(guān)系矩陣ATr。
接下來,需要對m 種不同類型的鏈接關(guān)系建立統(tǒng)一的模型,進(jìn)行如圖1 所示的工作。
圖1 多關(guān)系網(wǎng)絡(luò)建模示例圖
在多關(guān)系網(wǎng)絡(luò)中,對學(xué)生之間的關(guān)系進(jìn)行融合時,需要考慮各類關(guān)系層對其不同的影響力。對學(xué)生有較大影響的關(guān)系層,擬增加這類鏈接的權(quán)重。反之,對學(xué)生有較小影響的關(guān)系層,擬減小這類鏈接的權(quán)重。需要計算出學(xué)生u 和第r 類關(guān)系層的相關(guān)度。設(shè)Гr(u)為學(xué)生u 在第r 類關(guān)系層中的鄰居節(jié)點集合,dkr(u)為學(xué)生u 在第r 類關(guān)系層中k 介鄰居節(jié)點的個數(shù),其中k 可取1、2 等。記cr(u,v)為頂點u 和v 在第r 類關(guān)系層中的相關(guān)性,可以使用學(xué)生對在不同類型中鏈接的條數(shù)或者其余拓?fù)鋵傩赃M(jìn)行度量,c(u,v)為頂點u 和v 在所有關(guān)系層中的相關(guān)性值的和,即:c(u,v)=因此擬定義Rr(u)為節(jié)點u 與第r 類關(guān)系層的相關(guān)度,公式如下所示:
同樣,可以得出頂點v 與第r 類關(guān)系層的相關(guān)度Rr(v)。在對學(xué)生(u,v)進(jìn)行鏈接融合時,他們在第r 類關(guān)系層上的權(quán)重計算公式如下所示:
通過公式可以看出,Rr(u)+Rr(v)的值越大,那么第r 類關(guān)系層對節(jié)點對(u,v)賦予較大的權(quán)重。因此,可以得到所有學(xué)生之間的相關(guān)性,公式如下所示:
因此最后可以根據(jù)A(u,v)來構(gòu)建學(xué)生之間的相似度矩陣,得出哪些學(xué)生之前存在著相同的興趣,并對興趣小組的選擇具有指導(dǎo)性作用。
本文構(gòu)建的學(xué)生興趣小組預(yù)測系統(tǒng)示意圖如圖2所示。
圖2 學(xué)生興趣小組預(yù)測示例圖
高校學(xué)生興趣小組的構(gòu)建在提高學(xué)生社團(tuán)建設(shè)水平和學(xué)生培養(yǎng)過程中有指導(dǎo)性作用,本文將復(fù)雜網(wǎng)絡(luò)中的信息推薦技術(shù)運用在學(xué)生的興趣小組推薦中,將學(xué)生在校園生活中的各項數(shù)據(jù)構(gòu)建成多關(guān)系網(wǎng)絡(luò),考慮學(xué)生圖書借閱、飲食習(xí)慣數(shù)據(jù)等多層次關(guān)系構(gòu)成全新的多關(guān)系網(wǎng)絡(luò)的預(yù)測模型,該預(yù)測模型能夠促進(jìn)高校開展的科技活動更具特色和凝聚力。