金濤 丁國棟 焦清局
摘? ?要:隨著線上學(xué)習(xí)者數(shù)量的增多,網(wǎng)絡(luò)學(xué)習(xí)社區(qū)成為眾多學(xué)習(xí)者尋求幫助、共享資源的重要學(xué)習(xí)平臺。雖然向社區(qū)中的學(xué)習(xí)者推薦學(xué)習(xí)伙伴一定程度上能夠解決學(xué)習(xí)者學(xué)習(xí)需求,但存在一定的缺陷。文章嘗試性地提出了學(xué)習(xí)群體推薦新思路,并給出了一種可供參考的簡便方法。以百度貼吧為例,利用網(wǎng)絡(luò)爬蟲和社會網(wǎng)絡(luò)分析軟件gephi對貼吧中的會員進(jìn)行了興趣聚類,發(fā)現(xiàn)了該貼吧中存在的興趣群體,并得到了各群體的興趣特點(diǎn),證明此方法的可行性。
關(guān)鍵詞:百度貼吧;聚類;學(xué)習(xí)群體;學(xué)習(xí)社區(qū);gephi
中圖分類號:G434 文獻(xiàn)標(biāo)志碼:A 文章編號:1673-8454(2019)07-0057-06
有關(guān)統(tǒng)計(jì)表明,截至2018年6月,我國網(wǎng)民規(guī)模已超8億,在線教育用戶規(guī)模達(dá)到1.72億,較2017年末增加1668萬人,增長率為10.7%。[1]隨著網(wǎng)民規(guī)模和在線教育用戶的擴(kuò)大,越來越多的人將會選擇在線學(xué)習(xí),而大多數(shù)情況下在線學(xué)習(xí)是處于一種師生準(zhǔn)分離狀態(tài),學(xué)習(xí)者很難獨(dú)立完成學(xué)習(xí)任務(wù),網(wǎng)絡(luò)學(xué)習(xí)社區(qū)無疑成為大多數(shù)人的選擇。網(wǎng)絡(luò)學(xué)習(xí)社區(qū)為大家網(wǎng)上學(xué)習(xí)討論、尋求幫助、分享學(xué)習(xí)心得、共享學(xué)習(xí)資源提供了一個(gè)非常重要的學(xué)習(xí)平臺。當(dāng)網(wǎng)絡(luò)社區(qū)學(xué)習(xí)者規(guī)模較小時(shí),學(xué)習(xí)者很容易結(jié)識社區(qū)中興趣類似的學(xué)習(xí)伙伴,解決自己在學(xué)習(xí)過程中遇到的一些問題,來滿足自己的學(xué)習(xí)需求。然而,當(dāng)社區(qū)學(xué)習(xí)者規(guī)模較大時(shí),尋找社區(qū)中興趣相似的學(xué)習(xí)伙伴問題逐漸凸顯。這時(shí),如何幫助學(xué)習(xí)者發(fā)現(xiàn)興趣相似的學(xué)習(xí)伙伴成為在線學(xué)習(xí)研究熱點(diǎn)。學(xué)習(xí)伙伴推薦的研究一定程度上改善了這一問題,但是難免會有缺陷:推薦的學(xué)習(xí)伙伴能否解決學(xué)習(xí)者的困惑,推薦多少學(xué)習(xí)伙伴才能滿足學(xué)習(xí)者的需求,學(xué)習(xí)者能否相對容易地找到自己所需要的學(xué)習(xí)伙伴。針對這些問題,文章提出了學(xué)習(xí)社團(tuán)推薦方法,即將學(xué)習(xí)社區(qū)成員進(jìn)行興趣聚類,向?qū)W習(xí)者推薦與自己興趣類似的學(xué)習(xí)社團(tuán),進(jìn)而更好地滿足學(xué)習(xí)者的在線學(xué)習(xí)需求。因此如何對網(wǎng)絡(luò)社區(qū)中的學(xué)習(xí)者進(jìn)行學(xué)習(xí)社團(tuán)劃分,逐漸成為一項(xiàng)備受關(guān)注的研究問題。而已有的學(xué)習(xí)社團(tuán)劃分大多過于復(fù)雜,操作煩瑣,可借鑒性較差,針對這一問題,文章以百度貼吧某個(gè)主題吧為例,給出了一種相對簡單易操作的學(xué)習(xí)社團(tuán)劃分方法,嘗試為學(xué)習(xí)社團(tuán)劃分研究提供一種參考思路。
百度貼吧作為最大的中文學(xué)習(xí)社區(qū),就在線學(xué)習(xí)而言,有著獨(dú)特的優(yōu)勢。文章從某個(gè)主題貼吧的關(guān)注會員入手,將他們關(guān)注的貼吧作為其興趣的代表進(jìn)行統(tǒng)計(jì),如果兩個(gè)會員關(guān)注的貼吧相似度很高,那么他們的興趣愛好在很大程度上也是相似的,可以據(jù)此將貼吧會員進(jìn)行興趣聚類,得到貼吧會員的社團(tuán)狀況以及各自社團(tuán)的興趣特點(diǎn)。對貼吧會員進(jìn)行興趣聚類,一方面方便新成員選擇自己喜歡的學(xué)習(xí)社團(tuán),也可以進(jìn)行學(xué)習(xí)社團(tuán)推薦,另一方面也有助于原有學(xué)習(xí)者之間的交流討論,提高在線學(xué)習(xí)的積極性;同時(shí)有助于社區(qū)管理員更有針對性地進(jìn)行學(xué)習(xí)評價(jià),組織學(xué)習(xí)活動,進(jìn)行學(xué)習(xí)管理,根據(jù)不同群體成員的實(shí)際情況提供個(gè)性化的群體學(xué)習(xí)指導(dǎo)。
對國內(nèi)學(xué)習(xí)者群體的研究進(jìn)行文獻(xiàn)檢索時(shí),發(fā)現(xiàn)已有的學(xué)習(xí)者群體研究主要集中在三個(gè)方面:
第一,對學(xué)習(xí)者群體進(jìn)行行為分析與建模,比較群體之間的差異,分析學(xué)習(xí)者群體動機(jī)。如江波等利用某國外虛擬仿真實(shí)驗(yàn)課程學(xué)習(xí)過程數(shù)據(jù)集,采用層次聚類方法,對學(xué)習(xí)者的行為模式進(jìn)行了劃分,并分析了不同模式群體在學(xué)習(xí)行為上的差異以及學(xué)習(xí)行為模式與學(xué)習(xí)效果的關(guān)系,根據(jù)學(xué)習(xí)行為,劃分了“順其自然學(xué)習(xí)群體”、“積極學(xué)習(xí)群體”以及“消極學(xué)習(xí)群體”三類學(xué)習(xí)行為模式群體;[2]王曉玉以網(wǎng)絡(luò)學(xué)習(xí)的主要人群——在校大學(xué)生為研究對象,從時(shí)間任務(wù)管理策略、反思總結(jié)策略、合作交流策略三方面對青海省某所大學(xué)的在校生進(jìn)行了問卷調(diào)查,通過收集性別、學(xué)科、民族等數(shù)據(jù)分析了大學(xué)生群體網(wǎng)絡(luò)學(xué)習(xí)策略差異的影響因素;[3]李運(yùn)福等以Felder-Silverman學(xué)習(xí)風(fēng)格為依據(jù),對參與某門課程的學(xué)習(xí)群體進(jìn)行問卷調(diào)查,收集學(xué)習(xí)群體學(xué)習(xí)風(fēng)格數(shù)據(jù),然后利用SPSS對學(xué)習(xí)風(fēng)格數(shù)據(jù)進(jìn)行K均值聚類,通過單因素方差分析法對具有不同學(xué)習(xí)風(fēng)格的學(xué)習(xí)群體的動力性特征進(jìn)行了差異分析,最后通過歸納總結(jié)得到不同學(xué)習(xí)群體網(wǎng)絡(luò)學(xué)習(xí)動力性的特征。[4]
第二,對學(xué)校教育與網(wǎng)絡(luò)學(xué)習(xí)現(xiàn)狀展開調(diào)查,提出新的學(xué)習(xí)理論。牟智佳等以edX上的一門MOOC課程學(xué)習(xí)行為數(shù)據(jù)為分析對象,對學(xué)習(xí)者行為指標(biāo)進(jìn)行聚類分析,基于K均值算法將學(xué)習(xí)者群體分成了三種類型,即以視頻學(xué)習(xí)和評價(jià)為主、以視頻學(xué)習(xí)和文本學(xué)習(xí)為主、以文本學(xué)習(xí)和學(xué)習(xí)評價(jià)為主的學(xué)習(xí)群體。[5]鄭星通過對蘇州市鋼琴學(xué)習(xí)者群體進(jìn)行系統(tǒng)的問卷調(diào)查,對教學(xué)模式、教材選用、教學(xué)評價(jià)、學(xué)生對比賽和考試的參與度予以肯定,指出了學(xué)生專業(yè)參差不齊、練琴時(shí)間安排不合理、鋼琴伴奏能力弱等若干問題,最后提出改善鋼琴學(xué)習(xí)群體教育對策;[6]阮高峰等在介紹同儕互助的概念及應(yīng)用現(xiàn)狀的基礎(chǔ)上提出同儕輔助學(xué)習(xí)的思想,基于該思想,在校園網(wǎng)的支持下構(gòu)建了一個(gè)利用網(wǎng)絡(luò)互助群體促進(jìn)課堂教學(xué)的案例。[7]
第三,分析學(xué)習(xí)者群體關(guān)系,發(fā)現(xiàn)或者挖掘?qū)W習(xí)者群體,這方面的研究內(nèi)容比較多,例如算法設(shè)計(jì)、模型設(shè)計(jì)、技術(shù)創(chuàng)新等。如潘理等通過總結(jié)社交網(wǎng)絡(luò)群體研究進(jìn)展,介紹群體發(fā)現(xiàn)時(shí)出現(xiàn)的問題,闡述了基于個(gè)體和綜合屬性與結(jié)構(gòu)特征的群體發(fā)現(xiàn)方法,從特征選取和檢測算法兩個(gè)方面介紹了自己全新的群體發(fā)現(xiàn)方法。[8]曾珂提出了基于數(shù)據(jù)挖掘的微博用戶興趣群體發(fā)現(xiàn)方法與進(jìn)行聚類分析的數(shù)據(jù)標(biāo)準(zhǔn)化方法,該方法通過收集新浪微博用戶關(guān)注的數(shù)據(jù)來確定用戶的興趣愛好,再使用數(shù)據(jù)挖掘工具發(fā)現(xiàn)用戶興趣之間的關(guān)系,試圖建立起一種能夠反映用戶多重興趣,從而發(fā)現(xiàn)用戶興趣群體的方法。[9]
從上述文獻(xiàn)綜述中尚未發(fā)現(xiàn)相對簡單、易實(shí)施、可借鑒性高的群體發(fā)現(xiàn)方案,為此文章嘗試提出了使用網(wǎng)絡(luò)爬蟲和社會網(wǎng)絡(luò)分析軟件gephi相結(jié)合的方法,以百度貼吧為例進(jìn)行了實(shí)驗(yàn)。結(jié)果表明,當(dāng)學(xué)習(xí)者群體規(guī)模較大時(shí),采用該方法能夠發(fā)現(xiàn)較多興趣類似的學(xué)習(xí)者群體,并得到各自群體的主要興趣特點(diǎn),發(fā)現(xiàn)效果較好,可以向有類似興趣的學(xué)習(xí)者進(jìn)行推薦。
1.研究框架
通常社團(tuán)也可以被稱為群、聚類或模塊,是網(wǎng)絡(luò)中一群節(jié)點(diǎn)或邊的集合,社團(tuán)內(nèi)部連接較為緊密,而社團(tuán)間的連接卻相對稀疏。[10]文章提到的群體和社團(tuán)同義,學(xué)習(xí)者群體指的是具有共同愛好所聯(lián)系起來的貼吧會員的集合。度是用來描述和衡量一個(gè)節(jié)點(diǎn)結(jié)構(gòu)性質(zhì)的最基本的概念,無項(xiàng)圖中一個(gè)節(jié)點(diǎn)的度定義為這個(gè)節(jié)點(diǎn)所擁有的邊數(shù)目。通常意義上,節(jié)點(diǎn)的度值越大,則節(jié)點(diǎn)在網(wǎng)絡(luò)中的地位越重要。反之,度值越小的點(diǎn),對于整個(gè)網(wǎng)絡(luò)的作用和影響越小。[11]文章中所說的節(jié)點(diǎn)表示的是貼吧會員ID,邊表示會員之間的關(guān)系,度則指的是節(jié)點(diǎn)之間的邊數(shù)。
本次研究首先采用網(wǎng)絡(luò)爬蟲來獲取所需要的數(shù)據(jù),經(jīng)過Excel軟件和python算法處理后,再使用gephi對貼吧群體進(jìn)行興趣聚類。貼吧的學(xué)習(xí)者群體挖掘研究將重點(diǎn)關(guān)注兩個(gè)方面的問題:第一,能否成功將貼吧會員進(jìn)行興趣聚類?若能,效果如何?第二,貼吧會員可以分為哪幾種類型?每類群體興趣特征是什么?對這兩方面問題的回答,有望提供一種學(xué)習(xí)者群體聚類研究的新思路。
2.研究對象
研究對象選取的是百度貼吧的“python吧”,該主題吧擁有規(guī)模較大的會員數(shù)量,且各會員所關(guān)注的興趣貼吧數(shù)量與一般主題吧相比明顯較多,如圖1所示,會員關(guān)注的興趣貼吧達(dá)到20個(gè)的最多,有3760人,大部分會員關(guān)注的貼吧集中在16 至20個(gè)之間,占全部會員數(shù)量的60.85%,關(guān)注貼吧在10個(gè)以上的會員達(dá)到6925人,占比73.16%。由此可以看出,絕大部分會員的興趣愛好較為廣泛。實(shí)際上,由于百度貼吧中僅顯示每個(gè)成員關(guān)注的前20個(gè)興趣貼吧,所以,有理由相信,學(xué)習(xí)者實(shí)際關(guān)注的貼吧數(shù)量更多。因此,選取“python吧”作為研究對象較符合一般學(xué)習(xí)者興趣愛好廣泛的特點(diǎn),也便于對學(xué)習(xí)者群體進(jìn)行興趣聚類。
3.數(shù)據(jù)的收集與處理
首先通過網(wǎng)絡(luò)爬蟲獲取“python吧”會員所喜愛的貼吧,接下來利用Excel軟件對數(shù)據(jù)進(jìn)行預(yù)處理,通過預(yù)先編寫的算法實(shí)現(xiàn)數(shù)據(jù)存儲格式的轉(zhuǎn)換,從而得到gephi所需要的csv類型數(shù)據(jù)。
(1)數(shù)據(jù)獲取
在“python吧”中找到會員的主頁面,點(diǎn)擊右側(cè)的“他在百度”就會轉(zhuǎn)到“他在貼吧”一欄,該欄會顯示貼吧會員的相關(guān)信息。以“python吧”為例,隨機(jī)選取一位會員,他的頁面信息如圖2所示,他所喜愛的貼吧便是本次研究需要獲取的數(shù)據(jù)。
在通過網(wǎng)絡(luò)爬蟲獲取貼吧中的數(shù)據(jù)時(shí),有可能出現(xiàn)“網(wǎng)絡(luò)中斷”或者“服務(wù)器拒絕訪問”等現(xiàn)象,重新獲取數(shù)據(jù)就很有可能出現(xiàn)數(shù)據(jù)重復(fù)或者數(shù)據(jù)遺漏等問題,針對這一問題本次對網(wǎng)絡(luò)爬蟲進(jìn)行了分類設(shè)計(jì),由于貼吧會員“他在貼吧”頁面的鏈接是固定的,可以先把會員信息頁面鏈接一次性獲取,然后再按照所獲取的頁面鏈接獲得會員所喜愛的貼吧數(shù)據(jù)。具體實(shí)現(xiàn)過程如圖3所示,通過爬蟲“NetSpider1”獲取所有會員所在頁面的鏈接,對鏈接進(jìn)行保存和編號,接下來,通過爬蟲“NetSpider2”獲得對應(yīng)的貼吧頁面數(shù)據(jù),并將其保存。由于爬蟲“NetSpider2”獲取網(wǎng)頁數(shù)據(jù)時(shí)間可能較長,一旦出現(xiàn)“網(wǎng)絡(luò)中斷”等問題,這時(shí)僅需找到對應(yīng)的鏈接編號,從該鏈接開始重新啟動爬蟲即可。
圖3中考慮到時(shí)間和網(wǎng)絡(luò)原因,在獲取數(shù)據(jù)的過程中沒有直接解析出所需要貼吧數(shù)據(jù),而是選擇先保存到本地,然后再進(jìn)行數(shù)據(jù)處理,這樣可以避免再次發(fā)生網(wǎng)絡(luò)中斷或者服務(wù)器拒絕連接情況,效率也將大大提升。獲取到的數(shù)據(jù)導(dǎo)入Excel后如圖4所示,以行為單位,每行第一個(gè)單元格是會員的昵稱,其余為該會員所喜愛的貼吧。
(2)數(shù)據(jù)預(yù)處理
首先需要通過人工的方式將圖4表格中程序自動注冊的會員進(jìn)行剔除,之后將每位會員都關(guān)注的“python吧”予以剔除,因?yàn)檫@部分?jǐn)?shù)據(jù)雖然存在,但實(shí)際上是并不需要的,最終共有9465位有效的會員貼吧數(shù)據(jù)作為研究對象。最后通過python程序?qū)D5右側(cè)的數(shù)據(jù)轉(zhuǎn)換成左側(cè)的網(wǎng)絡(luò)存儲文本文件。其中Source表示原節(jié)點(diǎn),即貼吧會員編號,Target表示目標(biāo)節(jié)點(diǎn),即目標(biāo)會員ID,Weight表示權(quán)重,即兩個(gè)會員之間所關(guān)注相同貼吧的數(shù)量。由于每位會員都對應(yīng)著唯一的編號,通過該文本數(shù)據(jù)很容易發(fā)現(xiàn)會員彼此之間的關(guān)系。
由于gephi支持以邊表格的形式導(dǎo)入邊數(shù)據(jù),將圖5右側(cè)的數(shù)據(jù)導(dǎo)入Excel后再添加三列id、label、type,分別表示邊的ID、邊的label和圖的類型,最后將數(shù)據(jù)另存為csv格式文件即可。
1.整體網(wǎng)絡(luò)分析
將csv文件導(dǎo)入gephi0.9中后選擇“Openrd”布局算法,運(yùn)行相關(guān)命令后便得到表1所示的整體網(wǎng)絡(luò)屬性。該網(wǎng)絡(luò)擁有7119個(gè)節(jié)點(diǎn)、291463條邊,就學(xué)習(xí)社區(qū)網(wǎng)絡(luò)而言,該網(wǎng)絡(luò)規(guī)模相對較大。在網(wǎng)絡(luò)中模塊化數(shù)值越大分組越顯著,群組發(fā)現(xiàn)效果越好,群組結(jié)構(gòu)越清晰。平均路徑長度值越小,圖中節(jié)點(diǎn)之間的聯(lián)系越緊密。從表1中可以發(fā)現(xiàn),python吧的模塊化數(shù)值和模塊化數(shù)量較高,說明python吧群組發(fā)現(xiàn)效果較好,群組結(jié)構(gòu)較為清晰。python吧的網(wǎng)絡(luò)直徑為9,表明該社區(qū)中任意兩個(gè)成員之間最多需要9步便可以相互聯(lián)系,即兩個(gè)成員之間最大距離是9,網(wǎng)絡(luò)平均距離為2.964,說明該社區(qū)中任意兩個(gè)成員之間只需要通過3個(gè)成員便可以相互認(rèn)識,該網(wǎng)絡(luò)具有小世界特性。雖然該網(wǎng)絡(luò)規(guī)模較大,但網(wǎng)絡(luò)密度0.012明顯較低,說明該社區(qū)中的成員交流互動比較欠缺,即使存在共同的興趣,彼此知之甚少,大多處于分散狀態(tài)。
2.群組發(fā)現(xiàn)分析
群組發(fā)現(xiàn),也稱作團(tuán)體發(fā)現(xiàn),是指找到一個(gè)整體網(wǎng)絡(luò),分析網(wǎng)絡(luò)中存在多少群組,每個(gè)群組是什么關(guān)系,群組內(nèi)部成員之間的關(guān)系具有怎樣的特點(diǎn),一個(gè)群組成員和另一組成員之間的關(guān)系具有怎樣的特點(diǎn)等。[12]在gephi中模塊化命令是根據(jù)圖的連接關(guān)系對節(jié)點(diǎn)進(jìn)行聚類,類型相同的節(jié)點(diǎn)會增加一個(gè)字段,[13]用相同的數(shù)字表示,可以在圖中給各類群體選擇一種顏色,以相互區(qū)別,提高可視化程度。通過模塊化命令并結(jié)合“Openrd”布局算法得到如圖6左側(cè)所示的python吧學(xué)習(xí)者群體分布圖,以及各類群體的規(guī)模、編號及其對應(yīng)的色塊。
由圖6可以發(fā)現(xiàn)G3(編號3)、G0(編號0)、G1(編號1)的群體規(guī)模較大,大量會員都聚集在此三類中,其次是G7、G4、G5、G15、G30等比例較小的群體。實(shí)際上,通過模塊化命令后,成功將python吧中的會員分為了36類,而前7類占據(jù)成員總數(shù)的97.85%,能夠反映python吧學(xué)習(xí)者群體的整體情況,故文章選取前7類進(jìn)行重點(diǎn)分析。
如表2所示,利用gephi對python吧中7119位會員成功進(jìn)行了聚類,但是仍有2346位會員游離在表2中的36類團(tuán)體之外。由于百度貼吧擁有海量的主題吧,部分會員沒有共同關(guān)注的貼吧是極有可能的,存在小部分興趣特別的會員。由于各類群體中的會員較多,為深入分析群體的興趣特點(diǎn),選擇規(guī)模居于中間的G4類作為研究對象。在gephi中順序運(yùn)行“統(tǒng)計(jì)->分區(qū)->Modularity class(節(jié)點(diǎn))”命令后,可以顯示指定部分群體的節(jié)點(diǎn)圖。當(dāng)圖中節(jié)點(diǎn)過多時(shí),可以順序使用gephi中的“拓?fù)?>度范圍”中的過濾命令,過濾掉度值較小的部分節(jié)點(diǎn),保留度值范圍較大的部分節(jié)點(diǎn)作為分析研究的對象。如圖7所示,各節(jié)點(diǎn)通過編號唯一的邊相連,而邊L344992所連接的兩個(gè)節(jié)點(diǎn)與其他節(jié)點(diǎn)之間的連接關(guān)系顯然不同,這說明在G4內(nèi)部,存在著兩種典型興趣趨向的小群體。
將圖7中的數(shù)據(jù)導(dǎo)出后,結(jié)合csv格式文件,得到了各節(jié)點(diǎn)之間的關(guān)系,如表3所示??偟膩碚f,G4類群體對考研相關(guān)的貼吧十分關(guān)注,可以推測G4群體中的成員因這一共同話題而聚集在一起。正如圖7所示,邊“L344992”代表的兩位會員與其他成員之間略有差異,娛樂類的網(wǎng)絡(luò)游戲受到了這兩位成員的關(guān)注。
類似的對其他群體進(jìn)行上述分析,如表4所示的G15類,便可得到python吧各群體的共同興趣,結(jié)果證明,通過網(wǎng)絡(luò)爬蟲和gephi相結(jié)合的方法,能夠在較大的社區(qū)中探尋到較多的學(xué)習(xí)者群體,能夠發(fā)現(xiàn)各群體的共同興趣,效果較好。
3.群組特點(diǎn)分析
通過上述群組發(fā)現(xiàn)方法,將python吧學(xué)習(xí)者分成了36個(gè)興趣群體,總的來說,各個(gè)群體之間興趣偏好既存在差別也有一定聯(lián)系。首先選取前7大類進(jìn)行綜合分析,以進(jìn)一步了解python吧中主要學(xué)習(xí)者群體的興趣特點(diǎn),然后從宏觀上對群體進(jìn)行分類,以深入了解各興趣群體之間存在的差異與聯(lián)系,從而加深對學(xué)習(xí)群體分布狀況以及成員興趣偏好的認(rèn)識。
作為會員人數(shù)最多的G3類,其共同特點(diǎn)是樂于關(guān)注娛樂類信息,如“李毅吧”、“l(fā)ol吧”等,也顯露出了對計(jì)算機(jī)語言的興趣,如共同關(guān)注的“c語言吧”。雖然G3類學(xué)習(xí)者數(shù)量處于首位,但其共同的興趣點(diǎn)較少,這在群體內(nèi)討論交流時(shí)話題引領(lǐng)和深入比較困難。學(xué)習(xí)者數(shù)量居于第二位的G0類群體共同興趣比較單一,均表現(xiàn)出對計(jì)算機(jī)語言的熱愛,如“php吧”、“Java吧”、“C語言吧”、“c++吧”等。對于計(jì)算機(jī)語言方面的探討,該群體內(nèi)的成員很容易找到共同話題。和G0類不同的是G1類,除了對計(jì)算機(jī)語言方面比較感興趣外,也關(guān)注計(jì)算機(jī)硬件方面的信息如“顯卡吧”等,這類群體可能對計(jì)算機(jī)整體性能有較多的關(guān)注。雖然G7類群體學(xué)習(xí)者規(guī)模僅居于第四位,但是其共同興趣呈現(xiàn)出多樣化特點(diǎn),總的來說表現(xiàn)在三方面,即計(jì)算機(jī)語言、計(jì)算機(jī)軟件、休閑與美食。計(jì)算機(jī)語言的種類與上述幾類相比更加豐富,計(jì)算機(jī)軟件方面偏愛制圖與辦公軟件,如“Office吧”、“Photoshop吧”等,在休閑與美食方面,“電影吧”與“海鮮吧”受到了該群體成員的關(guān)注。可見G7類群體興趣愛好比較廣泛,樂于關(guān)注不同種類事物的信息。G4類群體的共同興趣體現(xiàn)在表3中,可以發(fā)現(xiàn)該類群體主要熱衷于考研相關(guān)信息,可以推測該類群體中存在著一定規(guī)模的考研群體,他們十分重視考研資料與信息的收集。G5類群體共同興趣點(diǎn)較集中,熱愛機(jī)械設(shè)計(jì)方面的信息,如“solidworks吧”、“機(jī)械設(shè)計(jì)吧”、“機(jī)械制圖吧”等,可以預(yù)測該群體中的成員主要以有關(guān)專業(yè)的學(xué)生群體或者相關(guān)工作者為主,他們需要獲取專業(yè)相關(guān)信息作為學(xué)習(xí)參考或指導(dǎo)工作。前7類中規(guī)模最小的為G15類,雖然該群體中僅有46位成員,但該群體共同的興趣點(diǎn)卻是最多的,如表4所示,高校主題貼吧受到了該群體成員的共同關(guān)注,但該類群體興趣種類較為單一,這類群體熱衷于高校信息,應(yīng)為高校中的學(xué)生或者媒體中心,也有可能是政府機(jī)構(gòu)或者社會媒體組織。
根據(jù)各群體興趣愛好傾向不同,將python吧主要群體分成了4類,如表5所示。第一類:實(shí)用型群體,該類群體的興趣特點(diǎn)是熱衷于專業(yè)或者行業(yè)信息,G0類、G5類、G15類群體便是典型代表,三類群體中共有1906位成員。第二類:知識型群體,該類群體熱衷于獲取知識的同時(shí)對生活與專業(yè)信息也比較感興趣,包括G1類和G4類群體,兩類群體共有1725位成員。第三類:均衡型群體,該類群體興趣愛好較為廣泛,沒有特別明顯的興趣偏好,對生活、專業(yè)、美食、休閑等多方面均有興趣,G7類群體很顯然屬于此類,共有381位成員。第四類:物質(zhì)型群體,該類群體興趣愛好偏向休閑娛樂,也關(guān)注一些知識方面的信息,G3類群體便屬于此類,該類群體中有2954位成員。
如表5所示,就單個(gè)群體規(guī)模而言,物質(zhì)型群體居于首位,實(shí)用型其次,知識型位列第三,均衡型排在最后。就群體分布而言,實(shí)用型群體和均衡型群體共同占據(jù)主要地位,這符合一般學(xué)習(xí)社區(qū)的特點(diǎn),有利于社區(qū)營造良好的學(xué)習(xí)氛圍,便于學(xué)習(xí)者尋求學(xué)習(xí)信息,獲得學(xué)習(xí)幫助。盡管如此,實(shí)用型群體和均衡型群體的單個(gè)優(yōu)勢并不明顯,物質(zhì)型群體無論是組成還是規(guī)模均優(yōu)于實(shí)用型或者均衡型群體,這對社區(qū)學(xué)習(xí)氛圍、話題導(dǎo)向等方面的建設(shè)產(chǎn)生一定影響??傮w上,該社區(qū)中的學(xué)習(xí)者仍舊是以實(shí)用型和知識型為主,物質(zhì)型其次。然而就推薦學(xué)習(xí)群體而言,均衡型群體卻是不可或缺的,其廣泛的興趣偏好一定程度上能夠滿足部分學(xué)習(xí)者信息咨詢、交流討論等需求,而就知識或者專業(yè)深度來看,知識型和專業(yè)型的優(yōu)勢明顯優(yōu)于均衡型。
[1]CNNIC.第42次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[R].
[2]江波,高明,陳朝陽.建構(gòu)學(xué)習(xí)行為模式發(fā)現(xiàn)與學(xué)習(xí)效果關(guān)系研究——基于虛擬仿真的學(xué)習(xí)分析[J].遠(yuǎn)程教育雜志,2018(4):100-102.
[3]王曉玉.青海大學(xué)生網(wǎng)絡(luò)學(xué)習(xí)群體差異研究[J].中國現(xiàn)代教育裝備,2017(23):95-96.
[4]李運(yùn)福,傅鋼善.網(wǎng)絡(luò)環(huán)境下學(xué)習(xí)者動力性特征群體差異研究[J].中國遠(yuǎn)程教育,2014(7):33-36.
[5]牟智佳,武法提.MOOC學(xué)習(xí)結(jié)果預(yù)測指標(biāo)探索與學(xué)習(xí)群體特征分析[J].現(xiàn)代遠(yuǎn)程教育研究,2017(3):64-65.
[6]鄭星.蘇州市鋼琴學(xué)習(xí)群體教育現(xiàn)狀與對策研究[D].蘇州大學(xué),2016:40-44.
[7]阮高峰,林葉郁.同儕輔助學(xué)習(xí)模式及網(wǎng)絡(luò)互助學(xué)習(xí)群體構(gòu)建實(shí)踐[J].中國電化教育,2006(11):34-37.
[8]潘理,吳鵬,黃丹華.在線社交網(wǎng)絡(luò)群體發(fā)現(xiàn)研究進(jìn)展[J].電子與信息學(xué)報(bào),2017(9):2097-2107.
[9]曾珂.基于數(shù)據(jù)挖掘的微博用戶興趣群體發(fā)現(xiàn)與分類[D].華中師范大學(xué),2014:13-23.
[10]葉祺.大規(guī)模網(wǎng)絡(luò)的社團(tuán)發(fā)現(xiàn)與多層次可視化分析[D].北京郵電大學(xué),2011:63-64.
[11]趙延樂.基于復(fù)雜網(wǎng)絡(luò)的鏈路預(yù)測研究[D].河北大學(xué),2014:7-8.
[12]鄧君,馬曉君,畢強(qiáng).社會網(wǎng)絡(luò)分析工具Ucinet和Gephi的比較研究[J].情報(bào)理論與實(shí)踐,2014(8):133-138.
[13]劉勇,杜一.網(wǎng)絡(luò)數(shù)據(jù)可視化與分析利器Gephi中文教程[M].北京:電子工業(yè)出版社,2017.1:172-175.
(編輯:王天鵬)