夏士嵐 覃希 劉夢娟
[摘 要] 文章針對現(xiàn)行高校大學(xué)生潛在的“網(wǎng)癮”問題,提出基于支持向量機的“網(wǎng)癮”模式識別方法。通過問卷調(diào)查和實際調(diào)查兩種形式獲得實驗數(shù)據(jù),借助計算機學(xué)科中的支持向量機算法對實驗數(shù)據(jù)進行模式識別,并對識別結(jié)果進行分析、核驗。實驗結(jié)果表明,該方法能有效輔助高校管理者及時發(fā)現(xiàn)具有“網(wǎng)癮”特征的學(xué)生。
[關(guān)鍵詞] “網(wǎng)癮”;支持向量機;模式識別;大學(xué)生;高校
中圖分類號:G647 文獻標(biāo)識碼:A 文章編號:1674-1722(2021)09-0001-03
★基金項目:廣西高校本科生潛在網(wǎng)癮威脅預(yù)測與防控研究研究階段性成果(項目編號:2015LSZ032);廣西大學(xué)大學(xué)生潛在網(wǎng)癮威脅預(yù)測與防控研究研究階段性成果(項目編號:XGS1437);廣西高等學(xué)校大學(xué)生思想政治教育理論與實踐研究課題
21世紀(jì)是一個網(wǎng)絡(luò)時代,大學(xué)生群體既是潮流的先鋒,又極易迷失在網(wǎng)絡(luò)世界,導(dǎo)致自我封閉、學(xué)習(xí)成績下降。更有甚者,導(dǎo)致精神抑郁、品行障礙、情感分裂、人格分裂、自殺行為或青少年犯罪等。這就是人們俗稱的“網(wǎng)癮”現(xiàn)象,對高校大學(xué)生的“網(wǎng)癮”問題應(yīng)當(dāng)予以高度重視。筆者利用支持向量機數(shù)學(xué)模型,通過對高校大學(xué)生的問卷數(shù)據(jù)和實際調(diào)查數(shù)據(jù)進行挖掘分析,及時發(fā)現(xiàn)具有“網(wǎng)癮”特征或潛在“網(wǎng)癮”特征的個體,并對其實施及時的教育引導(dǎo)。
一、相關(guān)概念的界定及研究背景
(一)大學(xué)生“網(wǎng)癮”
“網(wǎng)癮”的概念,最初由美國心理學(xué)家格登博格(Goldberg)提出,隨后,匹茲堡大學(xué)的金伯利·揚博士(Dr.Kimberly Young)發(fā)展完善了他的這一概念?!熬W(wǎng)絡(luò)成癮”(IA)、“網(wǎng)絡(luò)成癮癥”(IAD)或“病態(tài)網(wǎng)絡(luò)使用”(PIU),是指在無成癮物質(zhì)作用下的上網(wǎng)行為沖動失控,表現(xiàn)為由于過度使用互聯(lián)網(wǎng)而導(dǎo)致個體明顯的社會、心理功能損害。中國青少年網(wǎng)絡(luò)協(xié)會在2005年發(fā)布的《中國青少年網(wǎng)癮報告》中對“網(wǎng)癮”做出了如下界定:在認同“上網(wǎng)給青少年的學(xué)習(xí)、工作或現(xiàn)實中的人際交往帶來不良影響”前提下,如果滿足了以下三個條件中任何一個,就認為該網(wǎng)民從一定程度上具有網(wǎng)癮特征,即判定屬于“網(wǎng)癮”。1.覺得在網(wǎng)絡(luò)中比在現(xiàn)實生活中更快樂或更能實現(xiàn)自我;2.每當(dāng)因特網(wǎng)的線路被掐斷或由于其他原因不能上網(wǎng)時會感到煩躁不安、情緒低落或無所適從;3.向親人隱瞞了自己上網(wǎng)時間。
(二)支持向量機
支持向量機(SVM)是一種用來具體實現(xiàn)統(tǒng)計學(xué)習(xí)理論核心思想的一種通用的學(xué)習(xí)方法。SVM由統(tǒng)計學(xué)習(xí)理論(SLT)和結(jié)構(gòu)化風(fēng)險最小化原則(SRM)派生而來,是借助最優(yōu)化方法實現(xiàn)機器學(xué)習(xí)的數(shù)據(jù)挖掘利器。它能從小樣本中提取必要信息,能解決非線性問題,適用性廣,不會產(chǎn)生局部極小值。因此,SVM可以擺脫傳統(tǒng)統(tǒng)計學(xué)中“以大數(shù)據(jù)為實驗基礎(chǔ)”的束縛,采用小樣本即可解決分類、預(yù)測等問題[1]。SVM的數(shù)學(xué)機制如圖1所示,分類問題最終是要找到最優(yōu)分類面。圖1中實心點和空心點代表兩類樣本,H為分類線,H1、H2分別為過兩類中離分類線最近的樣本且平行于分類線的直線,它們之間的距離叫做分類間隔。若能將兩類數(shù)據(jù)正確分開,并且使分類間隔最大,此時的H為最優(yōu)分類線。由此概念可推廣得出最優(yōu)分類平面的概念。虛線上的少量樣本稱之為支持向量,支持向量機也因此得名。
二、大學(xué)生“網(wǎng)癮”成因分析
(一)個人因素
很多學(xué)者在研究中強調(diào)了個人因素以及生理機制對于大學(xué)生“網(wǎng)癮”的影響。個人因素主要包括大學(xué)生的性格、社交圈、人生觀、培養(yǎng)環(huán)境等方面。性格內(nèi)向的學(xué)生更喜歡使用網(wǎng)絡(luò)進行社交。尤其對于自信心不足、表達能力不好的學(xué)生在傳統(tǒng)的交流方式下他們不善于表達自己內(nèi)心的想法,而面對網(wǎng)絡(luò)所提供的方式就很喜歡。目前網(wǎng)絡(luò)社交的方式除了聊天以外就是網(wǎng)絡(luò)游戲。大學(xué)生在心理上長期依賴網(wǎng)絡(luò),久而久之就形成“網(wǎng)迷”或“網(wǎng)癮”習(xí)慣。大學(xué)生正常的社交圈人群多為同學(xué)、老師,交流的內(nèi)容是經(jīng)過校園環(huán)境凈化、篩選的精英主流文化。而具有“網(wǎng)癮”的大學(xué)生其社交圈人群是很復(fù)雜的,社交圈內(nèi)所交流的內(nèi)容往往都是未經(jīng)過濾的社會信息,這些信息中往往摻雜黃色、暴力文化、錯誤偏激認識等。因為成長的社交圈不同,所以造就“網(wǎng)癮”大學(xué)生和非“網(wǎng)癮”大學(xué)生。所以,大學(xué)生的個人因素跟“網(wǎng)癮”的形成有重要關(guān)系。
(二)家庭因素
家庭因素是大學(xué)生“網(wǎng)癮”問題的根源。據(jù)有關(guān)研究顯示,家長從小的教育方式深刻影響著大學(xué)生在校的行為。實際上,教育是家庭、學(xué)校、社會三者結(jié)合的產(chǎn)物,而家庭教育是教育體系的基礎(chǔ)。大學(xué)生在高校中出現(xiàn)“網(wǎng)癮”問題往往是長期家庭環(huán)境所致。父母缺乏關(guān)愛、錯誤的家庭教育方法等因素造成孩子心靈上的空缺,孩子只能通過網(wǎng)絡(luò)來彌補。進入大學(xué)后,離開父母的約束,他們習(xí)慣性地通過最熟悉的網(wǎng)絡(luò)來滿足自己,最終導(dǎo)致出現(xiàn)“網(wǎng)癮”的現(xiàn)象。因此,家庭中父母的情況、親情關(guān)系、教育方式都影響在校大學(xué)生對網(wǎng)絡(luò)的使用狀態(tài)。
(三)學(xué)校因素
在教育體系三元素中,學(xué)校是教育的主體,承擔(dān)著主要的教育任務(wù)。大學(xué)生在學(xué)校的學(xué)習(xí)環(huán)境、專業(yè)教學(xué)情況、同學(xué)氛圍都將影響大學(xué)生在學(xué)校的發(fā)展。教學(xué)設(shè)施是否完善、大學(xué)生對所學(xué)專業(yè)是否感興趣、同班或同宿舍同學(xué)的學(xué)習(xí)態(tài)度都會影響大學(xué)生個體的發(fā)展。當(dāng)大學(xué)生個體在學(xué)校發(fā)展不好時,普遍通過網(wǎng)絡(luò)來消除煩惱,如果大學(xué)生長期處于低迷狀態(tài)并通過網(wǎng)絡(luò)來解脫,這就有可能形成“網(wǎng)癮”習(xí)慣。
(四)社會因素
隨著信息時代的到來,網(wǎng)絡(luò)已經(jīng)成為人們生活中必不可少的元素。這使得人們足不出戶也能滿足生活需要。但是現(xiàn)階段的網(wǎng)絡(luò)社會發(fā)展還不夠健全,仍無法跟真實社會等同。有的大學(xué)生長期只通過網(wǎng)絡(luò)進行社交,只接受網(wǎng)絡(luò)規(guī)則的熏染,對真實社會的規(guī)則不能適應(yīng),甚至無法接受。久而久之,真實大學(xué)生個體對真實世界產(chǎn)生排斥感,反而對網(wǎng)絡(luò)世界充滿喜愛。最終,大學(xué)生只能依賴網(wǎng)絡(luò)生存,形成“網(wǎng)癮”習(xí)慣。
三、建立大學(xué)生潛在“網(wǎng)癮”預(yù)測模型
本文設(shè)計的大學(xué)生潛在“網(wǎng)癮”預(yù)測模型是基于SVM理論的分類預(yù)測模型完成的。模型中的各個維屬性根據(jù)大學(xué)生“網(wǎng)癮”的成因進行歸納而得。屬性根據(jù)性質(zhì)分為4組,共27維屬性值[2]。
第一、二組:父親/母親信息
職業(yè){1: 單位干部,2: 普通白領(lǐng),3: 工人,4: 務(wù)農(nóng)}
文化程度{1: 大學(xué)及以上,2: 大學(xué)以下}
收入{1: 5000元以上/月,2: 5000~3000元/月,3: 3000~1000元/月,4: 100 0元以下/月}
年齡{1: 60以上,2: 50多,3: 40多,4: 40以下}
第三組:家庭關(guān)系信息
1.父母關(guān)系{1:和睦,2:不和諧,3:離異}
2.是否為獨生子女家庭{1:是,2:否}
3.家里有無電腦{1:有,2:無}
4.父母一直為你設(shè)計好一切{1:是,2:否}
5.父母對你管教如何?{1: 非常嚴厲、事事干涉,2:正常關(guān)心,3: 有求必應(yīng),4: 不聞不問}
6.當(dāng)你犯錯誤時父母采取什么方式?{1: 打罵,2: 講道理,3: 不理睬}
7.跟父母有代溝嗎?{1:有,2:無}
第四組:個人信息
1.政治面貌{1: 黨員,2:團員,3:群眾}
2.性格{1:外向,2:內(nèi)向}
3.在大學(xué)中人際關(guān)系如何?{1: 朋友很多、社交很廣,2: 社交圈一般,只跟本班同學(xué)熟,3: 沒有什么朋友,常感到孤單寂寞}
4.目前是否談戀愛?{1:是,2:否}
5.進入大學(xué)后的成績?nèi)绾??{1:一如既往的好,2:比高中時好,3:比高中時差,4:一直一般,5:一直不好}
6.喜歡本專業(yè)嗎?{1:喜歡,2:不喜歡}
7.進入大學(xué)時是否給自己定有學(xué)習(xí)/工作上的奮斗目標(biāo)?{1:是,2:否}
8.目前是否仍朝著目標(biāo)努力?{1:能,2:不能}
9.無人提醒時能否自主學(xué)習(xí)?{1:是,2:否}
10.經(jīng)常自己的事情自己決定{1:有,2:沒有}
11.上大學(xué)前有無接觸過電腦?{1:有,2:沒有}
12.上大學(xué)前有無接觸過網(wǎng)游?{1:有,2:沒有}
四、實驗操作過程
(一)準(zhǔn)備階段
實驗數(shù)據(jù)通過發(fā)放問卷獲得。實驗對象選取廣西大學(xué)計算機與電子信息學(xué)院2019級(當(dāng)年大一)、2018級(當(dāng)年大二)、2017級(當(dāng)年大三)三個年級的大學(xué)生。共發(fā)放問卷數(shù)量1000份,回收934份,有效問卷929份。我們將回收的問卷數(shù)據(jù)錄入數(shù)據(jù)庫,并對數(shù)據(jù)進行數(shù)據(jù)類型轉(zhuǎn)換,將文本型的問卷數(shù)據(jù)轉(zhuǎn)換成數(shù)值型數(shù)據(jù)。本實驗的SVM模式識別借助libSVM算法包完成,因此要以libSVM的分類格式規(guī)范源數(shù)據(jù)。另外,SVM分類預(yù)測需要準(zhǔn)備兩個集合:訓(xùn)練集和測試集。于是我們將2017級、2018級的大學(xué)生數(shù)據(jù)作為訓(xùn)練集,將2019級大學(xué)生數(shù)據(jù)作為測試集。剔除不規(guī)則數(shù)據(jù)后,得到訓(xùn)練集數(shù)據(jù)670條,測試集數(shù)據(jù)264條。
(二)數(shù)據(jù)狀態(tài)的審定
實驗中“-1”表示網(wǎng)癮狀態(tài),“1”表示正常狀態(tài)。SVM利用訓(xùn)練集來習(xí)得預(yù)測模式,訓(xùn)練集中每一名同學(xué)的分類情況要盡可能的符合實際[3]。因此,訓(xùn)練集狀態(tài)的審定是至關(guān)重要的。訓(xùn)練集中的數(shù)據(jù)由老生(2017級、2018級的大學(xué)生)數(shù)據(jù)組成。通過對老生長期在校的表現(xiàn)、欠學(xué)分情況、大多數(shù)同學(xué)的反饋,很容易可以知道老生中具有顯性網(wǎng)癮表現(xiàn)的同學(xué),以此得到訓(xùn)練集中的數(shù)據(jù)狀態(tài)。
對于測試集而言,數(shù)據(jù)來自新生(2019級大學(xué)生)。利用SVM的分類功能來識別新生的狀態(tài),最后對預(yù)測的情況進行評測。新生經(jīng)過一個學(xué)期的觀察后,滿足以下條件的判定為具有潛在網(wǎng)癮威脅:
在校表現(xiàn):平時曠課時數(shù)≥5學(xué)時
考試情況:正考不及格科目數(shù)≥3門
宿舍調(diào)查:使用電腦從事上網(wǎng)活動超過≥6小時
(三)評測指標(biāo)
實驗設(shè)定3個評測指標(biāo)來評測試驗結(jié)果:精確度、漏檢率、誤檢率。其中精確度用來衡量實驗方法的準(zhǔn)確程度,公式如下:
精確度=實驗得到的狀態(tài)跟審定狀態(tài)相同的人數(shù)/新生總?cè)藬?shù)×100%
漏檢率用來描述實驗方法把有“網(wǎng)癮”學(xué)生誤判成了無“網(wǎng)癮”學(xué)生的錯誤程度,公式如下:
漏檢率=(實際狀態(tài)為有“網(wǎng)癮”但識別為無“網(wǎng)癮”的新生人數(shù))/新生總?cè)藬?shù)×100%
誤檢率用來描述實驗方法把無“網(wǎng)癮”的學(xué)生誤判成了有“網(wǎng)癮”的學(xué)生情況,公式如下:
誤檢率=(實際是無“網(wǎng)癮”但實驗識別為有“網(wǎng)癮”的新生人數(shù))/新生總?cè)藬?shù)×100%
(四)實驗數(shù)據(jù)分析
實驗結(jié)果的評測標(biāo)準(zhǔn)是經(jīng)審定后的測試數(shù)據(jù)狀態(tài)。將審定的數(shù)據(jù)狀態(tài)分別跟SVM實驗預(yù)測狀態(tài)和問卷調(diào)查得到的狀態(tài)經(jīng)行對比。結(jié)果如下表所示:
從表中精確度一欄看出SVM的精確度是88.46%,問卷調(diào)查得到的精確度是90.76%。雖然SVM比問卷調(diào)查得到的精確度要略低,但經(jīng)過進一步對比發(fā)現(xiàn),SVM的“網(wǎng)癮”漏檢率是17.6%,問卷的“網(wǎng)癮”漏檢率是44.1%,問卷比SVM預(yù)測的“網(wǎng)癮”漏檢率高出26.5個百分點。這說明,使用問卷的調(diào)查方式很難獲取潛在“網(wǎng)癮”狀態(tài),即被調(diào)查者更傾向于將自己認為是無“網(wǎng)癮”的。而使用SVM預(yù)測獲得的“網(wǎng)癮”狀態(tài)相對來說更客觀。SVM是通過計算被調(diào)查者的特征,將其根據(jù)模式歸類得到的結(jié)果。SVM能更客觀地挖掘潛在的“網(wǎng)癮”情況。從非“網(wǎng)癮”誤檢率看出,SVM的偏高,問卷的偏低。這也說明了,問卷調(diào)查過程中,被調(diào)查者更偏向于將自己填寫成非“網(wǎng)癮”狀態(tài),所以問卷的非“網(wǎng)癮”誤檢率低;而SVM通過計算來挖掘,會把一些本來是認為自己是正常的大同學(xué)誤檢成是“網(wǎng)癮”狀態(tài)。
綜上所述,在挖掘“新生中具有潛在‘網(wǎng)癮威脅”的過程中,SVM的挖掘效果更好。雖然SVM在盡可能發(fā)現(xiàn)具有“網(wǎng)癮”威脅大學(xué)生的同時,會把小部分無“網(wǎng)癮”的大學(xué)生誤認為是有“網(wǎng)癮”的,但這種誤檢,在實際中對大學(xué)生工作的開展沒有任何阻礙。相反,若將有潛在“網(wǎng)癮”威脅的”漏檢,在實際工作中輔導(dǎo)員和班主任會因此錯過對新生最佳的引導(dǎo)和教育時機,最終導(dǎo)致更多“網(wǎng)癮”大學(xué)生的出現(xiàn)。
五、結(jié)語
目前針對大學(xué)生“網(wǎng)癮”問題普遍的解決措施有兩大方面。一是針對已經(jīng)有明顯“網(wǎng)癮”狀況的大學(xué)生所采取的補救措施,二是為了防止“網(wǎng)癮”的發(fā)生而針對所有大學(xué)生采取的有效措施。前者屬于亡羊補牢,收效甚微;后者屬于漫天撒網(wǎng),費時費力,工作沒有重點,它們都不能從根本上解決這一問題。利用筆者提出的基于支持向量機的大學(xué)生潛在“網(wǎng)癮”威脅預(yù)測方法,可以利用老生的特征數(shù)據(jù),對新生進行預(yù)測。預(yù)測結(jié)果能為高校輔導(dǎo)員及大學(xué)生工作者提供有針對性的大學(xué)生群體名單,進而可以根據(jù)大學(xué)生的具體情況對該群體實施預(yù)防性的心理輔導(dǎo)教育。
參考文獻:
[1]危雅玲.青少年網(wǎng)癮治理的困境及對策研究 ——以南京市為例[J].南京師范大學(xué),2020(01):66.
[2]覃希,夏寧霞,蘇一丹.基于支持向量機的垃圾標(biāo)簽檢測模型[J].計算機應(yīng)用研究,2010,27(10):3893--3895.
[3]肖丹.社會化理論視域下網(wǎng)絡(luò)成癮大學(xué)生思想政治教育途徑研究[J].西南石油大學(xué),2017(05):49.