付 葉 蔣春芳 徐海峽 陳 然 孫金菊
(長春理工大學,吉林 長春 130022)
校園暴力是一種復雜的校園現象,受多因素影響。從教育角度看,與教育觀念、教育實施和教育方法有關;從法律角度看,與法律體系、法律懲戒和管教制度有關;從社會角度看,與社會環(huán)境、輿論導向和文化導向有關;從心理角度看,與心理發(fā)育時期、心理引導和心理健康教育有關。
目前校園暴力的研究,大多數只是從理論出發(fā),簡單地分析校園暴力相關事件發(fā)生的原因,探討可行的解決方法,未能有效地結合實際,且對學生個體因素關注較少。因此,本文從社交網絡出發(fā),利用數據挖掘、敏感詞分析等技術專注于一個學生個體,通過其社交圈分析出校園暴力相關角色及角色間可能的關系,重點關注于輿情傳播過程的特點和找出有暴力傾向的人群。將學科理論與技術實踐相結合,獲取真實可靠的數據后,共同防治校園暴力,發(fā)揮校園暴力預警的作用。
基于微博社交平臺,通過使用數據挖掘及敏感詞分析等技術,整理出人物關系網絡及校園暴力中的各類角色,從而得出輿情傳播的特點,最終以可視化方式展現研究結果。
目前,微博數據挖掘技術主要有基于網絡解析技術的網絡爬蟲和基于開放API的數據獲取。此案例主要采用基于網絡解析技術的網絡爬蟲,以@小李(化名)為案例中心,挖掘出所有轉發(fā)者、評論者、粉絲及關注者的主頁、粉絲、關注者等數據,從而獲得大量原始人物數據。
以@小李(化名)為案例中心,對數據進行處理,最終以可視化方式展現分析結果。
1.文本預處理
首先,對微博文本數據進行篩選及預處理;剔除無關數據后,在R環(huán)境中添加詞庫(如敏感詞庫,停用詞詞庫等),選擇Rwordseg分詞包中segmentCN()函數對整理后的數據進行分詞;其次,將分詞后的數據按頻數存儲,并統(tǒng)計詞頻,根據詞頻按降序排列,構建最終的語料庫后可以進行文本聚類、分類、關聯分析等挖掘工作。通過分詞后的結果,我們可以將詞頻高的熱點詞作為關鍵詞,進行抽取。
2.情感分析
情感分析方法主要有兩類,一類是基于情感詞典的情感分析,另一類是基于機器學習的情感分析。案例中選擇基于情感詞典的情感分析,對獲取的數據進行分析。微博屬于短文本,首先拆分微博為若干分句,針對句子中的詞語進行情感打分,進而來計算整個句子的情感傾向,整合該條微博的所有分句的分值進行累加,就可以獲得該條微博的最終得分,分析出可能有暴力傾向的人群,并對與案例相關的微博人物進行分析。
3.可視化方式
微博數據的可視化方式多種多樣,目的是直觀地把有價值的信息展現出來。
標簽云:根據標簽或者關鍵詞的出現頻率來確定其字體大小,用來展示@小李(化名)的微博關鍵詞。
圖1
社交圖譜:以@小李(化名)為圖譜中心,將與案例相關聯的人物關系以可視化的方式展現出來。
@小李(化名)在微博發(fā)布了一個施暴視頻,引起大量關注、評論和轉發(fā)。從其主頁出發(fā),通過以上對人物事件分析,發(fā)現微博輿情數量呈指數型增長,該事件一經微博發(fā)布并傳播,即使視頻已被刪除,其突發(fā)性和擴散性也很強,體現了校園暴力輿情在社交網絡“移動化”傳播明顯和“負面情緒”傳播熱度高的特征。
在篩選出的人物數據中,包含發(fā)表過激言論和暴力敏感詞匯的可能施暴者、關注大量校園暴力事件的旁觀者、校園暴力可能受害者、校園暴力輿情傳播者等人物角色,從而形成了@小李(化名)的人物關系網絡。因此,在移動互聯網和新的數字傳播技術的作用下,可以用文本情感分析的方式找出可能有暴力傾向的人物及其社交關系網絡,從而達到社交網絡校園暴力預警的作用。
校園暴力已然成為一個普遍存在的社會問題,不斷沖擊社會的道德底線與法律底線,輕則影響學生的學業(yè)教育,重則給學生造成嚴重的心理問題與身體傷害,更有甚者可能會付出生命代價,引起了社會公眾的重視。網絡社交媒體的迅猛發(fā)展使得校園暴力事件有了一個新的曝光和預警的途徑。但目前我們能做到的只是判別和推測有暴力傾向的人群,起到預警的作用。
要想從根本上解決校園暴力問題需要從源頭出發(fā),綜合各方教育和法律懲戒等手段,完善校園暴力犯罪的相關法律體系,加強對家長、教師的培訓,及時進行介入和干預,提高他們的道德素養(yǎng)和思想素質,密切關注學生的心理健康,營造和諧的校園文化氛圍,凈化學校的學習教育環(huán)境從根本上減少各種引起校園暴力事件的因素。相關部門在關注教育和法制建設的同時,也要重視網絡技術層面的預警作用,大力發(fā)展社交網絡敏感詞分析和情感分析的技術,更精準地分析人物性格和情感特點,使校園暴力預警技術更加成熟并得到更為廣泛的運用,從而降低校園暴力事件出現的可能性。