孫思宇,李澤義,陳 爽,黃琳心,郝梓旭
(長春中醫(yī)藥大學,長春 130117)
數學領域中的對數似然比LLR(likelihood rate)算法常見于通信領域中[1],將該算法運用到聚類中,可根據關鍵詞頻度、集中度與分散度等指標組成向量,判斷關鍵詞是否可以作為聚類的特征詞[2],進而對聚類標簽詞進行提取,挖掘某領域的研究熱點。21世紀,抑郁是影響人類身心健康的主要危險因素,大學生是抑郁的高發(fā)群體,抑郁癥狀的發(fā)生與大學生網絡成癮、學習倦怠等密切相關,抑郁情緒嚴重者會出現自傷、自殺等行為。目前,國內學者圍繞自我概念、人格、體育鍛煉、應對方式等對大學生抑郁開展研究,研究力度大,文獻眾多,但觀點較為分散,研究重點不突出。
2002年,Kleinberg提出了突發(fā)監(jiān)測算法[3],統(tǒng)計出低頻但卻比高頻詞更具情報意義的突發(fā)詞,以此來探測學科前沿。該算法在自然科學領域,尤其是在醫(yī)學領域應用廣泛,在社科領域的應用起步較晚[4]。對關鍵詞進行聚類分析,應用Kleinberg監(jiān)測算法探求大學生抑郁領域研究的發(fā)展趨勢,可為日后研究提供思路與參考依據。
在中國知網(CNKI)中以“抑郁癥”“抑郁”“大學生”為關鍵詞進行精確檢索(截至2022年11月),文獻檢索來源限定為北大中文核心期刊、中國科學引文數據庫(CSCD)、科學引文索引(SCI)、工程索引(EI)來源期刊。剔除無效文獻,共得到有效學術論文522篇。
使用COOC軟件進行數據查重與處理,將最終數據導入CiteSpace6.1.R3對關鍵詞進行可視化分析。參數設置:時間分區(qū)為1992—2022年,時間切片設置為1(Year Per Slice=1),節(jié)點類型設置為關鍵詞(keyword),共現選擇g-index(k=25),節(jié)點越大表示該節(jié)點代表的關鍵詞出現的次數越多。節(jié)點間的連線代表關鍵詞間的關聯(lián)程度,連線越粗代表兩個關鍵詞的聯(lián)系程度越強。
利用CiteSpace軟件中的快速聚類功能Clustering進行快速聚類,借助Dunning于1993年提出的Log Likelihood Ratio(LLR對數極大似然率)算法對聚類標簽詞進行提取,用下面兩個可選的假設解釋關鍵詞x、y的出現是否獨立,用0、1表示關鍵詞x是否出現:
假設H1:p(0|y)=p=p(1|y)
假設H2:p(0|y)=p1≠p2=p(1|y)
使用最大似然估計的方法計算p、p1、p2,用c1、c2、c12來表示x、y、xy出現的次數,N表示所有關鍵詞出現的總次數。
如圖1所示,大學生抑郁研究領域發(fā)文量整體呈上升趨勢,尤其是近十年累計發(fā)文量曲線斜率增大,表示發(fā)文量處于快速增長階段。構建作者合作網絡,其中節(jié)點(N)523個,連線(E)547條,網絡密度為0.004,即作者523名,作者間合作547次。發(fā)文作者中存在多個子網絡,主要形成了以伍曉艷、劉雙金、金岳龍、姚桂英等人為核心的研究團隊。發(fā)文機構合作網絡圖譜顯示,節(jié)點(N)431個,連線(E)497條,網絡密度為0.0032,即發(fā)文機構431個,機構合作497次;發(fā)文量較多的機構為安徽醫(yī)科大學公共衛(wèi)生學院兒少衛(wèi)生與婦幼保健學系,共發(fā)文15篇。
圖1 1992—2022年大學生抑郁研究領域發(fā)文量分布Fig.1 Publication distribution of research on college students’ depression from 1992 to 2022
運行CiteSpace,生成關鍵詞共現圖譜,共包括447個節(jié)點、1403條連線,網絡密度為0.0141。依據普萊斯定律,即M=0.749(Nmax)1/2,定義頻次大于14的為大學生抑郁研究的領域高頻詞,關鍵詞中心性>0.1表示有顯著重要性和高影響度,高頻詞頻次及中心性詳見表1。
表1 高頻關鍵詞Tab.1 High frequency keywords
采用LLR算法進行聚類分析,得到11個聚類群,詳見圖2。一般認為聚類模塊值(Modularity Q)>0.3意味著聚類結構顯著,聚類平均輪廓值(Silhouette S)越接近1,表示網絡的同質性越高;S>0.5表示該聚類合理,S>0.7意味著該聚類信度較高。表2的聚類分析結果顯示,Q=0.4967,S=0.7992,說明聚類結構顯著,聚類結果可信。
表2 關鍵詞聚類號及聚類子簇Tab.2 Keywords cluster number and cluster subcluster
圖2 關鍵詞聚類圖譜Fig.2 Keywords clustering map
聚類#0、#1、#4、#6、#9中“睡眠質量”“手機成癮”“體育鍛煉”等關鍵詞反映出部分學者關注行為生活習慣與大學生抑郁的相關性研究。聚類#2、#3、#5、#8中“孤獨”“心理韌性”“自尊”等關鍵詞可反映出部分學者關注心理、人格特征與大學生抑郁的相關性研究。聚類#7、#10中“社會階層”“人際關系”等關鍵詞則反映出部分學者關注人際關系、社會網絡與大學生抑郁的相關性研究。
從關鍵詞演變整體趨勢來看,我國大學生抑郁研究可劃分為3個階段。1992—2005年,為大學生抑郁研究的起步階段,研究內容較為單一,關鍵詞主要為“抑郁”“抑郁癥狀”“大學生”。2006—2015年,為相關研究的發(fā)展階段,“生活事件”“自尊”“人格”等主題類關鍵詞與“回歸分析”“中介作用”等統(tǒng)計學類關鍵詞同時出現,說明該階段研究內容與研究方法呈多元化趨勢。2016—2022年,該階段主要關鍵詞多與“睡眠”“手機”“體育鍛煉”相關,說明近年該領域主要研究熱點為行為生活習慣與大學生抑郁的相關性。詳見圖3。
圖3 關鍵詞聚類時間線圖譜Fig.3 Keywords clustering timeline map
運用Kleinberg監(jiān)測算法進行突現詞檢測,得到16個突現關鍵詞;“醫(yī)科”“自我概念”“自殺意念”“人格”“完美主義”這5個詞的突現時間較早,是大學生抑郁領域早期的關注方向;其中“醫(yī)科”這一突現關鍵詞持續(xù)時間較久,說明我國早期有關大學生抑郁的研究主要以醫(yī)學生為研究對象。2012—2018年,關鍵詞“調節(jié)作用”“中介作用”“留守經歷”“應對方式”逐漸開始突現,說明學者逐漸關注對中介變量及調節(jié)變量的挖掘,“留守經歷”“應對方式”成為這一階段學者主要關注的影響因素。近兩年的突現關鍵詞為“睡眠”“回歸分析”“睡眠質量”“行為”,較好地體現出未來大學生抑郁領域研究將圍繞行為生活因素與大學生抑郁的相關性展開,睡眠質量與大學生抑郁的相關性成為研究前沿。詳見圖4。
圖4 關鍵詞突現圖譜Fig.4 Keywords emergency map
可利用LLR聚類算法和Kleinberg監(jiān)測算法挖掘大學生抑郁領域研究的熱點與前沿趨勢。我國大學生抑郁領域研究熱點主要包括行為生活習慣、心理、人格特征、人際關系、社會網絡與大學生抑郁的相關性。睡眠質量、手機使用情況、體育鍛煉等行為活動習慣與抑郁情緒的相關性研究是近期研究前沿。