李剛,陳潔
(1.陜西中醫(yī)藥大學(xué)第二附屬醫(yī)院,陜西,咸陽 712000;2.西安市大數(shù)據(jù)服務(wù)中心,陜西,西安 710001)
大學(xué)生對自己未來的人生飽含期待,充滿著激情和活力,但他們抗壓能力嚴重不足,易受外界干擾,心理變化較大,導(dǎo)致許多大學(xué)生不自覺地產(chǎn)生不同的心理健康問題[1-3]。
針對大學(xué)生日趨嚴重的心理健康問題,該課題越來越多成為學(xué)術(shù)研究主題[4-5]。有學(xué)者在基于積極心理學(xué)視角下研究的學(xué)生心理健康評估方法,采用Cronbach’s α系數(shù)和Pearson相關(guān)系數(shù)評價量表的內(nèi)容效度獲取學(xué)生心理健康評估結(jié)果[6];有學(xué)者基于多特征融合的在線論壇研究的用戶心理健康自動評估方法,基于多特征設(shè)計的融合心理健康評估框架與貪婪法、降噪自編碼器等策略相結(jié)合的方式,實現(xiàn)對學(xué)生的心理健康評估目的[7]。雖然這兩種方法都能有效評估學(xué)生的心理健康狀態(tài),但是不完全體現(xiàn)出在校大學(xué)生的心理健康,基于此,本文進行了基于數(shù)據(jù)驅(qū)動的大學(xué)生心理健康評估研究,數(shù)據(jù)驅(qū)動是一種解決問題的方法,當(dāng)我們不能簡單且準確的解決一個問題的時候,就可以根據(jù)實際的歷史數(shù)據(jù)和關(guān)系數(shù)據(jù)構(gòu)造與真實情況相近的模型對問題進行求解,在適應(yīng)過程中具有實踐指導(dǎo)作用。
1.1.1 改進模糊聚類算法模型
假設(shè)數(shù)據(jù)集為n,類別數(shù)為c,類別數(shù)取值區(qū)間為[1,n]。
定義1hik為可能隸屬度,表示第k個對象與第i類別之間相對應(yīng)的隸屬程度,取值區(qū)間為[1,n],該類別的隸屬度與代表該類別的點和聚類中心之間的距離相關(guān),間距越小,則隸屬度越大,無關(guān)其他聚類中心。
定義2sik為不確定性隸屬度,表示第k個對象屬于第i類別的可能性,取值為0和1,不確定性隸屬度具備記憶存儲功能,能夠記憶以往的迭代過程。
(1)
本算法被定義為不確定性隸屬關(guān)系的前提條件時不同聚類的隸屬度均為1時,這與其他概念中的不確定性有所不同[8]。
定義3 算法的準則函數(shù)基于參數(shù)hik、sik進行構(gòu)造,即:
(2)
結(jié)合定義3和拉格朗日求值方法計算hik,拉格朗日函數(shù)為
(3)
F對hik求偏導(dǎo),即:
(4)
(5)
F對λ求偏導(dǎo),即:
(6)
在式(6)中代入hik,得:
(7)
在式(5)中代入式(7),即:
(8)
求解最終可能隸屬度公式為
(9)
所有數(shù)據(jù)點基于參數(shù)tik、sik進行加權(quán)求均值,求解新的聚類中心公式為
(10)
1.1.2 評價指標體系構(gòu)建
依據(jù)改進模糊聚類算法聚類結(jié)果,構(gòu)建心理健康評估指標體系如圖1所示。通過學(xué)習(xí)、生活、未來發(fā)展3個方面的共計11項指標衡量大學(xué)生心理健康[13]。
圖1 大學(xué)生心理健康評估指標體系
(1) 針對評估對象確定指標論域A,
A={a1,a2,…,an}
(11)
其中,n表示評估指標數(shù),大學(xué)生心理健康的評估體系采用兩層結(jié)構(gòu)式,評估對象為大學(xué)生心理健康狀況,指標論域表示一級指標。
(2) 確定評估等級論域B,
B={b1,b2,…,bm}
(12)
其中,m表示評估等級數(shù),各等級與各模糊子集呈一一對應(yīng)的關(guān)系,一般m為奇數(shù),可方便利用其中間等級進行評估。評估標準B分別為優(yōu)秀、良好、一般、較差、差。
(3) 建立模糊關(guān)系矩陣C。針對待評估項目依次對所有評估指標進行量化,模糊關(guān)系矩陣C根據(jù)模糊子集各等級的隸屬度C(ai)確定
(13)
式中,C為從A到B的模糊關(guān)系,cij表示第i個因素獲取的第j種評估結(jié)果。
(4) 確定評估因素的模糊權(quán)向量D,
D={d1,d2,…,dn}
(14)
對于評估對象來說,所有的評估指標不具備相同重要性,每個因素對總體影響性不同。在模糊評估中,di表示ai對模糊自己的隸屬度,采用歸一化方法確定模糊權(quán)重,然后進行合成。
(5) 模糊評估結(jié)果向量E通過合成算子對D和C合成得到C中不同的行反映的是不同的指標對模糊子集的隸屬程度,對不同的行采用D進行綜合即得到所有等級模糊子集的隸屬程度,模糊綜合評估的模型為
=(e1,e2,…,en)
(15)
式中,C表示模糊變換器,用于指標論域A和評估等級論域B之間,每個模糊向量都能得到相應(yīng)的綜合評估結(jié)果E,評估過程如圖2所示。
圖2 模糊評估過程示意圖
(6) 分析模糊評估結(jié)果向量。每個大學(xué)生的心理健康評估結(jié)果為一個模糊評估值集合,與其他評估方法相比其結(jié)果中包含了更豐富的信息量,對心理健康指數(shù)的評估結(jié)果通過評估等級呈現(xiàn)在相對應(yīng)的數(shù)值集合上。模糊綜合評估模型的工作流程如圖3所示。
圖3 大學(xué)生心理健康模糊評估模型的工作流程
選取某高校為實驗對象,對該校近3年的3 600名應(yīng)屆畢業(yè)生進行心理普查、學(xué)生基本情況、社會支持度等歷史數(shù)據(jù)作為實驗數(shù)據(jù)集。利用本文評估方法對大學(xué)生心理健康進行評估,評估指標見圖1。邀請10位心理健康方面權(quán)威專家對每個治療進行打分,每位專家的平均值為二級指標評估結(jié)果。估計等級結(jié)合被評估學(xué)生心理健康狀況,評估標準如表1所示。為了驗證本文評估方法的有效性,分別采用文獻[8]和文獻[9]方法進行對比實驗。
表1 大學(xué)生心理健康評估標準
從3 600名大學(xué)生的歷史數(shù)據(jù)中選取1 000個數(shù)據(jù)樣本并將其分為5組數(shù)據(jù)集,采用3種方法分別進行數(shù)聚類性能測試,對比結(jié)果如圖4所示。由圖4聚類結(jié)果可知,隨著數(shù)據(jù)樣本個數(shù)的增多,3種方法所耗時間均呈上升趨勢,但是本文方法的聚類效果與文獻[8]方法和文獻[9]方法具有明顯的優(yōu)勢,耗時短,運動平穩(wěn),時間控制在0.1 s以內(nèi),這是因為本文方法在聚類方面獨具記憶存儲功能,能夠有效減少循環(huán)次數(shù),確保結(jié)果的穩(wěn)定性。
圖4 數(shù)據(jù)聚類對比結(jié)果示意圖
本文方法獲取各指標模糊權(quán)重明細如表2所示。
表2 大學(xué)生心理健康指標權(quán)重明細表
根據(jù)以上指標權(quán)重,計算獲取大學(xué)生心理健康各指標評分及相對應(yīng)綜合評估等級,評估結(jié)果如表3所示。
表3 大學(xué)生心理健康指標綜合評估結(jié)果
參考專家實際綜合評估結(jié)果,將表3的本文評估結(jié)果與文獻[8]和文獻[9]的評估結(jié)果進行對比,對比結(jié)果如表4所示。由表4可知,采用本文方法進行的大學(xué)生心理健康評估結(jié)果與實際評估結(jié)果一致,效果與兩種對比評估方法具有明顯準確率的優(yōu)勢,說明本文基于數(shù)據(jù)驅(qū)動的大學(xué)生心理健康評估方法切實有效,能夠為大學(xué)生心理健康的評估提供有力的參考價值。
表4 大學(xué)生心理健康評估對比結(jié)果表
綜合運用3種誤差評價指標,分別為平方均根差(RMSE)、歸一化方均根差(NRMSE)以及平均絕對百分比誤差(MAPE),確保評估效果檢驗的全面性與客觀性。
(16)
(17)
(18)
3種方法評估誤差比對結(jié)果如圖5所示。由圖5可知,3種方法的誤差結(jié)果中,本文方法的誤差值始終保持最低,RMSE、NRMSE和MAPE誤差值分別為0.276、0.382和0.468,表明本文方法的預(yù)測誤差最低,能夠滿足對大學(xué)生心理健康評估的需求。
圖5 誤差測試結(jié)果
大學(xué)生在面對學(xué)業(yè)、家庭和即將踏入社會的三重壓力之下,出現(xiàn)心理健康問題的逐年增多,通過對在校大學(xué)生近幾年的心理普查、學(xué)生基本情況、社會支持度等調(diào)查的歷史數(shù)據(jù),提出基于數(shù)據(jù)驅(qū)動的大學(xué)生心理健康評估方法,該方法通過改進模糊聚類算法和模糊綜合評估模型的高效結(jié)合,有效降低數(shù)據(jù)冗長的影響,減少計算循環(huán)次數(shù),確保結(jié)果的穩(wěn)定性,提升大學(xué)身心理健康評估指標的合理性和正確性,促使結(jié)果量化,方便對評估結(jié)果進行分析和比較,有效消減評估過程中人為因素的干擾,具有良好的客觀性和科學(xué)性。試驗結(jié)果表明,該方法能有切實有效地評估大學(xué)生心理健康狀況。在后續(xù)的研究中,可以針對調(diào)查問卷的編制進行合理性的加強,盡量保證所有問題都具有適用價值且符合實際情況,完善問題的選項全面問題。