◎ 孫卓爾 尚志蕾 劉偉志 歐陽慧(海軍軍醫(yī)大學心理系基礎心理學教研室,上海 200433)
對于接受在校教育的青少年而言,大多數(shù)活動時間都是在學校環(huán)境中度過的。因此,做好學校心理健康教育工作、維護在校學生的心理健康至關重要。而開展心理測評,實現(xiàn)對學生群體心理狀況的有效監(jiān)控則是學校心理健康教育工作中的關鍵一環(huán),對于發(fā)現(xiàn)群體心理問題傾向,進而開展有針對性的心理健康教育工作,篩查心理問題風險個體,建立規(guī)范的學生心理健康檔案,以及在心理咨詢和輔導工作中更好地掌握來訪學生的心理現(xiàn)狀等具有重要意義[1-2]。
目前,國家相關部門已經出臺了部分政策和指導性意見,要求建立和完善學校心理健康監(jiān)測評估體系,以及時干預青少年心理健康問題。2020 年9月,國家衛(wèi)生健康委員會發(fā)布《探索抑郁癥防治特色服務工作方案》,明確“各個高中及高等院校將抑郁癥篩查納入學生健康體檢內容,建立學生心理健康檔案,評估學生心理健康狀況,對測評結果異常的學生給予重點關注”[3]。2021 年7 月,教育部在《關于加強學生心理健康管理工作的通知》中也提出了“定期開展學生心理健康測評工作,健全篩查預警機制,及早實施精準干預”等相關要求[4]。
利用各類專業(yè)化心理測量工具和技術協(xié)助開展學生心理健康測評目前已經相當普及。各高校新生入學后的心理測評已經基本實現(xiàn)全覆蓋,部分社會經濟較為發(fā)達的地區(qū)和城市的中小學也普遍開展了針對學生乃至教師和家長的心理測量[5]。隨著全國范圍內初等至高等各教育階段學校心理健康教育工作的專業(yè)化程度不斷提升,心理測量也日趨規(guī)范和完善。在一線心理測量的實操中已經開始注重測驗的標準化,并且認識到了測量誤差控制和測量結果信效度等對于開展學校心理測量工作的意義。
但是,目前學校心理健康測評工作的開展過程中依然存在專業(yè)性、科學性不夠的現(xiàn)象,特別是在測評工具的選擇方面,問題較為突出。例如,對中學生心理健康測評相關文獻進行研究發(fā)現(xiàn),學校心理測評中存在測量工具選擇不夠合理、合適的問題[6-7]。本文分析了學校心理測評中出現(xiàn)問題的常見原因,并提出了改進建議。
所有的測量工具都具有其適合的量程(range)。例如,在長度測量中,我們不會用直尺去測量操場的長度,也不會拿卷尺測量頭發(fā)絲直徑,因為這些測量對象顯然不適合直尺或卷尺的量程。但是在心理測量中,人們往往會忽視這一點。受測學生的某個心理特質是心理測量的對象,而心理特質也像長度等物理特征一樣有著極大的跨度范圍。以心理健康維度為例,有的個體心理彈性和情緒調節(jié)能力極強,不論經歷什么樣的挫折和困難都可以很快恢復積極的心態(tài),其心理健康水平位于特質軸上特別偏向“好”的一端的位置上;同樣,也有的個體罹患重度精神障礙,其心理健康水平位于特質軸上特別偏向“差”的一端的位置上,與前者在軸上的距離相去甚遠。就像長度測量工具往往只能覆蓋有限的量程范圍一樣,大多數(shù)心理測量工具也僅能夠覆蓋其測量的心理特質的一部分區(qū)間。因此,在開展心理測評時所選測量工具的量程必須與目標對象群體的整體心理水平相適配。
心理測量工具的量程不合適可能會造成很多不利后果。
一是心理測量的結果會出現(xiàn)天花板效應(ceiling effect)或地板效應(floor effect),導致整體結果集中在高分段或低分段,壓縮了測量結果的變異程度,進而影響測量結果的區(qū)分度和準確性。例如,90 項癥狀自評問卷(Symptom Check List 90,SCL-90)是目前在學校心理健康測評中廣泛使用的心理量表,該量表是從軀體化、抑郁、精神病性等多維度評估精神障礙癥狀程度的臨床心理量表,其量程在心理健康特質軸上應該在“疑似有精神障礙”到“中度或重度精神障礙”之間[8]。如果想基于該量表進行精神障礙的篩查,則目標群體就是可能患有精神障礙的個體,使用該量表是合適的;但如果想評估學生群體整體心理健康水平或一般心理問題傾向,該量表并不適用,因為對于學生群體而言,心理問題大部分集中表現(xiàn)在學習、交往、情緒狀態(tài)和社會適應性等方面,并且多數(shù)屬于發(fā)展性問題,僅少數(shù)屬于障礙性問題[9]。學生群體中的絕大多數(shù)心理健康水平會比SCL-90 適用的量程上限更好,如果用該量表施測,則結果會主要集中于低分段,難以進行實質性分析。
二是心理測量的實施是向受測學生提供標準化刺激(題目描述)并采集受測學生相應的行為反應(作答記錄)的過程,受測學生的心理活動本身也會受到測量過程的影響,而測驗量程與測驗題目表述往往密切相關,測驗量程不適配則該測驗表述通常也不適宜展示給受測學生。如果將這樣的測驗給低年級學生群體用,則可能會對受測學生造成一定的心理傷害,甚至可能引發(fā)惡性的群體心理事件。
例如,2021 年11 月,上海市某區(qū)在本區(qū)小學組織開展的心理健康測評中,就選用了貝克自殺意念量表(Beck Scale for Suicide Ideation,BSS)作為測評工具之一。該量表適用對象為可能存在抑郁等精神障礙且可能存有自殺意念的群體,因此其中含有大量類似“最近一周為了自殺,你的準備行動完成得怎么樣”的表述。使用該量表施測對于心智發(fā)展尚不成熟的小學生群體可能會起到負面的誘導作用,也引發(fā)了很多家長的擔憂。最終,該事件在媒體報道和互聯(lián)網(wǎng)討論中不斷發(fā)酵,發(fā)展成為公眾輿論事件,造成了較為惡劣的影響。
絕大多數(shù)心理測驗分數(shù)的意義都是靠測驗參照賦予的。按照測驗參照的不同,心理測驗可以分為標準參照測驗(Criterion-Referenced Test)和常模參照測驗(Norm-Referenced Test)[10]。其中,部分臨床心理測驗和成就測驗等屬于標準參照測驗,其余常用心理測驗大都為常模參照測驗。常模(norm)是根據(jù)標準化樣本的測驗結果,經過一定的統(tǒng)計處理建立起來的測驗結果評價參照系。常模參照測驗的實質就是將受測對象放到其所在的群體中來確定其在某心理特質上的相對位置。但群體的心理特征并非長久穩(wěn)定的,也會隨社會經濟文化的發(fā)展發(fā)生變化,因此常模也應隨群體的變化而不斷更新。根據(jù)心理測量學的要求,心理測驗的常模一般每5 至10 年就應重新制定[10]。但目前學校心理測量工作中常用常模參照測驗的本土化常模大部分是于20 世紀80 至90 年代制定的,以常用的人格測驗工具艾森克人格問卷(Eysenck Personality Questionnaire,EPQ)為例,其簡式中國版常模由錢銘怡等于20 世紀90 年代末修訂[11]。類似這些心理測驗的常模已經過于老舊,無法跟上我國日新月異的社會發(fā)展,不適宜在心理測量工作中繼續(xù)使用。
對于基于問卷的心理測量而言,受測學生認真如實作答是測量有效性的根本前提。如果受測學生因為某些原因提供了不準確的答案,心理測量的結果也就變成了空中樓閣。在學校心理測評的實施中,確實存在一些因工具選擇不當而影響受測學生作答真實性的問題。
一是使用的測驗過于冗長。不少教師在開展學校心理測評工作時,使用的測驗工具包含的題目數(shù)量本就很多,有時為了增強測量的全面性和信度水平,還會將多個心理測驗合并施測,總施測題目數(shù)量一般在100 項以上,學生要花20~40分鐘才能完成,低年級學生由于理解能力等方面的限制,可能花費的時間更長。學生在作答時,注意力難以做到長時間集中,往往會出現(xiàn)不認真讀題、隨機作答或選擇固定選項應付了事的情況,這就使得心理測量結果變得毫無意義。即便使用了如明尼蘇達多相人格測驗(Minnesota Multiphasic Personality Inventory,MMPI)等包含效度分量表的測驗,也僅能在一定程度上區(qū)分作答是否有效,并不能起到校正無效結果的作用。因此,控制題目數(shù)量以保證受測學生的注意維持使其能夠認真作答的實際效果,遠優(yōu)于提供大量題目但受測學生隨意應付作答的情況。
二是過于依賴自評測驗。目前,學校心理測評中使用的絕大多數(shù)都為自評測驗,即受測學生就是評估的對象,根據(jù)測驗題目和自身實際情況自行作答。在接受心理健康方面的篩查時,受測學生可能存在的掩飾會有意或無意地直接影響作答過程,造成測量結果的偏差。
在立足既有心理測驗開展學校心理測評工作時,應進一步加強測驗選擇的科學化和規(guī)范化。一般來說,按照以下五步流程就能夠選出合理、適用的工具。
1.根據(jù)心理測評的目的確定需要測量的心理特質,如心理健康、智力、人格等,并找出盡可能多的針對目標特質進行測量的心理測驗作為備選。
2.考慮備選心理測驗的量程和題目描述是否適合學生群體。
3.查看備選心理測驗的參照是否更新及時,如果確實沒有新近修訂的參照工具,在排除其他因素的情況下可優(yōu)先選擇標準參照測驗。因為標準參照測驗中標準的建立通?;谳^為確定的專家共識,相對于常模參照有更好的穩(wěn)定性。
4.根據(jù)測驗使用手冊評估備選測驗結果信效度是否在可以接受的范圍。
5.考慮備選測驗的題目數(shù)量,盡可能選擇簡短的測驗。
目前,我國針對在校學生群體的心理測評工具較為缺乏,有針對性地開發(fā)新的心理測驗,是解決學校心理測評工具選擇問題的更為理想的方案。即便是中國中學生心理健康量表這樣專門針對我國中學生群體編制的心理健康測驗,其測量內容也是以強迫、抑郁等精神障礙因子為主,并未涵蓋前文所述的更為關鍵和普遍的發(fā)展性問題[12]。因此,新的學校心理測評工具的開發(fā)勢在必行。
新的學校心理測評工具的開發(fā)應該遵循以下三個原則:
一是繼承現(xiàn)有工具的優(yōu)點。經典心理測驗經過長期使用和多次修訂,通常具有測驗結構清晰、施測信效度好、配套手冊完善等特點。在編制新的測驗時,應借鑒經典心理測驗對于特質結構的分析和典型表現(xiàn)的表述,在此基礎上進行適應我國學生群體的改編和拓展,可以更好地提供開發(fā)思路,保證開發(fā)質量,降低開發(fā)成本。
二是采用新測量理論和測評技術。新的學校心理測評工具應是基于項目反應理論(Item Response Theory,IRT)的計算化自適應測驗(Computerized Adaptive Testing,CAT)平臺,可以通過手機、智能平板、電腦等個人智能終端設備訪問。其特點是受測學生在完成每一道或每一組題目后,測評程序會重新評估受測學生的特質水平,然后根據(jù)其特質水平呈現(xiàn)最適合的后續(xù)題目。這一技術可以通過提供更加合適的題目減少測驗所需的題目數(shù)量,能夠較好地克服測驗冗長的問題,達到精簡測驗長度的目的[13]。而且此類平臺可以不斷更新測驗模型和參照,如在使用時借鑒美國教育測試服務機構(Educational Testing Service,ETS)編制的學業(yè)測驗的方法,在每一次施測的過程中對已有的和新的測驗題目模型和常模進行驗證和完善。同時,該方法還便于利用技術手段提高學校心理測評工作的保密性。
三是頂層統(tǒng)籌指導實施。不論是項目反應理論測驗模型的建立,還是計算機化自適應測驗平臺的建設,都具有前期投入和初始成本較高,但邊際成本很低的特點。因此,建議工具的開發(fā)建設應由省級以上教育主管部門牽頭組織,以提供較強的技術和資金支持,在平臺建成后以公共服務的形式向各級學校開放使用。
在短期內無法獲得特別適合的心理測評工具的情況下,也可以借鑒360 度評估技術,采用他評與自評相結合的方式開展學校心理測評。360 度評估是組織行為學中常用的評估技術,指由員工自己、上司、下屬、同級同事,乃至顧客等從全方位、多角度對員工進行評估的方法[14]。
心理測評其實只是以低成本快速了解測評對象心理狀況的妥協(xié)性手段,因此只要能夠達到了解目標群體心理的目的,并非一定要實施心理測評。當缺乏合適的工具直接實施自評測驗時,通過問詢測評對象的熟人其在一些關鍵表現(xiàn)和線索上的情況,同樣可以取得較好的效果。例如,關于自殺意念和自殺行為的監(jiān)測,可通過對學生開展心理健康教育,使學生了解自殺前常見表現(xiàn),之后通過學生間互助提供自殺預警,反而優(yōu)于使用貝克自殺意念量表等工具進行篩查的效果[15]。因此,在學校心理測評工作中,應重視學生中心理骨干、心理委員或學生心理社團隊伍的培訓,從學生群體內部入手,增進對學生心理健康狀況的了解和掌握,實現(xiàn)心理問題相關風險的提前預警。
心理測評作為學校心理健康教育工作中的重要一環(huán),其科學化和規(guī)范化應得到進一步加強。而測評工具的選擇作為心理測評中的關鍵環(huán)節(jié)之一,理應得到高度重視。針對當前學校心理測評工具選擇中存在的一些實際問題,學校心理健康教育工作的管理指導者和一線教師都應立足自身崗位資源,提升和完善個人和體系的專業(yè)化程度,以提高心理測評服務學校心理健康教育工作的實效。