王玉琳,張亞珂,李超然,劉佳,李俊辰,楊添淞,張琳,馮楚文,王更宏
輕度認知功能障礙(mild cognitive impairment,MCI)指認知功能下降快于年齡和文化程度相應(yīng)的預(yù)期下降,但不足以造成日常功能的顯著損害,是介于正常衰老與癡呆間的一種不穩(wěn)定的臨床過渡狀態(tài)[1]。隨著全球老齡化進程的加快,本病的發(fā)病率日漸攀升,最新一項針對我國46 011 例≥60 歲成年人的全國性橫斷面研究數(shù)據(jù)顯示[2],我國MCI總體患病率達15.5%。在MCI發(fā)病的3~5年后,有21.8%進展為癡呆癥,MCI患者發(fā)生阿爾茨海默病(Alzheimer’s disease,AD)的可能性是正常老年人的2.8 倍;眾所周知,癡呆癥所伴發(fā)的病理變化難以逆轉(zhuǎn),中后期療效差,給患者個人及其家人帶來心理、生理及經(jīng)濟壓力[3],所以早期準確診斷與干預(yù)在控制MCI進展,為個人、家庭、社會減負,增加國民幸福度中起關(guān)鍵作用。
根據(jù)MCI的診斷指南[4],本病的主要診斷以臨床癥狀為主,以量表篩查為主要手段。盡管神經(jīng)心理學(xué)評估(neuropsychological assessment,NPA)是認知評估的金標準,但由于時間限制和專家管理所需的成本,在臨床環(huán)境中并不常用。簡短的篩查工具為臨床醫(yī)生提供了可行的選擇,雖然無法完全替代NPA,但可以提供關(guān)鍵認知領(lǐng)域的功能指標并指導(dǎo)進一步評估。
縱觀國內(nèi)研究,針對MCI 的研究中使用最多的量表仍然是簡易智力狀態(tài)檢查量表(Mini-mental State Examination,MMSE),但國內(nèi)外各項研究均表示,MMSE 的篩查特異性、敏感性低于其他新量表,且有很明顯的地板效應(yīng)與天花板效應(yīng)。目前各種各樣的替代量表層出不窮,而臨床應(yīng)用卻很局限。本文對常用的MCI 篩查評價量表進行綜合論述,提供各量表的原始文獻、臨床應(yīng)用臨界值,并分析對比各量表特點及適宜人群,以便為MCI的臨床診療、研究選取合適的量表提供實用參考。
這部分量表常作為門診快速診斷與篩查量表,具有簡短便捷易操作的特點,包括MMSE、蒙特利爾認 知 評 估 量 表(Montreal Cognitive Assessment,MoCA)、快速輕度認知障礙篩查記錄表(Quick Mild Cognitive Impairment screen,Qmci)及專門針對低學(xué)歷人群、文盲開發(fā)的Phototest量表。
MMSE 為 Flistein 等[5]于 1975 年開發(fā),問世以來在國內(nèi)外得到推廣普及,目前已經(jīng)有100多種語言版本。中文版本的MMSE(Chinese MMSE,CMMSE)于1983 年開發(fā),在中國的大規(guī)模流行病學(xué)研究中被用作癡呆癥、認知功能障礙的篩查工具,CMMSE 在中國社區(qū)居民中具有合理的敏感性和特異性[6]。
MMSE的優(yōu)點為簡單、易操作,是目前知名度最高,流傳最廣泛,研究最多的量表。另外,MMSE 信度良好,聯(lián)合檢查的組內(nèi)相關(guān)系數(shù)為0.99,相隔48~72 h 重測,組內(nèi)相關(guān)系數(shù)可達0.91,用于隨訪敏感[7]。但MMSE總分易受到年齡、教育程度、文化背景甚至人種的影響,不僅文化程度較高的患者易出現(xiàn)“天花板效應(yīng)”,即可能出現(xiàn)假陰性,而且文化程度較低的人群也易出現(xiàn)“地板效應(yīng)”,即可能出現(xiàn)假陽性。另外,Mitchell[8]經(jīng)過文獻薈萃分析提出,MMSE 區(qū)分MCI 患者和健康參與者的能力非常有限。Pinto 等[9]研究提出,在篩查診斷MCI 方面,MoCA 優(yōu)于MMSE。
此外值得注意的是,MMSE 中的單個項目及其得分與相應(yīng)的認知領(lǐng)域并不能完全劃等號,其與相應(yīng)的神經(jīng)心理測驗的相關(guān)性非常低[6]。如MMSE 中物體命名不等同于語言(命名)能力,如果該項目得分較差,只能提示語言能力可能存在障礙,還需要采用針對該結(jié)構(gòu)領(lǐng)域的量表進一步診斷,如波士頓命名檢測。
中文版MMSE依據(jù)不同教育程度做出的臨界值為,文盲組17 分、小學(xué)組20 分、中學(xué)或以上組24 分,低于該值為認知功能受損[6]。2011 年上海華山醫(yī)院洪震課題組[10]通過大樣本研究又提出MMSE劃界值按照受教育時長:文盲≥20 分,1~5 年≥23 分,6 年以上≥27分。人群隨訪中MMSE下降≥2或3分被認為具有病理意義。
MoCA 為 Nasreddine 等[11]于 2004 年開發(fā),自問世以來被用于檢測不同種族及地區(qū)人群的認知功能障礙。此外基于該量表,已經(jīng)開發(fā)出適用于視力障礙、聽力障礙患者的版本,使其臨床應(yīng)用更加廣泛[12]。目前MoCA 在國內(nèi)被翻譯成多個版本,較常用的有2006年解恒革等翻譯修訂的北京版MoCA和2010年涂秋云等翻譯修訂的長沙版MoCA。
MoCA為解決MMSE的局限性而開發(fā),它較MMSE能更敏感地識別輕微的認知損傷,其檢測MCI 的敏感性為90%,檢測輕度AD 的敏感性達100%[11]。如Siqueira 等[13]通過對全球范圍文獻研究提出,在識別認知能力下降的早期階段,MoCA的敏感性優(yōu)于MMSE。但對于文盲與低教育水平的老人,該量表中的一些項目并不適合,如模仿立方體和畫鐘試驗對于沒有書寫經(jīng)驗的老人而言較困難,連線和相似性的指導(dǎo)語也不易為他們所理解。另外,MoCA項目分并不反映相應(yīng)的認知領(lǐng)域,如MoCA的簡短連線項目和相似性項目與完整的連線測驗和相似量測驗相關(guān)性極低[6]。
根據(jù)開發(fā)者 Nasreddine 等提出,MoCA 總分為 30 分,26 分是認知功能障礙出現(xiàn)的劃界值,低于26分可能患有認知功能障礙,受教育年限≤6(或12)年者總分加一分。但是,MoCA臨界值及評估結(jié)果容易受教育水平、年齡、文化背景等諸多因素影響,不同國家地區(qū)的臨界值存在差異,如O'Driscoll 等[14]提出在不同的文化背景下,MoCA篩選MCI的建議臨界值范圍很廣。
在我國,對北京版 MoCA 的研究如下:Lu 等[15]將 MoCA 應(yīng)用于8 411例65歲以上的中國社區(qū)居民,提出最佳分界點為:文盲=13/14,6 年≥教育時長≥1 年=19/20,受教育時長>7 年=24/25。在最佳臨界值的情況下,MoCA對MCI的敏感性為80.5%,對癡呆癥的敏感性為96.9%,而識別健康認知的特異性為82.5%。這些表明在最佳臨界值的情況下,MoCA可有效篩查中國社區(qū)中老年人的認知障礙。
自2019 年9 月1 日起,MoCA 官方網(wǎng)站對使用者進行強制性培訓(xùn)和認證,以提高臨床操作的準確性和得分的可靠性。這些進展將對MoCA 在檢測MCI 和癡呆癥方面的敏感性和特異性產(chǎn)生何種影響尚待觀察。
Qmci 為加拿大 O'Caoimh 等[16]創(chuàng)立,是 AB 認知篩查 135(ABCS 135)[17]的修改版,強調(diào)ABCS 135 的子測試延遲回憶和口語流利度,同時增加了邏輯記憶任務(wù)和新的評分系統(tǒng),旨在提高其檢測MCI 的敏感性;同時,最大程度地減少與MMSE 相關(guān)的天花板效應(yīng)[18]。子測試邏輯記憶任務(wù)部分涉及即刻回憶故事,并根據(jù)記憶的關(guān)鍵詞數(shù)量進行評分,在篩選MCI 方面顯示出最大的敏感性和特異性,為Qmci的特色所在。而新加的評分系統(tǒng)優(yōu)勢在于,可根據(jù)子測驗的效用對子測驗進行加權(quán),以衡量認知能力下降的不同階段的變化[19]。
Qmci已在世界范圍內(nèi)先后以多種語言進行了翻譯和驗證,顯示出不同文化背景下區(qū)分MCI 與正常認知的高度靈敏度(0.76~0.92)和特異性(0.72~0.95)。其中,O'Caoimh 等[20]研究表明,Qmci在區(qū)分MCI與正常認知方面較MMSE和ABCS 135更敏感。最近的系統(tǒng)綜述和薈萃分析[20]發(fā)現(xiàn),它與其他檢測MCI的簡短量表相比,具有更出色的敏感性與特異性,其檢測MCI的準確度高于MMSE與MoCA。
Qmci 目前尚缺乏相對全面的研究與測評,它是MCI 篩查領(lǐng)域中一個有希望的新成員。Iavarone等[21]在意大利語版Qmci(Qmci-I)針對307 例健康受試者的規(guī)范研究中提出,年齡與教育變量對總體Qmci-I得分表現(xiàn)出顯著的影響,其中對子測驗邏輯記憶的影響最大。Bunt等[22]在驗證該量表的有效性的同時提出,Qmci 可準確區(qū)分健康受試者與認知損傷者,但在區(qū)分MCI與AD時缺乏特異性。
Qmci 量表包括6 個子測試項目,總分100 分,臨界值<63/100 為認知功能損害,此時靈敏度為85%,特異性為85%[19]。臨界值<62/100時,對認知障礙的敏感性為83%,特異性為87%。
Phototest 為 Carnero-Pardo 等[23]針對低學(xué)歷人群、文盲開發(fā)的用于篩查MCI 及癡呆癥的簡易量表,內(nèi)容包括三個部分:命名任務(wù)、口語流利度與情境記憶;適用于基層醫(yī)療中心,完成測試只需約3 min,高效實用且不受教育程度的影響[24]。
Carnero-Pardo 等[25]對 Phototest 與 Eurotest、記憶改變測試(M@T)這兩種同樣適用于低文化水平的簡短篩查量表進行診斷準確性、有效性與成本分析提出,Eurotest、記憶改變測試(M@T)和Phototest具有同等效力。Eurotest和Phototest都是較便宜的選擇,但Phototest 最有效,所需時間最短。Russo 等[26]在Phototest對阿根廷人民檢測認知障礙和癡呆癥的診斷準確性研究中提出,Phototest 在識別MCI 方面的準確性優(yōu)于傳統(tǒng)的MMSE和畫鐘試驗(clock drawing test,CDT),同時,Phototest與MMSE 和CDT 有很強的相關(guān)性。這些分析支持標準有效性和總Phototest 評分篩查整體認知障礙的能力。Burke 等[27]在西班牙語國家的老年人群中研究發(fā)現(xiàn),Phototest在快速檢測MCI中,速度與效率比MMSE、MoCA更優(yōu)良。
MCI 的Phototest 臨界值為28/29 分,癡呆的臨界值為26/27分,對于癡呆和MCI 分別具有足夠的判別效度,敏感性和特異性達90%[23]。
這部分量表既可作為較細致的篩查量表,又可作為評價量表,用于臨床評價,包括Addenbrooke’s 認知功能檢查第三版(Addenbrooke’s Cognitive Examination-Ⅲ,ACE-Ⅲ)中文版和圣路易斯大學(xué)精神評估量表(Saint Louis University Mental Status Examination,SLUMS);量表包含的每個子項目均獨立可靠,代表特定的認知功能,在臨床療效觀察應(yīng)用中可更加敏感細致地體現(xiàn)治療結(jié)果。
ACE 是英國劍橋大學(xué) Hodges 等[28]于 20 世紀 90 年代編制,起初ACE 及ACE 修訂版的評估內(nèi)容包含MMSE,因而可同時得到ACE 和MMSE 兩部分的評分。2013 年,為使ACE 更具獨立性,在ACE-R基礎(chǔ)上,將MMSE內(nèi)容從量表中去除,進而發(fā)展為ACE-Ⅲ。中文版ACE-Ⅲ是在ACE-R的基礎(chǔ)上,由王剛和黃越翻譯修訂,評分指南由陳生弟、章軍建和熊麗翻譯修訂。
ACE-Ⅲ問世以來,先后以西班牙語、英語、中文、意大利文、葡萄牙文等驗證了在不同臨床背景下的高診斷準確性。Fang等[29]在運用ACE-Ⅲ篩選MCI 與AD 的研究中提出,中文版ACE-Ⅲ是一種可靠的認知障礙評估工具,其具有良好的可靠性(同類相關(guān)系數(shù)ICC=0.994,重測ICC=0.967)以及可靠的內(nèi)部一致性(α=0.859);ACE-Ⅲ篩選aMCI 的敏感性優(yōu)于MMSE,臨界值為 85/86 分。Li 等[30]將 ACE-Ⅲ中文版與 MMSE、MoCA 進行對比提出,ACE-Ⅲ具有良好的內(nèi)部一致性和收斂效度,并在檢測MCI方面明顯優(yōu)于MMSE和MoCA。同樣,該量表不可避免地受文化程度、年齡等變量的影響,有學(xué)者提出,對于中高文化水平的患者而言,ACE-Ⅲ的篩查準確性與特異性明顯優(yōu)于MMSE,而對于文化程度較低的患者,ACE-Ⅲ并不優(yōu)于MMSE[31]。
ACE-Ⅲ滿分100 分,原作者推薦兩個劃界值(88 分和82分)[28]。將88 分作為劃界值時,該量表識別癡呆的敏感性高(94%);將82分作為劃界值時,可以得到較好的特異性(100%),但敏感性降低(84%)。
ACE-Ⅲ由26個獨立部分組成5個子項目,每個項目代表了一個特定的認知功能:注意力和定向力(18分)、記憶力(26分)、詞語流暢性(14分)、語言(26分)和視空間能力(16分)。有研究提出,ACE-Ⅲ具有良好的內(nèi)部一致性(α=0.824),五個子測驗的內(nèi)部一致性系數(shù)分別為:注意力0.788、記憶力0.744、流利度0.772、語言0.702、視覺空間能力0.740,這表明ACE-Ⅲ的每一項子測試均獨立可靠[30]。
ACE-Ⅲ作為MCI 較詳實的評價量表,近來不斷被翻譯成各國語言廣泛應(yīng)用,更有North等[32]對ACE-Ⅲ量表進行改編(即HI-ACE-Ⅲ),以使其適用于聽力障礙患者的認知篩查,并初步驗證了該表在聽力障礙患者中的可靠性、有效性與篩查效用。
SLUMS由Morley和Tumosa于2002年開發(fā),在北美廣泛用于評估老年人和癡呆癥患者的認知功能。該量表包含11項,分為6 個子項,包括方向、記憶、執(zhí)行功能、注意力、視覺空間技能和畫時鐘圖,其格式與MMSE 相似,但它為MMSE 補充了增強任務(wù),包括注意力、數(shù)值計算、即時和延遲回憶、動物命名、數(shù)字跨度、鐘表繪制、圖形識別等,旨在解決MMSE在篩查高知識水平患者所遇到的“天花板效應(yīng)”這一局限性。
Tariq等[33]在針對MMSE、SLUM篩查認知障礙的對比研究中提出,SLUM可能更適合于檢測MMSE未能檢測到的輕度神經(jīng)認知障礙,在篩查MCI 方面,SLUM 比MMSE 更加準確、靈敏;而在區(qū)分 AD 與 MCI 時,MMSE 更勝一籌。Cao 等[34]運用SLUMS 篩查中國老年患者的認知障礙,發(fā)現(xiàn)SLUMS 評分與MoCA 和MMSE 評分高度相關(guān)。Zhang 等[35]運用中文版SLUMS檢測腦外傷患者認知障礙中的有效性和可靠性的初步研究中提出,中文版的SLUMS具有令人滿意的內(nèi)部一致性(α=0.723)、出色的間信度(ICC 0.990~0.998)和評估者內(nèi)信度(ICC 0.968)、良好的有效性、很高的敏感性和特異性。它可用于篩查中國腦外傷患者認知障礙。同樣,Yang等[36]針對中文版SLUM特異性與敏感性研究提出,中文版SLUM適用于中國人群認知功能的篩選。但該量表尚缺乏臨床大樣本研究的數(shù)據(jù)支持。
SLUM總分30分,對于未受過高中教育的老年人正常分數(shù)為25~30分,20~24分表示MCI(敏感性/特異性為0.92/0.81),1~19 分表示各種程度的癡呆(敏感性/特異性為1.0/0.98);對于高中或更高學(xué)歷的老年人,正常分數(shù)為27~30,21~26 分表示MCI(敏感性/特異性分別為0.95/0.76),1~20分表示癡呆(敏感性/特異性分別為0.98/1.0)[33]。
MCI 發(fā)病率高,起病隱匿,以記憶輕度損害為前驅(qū)癥狀[37],是介于正常衰老與癡呆間的一種不穩(wěn)定的臨床過渡狀態(tài),易向癡呆進展,故早期準確診斷、及時干預(yù)是本病治療的關(guān)鍵,也是降低癡呆發(fā)病率的關(guān)鍵??v觀國內(nèi)研究,臨床篩查診斷使用最多的仍然是MMSE,量表使用單一,正如Cullen 等[38]的評論所述,不可能有一種完美的量表可用于每個人群及所有類型的神經(jīng)退行性疾病,各量表各有偏倚,各有優(yōu)缺點,單一量表使用并不能有效規(guī)避量表自身的缺點,甚至造成研究結(jié)果的偏差,臨床應(yīng)用中應(yīng)根據(jù)具體需求,選擇合適的評價量表,方能事半功倍。
本文大致將常用的MCI篩查評價量表分為兩大類:①簡易篩查量表:這類量表具有簡短便捷易操作的特點,包括MMSE、MoCA、Qmci 及 Phototest;MMSE 作為臨床使用歷史最長的老牌經(jīng)典量表,流傳度廣,普及度高,但不可避免的有一些局限性,如“天花板效應(yīng)”、“地板效應(yīng)”,并對MCI 的篩查敏感度與特異性較低;后來的MoCA、Qmci及Phototest針對MMSE的局限性、針對篩查MCI而開發(fā),這其中,MoCA臨床應(yīng)用度最廣,對MCI篩查的靈敏度與特異性明顯高于MMSE,但由于MoCA評估結(jié)果易受教育程度、年齡、文化背景等諸多因素影響,不同國家地區(qū)的臨界值存在差異。Qmci是ABCS 135的修改版,旨在提高其檢測MCI 的敏感性,是臨床快速檢測MCI 的理想簡短量表;Phototest為針對低學(xué)歷人群、文盲開發(fā)的檢測MCI及癡呆的簡易量表,適用于基層醫(yī)療中心,不受教育變量的影響。②細致評價量表:這類量表在臨床中既可以用于細致篩查診斷,也是理想的評價量表,包括ACE-Ⅲ和SLUMS;ACE-Ⅲ量表由26個獨立部分組成5個子項目,每個項目代表了一個特定的認知功能,且每一項均獨立可靠。SLUM量表格式與MMSE相似,但它又補充增強了MMSE的一些項目,更有利于對MCI的篩查與評價。