何澤慧 張 戈 歐愛(ài)華
廣州中醫(yī)藥大學(xué)第二附屬醫(yī)院,廣東 廣州 510120
臨床療效是中醫(yī)學(xué)賴以生存和發(fā)展的基礎(chǔ),中醫(yī)臨床療效的評(píng)價(jià)一直是研究的熱點(diǎn)問(wèn)題。然而,目前尚未建立規(guī)范可行的中醫(yī)臨床療效評(píng)價(jià)的方法學(xué),成為中醫(yī)學(xué)廣泛應(yīng)用與國(guó)際化進(jìn)程中的短板[1-4]。
在幾千年的中醫(yī)臨床實(shí)踐中,療效評(píng)價(jià)的方法主要是由醫(yī)生主導(dǎo)來(lái)獲得患者報(bào)告的四診信息,結(jié)合醫(yī)生個(gè)人經(jīng)驗(yàn)來(lái)判斷臨床療效的優(yōu)劣。這種療效評(píng)價(jià)方法的特點(diǎn)是將疾病主要癥狀的改善作為療效的判定標(biāo)準(zhǔn)[5-7],醫(yī)生運(yùn)用“望聞問(wèn)切”四診方法對(duì)患者治療前后的病情進(jìn)行評(píng)估,以及療效進(jìn)行判定,判定方法為癥狀的改善,甚至消失,以及證候的轉(zhuǎn)歸等[8]??傊?,這種傳統(tǒng)上中醫(yī)療效評(píng)價(jià)的方法聚焦于癥狀和證候的療效評(píng)價(jià),側(cè)重患者的痛苦與不適,側(cè)重醫(yī)生個(gè)人經(jīng)驗(yàn),因此具有很大的主觀性,缺乏客觀統(tǒng)一的療效評(píng)價(jià)方法。
隨著時(shí)代的發(fā)展,中醫(yī)臨床療效評(píng)價(jià)方法與時(shí)俱進(jìn),其借鑒大量西醫(yī)療效評(píng)價(jià)中的客觀量化指標(biāo),同時(shí)結(jié)合中醫(yī)自身特點(diǎn),制定規(guī)范的臨床療效評(píng)價(jià)方法、過(guò)程和指標(biāo),包括證候量化評(píng)分、患者報(bào)告的癥狀積分等療效評(píng)價(jià)指標(biāo),納入中醫(yī)證候指標(biāo)的體現(xiàn)中醫(yī)特色的臨床療效評(píng)價(jià)體系正在形成。在2002年衛(wèi)生部制定了《中藥新藥臨床研究指導(dǎo)原則》(試行)[9],較全面的對(duì)證候診斷和療效評(píng)價(jià)指標(biāo)進(jìn)行了規(guī)范。其在借鑒西醫(yī)的療效評(píng)價(jià)體系基礎(chǔ)上,納入中醫(yī)證候指標(biāo),對(duì)證候診斷的主要癥狀進(jìn)行半定量化,將癥狀積分不僅用于證候診斷,而且用于治療前后療效的評(píng)價(jià)。此指導(dǎo)原則已在許多中醫(yī)臨床研究中廣泛使用。然而,此指導(dǎo)原則也存在許多問(wèn)題[10-11],如對(duì)證候主要癥狀的量化是否規(guī)范且具有權(quán)威性,癥狀分解和賦分信度、效度如何,證候主要癥狀能否同時(shí)作為療效評(píng)價(jià)指標(biāo)等問(wèn)題。這不僅是此指導(dǎo)原則存在的問(wèn)題,而且是目前整個(gè)中醫(yī)臨床療效評(píng)價(jià)方法研究所面臨的問(wèn)題。中醫(yī)與西醫(yī)從本質(zhì)上來(lái)源于不同的理論體系,將西醫(yī)療效評(píng)價(jià)方法照搬過(guò)來(lái)衡量中醫(yī)療效,存在盲目性,但如何尋求新的、符合中醫(yī)理論的療效評(píng)價(jià)方法仍需進(jìn)一步研究[12-13]。
關(guān)于中醫(yī)臨床療效評(píng)價(jià)的研究可分為兩部分[14],第一部分中醫(yī)臨床研究,第二部分中醫(yī)療效評(píng)價(jià)的基礎(chǔ)性問(wèn)題研究。第一部分中醫(yī)臨床研究隨著現(xiàn)代預(yù)防醫(yī)學(xué)中的臨床流行病學(xué)的發(fā)展,出現(xiàn)了大量借鑒或照搬西醫(yī)臨床設(shè)計(jì)的中醫(yī)臨床觀察、試驗(yàn)[15-17]。此類中醫(yī)臨床研究從病例納入排除標(biāo)準(zhǔn)、盲法和隨機(jī)分組、療效評(píng)價(jià)指標(biāo)、干預(yù)手段安全性、患者依從性、質(zhì)量控制和監(jiān)督等臨床研究過(guò)程環(huán)節(jié)均借鑒于西醫(yī)同類臨床試驗(yàn),僅在干預(yù)手段上將西醫(yī)變?yōu)榱酥嗅t(yī)藥。此類研究在一定程度上客觀反映了中醫(yī)藥療效,促進(jìn)了中醫(yī)藥療效被國(guó)際認(rèn)可,但尚存在許多問(wèn)題,例如,中醫(yī)的“同病異治、異病同治”理念如何體現(xiàn),西醫(yī)療效評(píng)價(jià)指標(biāo)是否適用于中醫(yī)。這類中醫(yī)臨床研究存在的問(wèn)題以及解決對(duì)策已有許多研究成果[18-20]。下面本文對(duì)第二部分中醫(yī)療效評(píng)價(jià)中的基礎(chǔ)性問(wèn)題進(jìn)行詳細(xì)闡述。
中醫(yī)與西醫(yī)在思維方式、診斷和治療措施上存在較大差異,因此在中醫(yī)臨床療效評(píng)價(jià)研究上有三個(gè)基礎(chǔ)性問(wèn)題需要面對(duì),即研究方法、評(píng)價(jià)指標(biāo)和分類標(biāo)準(zhǔn)3個(gè)問(wèn)題。
首先,研究方法上,雖然目前中醫(yī)臨床療效研究涌現(xiàn)出大量的隨機(jī)對(duì)照試驗(yàn)、病例對(duì)照研究、隊(duì)列研究、觀察性研究等,但是否有新的研究方法更適合中醫(yī)學(xué)特點(diǎn)、更能體現(xiàn)中醫(yī)個(gè)性化診療特點(diǎn)、更能體現(xiàn)中醫(yī)“同病異治、異病同治”理念、更能凸顯中醫(yī)天人相應(yīng)的思想,這些都值得我們深入研究。
其次,在評(píng)價(jià)指標(biāo)上,中醫(yī)在治療疾病過(guò)程中關(guān)注的癥狀、角度和環(huán)節(jié)與西醫(yī)學(xué)均不同,其療效評(píng)價(jià)指標(biāo)能否完全照搬西醫(yī)指標(biāo),尤其是一些醫(yī)生或患者報(bào)告的主觀指標(biāo)作為主要療效評(píng)價(jià)指標(biāo)時(shí)。在過(guò)敏性疾病、失眠、痛癥、皮膚病等以主觀評(píng)價(jià)指標(biāo)為主要結(jié)局的疾病中,如何有選擇性地納入醫(yī)生或患者報(bào)告的主觀指標(biāo),既能與西醫(yī)臨床評(píng)價(jià)指標(biāo)相接軌,使療效具有可比性,又能額外凸顯中醫(yī)治療效果的特色,這需要我們充分利用測(cè)量學(xué)理論與技術(shù),引進(jìn)和考評(píng)西醫(yī)療效指標(biāo),同時(shí)創(chuàng)造中醫(yī)特色的療效指標(biāo)。
最后,在分類標(biāo)準(zhǔn),如辨證標(biāo)準(zhǔn)、證候診斷標(biāo)準(zhǔn)和證候相關(guān)癥狀標(biāo)準(zhǔn)化等方面,是中醫(yī)藥特有的問(wèn)題[21],中醫(yī)“辨證論治”的核心思想,使得此類標(biāo)準(zhǔn)問(wèn)題與中醫(yī)治療措施和臨床療效密切相關(guān),因此標(biāo)準(zhǔn)相關(guān)的研究屬于中醫(yī)臨床療效評(píng)價(jià)研究的基礎(chǔ)問(wèn)題之一。
上述三個(gè)基礎(chǔ)性問(wèn)題中,筆者認(rèn)為評(píng)價(jià)指標(biāo)是其中的關(guān)鍵環(huán)節(jié),下面就中醫(yī)臨床療效評(píng)價(jià)指標(biāo)的現(xiàn)狀及思考進(jìn)一步闡述。
中醫(yī)臨床療效評(píng)價(jià)指標(biāo)是中醫(yī)臨床研究中的關(guān)鍵環(huán)節(jié)之一,評(píng)價(jià)指標(biāo)是否全面且準(zhǔn)確、是否具有優(yōu)良的測(cè)量學(xué)特性,成為中醫(yī)臨床療效評(píng)價(jià)的重要問(wèn)題[14,22]。在近年來(lái)的中醫(yī)臨床研究中,所采用的療效評(píng)價(jià)指標(biāo)復(fù)雜多樣,經(jīng)梳理后可觀察到幾個(gè)顯著特點(diǎn):①客觀與主觀指標(biāo)并存,以主觀指標(biāo)為主,多是基于證候診斷的主要癥狀體征;②有些中醫(yī)臨床研究照搬西醫(yī)背景下研制的患者報(bào)告結(jié)局(Patient-Reported Outcome, PRO),生存質(zhì)量量表(Quality of Life questionnaire, QoL)等;③針對(duì)個(gè)別病種,依托中醫(yī)理論,設(shè)計(jì)具有中醫(yī)特色的條目或量表作為療效評(píng)價(jià)指標(biāo),但規(guī)范化和量化不足,信度和效度未知。
大多數(shù)中醫(yī)臨床研究基于證候診斷的癥狀體征,通過(guò)癥狀積分治療前后的變化來(lái)進(jìn)行療效評(píng)價(jià)[1,9],此方法存在診斷指標(biāo)與評(píng)價(jià)指標(biāo)的混淆及賦分量化不規(guī)范等問(wèn)題,難以得到國(guó)際公認(rèn)。并且,在多達(dá)幾十個(gè)甚至上百個(gè)的中醫(yī)癥狀中,究竟哪些對(duì)療效的評(píng)估和測(cè)量是可靠的、準(zhǔn)確的,這些都是亟需解決的問(wèn)題。筆者認(rèn)為,對(duì)于主觀指標(biāo)的信度(可靠性)、效度(有效性)等的研究,需要借助心理測(cè)量學(xué)領(lǐng)域的經(jīng)典測(cè)量理論(Classical Test Theory, CTT)和項(xiàng)目反應(yīng)理論(Item Response Theory, IRT)來(lái)對(duì)條目進(jìn)行考評(píng)。
經(jīng)典測(cè)量理論由于直觀易懂、理論條件寬松等得到廣泛應(yīng)用。但不可否認(rèn),其在理論體系和方法體系上均存在嚴(yán)重缺點(diǎn):①測(cè)量真值與觀察值的線性關(guān)系這一假設(shè)難以成立;②信度只代表整個(gè)量表的平均測(cè)量精度,而不能反映單個(gè)條目的精度;③信度與效度一樣嚴(yán)重依賴于樣本,當(dāng)樣本的能力水平不同時(shí),計(jì)算出的信度效度就會(huì)不同[23]。項(xiàng)目反應(yīng)理論為克服這些缺點(diǎn)而被提出,并逐漸成為量表考評(píng)的熱門和主流方法。其在中醫(yī)領(lǐng)域的應(yīng)用也越來(lái)越多[24-26]。美國(guó)國(guó)立衛(wèi)生研究院自2004年以600萬(wàn)美元啟動(dòng)了以項(xiàng)目反應(yīng)理論為基礎(chǔ)的患者報(bào)告結(jié)局測(cè)量信息系統(tǒng)(Patient-reported Outcomes Measurement Information System, PROMIS)的構(gòu)建研究,力圖涵蓋并用于大多數(shù)慢性病的療效評(píng)價(jià),成為利用項(xiàng)目反應(yīng)理論研究患者報(bào)告結(jié)局這一領(lǐng)域的領(lǐng)跑者[27]。其中的Rasch模型是最常用的項(xiàng)目反應(yīng)理論模型之一。Rasch模型是項(xiàng)目反應(yīng)理論中的單參數(shù)logistic模型,由丹麥數(shù)學(xué)家Rasch提出,是目前被廣泛應(yīng)用的模型之一[28-30]。
Rasch模型建立了被試者潛在能力(橫軸)與對(duì)條目的回答(縱軸)之間的非線性關(guān)系,并以條目特征(難度difficulty)為模型參數(shù)[30-31]。具體到應(yīng)用于中醫(yī)療效評(píng)價(jià)指標(biāo)的考評(píng),療效指標(biāo)即為條目,被試者即為目標(biāo)疾病人群,潛在能力即為健康水平,因此,利用Rasch模型可以考評(píng)療效指標(biāo)的難度是否與目標(biāo)人群的健康水平相匹配。Rasch模型還能考評(píng)在治療前后兩次或多次測(cè)量中,療效指標(biāo)的模型參數(shù)有無(wú)差異,即是否存在條目功能差異。若療效指標(biāo)在治療前后功能存在差異,則不具備測(cè)量目標(biāo)人群健康水平改變的能力。因此,項(xiàng)目反應(yīng)理論中Rasch模型可以用于中醫(yī)臨床療效評(píng)價(jià)指標(biāo)的考評(píng)之中,來(lái)提高中醫(yī)臨床療效指標(biāo)對(duì)療效的測(cè)量精度。
隨著現(xiàn)代流行病學(xué)在中醫(yī)學(xué)中的應(yīng)用,中醫(yī)臨床療效評(píng)價(jià)研究得到了長(zhǎng)足的發(fā)展,已有許多??茖2?gòu)建了具有中醫(yī)特色的療效評(píng)價(jià)工具或量表,并用于臨床療效評(píng)價(jià),如銀屑病[32],冠心病心絞痛[33],肝癌[34],帕金森病[35]等。但仍未形成公認(rèn)的中醫(yī)臨床療效研究的方法學(xué)。筆者認(rèn)為,如何在遵循中醫(yī)學(xué)自身診療特點(diǎn)基礎(chǔ)上,創(chuàng)新性地構(gòu)建能夠科學(xué)評(píng)價(jià)中醫(yī)藥臨床療效的方法和標(biāo)準(zhǔn),是中醫(yī)藥現(xiàn)代化發(fā)展中的關(guān)鍵問(wèn)題。特別地,療效評(píng)價(jià)工具或量表的可靠性、有效性和適應(yīng)性是療效評(píng)價(jià)中的關(guān)鍵環(huán)節(jié),應(yīng)充分利用流行病與衛(wèi)生統(tǒng)計(jì)學(xué)、心理測(cè)量學(xué)中的先進(jìn)方法和技術(shù),對(duì)療效評(píng)價(jià)工具進(jìn)行考評(píng),有利于提升中醫(yī)療效評(píng)價(jià)研究的科學(xué)性和先進(jìn)性。