鄭州大學(xué)公共衛(wèi)生學(xué)院(450001) 尚小平 楊永利 施學(xué)忠
隨機(jī)對照臨床試驗(yàn)論文統(tǒng)計(jì)質(zhì)量評價(jià)量表的建立
鄭州大學(xué)公共衛(wèi)生學(xué)院(450001) 尚小平 楊永利 施學(xué)忠△
目的編制隨機(jī)對照臨床試驗(yàn)論文統(tǒng)計(jì)質(zhì)量評價(jià)量表,并對量表進(jìn)行信度、效度和可接受性評價(jià)。方法采用Delphi法和小組討論法確定量表的條目池及評分標(biāo)準(zhǔn),采用分層隨機(jī)抽樣的方法,分別從2008年發(fā)表的隨機(jī)對照臨床試驗(yàn)論文中,選取非核心期刊論文50篇,核心期刊論文50篇,SCI論文34篇。對量表進(jìn)行內(nèi)部一致性信度、重測信度、評價(jià)者間一致性信度和區(qū)分效度的考核。結(jié)果 量表的內(nèi)部一致性信度系數(shù)為0.801,各條目重測信度和測評者間信度測定kappa一致性系數(shù)均大于0.75。量表區(qū)分效度較好,能夠?qū)?種類型的期刊論文區(qū)分開來(F=173.81,P<0.001),非核心期刊論文(60.20±4.68)分,核心期刊論文(65.68±8.44)分,SCI期刊論文(86.91±6.06)分。結(jié)論 該研究形成的量表信度、效度和可接受性均較好,可用于隨機(jī)對照臨床試驗(yàn)論文的統(tǒng)計(jì)質(zhì)量評價(jià),也可為科研工作者撰寫規(guī)范的制訂提供借鑒。
隨機(jī)對照臨床試驗(yàn) 統(tǒng)計(jì)質(zhì)量 信度 效度
△通訊作者:施學(xué)忠,E-mail:xzshi@126.com
醫(yī)學(xué)論文,尤其是臨床研究性論文的質(zhì)量和水平取決于該研究的創(chuàng)新性、科學(xué)性和實(shí)用性,而這些性質(zhì)的準(zhǔn)確體現(xiàn)與醫(yī)學(xué)統(tǒng)計(jì)學(xué)在研究設(shè)計(jì)和成果表達(dá)上的正確應(yīng)用密切相關(guān)。在閱讀文獻(xiàn)時(shí),經(jīng)常發(fā)現(xiàn)醫(yī)學(xué)論文中存在著統(tǒng)計(jì)學(xué)問題,包括研究設(shè)計(jì)缺陷、統(tǒng)計(jì)描述指標(biāo)不合適、統(tǒng)計(jì)分析方法與研究目的不吻合、忽略統(tǒng)計(jì)方法的模型假設(shè)、統(tǒng)計(jì)圖表應(yīng)用錯(cuò)誤或不規(guī)范以及統(tǒng)計(jì)學(xué)術(shù)語不規(guī)范等〔1〕。近年來,有學(xué)者建立了醫(yī)學(xué)論文統(tǒng)計(jì)質(zhì)量評價(jià)量表,但其條目僅為是或否的二分類〔2-4〕。研制一個(gè)評分刻度精細(xì),評分標(biāo)準(zhǔn)明確的隨機(jī)對照臨床試驗(yàn)論文評價(jià)量表,對論文的統(tǒng)計(jì)質(zhì)量進(jìn)行科學(xué)評價(jià),十分必要。作者采用5級(jí)評分法,編制了一個(gè)涵蓋統(tǒng)計(jì)設(shè)計(jì)、統(tǒng)計(jì)過程和統(tǒng)計(jì)報(bào)告3個(gè)維度的隨機(jī)對照臨床試驗(yàn)論文統(tǒng)計(jì)質(zhì)量評價(jià)量表。
(1)明確研究目的和量表的適用范圍
該研究的目的是編制一份適用范圍是隨機(jī)對照臨床試驗(yàn)論文統(tǒng)計(jì)學(xué)質(zhì)量評價(jià)量表。
(2)設(shè)立專家咨詢組
所咨詢的專家包括流行病學(xué)專家、統(tǒng)計(jì)學(xué)專家、臨床研究人員和醫(yī)學(xué)科技期刊編輯,所有專家均具有副高級(jí)以上職稱或博士學(xué)歷且對隨機(jī)對照臨床試驗(yàn)方面的論文較熟悉。
(3)量表維度和條目池的形成
通過搜索和閱讀相關(guān)文獻(xiàn),進(jìn)行第一次專家咨詢,初步確定量表的維度和條目池,形成初始量表。
(4)確定量表?xiàng)l目評分方法及評分標(biāo)準(zhǔn)
根據(jù)條目的內(nèi)容和其他公認(rèn)程度較高的量表的評分方式,采用5級(jí)記分法,按條目質(zhì)量的高低,分成5個(gè)等級(jí),并由研究小組討論后制定詳細(xì)評分標(biāo)準(zhǔn)。
(5)期刊的篩選和論文的篩選
選取2008年已發(fā)表的有隨機(jī)對照臨床試驗(yàn)論文的期刊,其中每個(gè)期刊至少有7篇以上的隨機(jī)對照臨床試驗(yàn)論文。按照國內(nèi)非核心、國內(nèi)核心和SCI 3個(gè)層次隨機(jī)抽取期刊,選取國內(nèi)非核心期刊5種,隨機(jī)抽取隨機(jī)對照臨床試驗(yàn)論文50篇;國內(nèi)核心期刊5種,隨機(jī)抽取隨機(jī)對照臨床試驗(yàn)論文50篇;SCI期刊4種,隨機(jī)抽取隨機(jī)對照臨床試驗(yàn)論文34篇。
(6)初始量表的測評與修訂
將以上方法選取的隨機(jī)對照臨床試驗(yàn)論文依據(jù)初始量表進(jìn)行評分。根據(jù)評分結(jié)果,采用以下3種方法進(jìn)行條目再篩選,3種方法中有兩種選出者則刪除該條目。①專家重要性評價(jià):進(jìn)行第二次專家咨詢,70%的專家認(rèn)為應(yīng)該刪除的條目。②變異度法:計(jì)算每個(gè)條目的標(biāo)準(zhǔn)差并刪除小于0.5者〔5〕。③相關(guān)系數(shù)法:計(jì)算各個(gè)條目與其維度得分的相關(guān)系數(shù),刪除相關(guān)無統(tǒng)計(jì)學(xué)意義的條目〔6〕。
(7)最終量表的形成
根據(jù)量表的信度和效度分析結(jié)果,反復(fù)修訂量表,直至信度和效度滿意為止。
采用SPSS16.0進(jìn)行統(tǒng)計(jì)分析。應(yīng)用克朗巴赫系數(shù)計(jì)算內(nèi)部一致性信度,采用kappa一致性系數(shù),評價(jià)重測信度和評價(jià)者間一致性信度。采用單因素方差分析評價(jià)量表的區(qū)分效度,進(jìn)一步用Bonferroni法進(jìn)行兩兩比較。檢驗(yàn)水準(zhǔn)α=0.05。
(1)條目池的篩選及量表初表的形成
經(jīng)過第一輪專家咨詢,形成了含有21個(gè)原始條目的量表初表,并分別歸類于統(tǒng)計(jì)設(shè)計(jì)(9項(xiàng)),統(tǒng)計(jì)過程(6項(xiàng)),統(tǒng)計(jì)報(bào)告(6項(xiàng)),各條目均采用5級(jí)評分。
(2)預(yù)調(diào)查及量表修訂
將形成的量表反饋給咨詢專家,再次對條目的重要性進(jìn)行討論、評價(jià)。同時(shí)根據(jù)原始量表的信度和效度測評結(jié)果對量表進(jìn)行修訂。最終刪除條目為:統(tǒng)計(jì)設(shè)計(jì)中“統(tǒng)計(jì)設(shè)計(jì)的科學(xué)性”、統(tǒng)計(jì)過程中“數(shù)據(jù)的預(yù)處理”和“質(zhì)量控制”、統(tǒng)計(jì)報(bào)告中“討論與研究結(jié)果的一致性”。根據(jù)第二次專家咨詢建議增加條目為:統(tǒng)計(jì)過程中“效果評價(jià)的主要指標(biāo)”、統(tǒng)計(jì)報(bào)告中“結(jié)果的正確性”和“對主要指標(biāo)結(jié)果的臨床結(jié)論或生物學(xué)解釋”。最終形成了含20個(gè)條目的隨機(jī)對照臨床試驗(yàn)論文統(tǒng)計(jì)學(xué)質(zhì)量評價(jià)量表,見表1。
表1 隨機(jī)對照臨床試驗(yàn)論文統(tǒng)計(jì)質(zhì)量評價(jià)量表
(1)量表的信度
內(nèi)部一致性信度:量表的內(nèi)部一致性信度較好,克朗巴赫系數(shù)(Cronbach’a)為0.801。
重測信度和評價(jià)者間一致性信度:分別從3個(gè)層次的期刊論文中按照分層隨機(jī)化原則隨機(jī)抽取30篇論文進(jìn)行評分,兩次測量時(shí)間相差2周以上,各條目KAPPA一致性系數(shù)均大于0.75,重測信度較好;將上述所抽取的論文由研究小組另一位成員進(jìn)行評分,評價(jià)者間一致性信度測量結(jié)果顯示各條目KAPPA一致性系數(shù)均大于0.75,評價(jià)者間一致性信度較好,見表2。
(2)量表的效度
量表能將3個(gè)層次的雜志完全區(qū)分開來,非核心論文(60.20±4.68)分,核心論文(65.68±8.44)分,SCI論文(86.91±6.06)分,區(qū)分效度較好,F(xiàn)=173.81,P<0.001,兩兩比較顯示任兩種類型的期刊論文差異均有統(tǒng)計(jì)學(xué)意義。
(3)量表的可接受性
評價(jià)者獨(dú)立完成量表的時(shí)間在10-15分鐘,量表各條目的評分標(biāo)準(zhǔn)明確,可操作強(qiáng)。
表2 隨機(jī)對照臨床試驗(yàn)論文統(tǒng)計(jì)質(zhì)量量表重測信度和評價(jià)者間信度結(jié)果
該研究在文獻(xiàn)復(fù)習(xí)基礎(chǔ)上,采用專家咨詢和小組討論的方法研制了包含3個(gè)維度,20個(gè)條目,評分等級(jí)5分記分法的隨機(jī)對照臨床試驗(yàn)論文統(tǒng)計(jì)質(zhì)量評價(jià)量表。重測信度和評價(jià)者間一致性信度分析采用逐條目進(jìn)行KAPPA一致性檢驗(yàn),KAPPA越高,量表的可靠程度越高。該研究KAPPA值均大于0.75,顯示該研究所形成的量表的可靠性較好。效度考核結(jié)果能夠區(qū)分三個(gè)層次的期刊論文,SCI期刊論文的統(tǒng)計(jì)學(xué)質(zhì)量高于國內(nèi)期刊論文的質(zhì)量,國內(nèi)論文無論是核心期刊還是非核心期刊統(tǒng)計(jì)質(zhì)量僅處于及格的水平。可接受性分析中能夠?qū)⑼瓿擅糠菡撐恼{(diào)查的時(shí)間控制在15分鐘之內(nèi),符合量表規(guī)范。
國內(nèi)外關(guān)于醫(yī)學(xué)論文統(tǒng)計(jì)質(zhì)量評價(jià)的工具主要有國外的 CONSORT(Consolidated controlled trial,RCT)聲明〔2〕。國內(nèi)李清海〔3〕制作的RCT報(bào)告水平評價(jià)量表和汪培山〔4〕制作的評價(jià)量表等。該研究是在借鑒了現(xiàn)有量表的基礎(chǔ)上進(jìn)行的,但不同之處在于該研究按照統(tǒng)計(jì)設(shè)計(jì),統(tǒng)計(jì)過程和統(tǒng)計(jì)報(bào)告3個(gè)維度進(jìn)行條目的篩選,涵蓋了論文寫作的整個(gè)過程,而現(xiàn)有量表沒有將條目分維度;現(xiàn)有量表的評分為2級(jí)評分,該研究的評分標(biāo)準(zhǔn)分為5個(gè)等級(jí),評分刻度更加精細(xì),評分標(biāo)準(zhǔn)更加明確,以便更好的提高隨機(jī)對照臨床試驗(yàn)論文的統(tǒng)計(jì)質(zhì)量。
由于受文化背景的影響,中英文期刊論文在寫作風(fēng)格上不盡相同,個(gè)別條目對于中文期刊論文有較高的區(qū)分效度,但用于英文期刊論文未必也有同樣高的區(qū)分效度,如條目P1“組間均衡性”,反之亦然。因此作者將在下一步的研究中進(jìn)一步修訂量表的條目設(shè)置及評分標(biāo)準(zhǔn)。
該研究運(yùn)用專家咨詢和小組討論兩種方法,量表制定過程規(guī)范,所形成的量表信度、效度和可接受性均較好,可用于隨機(jī)對照臨床試驗(yàn)論文的統(tǒng)計(jì)質(zhì)量評價(jià),也可為科研工作者撰寫規(guī)范的制訂提供借鑒。
1.李為農(nóng).要重視統(tǒng)計(jì)學(xué)方法在醫(yī)學(xué)論文中的正確使用.中國骨傷,2006,19(1):56-57.
2.Begg Colin,Cho M,Eastwood S,et al.Improving the quality of reporting of random ized controlled trials:the CONSORT statement,JAMA,1996,276(8):637-639.
3.劉清海,方積乾.醫(yī)學(xué)論文統(tǒng)計(jì)學(xué)報(bào)告水平評價(jià)量表的研制及其意義.編輯學(xué)報(bào),2008,20(3):278-280.
4.汪培山,周登遠(yuǎn).臨床試驗(yàn)文獻(xiàn)質(zhì)量評價(jià)量表的制作和評價(jià).藥物流行病學(xué),2007,16(1):46-50.
5.孫振球主編.醫(yī)學(xué)綜合評價(jià)方法及其應(yīng)用.第一版.北京:化學(xué)工業(yè)出版社,2006,173-174.
6.萬崇華,孟瓊,羅家洪,等.癌癥患者生命質(zhì)量測定量表體系共性模塊的研制(一):條目篩選及共性模塊的形成.癌癥,2007,26(2):113-117.