黃海櫻 陳波 周強(qiáng) 冀天星 陳靖楠
隨著現(xiàn)代醫(yī)學(xué)發(fā)展,臨床實(shí)驗(yàn)室每天有大量數(shù)據(jù)產(chǎn)生。如何有效搜集、整理和加工這些數(shù)據(jù),做出科學(xué)決策與結(jié)論,都有賴于準(zhǔn)確的統(tǒng)計(jì)分析。傳統(tǒng)的手工計(jì)算方法早已被專業(yè)統(tǒng)計(jì)分析軟件如SPSS和SAS等取代。這些專業(yè)軟件雖然功能強(qiáng)大,但在臨床實(shí)驗(yàn)室中的普及性不高,軟件操作相對(duì)復(fù)雜,其應(yīng)用受到制約。而臨床實(shí)驗(yàn)室常常需要進(jìn)行的四格表卡方檢驗(yàn)的統(tǒng)計(jì)方法,主要應(yīng)用于對(duì)陽性率、患病率、發(fā)病率等數(shù)據(jù)的分析,運(yùn)用Excel軟件即可實(shí)現(xiàn)。相較于專業(yè)統(tǒng)計(jì)軟件,Excel具有操作簡(jiǎn)單、易學(xué)易用、方便、圖形美觀和普及性高等優(yōu)點(diǎn)[1]。在此背景下,筆者采用目前運(yùn)用廣泛的Microsoft Office Excel 2007開發(fā)的VBA宏程序,以實(shí)現(xiàn)四格表卡方檢驗(yàn),即根據(jù)不同數(shù)據(jù)智能計(jì)算出卡方檢驗(yàn)、校正卡方檢驗(yàn)和確切概率法的值與P值,自動(dòng)判斷是否有統(tǒng)計(jì)學(xué)意義,簡(jiǎn)化了繁瑣統(tǒng)計(jì)操作程序,達(dá)到計(jì)算準(zhǔn)確、迅速、方便、可靠和靈活等特點(diǎn),省時(shí)省力,可提高教學(xué)效率?,F(xiàn)將使用的體會(huì)介紹如下。
1 材料
1.1 配置:主機(jī)i3-3240 CPU主頻3.00 GHz,2 G內(nèi)存,450 GB硬盤,VGA彩顯。
1.2 軟件:Microsoft Windows WIN 10中文版操作系統(tǒng),Microsoft Office Excel 2010 中文版。
2 方法
2.1 卡方檢驗(yàn)的表設(shè)置:在Excel工作表建立四格表卡方檢驗(yàn)和四格表評(píng)估診斷試驗(yàn)的兩個(gè)sheet,在四格表卡方檢驗(yàn)表中設(shè)置A12=實(shí)驗(yàn)組、BC1=結(jié)果、D1=合計(jì)、B2=陽性數(shù)、C2=陰性數(shù)、A3=A實(shí)驗(yàn)、A4=B實(shí)驗(yàn)、A5=合計(jì)、A6=卡方檢驗(yàn)、A7=校正卡方檢驗(yàn)、A8=確切概率法、A9=采用雙側(cè)概率之和、A10=P值和A11=判斷,如圖1。四格表評(píng)估診斷試驗(yàn)的表中設(shè)置A12=診斷試驗(yàn)、BC1=金標(biāo)準(zhǔn)、D1=合計(jì)、B2=陽性、C2=陰性、A3=陽性、A4=陰性、A5=合計(jì)、A6=靈敏度、C6=配對(duì)卡方值、A7=特異性、C7=P值、A8=陽性預(yù)測(cè)值、C8=判斷、A9=陰性預(yù)測(cè)值和A10=正確率,如圖2。這樣可以完成對(duì)表的設(shè)置。
圖1 四格表卡方檢驗(yàn)和評(píng)估診斷試驗(yàn)在Excel中的設(shè)置
2.2 卡方檢驗(yàn)程序的編寫:通過Excel的VBA程序界面編寫,完成四格表卡方檢驗(yàn)和四格表評(píng)估診斷試驗(yàn)(配對(duì)四格表)的統(tǒng)計(jì)功能,并可以保存統(tǒng)計(jì)結(jié)果到相應(yīng)幫助菜單。以楊樹勤主編衛(wèi)生部規(guī)劃教材第三版的《衛(wèi)生統(tǒng)計(jì)學(xué)》書上的例子8.1(76~77頁)、8.2(78~79頁)、8.7(82~83頁)和8.8(84~85頁)分別進(jìn)行對(duì)比分析,將自行編寫的Excel程序?qū)τ诖死倪\(yùn)算結(jié)果,與應(yīng)用SPSS17.0統(tǒng)計(jì)軟件對(duì)此例的分析結(jié)果對(duì)比,以此驗(yàn)證本程序的準(zhǔn)確性[1]。Excel的VBA程序界面編寫如圖2。
2.3 四格表卡方檢驗(yàn)的統(tǒng)計(jì)方法:先計(jì)算四格表的實(shí)際頻數(shù)和理論頻數(shù)(理論頻數(shù)的計(jì)算公式為TRC=nRnC/n,即某個(gè)格子行列合計(jì)的乘積與總例數(shù)的比值)。當(dāng)n(總例數(shù))≥40且T(所有格子的理論頻數(shù))≥5的時(shí),使用卡方檢驗(yàn)χ2=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d);當(dāng)n≥40且1<T<5時(shí);使用校正卡方檢驗(yàn)χ2=(|ad-bc|-n/2)2n/(a+b)(c+d)(a+c)(b+d);當(dāng)n<40或T<1時(shí);可使用四格表的確切概率法,采用P=[(a+b)! (c+d)! (a+c)!(b+d)!]/(a!b!c!d!n!)直接計(jì)算表內(nèi)四個(gè)數(shù)據(jù)的各種組合之概率,取雙側(cè)檢驗(yàn)的概率值作為判斷點(diǎn)P<0.05[2]。
2.4 四格表評(píng)估診斷試驗(yàn)(配對(duì)四格表)的統(tǒng)計(jì):可靠的、公認(rèn)的、能正確的將有病和無病區(qū)分開的診斷方法,即標(biāo)準(zhǔn)診斷方法稱為“金標(biāo)準(zhǔn)”。在臨床工作中我們要想判斷一項(xiàng)診斷試驗(yàn)對(duì)某一疾病的診斷價(jià)值,常將該診斷試驗(yàn)的結(jié)果與“金標(biāo)準(zhǔn)” 的結(jié)果進(jìn)行比較,計(jì)算該診斷試驗(yàn)的靈敏度、特異度、陽性預(yù)測(cè)值、陰性預(yù)測(cè)值和準(zhǔn)確率來分析其診斷價(jià)值。這時(shí)就要用到四格表,對(duì)于不同的四格表其每一個(gè)格子的含義是相同的(見圖2):真陽性(A)、假陽性(B)、假陰性(C)、真陰性(D)。配對(duì)四格表用于兩種檢驗(yàn)方法和診斷方法的比較,例如相同患者用兩種方法檢驗(yàn)或診斷,相同樣本用兩種方法檢測(cè)等,其特點(diǎn)是相同對(duì)象使用兩種不同方法處理。因?yàn)樵u(píng)估診斷試驗(yàn)和配對(duì)四格表對(duì)數(shù)據(jù)處理一致,故兩者的統(tǒng)計(jì)分析放在一起,取雙側(cè)檢驗(yàn)的概率值作為判斷點(diǎn)P<0.05。
圖2 卡方檢驗(yàn)程序的Excel的主界面
2.5 利用Excel VBA函數(shù)在醫(yī)學(xué)檢驗(yàn)專業(yè)的實(shí)驗(yàn)數(shù)據(jù)教學(xué)嘗試:醫(yī)學(xué)檢驗(yàn)會(huì)產(chǎn)生很多實(shí)驗(yàn)數(shù)據(jù),其中許多要進(jìn)行四格表卡方檢驗(yàn);四格表評(píng)估診斷試驗(yàn);配對(duì)設(shè)計(jì)四格表卡方檢驗(yàn)等數(shù)據(jù)的統(tǒng)計(jì)分析統(tǒng)計(jì)。利用該軟件老師在實(shí)驗(yàn)的課堂上產(chǎn)生數(shù)據(jù)進(jìn)行即時(shí)、快速統(tǒng)計(jì)進(jìn)行統(tǒng)計(jì)分析與應(yīng)用評(píng)教評(píng)學(xué),驗(yàn)證學(xué)生實(shí)驗(yàn)的教學(xué)效果。
1 四格表卡方檢驗(yàn) 輸入?yún)?shù)為:A(A實(shí)驗(yàn)陽性數(shù))、B(A實(shí)驗(yàn)陰性數(shù))、C(B實(shí)驗(yàn)陽性數(shù))和D(B實(shí)驗(yàn)陰性數(shù))應(yīng)為數(shù)字,否則有提示框。軟件根據(jù)上述條件自動(dòng)輸出相應(yīng)統(tǒng)計(jì)描述參數(shù):A+C、B+D、A+B、C+D、A+B+C+D、具體卡方檢驗(yàn)、P值和判斷,以及與SPSS的驗(yàn)證結(jié)果比較,其結(jié)果一致(見下劃線),只存在有效位數(shù)不同,SPSS并不能按條件智能選擇卡方值!需人工再次判斷分析。Excel程序的驗(yàn)算結(jié)果和SPSS的分析結(jié)果印證詳見圖3和表1、圖4和表2、圖5和表3。
表3 校正卡方檢驗(yàn)結(jié)果(SPSS的統(tǒng)計(jì)結(jié)果)
圖5 校正卡方檢驗(yàn)的統(tǒng)計(jì)結(jié)果和存儲(chǔ)數(shù)據(jù)(T<1 or n<40,v=1)
表2 校正卡方檢驗(yàn)結(jié)果(SPSS的統(tǒng)計(jì)結(jié)果)
圖4 校正卡方檢驗(yàn)的統(tǒng)計(jì)結(jié)果和存儲(chǔ)數(shù)據(jù)(1<T<5 and n≥40,v=1)
表1 卡方檢驗(yàn)結(jié)果(SPSS的統(tǒng)計(jì)結(jié)果)
圖3 卡方檢驗(yàn)的統(tǒng)計(jì)結(jié)果和存儲(chǔ)數(shù)據(jù)(T≥5 and n≥40, v=1)
2 四格表評(píng)估診斷試驗(yàn)(配對(duì)四格表) 輸入?yún)?shù)為:A(真陽性)、B(假陽性)、C(假陰性)和D(真陰性)應(yīng)為數(shù)字,否則有提示框。軟件根據(jù)上述條件自動(dòng)輸出相應(yīng)統(tǒng)計(jì)描述參數(shù):A+C、B+D、A+B、C+D、A+B+C+D、該診斷試驗(yàn)的靈敏度、特異度、陽性預(yù)測(cè)值、陰性預(yù)測(cè)值和準(zhǔn)確率(左框內(nèi));配對(duì)卡方檢驗(yàn)、P值和判斷(右框內(nèi))。以及與SPSS的驗(yàn)證結(jié)果比較,其結(jié)果一致(見下劃線),SPSS只提供P值,沒有配對(duì)卡方檢驗(yàn)值,差別有效位數(shù)不同,可見本軟件能提供更多統(tǒng)計(jì)參數(shù)。詳見圖6和表4的相互印證。
表4 配對(duì)卡方檢驗(yàn)結(jié)果(SPSS的統(tǒng)計(jì)結(jié)果)
圖6 四格表評(píng)估診斷試驗(yàn)(配對(duì)四格表)的統(tǒng)計(jì)結(jié)果和存儲(chǔ)數(shù)據(jù)(v=1)
3 四格表的實(shí)驗(yàn)室教學(xué)的初步應(yīng)用 老師讓學(xué)生按照教學(xué)實(shí)驗(yàn)要求,完成外周血細(xì)胞的分類,用百分率表示,老師用此軟件將老師的分類結(jié)果與學(xué)生的進(jìn)行比較,判斷兩者是否有差異。外周血細(xì)胞共有五種(中性粒細(xì)胞,嗜酸性細(xì)胞,嗜堿性細(xì)胞,單核細(xì)胞,淋巴細(xì)胞),每個(gè)學(xué)生與老師的分類結(jié)果要比較五次,一個(gè)班有二十多學(xué)生,所以工作量可想而知,采用此軟件后,對(duì)學(xué)生的實(shí)驗(yàn)結(jié)果分析所需時(shí)間明顯較以往的手工判斷短,差異極其顯著,效率大大提高。
χ2檢驗(yàn)(chi-square test)是一種用途較廣的假設(shè)檢驗(yàn)方法,應(yīng)用于計(jì)數(shù)資料,即比較兩個(gè)總體率(或構(gòu)成比),根據(jù)不同四格表資料的總例數(shù)(n)且所有格子的理論頻數(shù)T,對(duì)應(yīng)采用不同卡方檢驗(yàn)、校正卡方檢驗(yàn)、確切概率法和配對(duì)卡方檢驗(yàn)的統(tǒng)計(jì)方法。傳統(tǒng)的χ2檢驗(yàn)手工計(jì)算方法早已被專業(yè)統(tǒng)計(jì)分析軟件,如SPSS和SAS等取代。但因這些軟件過于復(fù)雜所以在臨床實(shí)驗(yàn)室中的普及性不高。在此背景下,筆者采用目前運(yùn)用廣泛的Microsoft Office Excel 2007開發(fā)的VBA宏程序,以實(shí)現(xiàn)四格表卡方檢驗(yàn)。當(dāng)打開Excel文檔時(shí)自動(dòng)啟動(dòng)卡方檢驗(yàn)程序的主界面(如圖2所示),選擇四格表卡方檢驗(yàn)或四格表評(píng)估診斷試驗(yàn),只需按提示輸入四組數(shù)據(jù),點(diǎn)擊統(tǒng)計(jì)按鈕,即自動(dòng)完成分析判斷并判斷結(jié)果(是否有統(tǒng)計(jì)學(xué)意義),附帶統(tǒng)計(jì)值、P值和其它參數(shù)。如需要數(shù)據(jù)輸出,按數(shù)據(jù)保存鍵,即可將統(tǒng)計(jì)的數(shù)據(jù)保存到相應(yīng)Excel的表格里,便于存檔。因?yàn)樗械墓胶兔罹虬诔绦蚶铮杀WC可靠性。而在通過公式設(shè)置計(jì)算四格表卡方檢驗(yàn)的文獻(xiàn)報(bào)道[3-5]里,關(guān)注點(diǎn)是利用Excel替代卡方檢驗(yàn)和校正卡方檢驗(yàn)手工計(jì)算,并沒有提供確切概率法和配對(duì)卡方檢驗(yàn)的統(tǒng)計(jì)方法;且公式單元容易被誤刪和修改,即使可以設(shè)置保護(hù)也還存在操作繁瑣和保密性不強(qiáng)等缺點(diǎn)。本軟件與之相比具有界面簡(jiǎn)潔、功能更多、更加智能化等特點(diǎn)。該程序能滿足實(shí)驗(yàn)教學(xué)對(duì)χ2檢驗(yàn)的需求,增加評(píng)估診斷試驗(yàn)與配對(duì)四格表兩者合一(如圖6所示),進(jìn)一步開展功能及其適用性,在今后應(yīng)用中不斷改進(jìn)。本次的統(tǒng)計(jì)數(shù)據(jù)均來自楊樹勤主編衛(wèi)生部規(guī)劃教材第三版的《衛(wèi)生統(tǒng)計(jì)學(xué)》書上的的樣題,以SPSS專業(yè)統(tǒng)計(jì)軟件為標(biāo)準(zhǔn)進(jìn)行對(duì)比驗(yàn)證,兩者的統(tǒng)計(jì)結(jié)果均一致,可以采用有效位數(shù)來表達(dá)。
確切概率法實(shí)現(xiàn)是本文重點(diǎn)和難點(diǎn),須計(jì)算總例數(shù)<40或T<1值,|A-T|滿足以條件下:各格相等;依次增減四格表某格的數(shù)據(jù),可列出周邊合計(jì)不變條件下各種組合的四格表。當(dāng)計(jì)算所有|A-T|值等于及大于樣本|A-T|值的四格表的P值,然后相加獲得P值??梢姶_切概率法計(jì)算過程過于繁雜、重復(fù)、計(jì)算量大與易錯(cuò)、如果單單通過單元公式設(shè)置沒法實(shí)現(xiàn)上述功能,故采取編程的方式比較容易實(shí)現(xiàn),思路清晰。
四格表評(píng)估診斷試驗(yàn)(配對(duì)四格表)兩表合一,因?yàn)槭褂脭?shù)據(jù)相同。診斷試驗(yàn)是判斷一項(xiàng)診斷試驗(yàn)對(duì)某一疾病的診斷價(jià)值,常將該診斷試驗(yàn)的結(jié)果與“金標(biāo)準(zhǔn)” 的結(jié)果進(jìn)行比較,靈敏度、特異度、陽性預(yù)測(cè)值、陰性預(yù)測(cè)值和準(zhǔn)確率來分析其診斷價(jià)值。靈敏度是指一項(xiàng)診斷試驗(yàn)將實(shí)際有病的人正確地判定為陽性患者的能力,其計(jì)算公式為:靈敏度=A/(A+C)×100%;特異度是指一項(xiàng)診斷試驗(yàn)?zāi)軐?shí)際無病的人正確地判定為非陽性患者的能力,其計(jì)算公式為:特異度=D/(D+B)×100%;陽性預(yù)測(cè)值是診斷試驗(yàn)檢查結(jié)果為陽性者中確實(shí)患有該病的可能性,其計(jì)算公式為:陽性預(yù)測(cè)值=A/(A+B)×100%;陰性預(yù)測(cè)值是診斷試驗(yàn)檢查結(jié)果為陰性者中真正為非陽性患者的可能性,其計(jì)算公式為:陰性預(yù)測(cè)值=D/(D+C)×100%;準(zhǔn)確率(又稱為準(zhǔn)確性與正確性)是診斷實(shí)驗(yàn)的真陽性者與真陰性者占所檢總例數(shù)的比例,準(zhǔn)確率=(A+D)/(A+B+C+D)×100%。A、 B 、C 、D分別代表真陽性(A)、假陽性(B)、假陰性(C)、真陰性(D)。配對(duì)四格表的卡方檢驗(yàn)屬于計(jì)數(shù)資料的配對(duì)設(shè)計(jì),它常用于兩種檢驗(yàn)方法、診斷方法的比較,如同一批患者以兩種方法作檢查或診斷,同一批樣品用兩種方法作檢測(cè)等,其特點(diǎn)是對(duì)樣本中觀察單位分別用兩種方法處理。配對(duì)設(shè)計(jì)的計(jì)數(shù)資料的數(shù)據(jù)形式往往表示配對(duì)四格表。
利用提供的VBA實(shí)現(xiàn)χ2檢驗(yàn)統(tǒng)計(jì)處理,初步應(yīng)用效果令人滿意,克服手工的不足,提高工作效率,關(guān)于具體醫(yī)學(xué)統(tǒng)計(jì)學(xué)方面知識(shí),請(qǐng)參閱有關(guān)醫(yī)學(xué)統(tǒng)計(jì)學(xué)書籍。通過與SPSS統(tǒng)計(jì)軟件的驗(yàn)證發(fā)現(xiàn),本軟件能根據(jù)χ2檢驗(yàn)的不同統(tǒng)計(jì)條件,智能選擇與之相對(duì)應(yīng)的統(tǒng)計(jì)方法,并能給出統(tǒng)計(jì)學(xué)的判斷;SPSS統(tǒng)計(jì)則可一次性提供χ2檢驗(yàn)所有情況的χ2檢驗(yàn)值(除配對(duì)四格表外)與P值,還需自己依據(jù)統(tǒng)計(jì)的專業(yè)知識(shí)準(zhǔn)確判斷分析,對(duì)統(tǒng)計(jì)分析者要求更高。另外,SPSS統(tǒng)計(jì)數(shù)據(jù)輸入與醫(yī)學(xué)統(tǒng)計(jì)的教材不一樣,不直觀,要轉(zhuǎn)化它的特定的數(shù)據(jù)形式,增加其統(tǒng)計(jì)的難度。畢竟SPSS是專業(yè)統(tǒng)計(jì)軟件,功能強(qiáng)大,滿足臨床醫(yī)學(xué)對(duì)各種不同數(shù)據(jù)統(tǒng)計(jì)分析的要求,必然增加其使用的難度。而本軟件在χ2檢驗(yàn)使用跟傳統(tǒng)醫(yī)學(xué)統(tǒng)計(jì)的教材相仿,從數(shù)據(jù)輸入、表達(dá)方式和智能分析判斷,易學(xué)易用,易于理解,實(shí)現(xiàn)簡(jiǎn)單化,軟件編寫所用到的函數(shù)基本上Excel的自帶函數(shù)就可以完成。
Excel還能處理臨床數(shù)據(jù)、質(zhì)控?cái)?shù)據(jù)、質(zhì)控圖和統(tǒng)計(jì)代替?zhèn)鹘y(tǒng)手工繪圖方法[6];也能在科室的人事管理、試劑管理和財(cái)務(wù)管理等方面進(jìn)行科學(xué)管理,有助于科室資料信息管理工作簡(jiǎn)化、方便、提高效率,節(jié)約寶貴時(shí)間[7,8]。Excel還具有其他功能,如數(shù)據(jù)處理、表格制作、圖表制作等等,易學(xué)易用,計(jì)算機(jī)技術(shù)方面要求不高,易于推廣使用。同時(shí)還具備兼容性強(qiáng)等特點(diǎn),如有需要Excel貯存數(shù)據(jù)方便導(dǎo)入專業(yè)統(tǒng)計(jì)軟件(如:SAS、 SPSS 、Access和FoxPro等數(shù)據(jù)庫),不用重復(fù)錄入結(jié)果,節(jié)省統(tǒng)計(jì)的時(shí)間[9-11]。人們使用Excel非常普遍,通用性強(qiáng),能滿足各行各業(yè)的基本統(tǒng)計(jì)需求,本次的研究旨在此擴(kuò)展Excel的χ2檢驗(yàn)統(tǒng)計(jì),豐富其統(tǒng)計(jì)功能,醫(yī)務(wù)工作者在必要時(shí),可根據(jù)自己的要求,展開對(duì)Excel數(shù)據(jù)分析功能挖掘的可行性。
對(duì)臨床檢驗(yàn)專業(yè)的實(shí)驗(yàn)課產(chǎn)生的檢驗(yàn)數(shù)據(jù)進(jìn)行初步分析統(tǒng)計(jì),操作簡(jiǎn)單明了,采用Excel的界面,易學(xué)易用,容易上手;同時(shí),增加老師與學(xué)生對(duì)該軟件統(tǒng)計(jì)的興趣,通過了解Excel的函數(shù)功能可以實(shí)現(xiàn)部分統(tǒng)計(jì),加深統(tǒng)計(jì)功能內(nèi)容理解,達(dá)到很好教學(xué)效果,引導(dǎo)他們進(jìn)一步深入了解統(tǒng)計(jì)。同時(shí)也可以輔助臨床老師的數(shù)據(jù)統(tǒng)計(jì),提高教學(xué)工作的效率,也提升自身教學(xué)水平,為日后改進(jìn)與升級(jí)打下基礎(chǔ)。
利益沖突所有作者均聲明不存在利益沖突