• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      如何正確運用χ2檢驗——高維表資料優(yōu)勢比分析與SAS實現(xiàn)

      2021-07-20 07:00:48胡純嚴胡良平
      四川精神衛(wèi)生 2021年3期
      關鍵詞:高維置信區(qū)間估計值

      胡純嚴 ,胡良平 ,2*

      (1.軍事科學院研究生院,北京 100850;2.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

      為了分析來自病例對照研究設計的g×2×2表資料,需要完成以下4項任務:其一,檢驗各層2×2表資料的優(yōu)勢比是否滿足齊性;其二,估計共同優(yōu)勢比的數(shù)值;其三,估計共同優(yōu)勢比的置信區(qū)間;其四,檢驗共同優(yōu)勢比是否等于1。本文將對后三項任務有關內容進行介紹。

      1 高維表資料共同優(yōu)勢比分析的基本概念

      1.1 高維表g×2×2表的表達模式

      設高維表g×2×2表的表達模式如下,見表1。

      表1 病例對照研究設計下g×2×2表的第h層2×2表資料的表達模式

      1.2 高維表資料共同優(yōu)勢比的含義

      在分析“病例對照研究設計”的二維表資料時,可以很方便地依據(jù)公式“OR=ad/bc”計算出優(yōu)勢比OR的數(shù)值。然而,對于“g×2×2表資料”,卻無法直接計算出OR的數(shù)值。從概念上來說,似乎可以采取某種舉措,將“g×2×2表資料”降維或壓縮成一個“2×2表資料”。但事實上,這種理想的“2×2表資料”是無法直接呈現(xiàn)出來的。于是,統(tǒng)計學家通過統(tǒng)計學方法來體現(xiàn)出各層“2×2表資料”之間的“微小差別”,這就是求出各層“2×2表資料”的“權重系數(shù)wh”。通過它將各層“2×2表資料”進行加權平均,從而間接獲得合并后的優(yōu)勢比OR的數(shù)值。在SAS/STAT的FREQ過程中,將其稱為“common odds ratios”[1],常譯成“共同或普通或合并優(yōu)勢比”。

      1.3 估計共同優(yōu)勢比的前提條件

      基于“g×2×2表資料”計算共同優(yōu)勢比的前提條件是高維表資料應滿足齊性,針對“優(yōu)勢比”,檢驗高維表資料是否滿足齊性的檢驗方法有5種,分別是“Breslow-Day檢驗”“Breslow-Day-Tarone檢驗”“Q檢驗”“I2度量統(tǒng)計量及其不確定性限值”和“Zelen's精確檢驗”。

      1.4 估計共同優(yōu)勢比及其置信區(qū)間的方法概述

      SAS/STAT中的FREQ過程[1]采用3種方法估計共同優(yōu)勢比及置信區(qū)間,分別是:①校正的計算方法,Mantel-Haenszel估計法;②校正的計算方法,logit估計法;③基于條件分布的精確法。

      2 高維表資料優(yōu)勢比分析及SAS實現(xiàn)

      2.1 高維表資料優(yōu)勢比分析的具體算法

      2.1.1 高維表資料優(yōu)勢比分析的具體內容

      高維表資料優(yōu)勢比分析的具體內容包括以下4項[1]:其一,檢驗資料是否滿足齊性要求;其二,估計共同優(yōu)勢比;其三,估計共同優(yōu)勢比的置信區(qū)間;其四,檢驗共同優(yōu)勢比是否等于1。

      2.1.2 高維表資料共同優(yōu)勢比的點估計及置信區(qū)間估計

      2.1.2.1 Mantel-Haenszel估計量

      基于Mantel-Haenszel估計量(簡稱MH估計量)估計高維表資料共同優(yōu)勢比,見式(1):

      注意:當nh較小時,MH估計量不如logit估計量敏感。

      2.1.2.2 Logit估計量

      Woolf于1955年提出了logit估計量[1],見下式:

      式(7)中,ORh是第h層的優(yōu)勢比,其100(1-α)%置信區(qū)間見下式:

      在式(7)和式(8)中,wh是第h層的權重系數(shù),其定義見下式:

      在式(9)中,Var[ln(ORh)]的定義見下式:

      當?shù)趆層的表格中出現(xiàn)0頻數(shù)時,在計算ORh和wh之前,需要給該層的所有格加上 0.5[1]。

      2.1.3 高維表資料共同優(yōu)勢比的精確置信區(qū)間估計

      假定所有各層2×2表的優(yōu)勢比是一個常數(shù)。精確置信限的構造原理:在各層2×2表的邊際總數(shù)固定的條件下,基于S=∑hnh11的分布來構造精確置信限。精確置信區(qū)間的精度:Agresti于1992年指出,由于擬解決的問題是一個離散問題,所以,所構造的精確置信區(qū)間的“置信水平”不會恰好等于100(1-α)%,但至少是100(1-α)%。因此,所求得的置信限是保守的[1]。精確置信限算法的來源:SAS/STAT中的FREQ過程計算共同優(yōu)勢比的置信限是依據(jù)Vollset、Hirji和Elashoff于1991年提出的算法,還可參考Mehta、Patel和Gray于1985年發(fā)表的有關文獻[1]。

      算法的詳細描述:在第h層2×2表的邊際總數(shù)固定的條件下,讓隨機變量Sh代表第h層2×2表中(1,1)網(wǎng)格內的頻數(shù)。給定行合計nh1·、nh2·,列合計nh·1、nh·2,Sh的下限與上限是 lh、uh,則它們的計算公式分別見式(11)和式(12):

      讓s0代表所有q張表第(1,1)格上頻數(shù)之和。通過迭代計算方法求解下列兩個方程中的共同優(yōu)勢比置信限的下限值與上限值,φ1與 φ2,見式(16)、式(17):

      當觀測結果的和s0等于下界l時,SAS/STAT中的FREQ過程就將置信限的下限設置為0,并基于顯著性水平α來決定置信限的上限值;同理,當觀測結果的和s0等于上界u時,SAS/STAT中的FREQ過程就將置信限的上限設置為∞,并基于顯著性水平α來決定置信限的下限值。

      2.1.4 高維表資料共同優(yōu)勢比是否等于1的精確檢驗

      在運用SAS/STAT中的FREQ過程時,若在exact語句中使用了選項“COMOR”,該過程可以計算精確檢驗。設φ=1,在無效假設成立的條件下,S的條件分布變成如下形式:

      在無效假設成立且滿足分層2×2表的邊際固定的條件下,這個精確檢驗的點概率就是觀測和s0出現(xiàn)的概率,這個概率可以用P0(s0)表示。在無效假設成立的條件下,S的期望值由下式定義:

      單側精確概率P值(記為P1)可從條件分布P0(S≥s0)或P0(S≤s0)計算得到,取決于觀測結果的和s0大于還是小于E0(S),分別見下式:

      基于下面3種定義,可分別計算出雙側精確概率P值(記為P2)。

      定義1:雙側概率為單側概率的2倍。若該值超過1,將其設置為1。見下式:

      定義2:雙側概率為所有小于等于觀測結果的和s0的點概率的概率之和,求和范圍是s的所有可能取值,即l≤s≤u,公式如下:

      定義3:雙側概率為單側P值與分布的對側尾端(與期望值等距)相對應的面積之和,計算公式如下:

      2.2 高維表資料優(yōu)勢比分析的SAS實現(xiàn)

      2.2.1 問題與數(shù)據(jù)

      【例1】文獻[2]提供了如下資料,試對5項研究的共同優(yōu)勢比進行分析。見表2。

      表2 吸煙與肝細胞癌關系的5項病例對照研究結果

      【例2】文獻[2]提供了如下資料,試對6項研究的共同優(yōu)勢比進行分析。見表3。

      表3 鼻咽癌與EB病毒感染關系的6項病例對照研究結果

      2.2.2 共同優(yōu)勢比分析的SAS實現(xiàn)

      【例3】沿用例1中的“問題與數(shù)據(jù)”,試對5項研究的共同優(yōu)勢比進行分析。

      【分析與解答】設所需要的SAS程序如下:

      【程序說明】“exact語句”中的選項“eqor”要求對各層優(yōu)勢比OR是否滿足齊性進行Zelen's精確檢驗;選項“comor”要求對共同優(yōu)勢比進行精確檢驗。

      【SAS輸出結果及解釋】

      以上輸出的是“普通優(yōu)比和相對風險”的計算結果,其中,“普通優(yōu)比”也叫做“共同優(yōu)比”。實際上,就是基于“Mantel-Haenszel法”和“l(fā)ogit法”計算出來的校正“共同優(yōu)比”的估計值及其95%置信區(qū)間。在本例中,因95%置信區(qū)間不包含1,說明共同優(yōu)比與1之間的差別具有統(tǒng)計學意義。

      此處原本是各層2×2表優(yōu)比齊性檢驗結果,結果顯示,此資料滿足齊性(這部分計算結果在本期“科研方法專題”的《如何正確運用χ2檢驗——高維表資料齊性檢驗與SAS實現(xiàn)》中已經(jīng)呈現(xiàn)了,限于篇幅,此處從略)。關于共同優(yōu)比的估計和置信區(qū)間的計算,直接利用前面的“校正計算結果”即可。但在SAS/STAT的FREQ過程中,還可采取精確計算法,以獲得更加可靠的計算結果如下:

      以上輸出的是共同優(yōu)比的點估計值及其精確置信區(qū)間,因95%置信區(qū)間不包含1,說明共同優(yōu)比與1之間的差別具有統(tǒng)計學意義。

      以上輸出的是關于共同優(yōu)比是否等于1的精確檢驗結果。其中,“S=307”是高維表資料中各層2×2表中第(1,1)格上頻數(shù)之和;“SH0=345.0348”是 H0(即“共同優(yōu)比=1”)成立條件下推導出各層2×2表中第(1,1)格上頻數(shù)之和;點概率P(S=307)=0.0002,與其對應的單側概率為0.0008;與其對應的雙側概率P2有3個,分別基于不同的定義而算得,即基于定義1,得=0.0016;基于定義2,得=0.0016;基于定義3,得=0.0014。

      【結論】無論是基于單側檢驗還是雙側檢驗,所得P值都小于0.01,說明應拒絕H0(即“共同優(yōu)比=1”),接受H1(即“共同優(yōu)比≠1”)。因優(yōu)比的點估計值為0.7836(MH法),說明吸煙組的優(yōu)勢(odd值)小于不吸煙組的優(yōu)勢(odd值);更明確的專業(yè)結論是:吸煙者患肝細胞癌的風險小于不吸煙者患肝細胞癌的風險(注意:這個結論與臨床專業(yè)知識不相符,具體原因可能是原始資料中存在過失誤差,有待進一步核實)。

      【例4】沿用例2中的“問題與數(shù)據(jù)”,試對6項研究的共同優(yōu)勢比進行分析。

      【分析與解答】設所需要的SAS程序如下:

      【SAS輸出結果及解釋】

      以上輸出的是“普通優(yōu)比和相對風險”的計算結果,其中,“普通優(yōu)比”也叫做“共同優(yōu)比”。實際上,就是基于“Mantel-Haenszel法”和“l(fā)ogit法”計算出來的校正“共同優(yōu)比”的估計值及其95%置信區(qū)間。在本例中,因95%置信區(qū)間不包含1,說明共同優(yōu)比與1之間的差別具有統(tǒng)計學意義。

      此處原本是各層2×2表資料優(yōu)比齊性檢驗結果,結果顯示,此資料不滿足齊性(這部分計算結果在本期“科研方法專題”的《如何正確運用χ2檢驗——高維表資料齊性檢驗與SAS實現(xiàn)》中已經(jīng)呈現(xiàn)了,限于篇幅,此處從略)。關于共同優(yōu)比的估計和置信區(qū)間的估計,通常的做法是基于隨機效應模型推導出的公式進行計算。而在SAS/STAT的FREQ過程中,采取精確計算法,輸出結果如下:

      以上輸出的是共同優(yōu)比的點估計值及其精確置信區(qū)間,因95%置信區(qū)間不包含1,說明共同優(yōu)比與1之間的差別具有統(tǒng)計學意義。

      以上輸出的是關于共同優(yōu)比是否等于1的精確檢驗結果。其中,“S=242”是高維表資料中各層2×2表中第(1,1)格上頻數(shù)之和;“SH0=201.3895”是 H0(即“共同優(yōu)比=1”)成立條件下推導出各層2×2表中第(1,1)格上頻數(shù)之和;點概率P(S=242)<0.0001,與其對應的單側概率<0.0001;與其對應的雙側概率P2有3個,分別基于不同的定義而算得,即基于定義1,得<0.0001;基于定義2,得<0.0001;基于定義3,得<0.0001。

      【結論】無論是基于單側檢驗還是雙側檢驗,所得P值都小于0.0001,說明應拒絕H0(即“共同優(yōu)比=1”),接受H1(即“共同優(yōu)比≠1”)。因優(yōu)比的點估計值為3.2135(MH法),說明EB陽性組的優(yōu)勢(odd值)大于EB陰性組的優(yōu)勢(odd值);更明確的專業(yè)結論是:EB陽性者患鼻咽癌的風險大于EB陰性者患鼻咽癌的風險。

      3 討論與小結

      3.1 討論

      欲基于g×2×2表資料求共同優(yōu)勢比,需要先檢驗資料是否滿足齊性要求,即檢驗各層2×2表資料所對應的優(yōu)勢比是否相等。常規(guī)的做法[2-8]如下:若資料滿足齊性要求,可基于固定效應模型推導出的公式估計優(yōu)勢比及其置信區(qū)間;若資料不滿足齊性要求,可基于隨機效應模型推導出的公式估計優(yōu)勢比及其置信區(qū)間。然而,在SAS/STAT的FREQ過程中,若資料滿足齊性要求,可通過CMH χ2檢驗方法給出校正的計算結果,包括“校正的共同優(yōu)勢比的點估計值”及其“校正的95%置信區(qū)間”;若資料不滿足齊性要求,可通過各層2×2表中(1,1)網(wǎng)格內的頻數(shù)的條件分布來構造計算公式,可求得“共同優(yōu)勢比的精確點估計值”“精確95%置信區(qū)間”以及“共同優(yōu)勢比是否等于1”的精確單側概率和精確雙側概率。

      3.2 小結

      本文對g×2×2表資料進行了優(yōu)勢比分析,其全部內容包括“各層2×2表資料齊性檢驗”“共同優(yōu)勢比的點估計和置信區(qū)間估計”和“共同優(yōu)勢比是否等于1的假設檢驗”。從計算的角度來看,內容涉及“校正算法”和“精確算法”。通過兩個實例,演示了基于SAS軟件實現(xiàn)優(yōu)勢比分析的內容,并對結果進行了解釋,做出了統(tǒng)計和專業(yè)結論。

      猜你喜歡
      高維置信區(qū)間估計值
      定數(shù)截尾場合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
      p-范分布中參數(shù)的置信區(qū)間
      多個偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
      一道樣本的數(shù)字特征與頻率分布直方圖的交匯問題
      一種改進的GP-CLIQUE自適應高維子空間聚類算法
      測控技術(2018年4期)2018-11-25 09:46:48
      列車定位中置信區(qū)間的確定方法
      統(tǒng)計信息
      2018年4月世界粗鋼產量表(續(xù))萬噸
      基于加權自學習散列的高維數(shù)據(jù)最近鄰查詢算法
      電信科學(2017年6期)2017-07-01 15:44:37
      一般非齊次非線性擴散方程的等價變換和高維不變子空間
      满洲里市| 北宁市| 花垣县| 渭南市| 昂仁县| 涟源市| 榆树市| 冀州市| 合江县| 凉城县| 丰都县| 普兰店市| 固安县| 章丘市| 阿拉善左旗| 景谷| 溆浦县| 丰镇市| 江西省| 新兴县| 彭山县| 荃湾区| 女性| 五峰| 富平县| 安达市| 章丘市| 亚东县| 交城县| 万安县| 肥西县| 德清县| 呼和浩特市| 漠河县| 锦州市| 孝感市| 镇江市| 鹿泉市| 呈贡县| 泰顺县| 策勒县|