• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      如何用SAS軟件正確分析生物醫(yī)學(xué)科研資料XXIV.結(jié)果變量為多值有序變量的高維列聯(lián)表資料的統(tǒng)計分析與SAS軟件實現(xiàn)(二)

      2013-06-08 10:31:36鮑曉蕾王小利胡良平
      中國醫(yī)藥生物技術(shù) 2013年4期
      關(guān)鍵詞:二值置信區(qū)間賦值

      鮑曉蕾,王小利,胡良平

      對于結(jié)果變量為多值有序變量的高維列聯(lián)表資料可使用cmH 校正的秩和檢驗或有序變量多重 logistic 回歸分析等統(tǒng)計分析方法。在上一期中,我們已經(jīng)詳細(xì)介紹了CMH 校正的秩和檢驗。本期將詳細(xì)介紹多值有序變量的logistic 回歸分析。

      1 原理

      結(jié)果變量為多值有序變量的 logistic 回歸又稱為累計logistic 回歸。累積 logistic 回歸模型可視為二值變量logistic 回歸的擴(kuò)展,其回歸模型可定義如下:

      其中y* 表示觀測現(xiàn)象的內(nèi)在趨勢,不能被直接測量;ε為誤差項。當(dāng)結(jié)果變量有J個可能的結(jié)局,相應(yīng)的取值為y= 1、y= 2 ……y=J時,共有J– 1 個分界點將各相鄰類別分開。即:

      若y* ≤μ1,則y= 1;

      若μ1

      ……

      若y* >μJ–1,則y=J。

      給定x值的累積概率可以按如下形式表示:

      與二值變量的 logit變換相似,累積 logit 變換定義如下:

      其中 1 –P(y≤j|x) 即為P(y≥j+ 1 |x),這樣就依次將J個可能的結(jié)局合并成兩個,從而進(jìn)行 logistic 回歸分析。

      相應(yīng)地,累積概率可通過以下公式進(jìn)行預(yù)測:

      統(tǒng)計軟件在實際運行中,定義β0j為各類中截距α與分界點μj的綜合,所以上式就轉(zhuǎn)化為:

      值得注意的是,SPSS 和 SAS 在對累積 logistic 回歸模型進(jìn)行參數(shù)化時采用的形式是不同的,SPSS 軟件中采用的線性形式是,這與式 ⑸ 相同,而 SAS 中采用的是,所以式 ⑸ 就轉(zhuǎn)化為:

      在使用不同軟件時,應(yīng)該注意回歸系數(shù)符號的差別。

      由上面的討論可以看出,若結(jié)果變量有J個可能的結(jié)局,則可獲得J– 1 個累積 logit 函數(shù)(當(dāng)進(jìn)行統(tǒng)計分析時,若有m個截距項β0j無統(tǒng)計學(xué)意義,則只能獲得J–m– 1 個累積 logit 函數(shù))。累積 logistic 回歸模型對每一個累積 logit 函數(shù)各有一個不同的β0j估計,然而對所有的累積 logit 函數(shù),變量xk卻有一個相同的βk估計,因為其假設(shè)條件為自變量的作用與所有累積 logit 的截斷點無關(guān)。在此假設(shè)條件下,不同累積對數(shù)發(fā)生比的回歸線相互平行,只是截距參數(shù)有所不同。這被稱為成比例發(fā)生比假設(shè)條件或平行線假設(shè)條件。

      運用累積 logistic 回歸模型首先需要對平行線假設(shè)條件進(jìn)行檢驗。如果這一假設(shè)條件被拒絕,便說明自變量xk對不同的 logit 有不同的βk,因而說明累積 logistic 回歸模型不適合,需要采用其他模型來進(jìn)行資料的分析,如可在模型中引入二次項或交互項。

      2 變量賦值

      在 logistic 回歸模型中,原因變量可以是連續(xù)型變量,也可以是二值變量、多值有序變量或多值名義變量。

      如果原因變量是連續(xù)變量,一般不需要進(jìn)行處理,可直接建立 logistic 回歸模型。但有時根據(jù)專業(yè)知識需對其進(jìn)行分級以獲得更有實際意義的結(jié)果時,連續(xù)變量就轉(zhuǎn)換成了有序變量,此時可按影響結(jié)果變量由小到大的順序賦值為1、2 ……,并將它當(dāng)作連續(xù)型變量處理或直接引入啞變量,建立 logistic 回歸模型。比如在肺癌危險因素的病例-對照研究中,研究者往往感興趣的是年齡每增加 5 歲(根據(jù)專業(yè)知識和試驗?zāi)康臎Q定)肺癌發(fā)病的危險性是基礎(chǔ)狀態(tài)時的多少倍,而年齡每增加 1 歲肺癌發(fā)病的危險性是基礎(chǔ)年齡時的多少倍往往沒有多大實際意義。

      如果原因變量是二值變量,一般可按 0、1 賦值。

      如果原因變量是多值名義變量,需引入啞變量(dummy variable),每個啞變量都是一個二值變量,所需啞變量的數(shù)目為多值名義變量的類別數(shù)減 1。如“血型”是一個多值名義變量,有 A、B、AB、O 四種,若以 O 型血為基準(zhǔn),需引入 3 個(4 – 1 = 3)啞變量來描述。令

      則可得到下面的對應(yīng)關(guān)系(表1):

      表1 用 3 個啞變量描述一個四值名義的血型變量

      如果原因變量是多值有序變量,一般可按影響結(jié)果變量由小到大的順序賦值為1、2 ……,并將它當(dāng)作連續(xù)型變量處理,但這樣做有時并不科學(xué),因為該有序變量每上升或下降一個等級對結(jié)果變量的影響并非總是“線性”的。若遇到有序原因變量按連續(xù)變量處理所得回歸效果不理想時,建議引入啞變量的方式來處理。

      結(jié)果變量為多值有序變量,可按其程度或一般默認(rèn)的順序由小到大地賦值為1、2 ……。

      【例 1】在一項臨床試驗中,研究病程與依沙酰胺療效的關(guān)系。試驗在三所醫(yī)院中同時進(jìn)行,具體療效數(shù)據(jù)見表2,試對病程與治療效果之間的關(guān)系進(jìn)行分析。

      表2 病程與依沙酰胺療效的數(shù)據(jù)

      SAS 程序如下,程序名為example3。

      data example3;do a=1 to 3;do b=1 to 4;do c=1 to 3;input f@@;output;end; end; end;cards;24 10 3 10 4 2 35 26 10 10 8 4 25 12 3 11 4 2 30 22 8 10 10 5 20 8 2 10 4 1 20 17 5 12 10 6;run;ods html;proc logistic data=example3;class a b/param=ref;model c=a b/selection=stepwise;freq f;run;ods html close;

      程序說明:首先建立數(shù)據(jù)集,程序中的 a 表示試驗中心,a = 1 表示中心 1,a = 2 表示中心 2,a = 3 表示中心 3;b 表示病程,b = 1 表示 < 1 個月組,b = 2 表示 1~3 個月組,b = 3 表示 3 個月~5年組,b = 4表示 > 5年組;c 表示療效,c = 1 表示治愈,c = 2 表示好轉(zhuǎn),c = 3 表示無效;變量 f 表示頻數(shù)。調(diào)用 logistic 過程進(jìn)行有序變量多重 logistic 回歸分析。由于試驗中心是多值名義變量,需對其賦啞變量;病程是多值有序變量,可將其當(dāng)成連續(xù)型變量直接賦值,但最好是對其賦啞變量。若自變量是二值變量,則只需直接賦值 0、1 即可。class 語句可實現(xiàn)對自變量自動賦啞變量,同時還能保證啞變量在回歸方程中同進(jìn)同出。class a b 表示對 a、b 兩個因素均自動賦啞變量。選項param = ref 指定將其中的一個水平作為基準(zhǔn)實現(xiàn)啞變量賦值,默認(rèn)以輸入的該定性變量最后一個水平為基準(zhǔn)。若想以其他水平為基準(zhǔn),比如希望以 a 的第一個水平為基準(zhǔn)對因素 a 賦啞變量,則只需將語句改成 class a (ref = ‘1’)b/param = ref 即可。model 語句表示建模,等號前表示因變量,等號后表示自變量。選項 selection = stepwise 表示用逐步回歸法進(jìn)行變量篩選,其默認(rèn)的進(jìn)入和剔除方程的顯著性水準(zhǔn)為0.05;若希望改變這一標(biāo)準(zhǔn),可在選項后加入 sle =xx 和 sls = xx 選項,前者指定進(jìn)入方程的標(biāo)準(zhǔn),后者指定剔除方程的標(biāo)準(zhǔn),xx 表示具體的數(shù)值(0~1 之間)。freq f指定 f 變量為頻數(shù)變量。

      SAS 程序運行結(jié)果:

      以上是通過 class 語句對因素 a 和因素 b 自動賦啞變量的結(jié)果??梢钥吹?,兩因素均以最后一個水平為基準(zhǔn)。以 a 因素為例,啞變量 a1 表示 a 因素的第一個水平相對于第三個水平進(jìn)行分析;啞變量 a2 表示 a 因素的第二個水平相對于第三個水平進(jìn)行分析。b 因素的啞變量意義類似。

      Summary of stepwise selection

      以上為逐步篩選法的篩選結(jié)果,最終只有因素 b 進(jìn)入了回歸方程(χ2= 13.4863,P= 0.0037)。

      Score test for the proportional odds assumption

      以上為平行線假設(shè)的檢驗結(jié)果:χ2= 0.8909,P= 0.8276> 0.05,說明資料滿足平行線假設(shè)。

      Type 3 analysis of effects

      以上是將因素 b 作為一個整體的假設(shè)檢驗結(jié)果:waldχ2= 13.5102,P= 0.0037 < 0.05,說明病程對療效的影響有統(tǒng)計學(xué)意義。

      Analysis of maximum likelihood estimates

      以上為參數(shù)估計及假設(shè)檢驗的結(jié)果。本例結(jié)果變量有 3個水平,故模型包含 2 個截距項。若P1、P2和P3分別表示治愈、好轉(zhuǎn)和無效發(fā)生的概率,則回歸方程為:

      Odds ratio estimates

      以上是對優(yōu)勢比的估計結(jié)果:OR1vs4= 2.576,其 95%置信區(qū)間為(1.445,4.592);OR2vs4= 2.473,其 95%置信區(qū)間為(1.205,5.072);OR3vs4= 1.382,其 95%置信區(qū)間為(0.830,2.302)。

      統(tǒng)計及專業(yè)結(jié)論:病程對療效的影響有統(tǒng)計學(xué)意義(P= 0.0037 < 0.05),而試驗中心對療效的影響沒有統(tǒng)計學(xué)意義。OR1vs4= 2.576,其 95%置信區(qū)間為(1.445,4.592),說明病程小于 1 個月的療效是病程大于 5年療效的2.576倍;OR2vs4= 2.473,其 95%置信區(qū)間為(1.205,5.072),說明病程為1~3 個月的療效是病程大于 5年療效的 2.473 倍;OR3vs4= 1.382,其 95%置信區(qū)間為(0.830,2.302),說明病程為3 個月~5年的療效是病程大于 5年療效的 1.382 倍。

      [1]Hu LP.Statistics facing practical scientific issues -- (2) multi-factor designs and linear model analysis.Beijing: People’s Medical Publishing House, 2012:508-517.(in Chinese)胡良平.面向問題的統(tǒng)計學(xué)——(2)多因素設(shè)計與線性模型分析.北京: 人民衛(wèi)生出版社, 2012:508-517.

      [2]Hu LP.Medical statistics-analysis of quantitative and qualitative data applying the triple-type theory.Beijing: People’s Military Medical Press, 2009:363-375.(in Chinese)胡良平.醫(yī)學(xué)統(tǒng)計學(xué)-運用三型理論分析定量與定性資料.北京:人民軍醫(yī)出版社, 2009:363-375.

      猜你喜歡
      二值置信區(qū)間賦值
      關(guān)于1 1/2 … 1/n的一類初等對稱函數(shù)的2-adic賦值
      L-代數(shù)上的賦值
      定數(shù)截尾場合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
      混沌偽隨機二值序列的性能分析方法研究綜述
      p-范分布中參數(shù)的置信區(qū)間
      支持CNN與LSTM的二值權(quán)重神經(jīng)網(wǎng)絡(luò)芯片
      多個偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
      基于二值形態(tài)學(xué)算子的軌道圖像分割新算法
      列車定位中置信區(qū)間的確定方法
      強賦值幺半群上的加權(quán)Mealy機與加權(quán)Moore機的關(guān)系*
      麦盖提县| 女性| 花莲县| 沾益县| 永寿县| 垣曲县| 山东省| 裕民县| 临海市| 金秀| 兴安盟| 巴彦县| 桂林市| 西和县| 石楼县| 义乌市| 醴陵市| 自治县| 阿勒泰市| 屯留县| 准格尔旗| 高阳县| 宿州市| 玉山县| 汉川市| 句容市| 舒兰市| 东港市| 凤翔县| 高雄县| 余庆县| 梧州市| 永泰县| 沧州市| 福贡县| 黄冈市| 古交市| 托里县| 大冶市| 湄潭县| 石城县|