• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      用SAS軟件實現(xiàn)偏比例優(yōu)勢模型

      2011-03-11 14:01:42畢秀媛錢占成馮國雙
      中國衛(wèi)生統(tǒng)計 2011年6期
      關(guān)鍵詞:估計值參數(shù)估計回歸系數(shù)

      畢秀媛 錢占成 馮國雙

      比例優(yōu)勢模型(proportional odds model)是處理有反應(yīng)資料的常用方法〔1,2〕,目前在國內(nèi)醫(yī)學(xué)領(lǐng)域已有較多應(yīng)用〔3,4〕。但該法必須滿足比例優(yōu)勢假定條件,即自變量的回歸系數(shù)應(yīng)與分割點k無關(guān)。盡管以往有研究認為,比例優(yōu)勢模型對這一條件并不敏感〔5〕,但實際情況可能并非如此。Bender曾對此做過討論〔6〕,如果不滿足比例優(yōu)勢假定條件,比例優(yōu)勢模型跟其他模型的結(jié)果可能相反。Lall建議〔7〕,對假定條件不滿足的數(shù)據(jù),可采用偏比例優(yōu)勢模型(partial proportional odds model)進行分析,而不是比例優(yōu)勢模型。本文通過對一組有序反應(yīng)變量的分析,介紹如何利用SAS軟件實現(xiàn)偏比例優(yōu)勢模型的分析。?

      偏比例優(yōu)勢模型簡介

      比較一下可以發(fā)現(xiàn),偏比例優(yōu)勢模型與比例優(yōu)勢模型的不同之處在于多了γ系數(shù)。γ系數(shù)僅當(dāng)自變量不符合比例優(yōu)勢假定條件的情況下才存在,如果所有自變量均滿足該假定條件,則γ系數(shù)均為0,此時就是普通的比例優(yōu)勢模型。

      偏比例優(yōu)勢模型的分析首先要定義一個新變量,代表不同分割點(k個等級共有k-1個分割點),并分析自變量在不同分割點情況下的參數(shù)估計。γ系數(shù)反映了在不同分割點的情況下,在回歸系數(shù)β基礎(chǔ)上的增加值。

      由于定義了k-1個分割點變量,每一觀測的反應(yīng)變量不再是1個,而變成了k-1個。因此可利用SAS proc genmod命令中的GEE(generalized estimating equations)算法來實現(xiàn)多結(jié)果變量的分析。

      偏比例優(yōu)勢模型的SAS分析

      本文數(shù)據(jù)來源于某關(guān)于胃癌病變的影響因素研究,從中隨機選擇48例作為示例分析。因變量y為胃癌病變,分為淺表性胃炎(SG)、萎縮性胃炎(CAG)、腸上皮化生(IM)、異型增生(DYS),分別用 0、1、2、3 表示。自變量x1、x2分別為基因A和基因B,均為二分類變量,0表示表達陰性,1表示表達陽性。欲分析x1、x2對 y的影響。

      首先我們采用比例優(yōu)勢模型分別對x1和x2進行分析,結(jié)果發(fā)現(xiàn),x1不滿足比例優(yōu)勢假定(χ2=12.6659,P=0.0018),x2滿足比例優(yōu)勢假定(χ2=2.0151,P=0.3651)。因此我們采用偏比例優(yōu)勢模型,對不同分割點的x1進行參數(shù)估計。

      分析程序如下:

      run;

      /*上段程序?qū)γ恳挥^測創(chuàng)建3個logit,logit表示分割點,分別為3、2、1,新的反應(yīng)變量yy賦值為1和0,每一觀測均有3個反應(yīng)變量*/

      proc genmod desc;

      class id logit;

      model yy=x1 x2 logit logit*x1/link=logit dist=bin type3;

      repeated subject=id/type=un;

      run;

      /*上段程序利用proc genmod命令調(diào)用GEE算法,此時每一觀測包含3個反應(yīng)變量。由于X1不滿足比例優(yōu)勢假定條件,因此加入logit*x1,分析不同logit下x1的參數(shù)估計。作業(yè)相關(guān)矩陣類型選擇un,即無結(jié)構(gòu)相關(guān)*/

      主要輸出結(jié)果分別見表1和表2。表1給出了參數(shù)估計結(jié)果。其中X1對應(yīng)的是以3為分割點(0,1,2 vs 3)的參數(shù)估計值,由于程序中加入desc選項,因此實際反映的是(3 vs 0,1,2)的參數(shù)估計。由于參數(shù)估計值為1.7869,表明基因A陽性發(fā)生DYS的危險高于基因A陰性。X1*logit1、X1*logit2分別對應(yīng)以1、2為分割點的X1估計值的增加值。也就是說,分割點為2(0,1 vs 2,3)時(實際為 2,3 vs 0,1)X1的參數(shù)估計值為1.7869-2.2501=-0.4632,表明基因A陽性發(fā)生DYS和IM的危險低于基因A陰性。分割點為1(0 vs 1,2,3)時(實際為 1,2,3 vs 0)X1的參數(shù)估計值為1.7869-0.2004=1.5865,表明基因A陽性發(fā)生DYS、IM和CAG的危險高于基因A陰性。

      logit與此類似,Intercept反映的是 logit3的估計值,即分割點為3時的截距項。logit1反映了分割點為1時的截距項,其參數(shù)估計值為-2.2729+3.9428=1.6699。logit2反映了分割點為2時的截距項,其參數(shù)估計值為-2.2729+3.3225=1.0496。

      表1 參數(shù)估計結(jié)果

      表1的參數(shù)估計結(jié)果顯示,以不同分割點對因變量進行劃分,其參數(shù)估計值相差較大。以3為分割點時,X1的影響有統(tǒng)計學(xué)意義(P=0.0419)。以2為分割點時,X1也有統(tǒng)計學(xué)意義(P=0.0078)。以1為分割點時,X1無統(tǒng)計學(xué)意義(P=0.8788)。而如果直接采用比例優(yōu)勢模型,結(jié)果顯示X1無統(tǒng)計學(xué)意義(P=0.1841)。

      表2給出了score得分檢驗,結(jié)果顯示,X1*logit有統(tǒng)計學(xué)意義,提示不同分割點的X1估計值不同,進一步驗證了x1不符合比例優(yōu)勢假定條件。

      表2 Score得分檢驗

      表3列出了偏比例優(yōu)勢模型與比例優(yōu)勢模型的參數(shù)估計比較結(jié)果。可以看出,兩種模型的X1估計值差別較大。對于偏比例優(yōu)勢模型而言,不同分割點的X1估計值差別很大,當(dāng)j=3和j=2時,出現(xiàn)了截然相反的結(jié)果,這也正是比例優(yōu)勢模型失效的原因。

      表3 比例優(yōu)勢模型與偏比例優(yōu)勢模型的參數(shù)估計比較

      討 論

      有序分類資料最常用的分析方法是比例優(yōu)勢模型,目前該模型在國內(nèi)不少領(lǐng)域都有應(yīng)用,但關(guān)于其正確應(yīng)用的探討卻很少。比例優(yōu)勢模型的前提條件是自變量的回歸系數(shù)與分割點無關(guān),也就是要求不同分割點的回歸系數(shù)相同。只有滿足這一條件,模型的估計結(jié)果才是比較可靠的。但在實際中這一條件并不總是能滿足,尤其自變量較多的情況下,很難保證每一自變量都符合這一條件。此時如果采用比例優(yōu)勢模型是不妥的,而應(yīng)選擇其他更為合適的模型。Bender認為〔6〕,比例優(yōu)勢假定條件不滿足時,可用獨立的二分類模型(separate binary model)或偏比例優(yōu)勢模型進行擬合,且偏比例優(yōu)勢模型效率高于獨立的二分類模型。偏比例優(yōu)勢模型實際上也是基于累積logit的一種方法,可利用GEE算法來實現(xiàn)〔8,9〕。以往由于受統(tǒng)計軟件功能的限制,偏比例優(yōu)勢模型的實現(xiàn)較為困難。目前包括SAS軟件在內(nèi)的很多統(tǒng)計軟件均可實現(xiàn)GEE算法,因此偏比例優(yōu)勢模型可作為比例優(yōu)勢假定條件不滿足時的首選替代方法。

      偏比例優(yōu)勢模型主要有兩種:非限制的偏比例優(yōu)勢模型(unconstrained partial proportional model)和限制的偏比例優(yōu)勢模型(constrained partial proportional model)。非限制的偏比例優(yōu)勢模型中,符合比例優(yōu)勢假定的變量在不同分割點有相同的參數(shù)估計,不符合假定條件的變量在不同分割點有不同的參數(shù)估計。限制的偏比例優(yōu)勢模型中,假定自變量的參數(shù)估計在各分割點有一定的趨勢(如線性趨勢),該模型一般需要事先對估計值有一定的了解,或者可以先通過非限制的偏比例優(yōu)勢模型估計出參數(shù)值,然后看是否有一定的趨勢。

      本文所介紹的是非限制的偏比例優(yōu)勢模型及其分析過程,這一模型也是實際中較為常用的。目前國內(nèi)關(guān)于該模型的介紹極少,本文旨在拋磚引玉,以便進一步推動該模型的應(yīng)用。

      1.Amstrong BG,Sloan M.Ordinal regression models for epidemiologic data .Am J of Epodemiology,1989,129(1):191-204.

      2.Bender R,Grouven U.Ordinal logistic regression in medical research.Journal of the Royal College of Physicians of London,1997,31(5):546-551.

      3.吳彬,田俊,羅仁夏.胃癌患者生存質(zhì)量影響因素的累積比數(shù)模型分析.中國衛(wèi)生統(tǒng)計,2007,24(1):36-38.

      4.吳彬,曹建平,宋建華,等.福州地區(qū)高校教師亞健康影響因素的累積比數(shù)模型分析.中國衛(wèi)生統(tǒng)計,2010,27(3):262-264.

      5.李康,郭祖超,胡琳,等.有序分類數(shù)據(jù)回歸模型及醫(yī)學(xué)應(yīng)用.中國衛(wèi)生統(tǒng)計,1992,9(6):52-54.

      6.Bender R,Grouven U.Using binary logistic regression models for ordinal data with non-proportional odds.Journal of Clinical Epidemiol,1998,51(10):809-816.

      7.Lall R,Campbell MJ,Walters SJ,et al.A review of ordinal regression models applied to health-related quality of life assessments〔j〕.statistical methods in medical research,2002,11(1):49-67.

      8.Peterson B,Harrell F.Partial proportional odds models for ordinal response variables.Appl Statist,1990,39(2):205-217.

      9.Bender R,Benner A.Calculating ordinal regression models in SAS and S-plus .Biometrical Journal,2000,42(6):677-699.

      猜你喜歡
      估計值參數(shù)估計回歸系數(shù)
      基于新型DFrFT的LFM信號參數(shù)估計算法
      一道樣本的數(shù)字特征與頻率分布直方圖的交匯問題
      多元線性回歸的估值漂移及其判定方法
      統(tǒng)計信息
      2018年4月世界粗鋼產(chǎn)量表(續(xù))萬噸
      電導(dǎo)法協(xié)同Logistic方程進行6種蘋果砧木抗寒性的比較
      Logistic回歸模型的幾乎無偏兩參數(shù)估計
      多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時Bayes估計及優(yōu)良性
      基于向前方程的平穩(wěn)分布參數(shù)估計
      基于競爭失效數(shù)據(jù)的Lindley分布參數(shù)估計
      九龙县| 三穗县| 沙洋县| 陵水| 肥西县| 克拉玛依市| 新田县| 璧山县| 佛坪县| 宁强县| 庆安县| 三穗县| 乐亭县| 阿荣旗| 泰顺县| 睢宁县| 淮南市| 玉环县| 应用必备| 柘荣县| 玉林市| 洛川县| 旺苍县| 莱阳市| 广宗县| 化隆| 大渡口区| 镶黄旗| 营山县| 高尔夫| 田阳县| 石棉县| 安国市| 潮安县| 湟源县| 松滋市| 呼伦贝尔市| 红桥区| 衡东县| 柞水县| 股票|