• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      回歸校準和模擬外推對測量誤差的校正效果研究*

      2014-03-10 07:03:55霞張橋陳永杰李慧婷張秋菊劉美娜
      中國衛(wèi)生統(tǒng)計 2014年5期
      關(guān)鍵詞:外推法測量誤差回歸系數(shù)

      陳 霞張 橋陳永杰李慧婷張秋菊劉美娜△

      回歸校準和模擬外推對測量誤差的校正效果研究*

      陳 霞1張 橋2陳永杰1李慧婷1張秋菊1劉美娜1△

      目的探討回歸校準法(RC)和模擬外推法(SIMEX)對logistic回歸中測量誤差的校正效果。方法通過SAS軟件產(chǎn)生有測量誤差的模擬數(shù)據(jù),用RC和SIMEX對測量誤差進行校正,對比設(shè)定的真實β值和校正后的β*值之間的差別,以評價校正效果。結(jié)果當X可精確測量時,在設(shè)定的條件下,RC1的校正效果較好;P-SIMEX僅當很小時校正效果較好。當X不可精確測量時,隨著測量誤差的增大,E-SIMEX的校正效果降低,而RC2的校正效果相對較穩(wěn)定。結(jié)論無論X是否可測,在經(jīng)典測量誤差模型前提下,RC對logistic回歸模型中測量誤差的校正效果優(yōu)于SIMEX,建議應(yīng)用RC校正測量誤差。

      測量誤差 回歸校準法 模擬外推法 logistic回歸回歸稀釋

      統(tǒng)計分析過程中建立線性回歸或非線性回歸模型時,都假定自變量和應(yīng)變量無測量誤差,所得數(shù)據(jù)是變量的真實值。但在科研領(lǐng)域中,通過某種方式或者途徑所獲得的變量值未必是此變量的真實值,尤其是環(huán)境流行病學(xué)、膳食問卷調(diào)查等觀察性研究中,測量誤差是廣泛存在的問題[1,2]。數(shù)據(jù)分析時若忽略測量誤差的影響,會導(dǎo)致參數(shù)估計有偏,統(tǒng)計推斷不準確,因此需要對測量誤差進行校正[3]。關(guān)于測量誤差校正方法的研究,最經(jīng)典的是由Rosner提出的回歸校準法[4]和由Cook提出的模擬外推法[5],可通過SAS、Stata等統(tǒng)計軟件實現(xiàn)分析過程。本文通過模擬實驗,探討不同條件下回歸校準法和模擬外推法對logistic回歸中自變量測量誤差的校正效果。

      基本原理與方法

      1.測量誤差

      測量誤差是指科研過程中由于信息收集、固有的生物學(xué)變異和一些變量的主觀性等造成的誤差[6]。傳統(tǒng)回歸模型,如式(1):

      此模型中,變量Yi,Xi是可測的,εi是隨機誤差,β是待估參數(shù),fXi,()β是關(guān)于X的已知函數(shù)。通??筛鶕?jù)回歸函數(shù)fXi,()β的不同形式,估計出相應(yīng)的參數(shù)β。但在實際建模實踐時,自變量可能不可測,或者其測量帶有不可忽略的測量誤差。在一些觀察性研究中,如膳食頻率調(diào)查(FFQ),自變量X為真實值,是被調(diào)查者過去一年中的日平均膳食攝入量,通過問卷調(diào)查獲取的值為真實值X的估計值W,W和X之間的差別就是測量誤差[7]。

      2.回歸校準(regression calibration,RC)

      回歸校準的基本原理[8]是:先建立自變量真實值X關(guān)于觀測值W和協(xié)變量Z的回歸函數(shù),以此函數(shù)代替真實值X,再進行常規(guī)的回歸分析。RC的前提條件是W和X為線性關(guān)系,X關(guān)于W和Z的回歸函數(shù)叫做回歸校準函數(shù)。根據(jù)已知數(shù)據(jù)的特點,有RC1和RC2兩種方法建立回歸校準函數(shù)。

      RC1:當X可測,且測量值W與真實值X滿足非差分測量誤差模型[9](non-differentialmeasurement errormodel)W=γ0+γX+U,其中且U與X、Y相互獨立??蓮闹鲾?shù)據(jù)集中按一定比例隨機抽取一個同時有W和X值的數(shù)據(jù)集,稱效度數(shù)據(jù)集(validation data)。其較準過程分三步:首先利用效度數(shù)據(jù)集,建立X與W的線性模型X=λ0+λ1W,估算出系數(shù)然后根據(jù)校準模型利用主數(shù)據(jù)集,估算出每個個體校準后的XRC1;最后建立Y與XRC1的logistic回歸模型Pr(Y=1|X)=exp(β0+β1XRC1),估算出系數(shù)即為校準后的回歸系數(shù)。此種回歸校準簡稱RC1。

      3.模擬外推(simulation extrapolation,SIMEX)

      模擬外推是一種基于模擬的參數(shù)估計方法,其基本原理是:對有測量誤差的自變量W額外加一個逐級增大的擬測量誤差,基于擬數(shù)據(jù)集進行參數(shù)估計,再擬合這些參數(shù)的變化規(guī)律,最后外推出正確的參數(shù)值。此方法前提條件是W與真實值X滿足經(jīng)典測量誤差模型W=X+U,其中且U與X、Y相互獨立。根據(jù)是否已知,SIMEX可分為參數(shù)型和經(jīng)驗型[10]。參數(shù)型SIMEX(P-SIMEX)的基本步驟如下:

      模擬:在自變量觀測值W原有測量誤差U的基礎(chǔ)上,加上逐級增大的測量誤差,增加的幅度為θ,形成一個新模擬的其中測量誤差U的大小用其方差度量,即的測量誤差為

      擬估計:設(shè)θ為誤差增加幅度,b為擬估計模擬的次數(shù),定義

      數(shù)據(jù)模擬

      1.模擬設(shè)計

      真實數(shù)據(jù)集參數(shù)設(shè)置:樣本量N=1000,自變量X~N(0,1),協(xié)變量Z~N(0,1),通過logistic回歸模型Pr(Y=1|X,Z)=exp(β0+βxX+βzZ),產(chǎn)生因變量Y。β0=-2.5,βX=(0.5,1),βZ=1,分別對應(yīng)有90%、85%的Y=0。

      非差分測量誤差模型參數(shù)設(shè)置:γ0=0,γ=(0.5,根據(jù)模型W=γ0+γX+u產(chǎn)生自變量測量值W。從真實數(shù)據(jù)集中簡單隨機抽取100個觀測值作為效度數(shù)據(jù)集。此時應(yīng)用的校正方法為RC1、P-SIMEX(僅γ0=0,γ=1,且假定已知)。

      為確保模擬結(jié)果的穩(wěn)定性,對上述隨機變量的模擬均采用蒙特卡洛方法[11],模擬次數(shù)為100次,模擬結(jié)果取均值。

      2.評價指標

      評價校正效果的指標為校正后的回歸系數(shù)β*與設(shè)定真實值β真之差的絕對值和β*的標準差。β*與β真之差的絕對值越小,校正效果越好;β*的標準差越小,校正效果越穩(wěn)定。本文擬規(guī)定:0.05]時,校正效果理想;時,校正效果較好。

      結(jié) 果

      1.非差分測量誤差模型校正效果

      不同測量誤差條件下RC1校正效果如表1、圖1所示。將含測量誤差的測量值W作為自變量納入模型時,回歸系數(shù)βnaive都小于β真;隨著測量誤差的增大,βnaive越偏離β真。當非差分測量誤差模型中γ=0.5時,無論測量誤差的大小,經(jīng)RC1校正的雖然較βnaive好,但校正效果都不夠理想;當γ=0.75時,只有測量誤差較小1),RC1才能達到理想的校正效果。僅當W與X的關(guān)系滿足經(jīng)典測量誤差模型(即γ=1),RC1都能達到理想的校正效果。

      基于P-SIMEX的前提條件,僅當γ0=0,γ=1,且假定已知時,應(yīng)用此種方法進行校正。當非差分測量誤差模型中γ=1時,RC1和P-SIMEX如表1、圖2所示。僅當時,P-SIMEX能達到較好的校正效果。隨著測量誤差的增大,P-SIMEX校正的雖然較βnaive大,但校正效果都不好。在相同條件下,隨著的增大,經(jīng)RC1校正的的標準誤逐漸增大,而經(jīng)P-SIMEX校正的的標準誤逐漸減小。

      表1 RC1和P-SIMEX對測量誤差的校正效果

      圖1 非差分測量誤差條件下RC1的校正效果

      圖2 RC1(γ=1)和P-SIMEX的校正效果

      2.經(jīng)典測量誤差模型校正效果

      不同測量誤差條件下RC2和E-SIMEX的校正效果如表2、圖3所示。無論測量誤差多大,經(jīng)RC2校正后校正效果均理想。僅當時,E-SIMEX能達到較好的校正效果。在相同條件下,隨著的增大,經(jīng)RC2校正的的標準誤逐漸增大,而經(jīng)E-SIMEX校正的的標準誤逐漸減小。

      表2 RC2和E-SIMEX對測量誤差的校正效果

      圖3 經(jīng)典測量誤差條件下RC2及E-SIMEX的校正效果

      討 論

      測量誤差在環(huán)境暴露和營養(yǎng)膳食等流行病學(xué)調(diào)查中是普遍存在的,但在大多數(shù)研究數(shù)據(jù)處理分析時,往往被忽視,對其造成的影響很少進行調(diào)整或糾正。直接用含測量誤差的數(shù)據(jù)進行回歸分析時會產(chǎn)生一定的偏倚,導(dǎo)致參數(shù)估計有偏,或者推斷不準確,其效應(yīng)稱為回歸稀釋[12]。根據(jù)測量誤差的來源,可產(chǎn)生不同的稀釋效應(yīng)[13]:自變量X的測量誤差會造成回歸系數(shù)的減小;而應(yīng)變量Y的測量誤差不影響回歸系數(shù),但會造成其標準誤增大,使估計的精度下降。本文通過模擬試驗比較回歸校準法與模擬外推法兩種方法對logistic回歸中自變量測量誤差的校正效果結(jié)果顯示,當自變量有測量誤差時,未校正的βnaive都小于設(shè)定的β真,符合回歸稀釋的效應(yīng)。

      根據(jù)自變量X是否可精確測量,測量誤差的校正可分為RC1、P-SIMEX及RC2、E-SIMEX兩大類。當X可精確測量時,在設(shè)定的條件下,RC1的校正效果較好,P-SIMEX僅當很小時校正效果較好。當X不可精確測量時,隨著測量誤差的增大,E-SIMEX的校正效果降低,而RC2的校正效果相對較穩(wěn)定。無論X是否可測,在經(jīng)典測量誤差模型前提下,RC對logistic回歸模型中測量誤差的校正效果優(yōu)于SIMEX。但SIMEX也有自身的優(yōu)勢,其不僅可獲得校正后的回歸系數(shù),還可通過外推圖示直觀地體現(xiàn)出測量誤差對回歸系數(shù)的效應(yīng)。與RC相比,SIMEX更適用于對非線性回歸模型中的測量誤差進行校正[8]。

      基于本文模擬結(jié)果,對logistic回歸模型中測量誤差進行校正時,在經(jīng)典測量誤差模型前提下,建議應(yīng)用回歸校正法。本研究僅對模型中單個自變量(正態(tài)分布)含加法測量誤差的情況進行討論。但在實際應(yīng)用中,模型中含測量誤差自變量的個數(shù)、自變量的分布以及測量誤差模型的結(jié)構(gòu)更加復(fù)雜,回歸校準與模擬外推的校正效果如何,還需進一步研究。

      1.Pollack AZ,Perkins NJ,Mum ford SL,etal.Correlated biomarkermeasurement error:an important threat to inference in environmental epidem iology.American journal of epidem iology,2013,177(1):84-92.

      2.Day NE,Wong MY,Bingham S,et al.Correlated measurement error implications for nutritional epidem iology.Int J Epidem iol,2004;33(6):1373-1381.

      3.張橋,張秋菊,陳霞,等.回歸校準法對線性回歸中信息偏倚校正的模擬研究.中國衛(wèi)生統(tǒng)計,2013,30(3):327-329.

      4.Rosner B,Spiegelman D,W illettWC.Correction of logistic regression relative risk estimates and confidence intervals for measurement error:the case ofmultiple covariatesmeasured w ith error.American Journal of Epidem iology,1990,132(4):734-745.

      5.Cook JR,Stefanski LA.Simulation-extrapolation estimation in parametric measurement errormodels.Journal of the American Statistical Association,1994,89(428):1314-1328.

      6.Buonaccorsi JP.Measurement error:models,methods and applications. Chapman and Hall/CRC,2010.

      7.Jaceldo-Siegl K,Knutsen SF,Sabate′J,et al.Validation of nutrient intake using an FFQ and repeated 24 h recalls in black and white subjects of the Adventist Health Study-2(AHS-2).Public Health Nutr,2010,13(6):812-819.

      8.Carroll RJ,Ruppert D,Stefanski LA,etal.Measurementerror in nonlinearmodels:amodern perspective.Second Edition,Chapman and Hall/CRC,2006.

      9.Armstrong BG.Effect ofmeasurement error on epidem iological studies of environmental and occupational exposures.Occupational and environmentalmedicine,1998,55(10):651-656.

      10.Devanarayan V,Stefanski LA.Empirical simulation extrapolation for measurement error models with replicate measurements.Statistics&Probability Letters,2002,59(3):219-225.

      11.Rubinstein RY.Simulation and the Monte Carlo method.Wiley-interscience,2009.

      12.MacMahon S,Peto R,Cutler J,et al.Blood pressure,stroke,and coronary heart disease.Part1,prolonged differences in blood pressure:prospective observational studies corrected for the regression dilution bias. Lancet,1990,335:765-774.

      13.Hutcheon JA,Chiolero A,Hanley JA.Random measurement error and regression dilution bias.BMJ,2010,340(7761):1402-1406.

      (責(zé)任編輯:丁海龍)

      The Correction Effect Analysis of Regression Calibration and Simulation Extrapolation for M easurement Error

      Chen Xia,Zhang Qiao,Chen Yongjie,et al(BiostatisticsDepartment,HarbinMedicalUniversity(150081),Harbin)

      ObjectiveTo estimate the correction effect of regression calibration(RC)and simulation extrapolation(SIMEX)formeasurement error in logistic regression model.MethodsWe simulated datasets including given measurement error by SAS software,and applied RC and SIMEX to correctmeasurementerror.Then evaluated the correction effectby comparing the difference between trueβvalue and correctedβ*value.ResultsIfXcould be accuratelymeasured,RC1 could achieve preferable correction effect under the given,while P-SIMEX could only do wellwhen the valuewere ratherm inimal.IfXwas unobservable,the effect of E-SIMEX appeared worse w ith the increase ofmeasurement error,while RC2 performed relatively stable w ith differentvalues.ConclusionWhether or notXcould be accurately measured,RC worked better than SIMEX in the classicalmeasurement errormodel condition.We recommend RC on the basis of our simulation results.

      Measurementerror;Regression calibration;Simulation extrapolation;Logistic regression;Regression dilution

      國家科技支撐計劃(2011BAIO9B02)

      1.哈爾濱醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室(150081)

      2.哈爾濱醫(yī)科大學(xué)醫(yī)務(wù)處

      △通信作者:劉美娜,E-mail:liumeina369@163.com

      猜你喜歡
      外推法測量誤差回歸系數(shù)
      一種基于機械臂的外推天線增益標定系統(tǒng)
      中國新通信(2023年3期)2023-06-24 03:00:06
      密度測量誤差分析
      縱向數(shù)據(jù)下變系數(shù)測量誤差模型的漸近估計
      濱海相河口大型沉井基礎(chǔ)設(shè)計荷載效應(yīng)估計
      人民黃河(2018年8期)2018-09-10 16:05:55
      多元線性回歸的估值漂移及其判定方法
      電導(dǎo)法協(xié)同Logistic方程進行6種蘋果砧木抗寒性的比較
      多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時Bayes估計及優(yōu)良性
      用熱線法測定氣體熱導(dǎo)率的儀器改進
      牽引變壓器功率測量誤差分析
      稀溶液與固體反應(yīng)焓變的測量和校準
      玉林市| 左云县| 苍山县| 灵川县| 黄石市| 肇州县| 崇阳县| 唐河县| 梅河口市| 茂名市| 乌海市| 上高县| 康保县| 秦皇岛市| 昌黎县| 惠来县| 延吉市| 汨罗市| 永顺县| 新民市| 罗定市| 平顶山市| 仙桃市| 紫云| 永修县| 科尔| 密山市| 甘南县| 靖边县| 镇康县| 来宾市| 耿马| 蕲春县| 吉林省| 肥城市| 阿鲁科尔沁旗| 防城港市| 岳池县| 商城县| 林西县| 荆州市|