• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      多元分析中的多重共線性及其處理方法*

      2012-03-11 14:01:34靜△
      關(guān)鍵詞:共線性因變量回歸系數(shù)

      楊 梅 肖 靜△ 蔡 輝

      在醫(yī)學(xué)領(lǐng)域研究中,變量間存在多重共線性的現(xiàn)象十分普遍,其結(jié)果可能導(dǎo)致治療效果或暴露因素作用的估計(jì)產(chǎn)生偏性。研究者常常通過調(diào)整某些協(xié)變量或混雜因素來調(diào)整變量間的多重共線性,以評(píng)價(jià)某些治療方法或暴露因素與疾病間的關(guān)系〔1-2〕。但這樣不僅會(huì)損失掉信息,而且某些混雜因素難以達(dá)到治療組間或暴露因素各水平間的平衡,降低檢驗(yàn)效能,甚至使分析結(jié)果失真。不同的解決變量間多重共線性的統(tǒng)計(jì)學(xué)處理方法〔3-5〕均有各自的優(yōu)缺點(diǎn)和適用范圍,至今仍沒有一種通用的解決方法。本文闡述目前常用的幾種方法:嶺回歸、主成分回歸、逐步回歸、偏最小二乘法和傾向評(píng)分等,并闡述了各方法的優(yōu)缺點(diǎn)以及這些方法的有效性和適用范圍,以供研究者根據(jù)需要和數(shù)據(jù)特征選擇合適的處理方法。

      多重共線性的定義

      “多重共線性”一詞最早由R.Frisch于1934年提出〔6〕。共線性是指線性模型中兩個(gè)自變量之間存在相關(guān)關(guān)系,而多重共線性是指線性回歸模型中的兩個(gè)自變量或者多個(gè)自變量之間由于存在相關(guān)關(guān)系而使模型估計(jì)失真或難以估計(jì)準(zhǔn)確〔7〕。最初指模型中某些自變量線性相關(guān)。當(dāng)自變量X1、X2…Xn滿足k1X1+… +kiXi+ … +knXn=0,常數(shù) ki(i=1、2…,n)不全為0時(shí)稱為完全多重共線,是多重共線性的極端情況,在實(shí)際工作中較為少見;當(dāng)自變量滿足k1X1+k2X2+…+kiXi+Vi=0,Vi為隨機(jī)誤差項(xiàng),稱為不完全多重共線,變量間有某種關(guān)系但又不是完全的線性關(guān)系,這種情況是在醫(yī)學(xué)研究中普遍存在的。

      產(chǎn)生多重共線性的原因及其影響

      一般多重共線性產(chǎn)生的根源有二方面〔8〕:一是自變量自身的性質(zhì),即兩個(gè)或多個(gè)自變量間高度相關(guān),與數(shù)據(jù)形式,樣本含量大小無關(guān)。這時(shí)如果把這些自變量納入模型前不對(duì)條件加以任何限制或考慮,很多時(shí)候得不到理想的結(jié)果,甚至導(dǎo)致錯(cuò)誤的結(jié)論。二是數(shù)據(jù)的問題。各自變量間并不存在線性關(guān)系,但由于樣本含量較小,小于模型中的自變量個(gè)數(shù),也可能會(huì)產(chǎn)生多重共線性。如當(dāng)樣本含量為2(n=2),兩點(diǎn)連成一條直線,易造成共線性。隨著研究的深入,20世紀(jì)80年代后期研究者開始關(guān)注異常觀測(cè)值對(duì)多重共線性的影響。Hadi〔9〕、Walker〔10〕等人研究表明,異常觀測(cè)值會(huì)導(dǎo)致或掩蓋多重共線性現(xiàn)象從而影響正確的參數(shù)估計(jì)。另外如果模型自變量是高階單整時(shí)序變量,那么也會(huì)導(dǎo)致多重共線性,因?yàn)檫@種時(shí)序變量之間高度相關(guān)。

      Yohanan〔11〕指出雖然回歸模型擬合較好,但由于共線性的存在,會(huì)出現(xiàn)下列現(xiàn)象:某些回歸系數(shù)通不過假設(shè)檢驗(yàn);或者某個(gè)自變量與因變量有很強(qiáng)的相關(guān)性,而在回歸模型中該變量的回歸系數(shù)卻沒有通過假設(shè)檢驗(yàn),導(dǎo)致錯(cuò)誤剔除有用的自變量;再或者回歸系數(shù)的符號(hào)與相關(guān)專業(yè)相反導(dǎo)致無法得到合理的專業(yè)解釋等。因此,多重共線性的存在,會(huì)使模型與實(shí)際相差甚遠(yuǎn)。

      多重共線性的診斷

      消除或減少多重共線性的統(tǒng)計(jì)方法

      處理多重共線性的方法很多,如增加新變量〔3〕、剔除不重要變量〔4〕、利用 Bayes技術(shù)〔5〕、數(shù)據(jù)分組處理算法(group method of data handling,GMDH)〔18〕、Lasso回歸〔19〕、嶺回歸(RR)、主成分回歸(PCR)、逐步回歸、偏最小二乘法(PLS)以及傾向評(píng)分法(PS)等。這些方法在某些方面對(duì)多重共線性問題的解決起到了很好的作用,但在應(yīng)用條件上或在結(jié)果解釋方面都存在局限性。就目前常用的幾種方法逐一介紹。

      1.嶺回歸

      Hoerl〔20〕1962 年提出,Hoerl和 Kennard〔21-22〕1970年發(fā)展了嶺回歸,嶺回歸是一種改進(jìn)最小二乘估計(jì)的有偏估計(jì)方法。當(dāng)自變量間存在多重共線性,自變量的相關(guān)矩陣X為奇異陣,X'X也是奇異的。嶺回歸技術(shù)從減少誤差均方角度改善矩陣的奇異性,將X'X加上一常數(shù)矩陣kI,相應(yīng)嶺估計(jì)^β(k)=(X'X+kI)-1X'Y,(0<k<+∞),當(dāng)k=0時(shí),^β(k)為最小二乘估計(jì);當(dāng)k趨于+∞,^β(k)趨于0,因此k值不宜太大,不同k值估計(jì)得到不同的回歸系數(shù),再將不同k值時(shí)的回歸系數(shù)連成一條曲線,所得的曲線稱為嶺跡。當(dāng)嶺跡趨于平穩(wěn),且回歸系數(shù)沒有不合理的符號(hào)時(shí)對(duì)應(yīng)的k值即為所求〔23-24〕。薛美玉〔25〕進(jìn)一步提出了廣義嶺估計(jì)^β(k)=(X'X+QkQ')-1X'Y,實(shí)質(zhì)是將X'X加上不同常數(shù)矩陣QkQ'。但廣義嶺估計(jì)的計(jì)算量相當(dāng)大。有學(xué)者認(rèn)為〔26-27〕嶺回歸雖然不是無偏估計(jì),但它通過對(duì)最小二乘法的改進(jìn)對(duì)回歸系數(shù)的有偏估計(jì)量進(jìn)行補(bǔ)救從而顯著增強(qiáng)估計(jì)的穩(wěn)定性。其局限性在于無法進(jìn)行一般的統(tǒng)計(jì)推斷,且未知其精確分布,所得回歸方程符合實(shí)際但效果稍差。此外,嶺參數(shù)的選取和確定非常麻煩,偏倚常數(shù)k人為確定,帶有一定的主觀判斷,因此不唯一。國(guó)內(nèi)一些學(xué)者如王思珍〔28〕、汪明瑾〔29〕等人對(duì)確定k值的方法進(jìn)行了一些探討及推廣,縮小了k值的范圍,改進(jìn)了Hoerl和Kennard的結(jié)果,但是對(duì)怎樣才能完全逼近極值點(diǎn),還有待進(jìn)一步研究〔30-31〕。

      2.主成分回歸

      主成分回歸是Massy〔32〕于1965年提出的一種處理多重共線性的新參數(shù)方法,是建立在主成分分析思路上的一種有偏估計(jì)。其基本思想是首先將原自變量線性組合成若干個(gè)主成分,然后建立因變量與主成分的回歸方程,再根據(jù)主成分與原自變量間的對(duì)應(yīng)關(guān)系最后求得原自變量回歸模型的估計(jì)方程。因轉(zhuǎn)換后的各主成分間不存在共線性,從而消除了共線性的危害。

      王惠文〔33〕、陳偉〔34〕和舒曉惠〔35〕等人對(duì)主成分回歸消除共線性的有效性并不樂觀,王惠文甚至認(rèn)為利用主成分分析消除多重共線性實(shí)際上是一種錯(cuò)誤觀念。然而作為多元分析的一種常用方法,主成分回歸具有一定的優(yōu)越性,其降維的優(yōu)勢(shì)是明顯的。在一定程度上會(huì)使得回歸方程及參數(shù)估計(jì)更加可靠。但由于主成分回歸只針對(duì)自變量去尋找有代表性的成分,可能造成選取的主成分雖可反映自變量的重要信息,但與因變量的關(guān)系卻極小,而與因變量相關(guān)性極大、在自變量中所占比例小的成分有可能被刪除。此時(shí)得到的回歸方程反映真實(shí)情況的效果較差,且主成分一般不具有實(shí)際意義,使得模型很難對(duì)實(shí)際問題做出合理解釋。趙海清〔36〕結(jié)合主成分估計(jì)和嶺估計(jì)的思想和方法提出廣義嶺型估計(jì),降低了均方誤差,便于對(duì)原變量做出解釋的同時(shí)大大減少了計(jì)算量。此外,一些學(xué)者將根據(jù)主成分思想改進(jìn)的主成分條件logistic回歸〔37〕以及主成分Weibull〔38〕回歸模型應(yīng)用于處理多重共線性問題,發(fā)現(xiàn)這兩種改進(jìn)的方法能減小部分偏回歸系數(shù)的標(biāo)準(zhǔn)誤并在提高回代符合率上取得了較為理想的結(jié)果。

      3.逐步回歸

      逐步回歸法是建立在多元回歸基礎(chǔ)上的一種思維方法和建模策略。其基本原理是從所有自變量中選擇對(duì)因變量Y影響最為顯著的變量建立模型,事先給定一剔選標(biāo)準(zhǔn),每選入或剔除一個(gè)變量,都要對(duì)模型中和模型外的變量進(jìn)行檢驗(yàn),對(duì)低于剔除標(biāo)準(zhǔn)或符合入選標(biāo)準(zhǔn)的變量都要重新考慮剔除或選入,以保證每次引入變量前回歸方程中只包括顯著性變量,反復(fù)進(jìn)行,直到方程內(nèi)沒有變量可被剔除,方程外沒有變量可引入為止。從變量間的相關(guān)系數(shù)矩陣可看出各變量間是否有相關(guān)關(guān)系,將高度相關(guān)的各自變量間進(jìn)行比較,剔除對(duì)因變量影響較小的,保留影響較大的自變量,而被剔除的自變量對(duì)因變量的解釋由與之高度相關(guān)的其他自變量承擔(dān),以消除多重共線性,這時(shí)所得的回歸方程即最優(yōu)回歸方程。

      逐步回歸法在一定程度上克服了多重共線性,但模型F檢驗(yàn)的檢驗(yàn)水準(zhǔn)α的選擇帶有主觀性,不同α所得結(jié)果不同。且逐步回歸分析一般需要較大樣本,為此,肖筱南〔39〕提出了利用分階段、分批逐步回歸的方法處理小樣本問題。譚啟華〔40〕認(rèn)為個(gè)別異常點(diǎn)對(duì)逐步回歸分析的影響作用是不容忽視的,分析時(shí)要注意異常點(diǎn)的存在。于雷〔41〕認(rèn)為加權(quán)逐步回歸可更好地避免樣本中可能存在的多重共線性造成的模型失真。針對(duì)逐步回歸在消除多重共線性的同時(shí),也可能刪掉一些對(duì)Y有解析力的變量,張華嘉〔42〕提出一種方法,在逐步回歸后,使每一前進(jìn)(后退)步為一單元步,用F檢驗(yàn)來判別這單元步的去留,使回歸式子比逐步回歸納入更多的解析變量,同時(shí)能減低向后消元法產(chǎn)生多重共線性的可能性。汪仁宮〔43〕以傳統(tǒng)逐步回歸為基礎(chǔ),提出了基法逐步回歸,認(rèn)為該法既保持了傳統(tǒng)逐步回歸法的長(zhǎng)處,也在一定程度上緩解了其局限性。在傳統(tǒng)逐步回歸法的基礎(chǔ)上做多種形式的修正與推廣,這有待進(jìn)一步探索與分析。

      4.偏最小二乘回歸

      Wold等人〔44〕于1983年首次提出,近年來,在理論和應(yīng)用方面都得到了迅速的發(fā)展〔45-47〕。偏最小二乘回歸根源于主成分分析和主成分回歸,它的基本做法是分別在自變量X與因變量Y中提取出因子t和u,要求t和u應(yīng)盡可能大地?cái)y帶它們各自變異信息并且相關(guān)程度能夠達(dá)到最大。在第一個(gè)因子被提取后,通過偏最小二乘法分別建立X對(duì)t的回歸以及Y對(duì)u的回歸。如果回歸方程已經(jīng)達(dá)到滿意的精度,則算法終止;否則,將利用X被t解釋后的殘余信息以及Y被u解釋后的殘余信息進(jìn)行第二輪的成分提取。如此往復(fù),直到能達(dá)到一個(gè)較滿意的精度為止。若最終對(duì)X共提取了k個(gè)成分,偏最小二乘回歸將通過施行yk對(duì)X的這些成分的回歸,然后再表達(dá)為Y與原自變量的回歸方程式。

      Wold〔48〕、Skuldson〔49〕和 Geladi〔50〕的研究均指出當(dāng)多個(gè)因變量間以及多個(gè)自變量間存在嚴(yán)重的多重相關(guān)時(shí),偏最小二乘回歸是構(gòu)造預(yù)測(cè)模型的一種有效方法。該模型只要選取的因子足夠多,完全可以包容自變量系統(tǒng)的全部信息,因子的選擇比較容易。從模型系數(shù)的解釋能力來看,偏最小二乘回歸最終得到整個(gè)自變量空間的線性組合,在充分考慮了單因素間的綜合作用對(duì)預(yù)測(cè)值的影響下對(duì)因變量進(jìn)行全面合理的解釋。該方法對(duì)樣本的要求較為寬松〔51〕,綜合了多元線性回歸分析、典型相關(guān)分析和主成分分析的基本功能,但也有一定的局限性,如動(dòng)態(tài)多變量過程的模型建立等,尚待進(jìn)一步研究。

      5.傾向評(píng)分

      1983年,Rosenbaum 和 Rubin〔52〕首次提出了利用傾向評(píng)分法來消除觀察研究中混雜因素引起的偏倚。傾向評(píng)分法最初并未受到廣大研究者的重視,直到20世紀(jì)末才被逐漸應(yīng)用至臨床試驗(yàn)評(píng)價(jià)、流行病學(xué)等領(lǐng)域〔53-54〕。傾向評(píng)分是指在給定觀察協(xié)變量(xi)的條件下,研究對(duì)象i(i=1,…,n)被分配到特定處理組(Zi=1)或?qū)φ战M(Zi=0)的條件概率,即e(xi)=pr(Zi=1|Xi=xi)或e(xi)=pr(Zi=0|Xi=xi)。假定在給定的一組特征變量Xi下,分組變量Zi是獨(dú)立的,則:pr(Zi=z1,…,Z=zn|X1=xi,…,XN=xN)=

      ΠN

      i=1ezi

      (xi){1 - e(xi)}1-zi〔54〕。也就是所有可觀察的協(xié)變量在兩組間(處理組與對(duì)照組)或多組間均衡性的一個(gè)近似函數(shù)。它通過調(diào)整各協(xié)變量在組間的分布差異從而提高組間的可比性。

      傾向評(píng)分法是對(duì)傳統(tǒng)多元回歸方法的補(bǔ)充,若將其思想結(jié)合到傳統(tǒng)方法中(如多元logistic回歸),可以改善組間均衡性,而且不受協(xié)變量數(shù)量的限制,有助于減少偏倚和提高精度。但與隨機(jī)試驗(yàn)相比,傾向評(píng)分僅控制了可觀察的混雜因素。換而言之,偏倚的問題仍然存在。同時(shí)傾向評(píng)分在觀察研究中往往在樣本較大時(shí)效果更好,小樣本中仍難以避免某些協(xié)變量間的嚴(yán)重失衡〔55〕。

      消除或減少多重共線性的其他方法

      蔣平〔56〕提出了在解決選擇自變量和降低其相關(guān)性的問題上采用聚類回歸分析能在一定程度上降低多重共線性,但是該方法首先要在動(dòng)態(tài)聚類中給定一個(gè)參數(shù)k,而k是人為確定的,也就是說,該方法的主觀性很強(qiáng)。而林樂義〔57〕提出了基于聚類分析和因子分析的方法也能夠很好的消除多重共線性,并且還能改善某些消除共線性方法中過分剔除自變量的缺陷,使得某些重要變量能夠保留下來。另外王玉梅〔58〕提出的不相關(guān)法,也能在一定程度上改善多重共線性。Oscar〔59〕曾指出差分法主要針對(duì)時(shí)間序列數(shù)據(jù)的樣本可以較有效地消除存在于原模型中的多重共線性,但是同時(shí)也指出了差分法只有在很少情況下能夠改善估計(jì)效應(yīng)。當(dāng)Cox模型中出現(xiàn)多因子共線性時(shí),張丕德〔60〕提出首先應(yīng)用因子分析法將多因子的信息分解為公因子和特殊因子兩部分,然后對(duì)這兩部分信息分別進(jìn)行Cox模型擬合,這樣兩個(gè)模型互為補(bǔ)充,也可以避免信息的損失,使模型的解釋更加全面。另外,曾繁會(huì)〔61〕用具體實(shí)例說明了神經(jīng)網(wǎng)絡(luò)(GRNN)也是一種可以將存在多重共線性的統(tǒng)計(jì)問題映射為線性可分問題來解決的方法。

      展 望

      在實(shí)際應(yīng)用中,為了更全面分析問題,往往涉及到的相關(guān)變量較多,然而,較多的變量易造成變量間的多重共線性,進(jìn)而嚴(yán)重影響參數(shù)估計(jì),增大模型誤差,把一些重要變量排除在模型之外,破壞模型的穩(wěn)定性,給合理地分析問題和解決問題帶來困難。各多重共線性處理方法本身也存在著許多亟待解決的問題。因此,迫切需要我們發(fā)展一些新的、適用性強(qiáng),效果更理想的處理變量共線性的方法。將現(xiàn)有不同共線性處理方法有機(jī)地結(jié)合是個(gè)很好的思路,它能夠綜合利用各種方法的優(yōu)點(diǎn),提高模型估計(jì)的精度和準(zhǔn)確性。如:結(jié)合主成分估計(jì)和嶺估計(jì)的思想和方法提出的廣義嶺型估計(jì),降低了均方誤差的同時(shí)便于對(duì)原變量做出解釋〔36〕。隨著科技的發(fā)展,這些探索性方法必將在生物學(xué)和醫(yī)學(xué)研究中得到檢驗(yàn)。再者,共線性處理方法要與生物醫(yī)學(xué)實(shí)際充分結(jié)合起來,根據(jù)醫(yī)學(xué)實(shí)際情況選擇變量共線性的處理方法。同時(shí),我們認(rèn)為應(yīng)尋求新的思路和發(fā)展方向,如不相關(guān)法〔58〕、神經(jīng)網(wǎng)絡(luò)法〔61〕,來解決多重共線性問題等新方法。最后,優(yōu)化及完善較成熟的方法,進(jìn)一步探索與研究一些技術(shù)性方法,如Fabrycy〔62〕于1975年提出通過改變模型形式改變共線性等,將其應(yīng)用到實(shí)際問題中,這些都將是對(duì)處理多重共線性問題的挑戰(zhàn)。

      1.Joffe MM,Rosenbaum PR.Invited commentary:propensity scores.Am J Epidemiol,1999,150(4):327-333.

      2.Hosmer DW,Lemeshow S.Applied logistic regression.2nd ed,New York:Wiley,2000:31-43.

      3.Lardaro L.Applied econometrics.New York:Harper collins,1992:441-464.

      4.Schrocder MA.Diagnosing and dealing with multicollinearity.Western Journal of Nursing Reserch,1990,12(2):175.

      5.Leamer EE.Multicollinearity:a bayesian interpretation.Review of Economics and Statistics,1973,55(3):371-380.

      6.Frisch R.Statistical confluence analysis by means of complete regression systems.Pub.No.5,Economic Institute,Oslo University,1934.

      7.陳希儒,王松桂主編.近代回歸分析.合肥:安徽教育出版社,1987:217-278.

      8.Chatterjee S,Hadi AS.Sensitivity analysis in linear regression.New York:John Wiley and Sons,1988:39-59.

      9.Hadi AS.Diagnosing collinearity-influential observations.Computational Statistics and Data Analysis,1988,7:143-159.

      10.Walker E.Detection of collinearity-influential observations.Communication in Statistics,1989,18(5):1675-1690.

      11.Yohanan W.Collinearity diagnosis for a relative risk regression analysis:an application to assesment of diet cancer relationship in epidemiological studies.Statistics in medicine,1992,11:1273-1287.

      12.Chatterjee S,Price B.Regression analysis by example.2nd ed.New-York:Wiley,1991:186-197.

      13.Kenneth N.Tolerance and condition in regression copmputations.J of America Statistical Association,1977:863-866.

      14.Stewart GW.Collinearity and least squares regression.Statistical Science,1987,2(1):68-100.

      15.Farrar DE,Glauber RR.Multicollinearity in regression analysis:the problem revisited.Review Econmics and Statistics,1967,49:92-107.

      16.Kendall MG.A course in multivariate analysis.Griffin:London,1957:68-86.

      17.Silevy SD.Multicollinearity and imprecise estimation.J.Roy.Stasist.1969,31:539-552.

      18.Ivakhnenko AG.Heuristic self-anization in problem of engineering.Cyberneties Automatiea,1970,6:207-219.

      19.Tibshitani R.Regression shrinkage and selection via the lasso.J.Roy.Statistsocser,1994,58:267-288.

      20.Hoerl AE.Application of ridge analysis to regression problems.Chemical Engineering Progress,1962,58:54-59.

      21.Hoerl AE,Kennard RW.Ridge regression:biased estmiation for nonorthogonal problems.Techometrics,1970,12(1):55-68.

      22.Hoerl AE,Kennard RW.Ridge regression:application for nonorthogonal prolems.Techometrics,1970,12(1):69-72.

      23.Hadgn A.An application of ridge regression analysis in the study of syphilis data.Statistics in Medicine,1984,3(3):293.

      24.陳峰主編.醫(yī)用多元統(tǒng)計(jì)分析方法.第二版.北京:中國(guó)統(tǒng)計(jì)出版社.2006:46-48.

      25.薛美玉,梁飛豹.廣義嶺估計(jì)參數(shù)的迭代算法.福州大學(xué)學(xué)報(bào),2002,30(2):167-171.

      26.栗麗,趙偉,王志福.在解決多重共線性問題上嶺回歸法比LS法的優(yōu)越性.渤海大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,27(2):124-126.

      27.楊楠.嶺回歸分析在解決多重共線性問題中的獨(dú)特作用.統(tǒng)計(jì)與決策,2004,3:14-15.

      28.王思珍,李良臣,王維.嶺選擇指數(shù)及其應(yīng)用.哲里木畜牧學(xué)院學(xué)報(bào),1998,8(1):50-58.

      29.汪明瑾,王靜龍.嶺回歸中確定K值的一種方法.應(yīng)用概率統(tǒng)計(jì),2001,17(1):7-13.

      30.何中市,何良才.嶺回歸估計(jì)K值選取迭代算法的收斂性定理和極限.應(yīng)用數(shù)學(xué)學(xué)報(bào),1994,17(1):59-64.

      31.葛宏立,方陸明.無偏的嶺回歸迭代算法.?dāng)?shù)學(xué)的實(shí)踐與認(rèn)識(shí),1997,27(4):320-326.

      32.Massy WF.Principle Components Regression in Exploratory Statistical Research.JAmer Statist Assoc,1965,60:234-266.

      33.王惠文主編.偏最小二乘回歸方法及其應(yīng)用.北京:國(guó)防工業(yè)出版社,1999:67-84.

      34.陳偉.主成分分析法用于評(píng)價(jià)需注意的若干問題.人類工效學(xué),2002,3(8):30-33.

      35.舒曉惠,劉建平.利用主成分回歸法處理多重共線性的若干問題.理論新探,2004,10:25-26.

      36.趙海清,詹環(huán).復(fù)共線性與廣義嶺型估計(jì).大學(xué)數(shù)學(xué),2009,25(3):31-34.

      37.陳雄飛,董曉梅,汪寧,等.多因子共線性的主成分logistic回歸分析.中國(guó)衛(wèi)生統(tǒng)計(jì),2003,20(4):212-215.

      38.吳彬,羅仁,夏田?。嘁蜃庸簿€性的主成分Weibull回歸分析.中國(guó)衛(wèi)生統(tǒng)計(jì),2008,25:513-514.

      39.肖筱南.小樣本多元逐步回歸的最優(yōu)篩選分析.統(tǒng)計(jì)與信息論壇,2002,17:22-24.

      40.譚啟華,何大衛(wèi).異常點(diǎn)對(duì)逐步回歸分析的影響.現(xiàn)代預(yù)防醫(yī)學(xué),1993,20(1):18-20.

      41.于雷,鄭云龍.逐步回歸響應(yīng)面法.大連理工大學(xué)學(xué)報(bào),1999,39(6):792-796.

      42.張華嘉,舒元.逐步回歸分析的拓展.山大學(xué)學(xué)報(bào)(自然科學(xué)版),1998,37(5):11-14.

      43.汪仁宮,劉婉如.基法逐步回歸.?dāng)?shù)理統(tǒng)計(jì)與應(yīng)用概率,1994,9(3):80-84.

      44.Lindberg W,Persson JA,Wold S.Partial least squares method for spectrofluorimetric analysis of mixtures of humicacid and ligninsulfonate.A-nal Chem,1983,55:643.

      45.Wegelin JA.A survey of partial least squares(PLS)methods with emphasis on the two block case.Seattle:Department of Statistics,University of Washington,2000:1-35.

      46.Xu RJ,Liu HL,Chen NY,et al.An expert system for 16Mn steel industrial process designed by PLS method.Computers and Applied Chemistry,2000,17(1/2):50.

      47.Wen X,Zhou WH,Liu XL,et al.Studies on phosphorus containing angiotensin converting enzyme in hibitors.Computers and Applied Chemistry,2000,17(1/2):13-14.

      48.Wold S.Modeling data tables by principal component and PLS:class patterns and quantitative predictive relations.Analysis,1984,12:477-485.

      49.Hoskuldson A.PLS regression methods.Journal of Chemometrics,1988,2:211-228.

      50.Geladi P,Qkowlaski B.Partial least squares regression:A tutorial.Analytical chemical Acta,1986,35:1-17.

      51.Wise BM,Gallagher NB.The process chenometrics approad to process monitoring and Fault detection.Jof Process Control,1986,6:329-348.

      52.Rosenbaum P,Rubin D.The central role of the propensity score in observational studies for causal effects.Biometrika,1983,70:41-55.

      53.李智文,劉建蒙,張樂,等.傾向評(píng)分配比在流行病學(xué)設(shè)計(jì)中的應(yīng)用.中華流行病學(xué)雜志,2009,30(5):514-517.

      54.D'Agostino RB.Propensity score methods for bias reduction in the comparison of a treatment to a nonrandomized control group.Statistics in Medicine,1998,17(19):2265-2281.

      55.Rubin D.Estimating causal effects from large data-sets using propensity scores.AnnInternMed,1997,127:757-763.

      56.蔣平,邢云燕,王蕓,等.聚類回歸分析在FMS加工質(zhì)量分析中的應(yīng)用.自動(dòng)化技術(shù)與應(yīng)用,2005,24(8):15-16.

      57.林樂義,印凡成.基于聚類分析和因子分析消除多重共線性的方法.統(tǒng)計(jì)與決策,2008,8:153-155.

      58.王玉梅.多重共線性的消除:不相關(guān)法.統(tǒng)計(jì)教育,2006,7:18-19.

      59.Oscar R.The fallacy of differencing to reduce multicollinearity.American Journal of Agricultural Economcs,1987,69(3):697-700.

      60.張丕德.Cox模型多因子共線性處理方法的進(jìn)一步研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2000,17(4):207-210.

      61.曾繁會(huì),李偉,呂渭濟(jì).多重共線性問題的神經(jīng)網(wǎng)絡(luò)實(shí)例分析.遼寧工程技術(shù)大學(xué)學(xué)報(bào)(自然科學(xué)版),2001,20(5):659-661.

      62.Fabrycy MZ.Multicollinearity caused by specification errors.Applied Statistics,1975,24(2):250-254.

      猜你喜歡
      共線性因變量回歸系數(shù)
      調(diào)整有限因變量混合模型在藥物經(jīng)濟(jì)學(xué)健康效用量表映射中的運(yùn)用
      銀行不良貸款額影響因素分析
      文氏圖在計(jì)量統(tǒng)計(jì)類課程教學(xué)中的應(yīng)用
      ——以多重共線性內(nèi)容為例
      適應(yīng)性回歸分析(Ⅳ)
      ——與非適應(yīng)性回歸分析的比較
      不完全多重共線性定義存在的問題及其修正建議
      多元線性回歸的估值漂移及其判定方法
      電導(dǎo)法協(xié)同Logistic方程進(jìn)行6種蘋果砧木抗寒性的比較
      偏最小二乘回歸方法
      多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時(shí)Bayes估計(jì)及優(yōu)良性
      回歸分析中應(yīng)正確使用r、R、R23種符號(hào)
      佛冈县| 哈尔滨市| 鄢陵县| 岑巩县| 丰都县| 班玛县| 斗六市| 泰兴市| 祁门县| 玉环县| 密山市| 金寨县| 大田县| 固始县| 濮阳市| 登封市| 浮梁县| 海宁市| 保德县| 罗江县| 西华县| 胶南市| 灌南县| 英德市| 宁蒗| 来宾市| 磐石市| 宽甸| 丁青县| 筠连县| 彭州市| 疏勒县| 东丽区| 昌黎县| 泸州市| 射洪县| 济宁市| 和田市| 饶平县| 中卫市| 溧水县|