• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      多元線性回歸的估值漂移及其判定方法

      2018-08-22 12:38:08葛永慧
      統(tǒng)計與決策 2018年14期
      關(guān)鍵詞:均方回歸系數(shù)百分比

      高 庚,吳 悠,葛永慧

      (太原理工大學(xué) 礦業(yè)工程學(xué)院,太原 030024)

      0 引言

      在實際生產(chǎn)實踐和科學(xué)實驗中,為了闡明多種因素與事件發(fā)生、發(fā)展的關(guān)系,通常采用多元線性回歸分析的方法。多元線性回歸研究的是建立一個能反映因變量Y與多個自變量X之間線性關(guān)系的多元回歸方程,利用這個方程來分析因變量和自變量之間的相互關(guān)系,以及回歸系數(shù)的相關(guān)情況等。為了檢驗回歸方程的擬合程度,通常采用復(fù)相關(guān)系數(shù)和復(fù)判定系數(shù)來進(jìn)行判定,復(fù)相關(guān)系數(shù)和復(fù)判定系數(shù)越趨近于1,說明因變量和自變量的線性關(guān)系越密切,回歸方程的擬合程度越高,回歸有效性越好。文獻(xiàn)[1]詳細(xì)敘述了最小二乘法(LS法)在多元線性回歸分析中的應(yīng)用研究,以及相關(guān)系數(shù)等的計算。文獻(xiàn)[2]運(yùn)用仿真實驗的方法,在多元線性回歸分析中,通過回歸系數(shù)估值的相對真誤差發(fā)現(xiàn),在應(yīng)用LS法解算多元線性回歸系數(shù)時,總會有回歸系數(shù)估值明顯偏離其真值的現(xiàn)象出現(xiàn),即估值發(fā)生了顯著漂移。大量模擬實驗表明,即便復(fù)相關(guān)系數(shù)和復(fù)判定系數(shù)都趨近1,也總會有回歸系數(shù)發(fā)生估值漂移現(xiàn)象,甚至?xí)l(fā)生嚴(yán)重的估值漂移。在多元回歸統(tǒng)計分析的分支中,如主成分分析、因子分析等,回歸系數(shù)的有效性顯得尤為重要,若其回歸系數(shù)發(fā)生了顯著估值漂移,則將會產(chǎn)生不可預(yù)知的結(jié)果。

      本文以三元線性回歸分析為例,對回歸系數(shù)中出現(xiàn)的顯著估值漂移現(xiàn)象進(jìn)行了分析與討論,并進(jìn)一步通過二元至五元線性回歸仿真實驗,提出了一種判定多元線性回歸系數(shù)估值漂移的總體指標(biāo)和判定回歸系數(shù)有效性的基本條件。

      1 材料與方法

      1.1 多元線性回歸的計算

      多元線性回歸方程的一般形式:

      誤差方程:

      由LS法得多元線性回歸的法方程:

      式中,N為法方程系數(shù)矩陣,Q為協(xié)因數(shù)矩陣。

      回歸系數(shù)的解:

      觀測值的均方誤差:

      觀測值絕對值平均值:

      相關(guān)系數(shù)、復(fù)相關(guān)系數(shù)和復(fù)判定系數(shù):

      1.2 參數(shù)估值的相對真誤差與估值漂移

      定義:用參數(shù)估計方法得到的參數(shù)的估值顯著地偏離其真值的現(xiàn)象稱為參數(shù)的估值漂移(Estimated Value Drift,EVD)。當(dāng)dk>時就認(rèn)為是“估值顯著地偏離其真值”。不同應(yīng)用可對賦予不同值。當(dāng)dk>=50%時,參數(shù)估值的有效數(shù)字只有1位,而且還是可疑數(shù)字,稱為參數(shù)具有顯著估值漂移。dk表示觀測值估值的相對真誤差或回歸系數(shù)估值的相對真誤差。

      實踐表明,在多元線性回歸分析中,當(dāng)觀測值母體的均方誤差大到一定程度,回歸系數(shù)估值就可能出現(xiàn)估值漂移現(xiàn)象。用σ0表示觀測值母體的均方誤差,||表示參與回歸計算的觀測值絕對值的平均值,ω表示為均方誤差系數(shù)。對于給定的估值漂移指標(biāo),當(dāng):

      就認(rèn)為回歸系數(shù)估值可能產(chǎn)生估值漂移。在實際應(yīng)用中用觀測值的驗后均方誤差?0代替觀測值母體的均方誤差σ0。

      2 結(jié)果與討論

      2.1 算例

      三元線性回歸的理論回歸方程:

      用觀測值真值加隨機(jī)誤差生成三組模擬觀測值(簡稱為觀測值),三元線性回歸的理論觀測值與模擬觀測值見表1。對于三組模擬觀測值分別用LS法計算回歸方程回歸系數(shù)估值、相對真誤差及相關(guān)系數(shù)見表2。

      2.1.1 回歸系數(shù)估值可能產(chǎn)生估值漂移

      表1 三元線性回歸的理論觀測值和模擬觀測值

      表2 回歸系數(shù)估值、相對真誤差及相關(guān)系數(shù)

      回歸數(shù)學(xué)模型的特點導(dǎo)致了回歸系數(shù)估值可能產(chǎn)生顯著的估值漂移。由于多元線性回歸數(shù)學(xué)模型的特點,導(dǎo)致了用LS法求解時法方程系數(shù)間的差異很大,例如在本算例中法方程系數(shù)主對角線Nb0b0=10.000、Nb1b1=1.272×1010、Nb2b2=1.808×108和 Nb3b3=2.871×109。不同的觀測值誤差會導(dǎo)致法方程的常數(shù)項有微小的變化,法方程的常數(shù)項的微小變化就有可能導(dǎo)致回歸系數(shù)的顯著變化。

      觀測值估值不會產(chǎn)生顯著估值漂移。由后文表3可知,A、B和C三組的觀測值估值的相對真誤差最大值分別為0.59%、0.29%和0.06%,三組觀測值估值與其真值的差異均不顯著。

      2.1.2 僅用復(fù)相關(guān)系數(shù)和復(fù)判定系數(shù)說明多元線性回歸的有效性有一定局限性

      2.2 仿真實驗

      理論觀測值模擬值見表1,仿真實驗方法見文獻(xiàn)[1]。理論觀測值絕對值的平均值約為1500?;貧w系數(shù)估值相對真誤差均小于等于給定限值的百分比見表3?;貧w系數(shù)估值相對真誤差平均值和相對均方誤差平均值的百分比見表4。

      表3 回歸系數(shù)估值相對真誤差均小于等于的百分比(%)

      表3 回歸系數(shù)估值相對真誤差均小于等于的百分比(%)

      注:σ0表示觀測值母體均方誤差,ω表示均方誤差系數(shù);1表示回歸系數(shù)估值的相對真誤差均小于等于=50%的百分比,2表示回歸系數(shù)估值的相對真誤差均小于等于=10%的百分比,表示回歸系數(shù)估值的相對真誤差均小于等于=1%的百分比。R表示復(fù)相關(guān)系數(shù)的總體平均值,R2表示復(fù)判定系數(shù)的總體平均值。

      序號1 2 3 R R2 0.4942 0.9450 0.9855 0.9994 0.9998 1.0000 1.0000 1.0000 12345678 σ0(ω)75.00(5.00%)15.00(1.00%)7.50(0.50%)1.50(0.10%)0.75(0.05%)0.15(0.01%)0.075(0.005%)0.015(0.001%)0.3 9.1 23.2 89.3 99.9 100.0 100.0 100.0 0.0 0.3 1.5 24.9 49.1 99.9 100.0 100.0 0.0 0.0 0.0 0.2 1.7 23.5 47.1 100.0 0.7030 0.9721 0.9927 0.9997 0.9999 1.0000 1.0000 1.0000

      表4回歸系數(shù)估值相對真誤差平均值和相對均方誤差平均值的百分比(%)

      2.2.1 回歸系數(shù)估值的估值漂移

      由表3可知,當(dāng)ω=5%時,回歸系數(shù)估值的相對真誤差均小于等于=50%的百分比是0.3%,當(dāng)ω=1%時,回歸系數(shù)估值的相對真誤差均小于等于1=50%的百分比是9.1%,當(dāng)ω=0.5%時,回歸系數(shù)估值的相對真誤差均小于等于1=50%的百分比是23.2%,即回歸系數(shù)估值漂移的顯著程度隨著均方誤差系數(shù)ω的增大而增大。對于2=10%和2=1%具有相同的結(jié)果。

      2.2.2 僅用復(fù)相關(guān)系數(shù)和復(fù)判定系數(shù)說明多元線性回歸的有效性有一定局限性

      由表3可知,當(dāng)ω=1%時,復(fù)相關(guān)系數(shù)和復(fù)判定系數(shù)總體平均值分別是0.9721和0.9450,回歸系數(shù)估值的相對真誤差均小于等于=50%的百分比是9.1%;當(dāng)ω=0.5%時,復(fù)相關(guān)系數(shù)和復(fù)判定系數(shù)總體平均值分別是0.9927和0.9855,回歸系數(shù)估值的相對真誤差均小于等于=50%的百分比是23.2%。由此可見,即使復(fù)相關(guān)系數(shù)和復(fù)判定系數(shù)滿足要求,回歸系數(shù)的估值也可能產(chǎn)生顯著的估值漂移。

      2.2.3 回歸系數(shù)估值的有效性和均方誤差系數(shù)ω的選取

      由表3可知,當(dāng)ω=0.10%時,回歸系數(shù)的相對真誤差均小于等于=50%的百分比是89.3%;即當(dāng)ω≈0.10%或ω<0.10%時,回歸系數(shù)估值的相對真誤差小于等于=50%,回歸系數(shù)估值具有1位有效數(shù)字。當(dāng)ω=0.01%時,回歸系數(shù)估值的相對真誤差均小于等于=10%的百分比是100%;即當(dāng)ω≈0.01%或ω<0.01%時,回歸系數(shù)估值的相對真誤差小于等于=10%,回歸系數(shù)估值具有2位有效數(shù)字。當(dāng)ω=0.001%時,回歸系數(shù)估值的相對真誤差均小于等于=1.0%的百分比是100%;即當(dāng)ω≈0.001%或ω<0.001%時,回歸系數(shù)估值的相對真誤差小于等于=1.0%,回歸系數(shù)估值具有3位有效數(shù)字。

      2.2.4 回歸系數(shù)估值有效性的判定方法

      由表4可知,對于相同的均方誤差系數(shù)ω,回歸系數(shù)的相對真誤差均值和相對均方誤差均值的各種百分比均接近。比如,在三元仿真實驗中,當(dāng)ω=0.10%時,回歸系數(shù)的相對真誤差均小于等于=50%的百分比是89.3%,其相對均方誤差均小于等于=50%的百分比是88.3%,兩者同時小于等于=50%的百分比是82.3%,數(shù)據(jù)差距不大,對于相同的均方誤差系數(shù)和其相應(yīng)給定的限值也具有相同的結(jié)果。即用回歸系數(shù)估值的相對均方誤差和用回歸系數(shù)估值的相對真誤差對回歸系數(shù)估值的有效性判定基本等價,可用回歸系數(shù)估值的相對均方誤差代替回歸系數(shù)估值的相對真誤差對回歸系數(shù)估值的有效性進(jìn)行判定。

      按照三元線性回歸仿真實驗的方法,本文模擬了二元至五元線性回歸的五組實驗,每組至少整理了五個線性回歸方程來進(jìn)行仿真實驗,根據(jù)每個回歸方程觀測值絕對值均值來模擬觀測值母體均方誤差的大小,從而判斷回歸系數(shù)的估值中是否可能會出現(xiàn)估值漂移,并確定判定多元線性回歸系數(shù)估值漂移的總體指標(biāo)。對于不同元的線性回歸方程,則有不同的回歸系數(shù)估值漂移總體指標(biāo),二元至五元線性回歸系數(shù)的估值漂移總體指標(biāo)見表5。

      表5 二元至五元線性回歸系數(shù)估值漂移總體指標(biāo)(%)

      3 結(jié)論

      多元線性回歸中回歸系數(shù)的估值可能產(chǎn)生估值漂移,隨著觀測值均方誤差的增大,回歸系數(shù)估值漂移的可能性增大。

      在二元線性回歸中,當(dāng)均方誤差系數(shù)ω≈1.0%或ω<1.0%時,回歸系數(shù)估值的相對真誤差小于等于=50%(=50%是本文所采用的回歸系數(shù)估值漂移的臨界值,根據(jù)不同的應(yīng)用情況可做適當(dāng)?shù)恼{(diào)整),回歸系數(shù)估值具有1位有效數(shù)字;當(dāng)ω≈0.1%或ω<0.1%時,其相對真誤差小于等于=10%,具有2位有效數(shù)字;當(dāng)ω≈0.01%或ω<0.01%時,其相對真誤差小于等于=1.0%,具有3位有效數(shù)字。為了確保二元線性回歸系數(shù)的有效性,至少應(yīng)當(dāng)使ω≈0.1%或ω<0.1%。

      在三元至五元線性回歸中,當(dāng)均方誤差系數(shù)ω≈0.10%或ω<0.10%時,回歸系數(shù)估值的相對真誤差小于等于=50%,回歸系數(shù)估值具有1位有效數(shù)字;當(dāng)ω≈0.01%或ω<0.01%時,其相對真誤差小于等于=10%,具有2位有效數(shù)字;當(dāng)ω≈0.001%或ω<0.001%時,其相對真誤差小于等于=1.0%,具有3位有效數(shù)字。為了確保三元至五元線性回歸系數(shù)的有效性,至少應(yīng)當(dāng)使ω≈0.01%或ω<0.01%。

      用回歸系數(shù)估值的相對均方誤差和用回歸系數(shù)估值的相對真誤差對回歸系數(shù)估值的有效性判定基本等價,可用回歸系數(shù)估值的相對均方誤差代替回歸系數(shù)估值的相對真誤差對回歸系數(shù)估值的有效性進(jìn)行判定。當(dāng)回歸系數(shù)估值的相對均方誤差大于50%時,就認(rèn)為回歸系數(shù)產(chǎn)生了顯著估值漂移。相對于僅用復(fù)相關(guān)系數(shù)和復(fù)判定系數(shù)確定多元線性回歸有效性,增加回歸系數(shù)估值漂移的確定,對多元線性回歸特別是回歸系數(shù)的有效性確定具有更高的可靠性。

      猜你喜歡
      均方回歸系數(shù)百分比
      一類隨機(jī)積分微分方程的均方漸近概周期解
      Beidou, le système de navigation par satellite compatible et interopérable
      電導(dǎo)法協(xié)同Logistic方程進(jìn)行6種蘋果砧木抗寒性的比較
      普通照明用自鎮(zhèn)流LED燈閃爍百分比測量不確定度分析
      電子制作(2017年20期)2017-04-26 06:57:46
      多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時Bayes估計及優(yōu)良性
      肝癌患者外周血Treg、Th17百分比及IL-17水平觀察
      基于抗差最小均方估計的輸電線路參數(shù)辨識
      基于隨機(jī)牽制控制的復(fù)雜網(wǎng)絡(luò)均方簇同步
      城鎮(zhèn)居民收入差距主要因素回歸分析
      On Commuting Graph of Group Ring ZnS3?
      桓台县| 西丰县| 利津县| 汝阳县| 青田县| 新丰县| 西乡县| 陕西省| 彰化县| 陇南市| 台湾省| 宿松县| 象山县| 平凉市| 合作市| 江华| 莆田市| 汾阳市| 当阳市| 林甸县| 萨迦县| 舟山市| 连云港市| 望谟县| 吴江市| 城固县| 广宗县| 肥东县| 新余市| 赫章县| 大余县| 论坛| 大渡口区| 曲周县| 达州市| 仙游县| 定安县| 荆门市| 南平市| 阿合奇县| 耿马|