• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      變系數(shù)統(tǒng)計(jì)模型研究進(jìn)展

      2014-12-23 12:16:58張輝國
      科技視界 2014年7期
      關(guān)鍵詞:空間數(shù)據(jù)回歸系數(shù)系數(shù)

      張輝國

      (新疆大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院,新疆 烏魯木齊 830046)

      線性回歸模型是分析變量間相依關(guān)系的強(qiáng)大統(tǒng)計(jì)方法,被廣泛應(yīng)用于眾多領(lǐng)域。Hastie 和Tibshirani[1]通過設(shè)定線性模型的參數(shù)為某些協(xié)變量的非參數(shù)函數(shù),提出了變系數(shù)模型(varying coefficient models)用于探索高維數(shù)據(jù)回歸結(jié)構(gòu)的動(dòng)態(tài)模式。變系數(shù)模型極大擴(kuò)展了經(jīng)典線性回歸模型,此后近二十年內(nèi),變系數(shù)模型被深入研究,并被應(yīng)用于許多學(xué)科領(lǐng)域,如環(huán)境科學(xué)、生態(tài)學(xué)、計(jì)量經(jīng)濟(jì)學(xué)、金融學(xué)和醫(yī)學(xué)等[2]。

      1 變系數(shù)回歸模型及其研究進(jìn)展

      變系數(shù)模型一般形式可表示為:

      其中,Y 表示響應(yīng)變量,而X1,X2,…,Xm和U 表示協(xié)變量,誤差ε 滿足E(ε|U,X1,…,Xm)=0 和Var(ε|U,X1,…,Xm)=σ2(U),βj(U)(j=1,2,…,m)是關(guān)于U 的一些未知非參數(shù)函數(shù)。此外,當(dāng)設(shè)定X1=1 時(shí),模型將包含一個(gè)變截距項(xiàng)。

      變系數(shù)模型兼具線性回歸模型良好的解釋性和非參數(shù)回歸模型的靈活性,在探索回歸關(guān)系動(dòng)態(tài)特征方面是一個(gè)強(qiáng)有力工具。變系數(shù)模型能夠顯著減少模型設(shè)定的偏誤(modeling bias),并且能有效避免“維數(shù)災(zāi)難”[3](curse of dimensionality)。因其良好的適應(yīng)性和解釋能力,變系數(shù)模型被用于分析縱向數(shù)據(jù)(longitudinal data)、函數(shù)型數(shù)據(jù)(functional data)、生存數(shù)據(jù)(survival data)以及時(shí)間序列(time series data)等。此外,以變系數(shù)模型為基礎(chǔ)還發(fā)展了一系列有著廣泛應(yīng)用背景的衍生模型,包括廣義變系數(shù)模型和半變系數(shù)模型 (semi-varying coefficient models)等。關(guān)于變系數(shù)模型的統(tǒng)計(jì)推斷理論及其在眾多學(xué)科領(lǐng)域的實(shí)際應(yīng)用可參見Park 等的綜述[4]。

      變系數(shù)模型將回歸系數(shù)估計(jì)的變化特征作為反映解釋變量與響應(yīng)變量動(dòng)態(tài)關(guān)系的主要證據(jù)。因此在變系數(shù)模型統(tǒng)計(jì)推斷的研究中,兩個(gè)檢驗(yàn)問題極其重要:

      1)變系數(shù)模型中的系數(shù)函數(shù)是否真的變化?亦即需要檢驗(yàn)?zāi)P拖禂?shù)是否為常數(shù);

      2)如果某個(gè)系數(shù)是變化的,那么它是如何變化的? 亦即需要探索系數(shù)函數(shù)變化的細(xì)部特征,例如函數(shù)的單調(diào)性、凹凸性、峰值、谷值和拐點(diǎn)等變化特征。

      大量研究工作都致力于解決第一個(gè)問題,如關(guān)于系數(shù)估計(jì)的逐點(diǎn)置信區(qū)間(pointwise confidence intervals)以及邦弗倫尼置信帶(Bonferroni-type confidence bands)的研究以及關(guān)于變系數(shù)模型和廣義變系數(shù)模型系數(shù)估計(jì)的聯(lián)合置信帶(simultaneous confidence band)的研究[5]。此外,還提出了利用擬合優(yōu)度方法(goodness-of-fit tests)檢驗(yàn)變系數(shù)模型系數(shù)是否為常數(shù)。若利用以上方法檢驗(yàn)確認(rèn)變系數(shù)模型的某個(gè)系數(shù)是顯著變化的,那么進(jìn)一步探索該系數(shù)變化的細(xì)部動(dòng)態(tài)特征在應(yīng)用中是非常重要的。然而,目前鮮見針對(duì)此主題,即上述第二個(gè)統(tǒng)計(jì)推斷問題的研究工作。

      由于變系數(shù)模型是局部線性模型,因而使用核光滑方法(kernel smoothing method)擬合模型是非常適宜的。在此情形下,上述針對(duì)變系數(shù)模型的兩個(gè)關(guān)鍵統(tǒng)計(jì)推斷問題都要面臨非參數(shù)核光滑方法中重要而困難的問題:如何選擇最優(yōu)帶寬或合適的光滑水平。帶寬水平會(huì)直接影響回歸系數(shù)估計(jì)和推斷結(jié)果,盡管有一些經(jīng)驗(yàn)性的準(zhǔn)則用于選擇帶寬,但帶寬選擇問題始終沒有滿意的解決方法。例如,交叉驗(yàn)證方法(cross-validation,CV)、施瓦茲信息信息準(zhǔn)則(Schwarz information criterion,SIC)和赤池信息準(zhǔn)則[6](AIC)。研究發(fā)現(xiàn),若變系數(shù)模型的各個(gè)系數(shù)具有不同光滑度(degrees of smoothness)時(shí),情況將變得非常復(fù)雜,因?yàn)橐玫讲煌饣认禂?shù)的有效估計(jì),必須對(duì)各個(gè)系數(shù)選擇不同的帶寬水平,高光滑度系數(shù)函數(shù)需要較大的帶寬水平,而低光滑度系數(shù)則需要較小的擬合帶寬。然而實(shí)現(xiàn)這一操作并不容易,主要原因在于缺乏各個(gè)系數(shù)光滑度的具體信息,因此不得不在多個(gè)帶寬水平下,采用分步擬合方法[7]。事實(shí)上以系數(shù)估計(jì)為目的而選擇的最優(yōu)帶寬水平并一定適合假設(shè)檢驗(yàn)的需要。不同光滑度的系數(shù)在不同光滑水平下被分別估計(jì),這使得為每個(gè)系數(shù)的統(tǒng)計(jì)檢驗(yàn)選擇一個(gè)適宜的光滑水平變得更加困難。變系數(shù)模型被視為探索變量間回歸關(guān)系的重要工具,應(yīng)用于眾多學(xué)科領(lǐng)域,但是變系數(shù)模型系數(shù)估計(jì)和統(tǒng)計(jì)推斷卻始終被“最優(yōu)帶寬選擇”和“系數(shù)具有不同光滑度”等問題困擾。此外,前述文獻(xiàn)中所涉及的檢驗(yàn)方法主要從全局角度檢驗(yàn)系數(shù)是否變化,而不能充分探索那些變化系數(shù)函數(shù)的細(xì)部變化特征。因此,有必要發(fā)展新的變系數(shù)模型推斷方法用于分析系數(shù)函數(shù)顯著的動(dòng)態(tài)變化特征,如系數(shù)函數(shù)的單調(diào)性、峰值和谷值等,這在實(shí)際應(yīng)用中是不可或缺的。

      另外一個(gè)值得關(guān)注的問題是變系數(shù)模型的穩(wěn)健推斷方法,若數(shù)據(jù)集存在異常值,它們會(huì)在回歸系數(shù)函數(shù)估計(jì)中創(chuàng)造出虛假的回歸關(guān)系特征,這可能會(huì)誤導(dǎo)探索高維數(shù)據(jù)回歸結(jié)構(gòu)的動(dòng)態(tài)模式。許多方法先后被研究用于變系數(shù)模型的估計(jì),如核方法,樣條方法,局部多項(xiàng)式方法,局部極大似然方法以及聯(lián)合置信帶[5]等。上述方法大都基于均值回歸,使用最小二乘方法得到系數(shù)估計(jì)。眾所周知,若數(shù)據(jù)有厚尾特征或數(shù)據(jù)包含異常值時(shí),系數(shù)估計(jì)會(huì)缺乏穩(wěn)健性,最小二乘法將不再是適宜的擬合方法,因?yàn)楫惓V禃?huì)扭曲模型擬合過程,在系數(shù)估計(jì)中創(chuàng)造出虛假變化結(jié)構(gòu)。盡管一些穩(wěn)健方法用于變系數(shù)模型估計(jì),包括L1 估計(jì),M 估計(jì),分位數(shù)回歸,上述研究除了給出系數(shù)函數(shù)的穩(wěn)健估計(jì)還建立了相應(yīng)的逐點(diǎn)置信區(qū)間,但是這些方法難以滿足實(shí)際應(yīng)用。

      2 空間變系數(shù)回歸模型及其研究進(jìn)展

      在地理、環(huán)境、氣象、生態(tài)、經(jīng)濟(jì)、金融、人口以及流行病等眾多學(xué)科領(lǐng)域的科學(xué)研究中,研究對(duì)象的觀測(cè)數(shù)據(jù)總是在特定的地理空間位置被搜集整理,形成了具有空間位置屬性的空間數(shù)據(jù)集,例如某區(qū)域內(nèi)的氣象數(shù)據(jù)、環(huán)境監(jiān)測(cè)數(shù)據(jù)、流感病例數(shù)據(jù)或經(jīng)濟(jì)數(shù)據(jù)等。因其廣泛的應(yīng)用前景,伴隨著近年計(jì)算機(jī)運(yùn)算能力的進(jìn)步和各領(lǐng)域空間數(shù)據(jù)生產(chǎn)能力的提升,空間數(shù)據(jù)統(tǒng)計(jì)分析方法正成為統(tǒng)計(jì)學(xué)新興分支學(xué)科--空間統(tǒng)計(jì)學(xué)研究的前沿?zé)狳c(diǎn),空間數(shù)據(jù)分析方法與某些學(xué)科的交叉甚至產(chǎn)生了諸如空間生態(tài)學(xué)、空間計(jì)量經(jīng)濟(jì)學(xué)等一些特色鮮明的交叉學(xué)科[8]。

      回歸分析是分析變量間相依關(guān)系的強(qiáng)大統(tǒng)計(jì)方法,然而經(jīng)典的回歸模型卻無法直接應(yīng)用于空間變量間相依關(guān)系的分析,原因在于時(shí)空數(shù)據(jù)的兩個(gè)基本統(tǒng)計(jì)特性:空間數(shù)據(jù)的自相關(guān)性和空間數(shù)據(jù)的非平穩(wěn)性??臻g數(shù)據(jù)的這些特殊屬性違背了經(jīng)典回歸分析得以有效應(yīng)用的重要前提假設(shè)。自二十世紀(jì)九十年代,對(duì)空間數(shù)據(jù)自相關(guān)性和非平穩(wěn)性建模研究過程中,F(xiàn)otheringham 等人[9]基于變系數(shù)模型提出了如下空間變系數(shù)地理加權(quán)回歸(geographically weighted regression,GWR)模型

      其中,(ui,vi)是研究區(qū)域內(nèi)第i 個(gè)位置的空間坐標(biāo),(yi;xi1,…,xip)為響應(yīng)Y 變量和解釋變量X1,X2,…,XP在空間位置(ui,vi)處的觀測(cè)值;βj(u,v)(j=1,2,…,p)是待估回歸系數(shù)函數(shù);εi(i=1,2,…,n)是相互獨(dú)立服從正態(tài)分布的隨機(jī)誤差,且滿足期望為零,方差為σ2。另外,若假定xi1≡1(i=1,2,…,n),上述模型將包含一個(gè)空間變化的截距項(xiàng)。

      空間變系數(shù)模型克服了全局回歸模型不能有效分析空間數(shù)據(jù)自相關(guān)性及回歸關(guān)系空間非平穩(wěn)性的不足,被廣泛用于分析空間數(shù)據(jù)非平穩(wěn)特征,是探索回歸關(guān)系空間非平穩(wěn)性的有效工具,在眾多學(xué)科領(lǐng)域中涌現(xiàn)出大量相關(guān)應(yīng)用研究成果。近幾十年來,地理加權(quán)回歸不僅在諸如地理學(xué)、環(huán)境科學(xué)、生態(tài)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)等眾多領(lǐng)域內(nèi)有大量應(yīng)用性結(jié)果,同時(shí)在統(tǒng)計(jì)推斷和理論方法改進(jìn)方面也不斷涌現(xiàn)新成果。地理加權(quán)回歸、混合地理加權(quán)回歸的假設(shè)檢驗(yàn)問題、共線性和變量選擇問題以及異方差問題均得到細(xì)致的研究。最近的實(shí)證研究在地理加權(quán)回歸分析框架探討了空間多尺度非平穩(wěn)性以及回歸關(guān)系的尺度依賴性質(zhì)[10]。

      空間變系數(shù)模型的系數(shù)估計(jì)曲面被當(dāng)作探索和解釋回歸關(guān)系的空間非平穩(wěn)性的主要證據(jù),因此系數(shù)估計(jì)準(zhǔn)確性及其統(tǒng)計(jì)檢驗(yàn)對(duì)于得到回歸關(guān)系結(jié)構(gòu)的正確結(jié)論非常重要。無論地理加權(quán)回歸估計(jì)還是統(tǒng)計(jì)檢驗(yàn)都面對(duì)一個(gè)棘手的問題:選擇一個(gè)最優(yōu)帶寬或一個(gè)合適的光滑水平。眾所周知,帶寬的水平對(duì)于回歸系數(shù)的估計(jì)和統(tǒng)計(jì)推斷有很大的影響,而且到目前為止,地理加權(quán)回歸方法中的帶寬選擇問題始終沒有一個(gè)滿意的解決方案,盡管有一些諸如交叉驗(yàn)證以及校正AIC 準(zhǔn)則[9]等選擇帶寬的數(shù)據(jù)驅(qū)動(dòng)方法,但是此類數(shù)據(jù)驅(qū)動(dòng)方法與響應(yīng)變量的觀測(cè)值密切相關(guān),這使得推導(dǎo)檢驗(yàn)統(tǒng)計(jì)量的精確分布變得非常困難。另一方面,以系數(shù)估計(jì)為目標(biāo)選取的帶寬未必適合統(tǒng)計(jì)檢驗(yàn),因此為了確定帶寬變化對(duì)統(tǒng)計(jì)檢驗(yàn)穩(wěn)健性的影響應(yīng)當(dāng)在一個(gè)較大帶寬范圍內(nèi)實(shí)施統(tǒng)計(jì)檢驗(yàn)。如果空間變系數(shù)模型的系數(shù)函數(shù)具有不同光滑度,那么就不可能存在某個(gè)單一帶寬作為所謂最優(yōu)帶寬而適合所有系數(shù)估計(jì),因?yàn)樵诠烙?jì)高光滑度系數(shù)函數(shù)時(shí)需要較大帶寬值,而估計(jì) 低光滑度系數(shù)函數(shù)時(shí)則需要較小帶寬水平。由此可見,受到帶寬選擇問題的影響,單一帶寬水平下地理加權(quán)回歸系數(shù)估計(jì)所反映的回歸關(guān)系的空間變異模式是不可靠的。需要強(qiáng)調(diào)的是上述檢驗(yàn)方法中所使用的檢驗(yàn)統(tǒng)計(jì)量都是全局統(tǒng)計(jì)量,根據(jù)全局統(tǒng)計(jì)量檢驗(yàn)結(jié)果可以推斷回歸系數(shù)在整個(gè)研究區(qū)域內(nèi)是否變化,但是當(dāng)系數(shù)為常數(shù)的原假設(shè)被拒絕后卻無法進(jìn)一步推斷出系數(shù)函數(shù)在研究區(qū)域內(nèi)變化的細(xì)節(jié)特征。

      空間尺度問題是研究空間變量相依關(guān)系過程中必須要考慮的因素。長期的空間數(shù)據(jù)統(tǒng)計(jì)分析研究實(shí)踐發(fā)現(xiàn),空間數(shù)據(jù)統(tǒng)計(jì)特征與研究者所限定的空間范圍密切相關(guān),如空間自相關(guān)性、非平穩(wěn)模式和空間數(shù)據(jù)異常值探測(cè)(SOD,spatial outlier detecting)過程會(huì)隨數(shù)據(jù)的空間尺度而變化??臻g數(shù)據(jù)統(tǒng)計(jì)特征的尺度相依性(scale dependence)嚴(yán)重制約了各種經(jīng)典統(tǒng)計(jì)方法探索分析時(shí)空數(shù)據(jù)的有效性,為時(shí)空數(shù)據(jù)統(tǒng)計(jì)分析研究帶來巨大挑戰(zhàn),指出空間局部模型為分析具有尺度相依性的各種空間數(shù)據(jù)特征開辟了極具研究價(jià)值的新途徑。大量研究結(jié)論亦證實(shí)回歸關(guān)系的空間變異通常與空間尺度相關(guān),即具有尺度相關(guān)性。上述研究指出地理加權(quán)回歸所使用的核函數(shù)中的帶寬參數(shù)實(shí)質(zhì)上空間尺度的某種測(cè)度。因此,僅使用單一的帶寬值不能準(zhǔn)確估計(jì)具有不同光滑度的系數(shù)函數(shù),并且也不能充分探索回歸關(guān)系中具有尺度相依性的空間變異?;谏鲜鲈?,有必要轉(zhuǎn)變傳統(tǒng)的觀點(diǎn):從選擇某個(gè)最優(yōu)帶寬值用于估計(jì)潛在的真實(shí)回歸系數(shù)的觀點(diǎn)轉(zhuǎn)向在不同尺度或光滑水平下全面考察回歸關(guān)系。

      在地理加權(quán)回歸分析中,變系數(shù)模型的系數(shù)估計(jì)的變化模式被看作探索回歸關(guān)系非平穩(wěn)特征的主要證據(jù)。因此,探索系數(shù)估計(jì)所具有的空間變化模式并對(duì)這些變化特征實(shí)施統(tǒng)計(jì)顯著性檢驗(yàn)是得到空間回歸關(guān)系非平穩(wěn)特征的真實(shí)結(jié)論的先決條件。從非參數(shù)回歸擬合方法角度看,傳統(tǒng)的地理加權(quán)回歸和局部線性地理加權(quán)回歸均以核光滑方法為基礎(chǔ),它們利用局部加權(quán)最小二乘方法估計(jì)模型中的回歸系數(shù)函數(shù)。然而,最小二乘方法對(duì)于異常值是不穩(wěn)健的,地理加權(quán)回歸方法也因此會(huì)扭曲空間變系數(shù)模型的估計(jì)過程。事實(shí)上,數(shù)據(jù)集特別是大型數(shù)據(jù)集中通常都會(huì)存在異常值,它們會(huì)在系數(shù)函數(shù)估計(jì)中創(chuàng)造出虛假的回歸關(guān)系結(jié)構(gòu)特征,這會(huì)誤導(dǎo)回歸關(guān)系非平穩(wěn)性的探索結(jié)論。由于在地理加權(quán)回歸方法中,回歸系數(shù)估計(jì)為局部估計(jì),最終探測(cè)到的異常值也相應(yīng)為局部異常值,準(zhǔn)確探測(cè)異常值并不容易。然而局部異常值不一定是全局異常值,并且也不一定是有問題的數(shù)據(jù),所以應(yīng)當(dāng)謹(jǐn)慎對(duì)待異常值,而不是簡單地丟棄它們。因此針對(duì)空間變系數(shù)模型發(fā)展能處理異常值的穩(wěn)健的擬合與推斷方法是有價(jià)值的研究方向。

      [1]Hastie TJ,Tibshirani RJ.Varying-coefficient models [J].Journal of the Royal Statistical Society B,1993,55:757-796.

      [2]Fan J,Zhang W.Statistical methods with varying coefficient models [J].Statistics and Its Interface,2008,1:179-195.

      [3]Fan J,Zhang JT.Functional linear models for longitudinal data [J].Journal of the Royal Statistical Society B,2000,62:303-322.

      [4]Park BU,Mammen E,Lee YK,Lee ER.Varying coefficient regression models:a review and new developments[J].International Statistical Review,2014,82:1-19.

      [5]Zhang W,Peng H.Simultaneous confidence band and hypothesis test in generalized varying -coefficient models [J].Journal of Multivariate Analysis,2010,101:1656-1680.

      [6]Cai Z,Xu X.Nonparametric quantile estimations for dynamic smooth coefficient models [J].Journal of the American Statistical Association,2009,104:371-383.

      [7]Fan JQ,Zhang WY.Two-step estimation of functional linear models with applications to longitudinal data [J].Journal of the Royal Statistical Society B,2000,62:303-322.

      [8]Nelson TA.Trends in spatial statistics [J].The Professional Geographer,2012,64:83-94.

      [9]Fotheringham AS,Brunsdon C,Charlton ME.Geographically Weighted Regression:The Analysis of Spatially Varying Relationships[M].Chichester:Wiley,2002.

      [10]Su S,Xiao R,Zhang Y.Multi-scale analysis of spatially varying relationships between agricultural landscape patterns and urbanization using geographically weighted regression [J].Applied Geography,2012,32:360-375.

      猜你喜歡
      空間數(shù)據(jù)回歸系數(shù)系數(shù)
      這些待定系數(shù)你能確定嗎?
      打雪仗
      多元線性回歸的估值漂移及其判定方法
      過年啦
      電導(dǎo)法協(xié)同Logistic方程進(jìn)行6種蘋果砧木抗寒性的比較
      多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時(shí)Bayes估計(jì)及優(yōu)良性
      兩張圖弄懂照明中的“系數(shù)”
      中國照明(2016年6期)2016-06-15 20:30:14
      元數(shù)據(jù)驅(qū)動(dòng)的多中心空間數(shù)據(jù)同步方法研究
      基于文件系統(tǒng)的分布式海量空間數(shù)據(jù)高效存儲(chǔ)與組織研究
      客戶端空間數(shù)據(jù)緩存策略
      泽普县| 清流县| 常宁市| 松潘县| 辽源市| 庆安县| 普宁市| 廉江市| 安阳市| 左云县| 黄冈市| 龙井市| 红原县| 崇阳县| 南和县| 介休市| 绥芬河市| 邓州市| 英吉沙县| 清苑县| 同江市| 堆龙德庆县| 沙湾县| 临潭县| 玉树县| 城口县| 郁南县| 饶阳县| 精河县| 荣昌县| 灵宝市| 怀集县| 叶城县| 桑植县| 阳东县| 廉江市| 中西区| 平遥县| 富顺县| 扎囊县| 九江市|