• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      完全輔助信息下非參數(shù)模型校準(zhǔn)估計(jì)方法研究

      2020-11-04 14:13:08賀建風(fēng)陳茜儒
      統(tǒng)計(jì)與信息論壇 2020年11期
      關(guān)鍵詞:估計(jì)量總體輔助

      賀建風(fēng),陳茜儒,陳 飛

      (1.華南理工大學(xué) 經(jīng)濟(jì)與金融學(xué)院,廣東 廣州 510006; 2.安徽長(zhǎng)豐雙鳳經(jīng)濟(jì)開(kāi)發(fā)區(qū)管理委員會(huì),安徽 合肥 231100)

      一、引 言

      隨著信息技術(shù)快速發(fā)展,云計(jì)算和大數(shù)據(jù)技術(shù)正不斷成熟,在現(xiàn)代化的統(tǒng)計(jì)調(diào)查實(shí)踐中,我們更容易獲取大量與研究變量相關(guān)聯(lián)的輔助信息,例如普查資料、前一期調(diào)查數(shù)據(jù)、衛(wèi)星遙感信息、行政記錄以及商業(yè)大數(shù)據(jù)資源等。利用輔助信息構(gòu)建抽樣估計(jì)量能夠在不增加調(diào)查成本的同時(shí),極大地提高估計(jì)精度。校準(zhǔn)估計(jì)方法就是一種能夠很好利用輔助信息改進(jìn)抽樣估計(jì)效率的方法,其基本思路是通過(guò)校準(zhǔn)約束信息來(lái)修正原有估計(jì)量的權(quán)重系數(shù),從而達(dá)到提高估計(jì)精度的目標(biāo)。然而,傳統(tǒng)的校準(zhǔn)估計(jì)量?jī)H利用到了總體和樣本觀測(cè)個(gè)體所構(gòu)成的部分輔助信息,對(duì)于調(diào)查環(huán)節(jié)中未被觀測(cè)樣本的輔助信息并沒(méi)有加以利用,這樣勢(shì)必會(huì)浪費(fèi)更多可利用的輔助信息。事實(shí)上,在信息比較容易獲取的大數(shù)據(jù)時(shí)代,我們通常有條件利用每一個(gè)總體單位的完全輔助信息來(lái)進(jìn)行校準(zhǔn)估計(jì)。最早Wu和Sitter通過(guò)構(gòu)建研究變量與輔助變量之間的超總體模型,將完全輔助信息應(yīng)用于校準(zhǔn)估計(jì),首次提出模型校準(zhǔn)估計(jì)的概念[1]。在此基礎(chǔ)上,Wu證明了模型校準(zhǔn)估計(jì)為最優(yōu)估計(jì)量,即在超總體模型下,其漸近設(shè)計(jì)方差的期望最小[2]。利用完全輔助信息構(gòu)建模型校準(zhǔn)抽樣估計(jì)過(guò)程中,關(guān)鍵在于選擇合適的模型以及模型的估計(jì)方法。

      傳統(tǒng)校準(zhǔn)估計(jì)方法適用的前提較為嚴(yán)格,要求研究變量與輔助變量之間呈線性關(guān)系。然而大數(shù)據(jù)時(shí)代背景下,數(shù)據(jù)結(jié)構(gòu)較為復(fù)雜,研究變量與輔助變量之間往往并沒(méi)有明顯的線性關(guān)系,為了構(gòu)建適應(yīng)性更強(qiáng)的模型校準(zhǔn)估計(jì)量,本文考慮在超總體模型的基礎(chǔ)上構(gòu)建非參數(shù)模型校準(zhǔn)估計(jì)方法體系。與線性假定條件下的傳統(tǒng)校準(zhǔn)估計(jì)方法一樣,直觀上來(lái)看,由于非參數(shù)模型校準(zhǔn)估計(jì)量中也會(huì)納入輔助信息,其估計(jì)精度在理論上將高于HT估計(jì)量。為了更全面、深入地研究具有完全輔助信息條件下,且輔助變量與研究變量之間呈非線性關(guān)系時(shí),如何更好地開(kāi)展模型校準(zhǔn)抽樣估計(jì),本文將對(duì)此問(wèn)題進(jìn)行系統(tǒng)性討論。本文的主要貢獻(xiàn)在于:第一,在文獻(xiàn)梳理的基礎(chǔ)上,將校準(zhǔn)抽樣估計(jì)方法歸納為部分輔助信息下的傳統(tǒng)校準(zhǔn)估計(jì)和完全輔助信息下的模型校準(zhǔn)估計(jì)兩大類(lèi);第二,在介紹局部多項(xiàng)式模型校準(zhǔn)估計(jì)的基礎(chǔ)上,拓展性地提出了基于懲罰樣條的模型校準(zhǔn)估計(jì)方法,對(duì)非參數(shù)模型校準(zhǔn)估計(jì)方法體系進(jìn)行了補(bǔ)充;第三,理論分析與數(shù)值模擬均表明,完全輔助信息下的模型校準(zhǔn)估計(jì)方法具有較好的性質(zhì)與更好的估計(jì)效果。

      二、文獻(xiàn)綜述

      (一)校準(zhǔn)估計(jì)方法的研究進(jìn)展

      20世紀(jì)90年代,Deville和S?rndal最早提出了校準(zhǔn)估計(jì)法,并通過(guò)拉格朗日函數(shù)求極值的方法求得校準(zhǔn)權(quán)數(shù)和總體總值的校準(zhǔn)估計(jì)量形式[3]。之后的20多年間,抽樣校準(zhǔn)估計(jì)方法很快成為了國(guó)內(nèi)外抽樣調(diào)查研究領(lǐng)域的熱點(diǎn)。Deville等在常用距離函數(shù)的基礎(chǔ)上提出指數(shù)型、二次型和logit方程等其他形式的距離函數(shù),并證明不同形式的距離函數(shù)均可得到估計(jì)量的漸近無(wú)偏性和一致性[4]。為了解決部分距離函數(shù)求解校準(zhǔn)權(quán)重中可能出現(xiàn)負(fù)值和極端值的情況,Rao和Singh采用嶺回歸壓縮系數(shù)方法,在給定容忍度范圍情況下使得滿足約束條件的校準(zhǔn)系數(shù)落入指定范圍[5]。為了使求解校準(zhǔn)權(quán)重的方法更加多樣化,Estevao和S?rndal對(duì)校準(zhǔn)權(quán)重的獲得采取了一種新的方法,在新的方法中放棄原有的約束等式進(jìn)而應(yīng)用工具向量法,該方法可以在同一組輔助信息上產(chǎn)生多種校準(zhǔn)權(quán)重[6]。Estevao和S?rndal等人將工具向量法拓展到了復(fù)雜抽樣中,例如二重抽樣、二階抽樣、無(wú)回答問(wèn)題中[7]。Wu和Sitter研究在輔助信息完全的情況下,通過(guò)構(gòu)造超總體模型求得總體簡(jiǎn)單參數(shù)的校準(zhǔn)估計(jì)量,放松了研究變量和輔助變量之間關(guān)系的假定,一定程度上拓展了校準(zhǔn)估計(jì)法的運(yùn)用空間。進(jìn)一步地,Wu證明了在沒(méi)有模型誤設(shè)的條件下,通過(guò)模型校準(zhǔn)估計(jì)法獲得的估計(jì)量是最優(yōu)的;若模型有誤,所得到的估計(jì)量在性質(zhì)上至少具有一致性。Montanari和Ranalli將局部多項(xiàng)式回歸和神經(jīng)網(wǎng)絡(luò)回歸兩種非參數(shù)方法引入校準(zhǔn)估計(jì)中,采用模型校準(zhǔn)估計(jì)方法,在研究變量和輔助變量是非線性關(guān)系的情形下,分別得到其模型校準(zhǔn)估計(jì)量,并證明了在合適的條件下估計(jì)量具有漸近正態(tài)性和一致性等良好性質(zhì)[8]。Rueda等在有限總體分布函數(shù)的估計(jì)中運(yùn)用校準(zhǔn)估計(jì)法,并運(yùn)用局部線性回歸,得到模型校準(zhǔn)估計(jì)量[9]。

      國(guó)內(nèi)學(xué)者對(duì)校準(zhǔn)估計(jì)法的研究大部分集中在對(duì)校準(zhǔn)估計(jì)理論的梳理和方法的應(yīng)用上。劉建平和常啟輝對(duì)國(guó)外抽樣調(diào)查中的校準(zhǔn)估計(jì)在理論方法和應(yīng)用方面做了系統(tǒng)的梳理,并對(duì)其在中國(guó)抽樣調(diào)查中的應(yīng)用前景做了一些展望[10]。馬志華和陳光慧將局部多項(xiàng)式回歸引入模型校準(zhǔn)抽樣估計(jì)中,得到了局部多項(xiàng)式模型校準(zhǔn)估計(jì)量,并說(shuō)明了該估計(jì)量具有良好的統(tǒng)計(jì)性質(zhì)[11]。賀建風(fēng)則將校準(zhǔn)估計(jì)方法引入到多重抽樣框的情形,并比較了不同模式下的估計(jì)功效[12]。金勇進(jìn)等將RGRG法引入不可忽略的無(wú)回答機(jī)制下的校準(zhǔn)估計(jì),并證明該方法對(duì)無(wú)回答具有雙重保護(hù)作用[13]。

      (二)非參數(shù)抽樣估計(jì)的研究現(xiàn)狀

      本文對(duì)研究總體特征進(jìn)行統(tǒng)計(jì)推斷的另一個(gè)理論基礎(chǔ)是非參數(shù)回歸方法。在基于模型(Based model)和模型輔助(Model assist)兩種不同的估計(jì)框架下,國(guó)外學(xué)者對(duì)非參數(shù)方法在抽樣估計(jì)中的運(yùn)用進(jìn)行了廣泛且比較深入的研究。在基于模型的框架下,Kuo最早運(yùn)用核估計(jì)方法在單個(gè)輔助變量的條件下對(duì)總體分布函數(shù)和總體總值構(gòu)造了基于模型的估計(jì)量,得到了總體總值的Kuo估計(jì)量[14];Dofman在對(duì)有限總體總值估計(jì)抽樣單元的研究變量估計(jì)中使用了Nadaraya-Watson核估計(jì)量[15];Chambers等在得到核估計(jì)量后運(yùn)用了非參數(shù)校準(zhǔn)方法,研究顯示該估計(jì)量在線性超總體模型正確情況下比Kuo估計(jì)量有效,當(dāng)模型誤設(shè)時(shí),模型對(duì)估計(jì)量的估計(jì)效果影響較小[16]。

      基于模型的估計(jì)量有一個(gè)突出特點(diǎn),即當(dāng)模型設(shè)定正確時(shí),估計(jì)量的估計(jì)效果要遠(yuǎn)高于其他類(lèi)型的估計(jì)量,但當(dāng)模型誤設(shè)時(shí),估計(jì)量的估計(jì)效果較差,甚至不如一些線性估計(jì)量。為了解決這一問(wèn)題,不少學(xué)者開(kāi)展采用模型輔助方法進(jìn)行抽樣估計(jì)的研究工作,產(chǎn)生了大量模型輔助估計(jì)量。Breidt和Opsomer最早在模型輔助框架下,利用非參數(shù)回歸中的局部多項(xiàng)式回歸估計(jì)方法構(gòu)建基于局部多項(xiàng)式模型的輔助回歸估計(jì)量,研究表明該估計(jì)量具有一致性和漸近正態(tài)性的良好性質(zhì),模擬研究顯示該估計(jì)量在模型誤設(shè)時(shí),其估計(jì)精度仍然很高[17]。Breidt等構(gòu)建了懲罰樣條的非參數(shù)模型,結(jié)合差分估計(jì)方法,得到了懲罰樣條模型輔助估計(jì)量,并把懲罰樣條方法推廣到半?yún)?shù)回歸估計(jì)中[18]。Montanari和Ranalli運(yùn)用了神經(jīng)網(wǎng)絡(luò)回歸方法對(duì)研究變量和輔助變量的關(guān)系進(jìn)行建模,得到模型輔助的神經(jīng)網(wǎng)絡(luò)估計(jì)量,并證明了在一定的條件下,該估計(jì)量具有一致性和無(wú)偏性等良好的性質(zhì)。Opsomer等研究了非參數(shù)可加模型在模型輔助估計(jì)中的應(yīng)用,得到的半?yún)?shù)估計(jì)量具有設(shè)計(jì)一致和漸近性的性質(zhì)[19]。

      三、校準(zhǔn)抽樣估計(jì)方法的分類(lèi)

      (1)

      其中di=1/πi,顯然HT估計(jì)量具有設(shè)計(jì)無(wú)偏性,其估計(jì)量方差為:

      (2)

      雖然HT估計(jì)量具有良好的性質(zhì),但是由于在估計(jì)過(guò)程中僅利用到研究變量本身的樣本信息和樣本單元的包含概率,并沒(méi)有利用其他任何輔助信息,其估計(jì)效率必然不會(huì)很高。下面我們根據(jù)利用輔助信息的不同程度介紹兩類(lèi)針對(duì)式(1)的校準(zhǔn)估計(jì)方法。

      (一)基于部分輔助信息的傳統(tǒng)校準(zhǔn)估計(jì)

      (3)

      式(3)中qi是調(diào)節(jié)參數(shù),取值為正,且與di不相關(guān)。利用拉格朗日極值法可求出校準(zhǔn)估計(jì)為:

      (4)

      (二)基于完全輔助信息的模型校準(zhǔn)估計(jì)

      根據(jù)前文的分析可知,傳統(tǒng)校準(zhǔn)估計(jì)量至少存在輔助信息利用不全和要求研究變量與輔助變量之間呈線性關(guān)系兩大缺陷,因此其在應(yīng)用中會(huì)出現(xiàn)效率不高和范圍受限等問(wèn)題。為了解決校準(zhǔn)估計(jì)量在這兩方面的難題,Wu和Sitter提出了模型校準(zhǔn)估計(jì)方法,基本思路是在超總體模型的基礎(chǔ)上,利用完全輔助信息來(lái)重新構(gòu)建校準(zhǔn)估計(jì)量,進(jìn)而得到模型校準(zhǔn)估計(jì)量[1]。事實(shí)上,隨著大數(shù)據(jù)時(shí)代的來(lái)臨,各種信息和數(shù)據(jù)搜集的手段不斷進(jìn)步,獲取完全的輔助信息已不再是難事。因此,在抽樣調(diào)查的估計(jì)推斷環(huán)節(jié)中,我們可以充分利用完全的輔助信息來(lái)建立模型校準(zhǔn)估計(jì)量,進(jìn)而提高估計(jì)精度。

      (5)

      其中,模型校準(zhǔn)權(quán)重ωi與初始基于設(shè)計(jì)的權(quán)重di之間的平均距離最小,并滿足如下限制條件:

      (6)

      (7)

      四、非參數(shù)模型校準(zhǔn)估計(jì)方法構(gòu)建

      在上一節(jié)所介紹的模型校準(zhǔn)估計(jì)方法中,假定μ(xi,θ)是一個(gè)包含總體參數(shù)的已知函數(shù),其函數(shù)形式并未做出明確要求。未知總體參數(shù)可以依據(jù)樣本的信息進(jìn)行估計(jì),進(jìn)而可得到超總體模型中均值方程的估計(jì)式。當(dāng)研究變量與輔助變量之間不呈線性關(guān)系時(shí),我們可以建立更為復(fù)雜的非參數(shù)超總體回歸模型來(lái)得到模型校準(zhǔn)估計(jì)量,其估計(jì)效果將優(yōu)于傳統(tǒng)校準(zhǔn)估計(jì)方法。非參數(shù)回歸模型可以針對(duì)非線性的復(fù)雜問(wèn)題進(jìn)行靈活的推斷,模型的形式可以靈活變化,在實(shí)際中應(yīng)用范圍十分廣泛。由于對(duì)總體分布的假定要求條件較寬,因而非參數(shù)回歸模型的估計(jì)效果往往不會(huì)因?yàn)榧俣ú划?dāng)而導(dǎo)致較大誤差出現(xiàn),通常表現(xiàn)出較好的穩(wěn)健性。

      這里我們沿用Montanari和Ranalli的基本思路,在介紹傳統(tǒng)局部多項(xiàng)式回歸的非參數(shù)模型校準(zhǔn)估計(jì)方法的基礎(chǔ)上,將懲罰樣條估計(jì)方法引入到非參數(shù)模型校準(zhǔn)估計(jì)框架中,并與局部多項(xiàng)式模型校準(zhǔn)估計(jì)方法進(jìn)行比較分析[8]。借鑒Breidt和Opsomer提出的非參數(shù)模型基本框架,非參數(shù)超總體回歸模型ξ可設(shè)定為[17]:

      yi=m(xi)+εi,i=1,2,…,N

      (8)

      這里m(·)是輔助變量xi的光滑函數(shù),εi是均值為零的獨(dú)立隨機(jī)變量,其方差為v(xi),且v(·)是嚴(yán)格為正的光滑函數(shù),{(yi,xi):i∈U}是超總體模型中的一個(gè)隨機(jī)實(shí)現(xiàn)組合。在非參數(shù)模型校準(zhǔn)估計(jì)的方法體系中,輔助變量的光滑函數(shù)m(·)不再是經(jīng)典的線性模式,而需要通過(guò)非參數(shù)的方法得到具體的估計(jì)形式。下面在已有的局部多項(xiàng)式模型校準(zhǔn)估計(jì)方法的基礎(chǔ)上,給出了一種全新的懲罰樣條回歸模型校準(zhǔn)估計(jì)方法。

      (一)局部多項(xiàng)式模型校準(zhǔn)估計(jì)

      目前,局部多項(xiàng)式估計(jì)方法是一種應(yīng)用廣泛的非參數(shù)技術(shù)。這種估計(jì)方法的基本思想是假定距離當(dāng)前位置較遠(yuǎn)的數(shù)據(jù)點(diǎn)能夠提供的信息很少,當(dāng)前位置的信息主要利用其附近的局部數(shù)據(jù)來(lái)推斷。在模型輔助抽樣估計(jì)中,Breidt和 Opsomer首次給出了局部多項(xiàng)式模型輔助估計(jì)方法的基本框架[16]。局部多項(xiàng)式模型校準(zhǔn)估計(jì)是在其基礎(chǔ)上針對(duì)權(quán)重系數(shù)進(jìn)行校準(zhǔn)所得。

      假定m(x)在x=x0處存在p+1階導(dǎo)數(shù),則可以用該點(diǎn)的泰勒展開(kāi)式來(lái)表示光滑函數(shù)m(x)的近似形式,所以對(duì)于式(8)而言,可近似表示為:

      yi=m(x0)+m′(x0)(xi-x0)+…+

      (9)

      接下來(lái),使用局部加權(quán)多項(xiàng)式的模型方法進(jìn)行估計(jì),可得到多項(xiàng)式模型校準(zhǔn)估計(jì)。其中擬合過(guò)程的目標(biāo)函數(shù)為:

      (10)

      (11)

      (12)

      求解最小化問(wèn)題可得局部多項(xiàng)式模型校準(zhǔn)估計(jì)量的具體表達(dá)式為:

      (13)

      Montanarii、馬志華等的模擬研究均表明,當(dāng)研究變量與輔助變量之間并不呈線性關(guān)系時(shí),傳統(tǒng)的校準(zhǔn)估計(jì)量的估計(jì)效率與經(jīng)典HT估計(jì)量相比并沒(méi)有顯著改善,而基于局部多項(xiàng)式回歸的模型校準(zhǔn)估計(jì)量有著較高的估計(jì)效率,很好地解決了抽樣估計(jì)中,輔助變量與研究變量呈非線性關(guān)系時(shí)的估計(jì)問(wèn)題[8,11]。但是基于局部多項(xiàng)式回歸的模型校準(zhǔn)估計(jì)也存在一些缺憾,比如很難將多個(gè)協(xié)變量組合在一起引入到核函數(shù)中,特別是分類(lèi)變量和連續(xù)變量的組合比較困難。利用大量的樣條或其他形式的基函數(shù),結(jié)合變量選擇或正則化懲罰方法來(lái)控制模型的復(fù)雜性,能夠在很大程度上克服上述局部多項(xiàng)式模型校準(zhǔn)估計(jì)的缺點(diǎn)。

      (二)懲罰樣條回歸模型校準(zhǔn)估計(jì)

      在超總體模型輔助的框架下,Breidt等最早給出了總體總值的懲罰樣條回歸估計(jì)量,并證明了該估計(jì)量具有漸近正態(tài)性、漸近一致性等一系列良好的統(tǒng)計(jì)性質(zhì),并把研究變量和輔助變量的關(guān)系描述成一個(gè)線性混合模型,使得懲罰樣條模型很容易處理連續(xù)數(shù)據(jù)或分類(lèi)數(shù)據(jù)、參數(shù)和非參數(shù)關(guān)系、空間和時(shí)間結(jié)構(gòu)的數(shù)據(jù)等,極大地拓展了懲罰樣條方法在抽樣估計(jì)中的應(yīng)用[18]。因此,我們接下來(lái)將懲罰樣條這種非參數(shù)方法引入到完全輔助信息條件下的模型校準(zhǔn)估計(jì)中,首先,需要按照懲罰樣條的基本形式來(lái)定義光滑函數(shù)m(·),其定義如式(14)所示:

      m(x;β)=β0+β1x+…+βqxq+

      (14)

      (15)

      其中,λ為光滑參數(shù),為了得出估計(jì)量,這里假定為一個(gè)固定的常數(shù),光滑參數(shù)值決定最終擬合的效果。根據(jù)最小二乘法的基本計(jì)算過(guò)程,可得系數(shù)向量βU的嶺回歸估計(jì)量如式(16)所示。

      βU=(XTX+Aλ)-1XTY

      (16)

      (17)

      其中,mi=mi(x),可以證明該估計(jì)量是設(shè)計(jì)無(wú)偏的,其設(shè)計(jì)方差為:

      根據(jù)樣本信息,可以構(gòu)造廣義差分估計(jì)量式(17)中βU的估計(jì)形式:

      (18)

      (19)

      =Xsβ+Zsb+εk

      (20)

      與基于局部多項(xiàng)式回歸方法的模型校準(zhǔn)估計(jì)不同,這里采用懲罰樣條回歸的估計(jì)方法,研究變量與輔助變量之間的關(guān)系可以表達(dá)成線性混合模型的形式,因此可以很方便地將連續(xù)型或者分類(lèi)型的輔助變量都納入模型中,從而進(jìn)行有效的校準(zhǔn)估計(jì)。

      (三)模型校準(zhǔn)估計(jì)量性質(zhì)

      在大樣本情況下,局部多項(xiàng)式和懲罰樣條兩種非參數(shù)方法具有相似的漸近性質(zhì),這里我們不加以區(qū)分,進(jìn)行統(tǒng)一討論。對(duì)于局部多項(xiàng)模型校準(zhǔn)估計(jì)量的性質(zhì),Montanari和Ranalli針對(duì)單一輔助變量的情形進(jìn)行了一般性的探討[8],馬志華和陳光慧在其基礎(chǔ)上討論了多元輔助變量條件下的估計(jì)量性質(zhì),理論上來(lái)看是完全一致的[11]。由于實(shí)際中多元輔助變量情形操作比較復(fù)雜,這里同樣給出一元輔助變量情形下的局部多項(xiàng)式模型校準(zhǔn)估計(jì)量和懲罰樣條回歸模型校準(zhǔn)估計(jì)量的性質(zhì)。為了研究該估計(jì)量的性質(zhì),需要作以下基本假設(shè):

      (2)對(duì)于每個(gè)v值,輔助變量xi基于式(8)中假定的超總體模型ξ來(lái)說(shuō)是固定的。模型誤差項(xiàng)εi相互獨(dú)立,其均值為0,方差為v(xi)是連續(xù)函數(shù)且嚴(yán)格為正。

      (3)均值函數(shù)m(·)是連續(xù)函數(shù),且p+1階連續(xù)可導(dǎo),p為局部多項(xiàng)式函數(shù)的最高次數(shù)。

      (5)當(dāng)v→時(shí),有n/N→π∈(0,1),帶寬hv→0和均成立。

      (21)

      (22)

      當(dāng)ν→時(shí),有也意味著

      由式(22)可得,方差的設(shè)計(jì)一致估計(jì)量為:

      (23)

      五、模擬研究

      線性函數(shù):m1(x)=1+2(x-0.5)

      二次函數(shù):m2(x)=1+2(x-0.5)2

      指數(shù)函數(shù):m3(x)=exp(-8x)

      Bump函數(shù):m4(x)=1+2(x-0.5)+

      exp(-200(x-0.5)2)

      Jump函數(shù):m5(x)=1+2(x-0.5)I(x≤0.65)+0.65I(x>0.65)

      Cdf函數(shù):m6(x)=Φ[(1.5-2x)/σ],Φ是標(biāo)準(zhǔn)正態(tài)分布的累計(jì)分布函數(shù)。

      Cycle1函數(shù):m7(x)=2+sin(2πx)

      Cycle4函數(shù):m8(x)=2+sin(8πx)

      (24)

      (25)

      接下來(lái),通過(guò)編寫(xiě)Python程序,并運(yùn)算分別得到這4種估計(jì)量的數(shù)值模擬分析結(jié)果。分析相對(duì)設(shè)計(jì)偏差模擬結(jié)果發(fā)現(xiàn):局部多項(xiàng)式模型校準(zhǔn)估計(jì)量和懲罰樣條模型校準(zhǔn)估計(jì)量在對(duì)應(yīng)的參數(shù)之下,除了在指數(shù)函數(shù)總體外,局部多項(xiàng)式模型校準(zhǔn)估計(jì)量相對(duì)于HT估計(jì)量的偏差較大之外,其他情況下,估計(jì)量的偏差并無(wú)明顯的優(yōu)劣區(qū)別,絕大部分都在0.1%以內(nèi)(2)限于篇幅,這里并未報(bào)告相對(duì)設(shè)計(jì)偏差的模擬結(jié)果,有興趣者可向作者索要。。下面我們將重點(diǎn)分析輔助變量不同分布情況下基于非參數(shù)方法得到的模型校準(zhǔn)估計(jì)量和傳統(tǒng)線性估計(jì)量的相對(duì)效率值,估計(jì)量相對(duì)效率的模擬結(jié)果如表1和表2所示。

      表1 輔助變量為均勻分布下各估計(jì)量的相對(duì)效率值

      表1顯示了在輔助變量為均勻分布情況下,各估計(jì)量在不同的總體回歸函數(shù)下的相對(duì)效率值。從總體線性程度的角度看,在線性函數(shù)的總體下,非參數(shù)模型和參數(shù)模型的效率差距不大,GREG估計(jì)量甚至略優(yōu)與LPR模型校準(zhǔn)估計(jì)量,SPL模型校準(zhǔn)估計(jì)量的估計(jì)效果的優(yōu)勢(shì)也比較微弱,其原因是對(duì)于線性函數(shù)而言,參數(shù)模型就能產(chǎn)生較好的估計(jì)效果,而不需要復(fù)雜的非參數(shù)模型。從縱向比較來(lái)看,非參數(shù)模型校準(zhǔn)估計(jì)量的估計(jì)效果都優(yōu)于參數(shù)模型,隨著總體函數(shù)的線性程度不斷降低,可以發(fā)現(xiàn)GREG的估計(jì)效果呈現(xiàn)下降的趨勢(shì),在最后的幾個(gè)個(gè)函數(shù)中,RE值接近1,而非參數(shù)模型校準(zhǔn)估計(jì)量的估計(jì)效果大致上保持不變,并且SPL模型校準(zhǔn)估計(jì)量整體上要優(yōu)于LPR模型校準(zhǔn)估計(jì)量,此外各非參數(shù)模型校準(zhǔn)估計(jì)量對(duì)GREG估計(jì)量的優(yōu)勢(shì)隨著非線性程度的增強(qiáng)而不斷增大。從系數(shù)對(duì)比的角度來(lái)看,在LPR估計(jì)中,窗寬h由0.1增大到0.25情況下,大部分RE值有所降低,可以猜測(cè)隨著窗寬h的增大,LPR估計(jì)量的估計(jì)效果逐漸降低;SPL的光滑系數(shù)從0.25至0.75過(guò)程中,其估計(jì)效果差別不大,一個(gè)可能的解釋是選擇的光滑系數(shù)并沒(méi)有落在最優(yōu)的區(qū)間,因此光滑系數(shù)的變動(dòng)對(duì)估計(jì)效果的影響很有限。

      表2為輔助變量在服從有偏的beta分布情況下,各估計(jì)量在不同的總體回歸函數(shù)下的相對(duì)效率值。從表中的數(shù)據(jù)可以看出,雖然輔助變量的分布確實(shí)影響了各個(gè)估計(jì)量的估計(jì)效果,尤其在總體函數(shù)為Cdf函數(shù)時(shí),beta分布下的LPR模型校準(zhǔn)估計(jì)量的相對(duì)效率有較大幅度的提高,其他情況下大體上與表1的分析情況相一致,這也說(shuō)明了非參數(shù)模型校準(zhǔn)估計(jì)是比較穩(wěn)健的。

      表2 輔助變量為beta分布下各估計(jì)量的相對(duì)效率值

      六、實(shí)際應(yīng)用中的展望

      隨著中國(guó)經(jīng)濟(jì)社會(huì)的持續(xù)快速發(fā)展,國(guó)家以及地方政府的管理與服務(wù)水平也在不斷完善。為了更好地提供高質(zhì)量的政府服務(wù)公共產(chǎn)品,需要依賴(lài)政府統(tǒng)計(jì)工作來(lái)獲取高質(zhì)量的基礎(chǔ)性統(tǒng)計(jì)信息。在中國(guó)政府統(tǒng)計(jì)工作的數(shù)據(jù)搜集過(guò)程中,抽樣調(diào)查是目前比較普遍的一種做法,比如自然資源環(huán)境監(jiān)測(cè)調(diào)查、農(nóng)產(chǎn)量調(diào)查、規(guī)模以下工業(yè)企業(yè)調(diào)查等,因此政府統(tǒng)計(jì)部門(mén)對(duì)抽樣調(diào)查方案設(shè)計(jì)及其抽樣估計(jì)工作均非常重視。在抽樣估計(jì)環(huán)節(jié),中國(guó)政府統(tǒng)計(jì)部門(mén)通常采用簡(jiǎn)單估計(jì)和比率估計(jì),對(duì)于能夠有效利用輔助信息的校準(zhǔn)估計(jì)方法應(yīng)用較少,更沒(méi)有考慮到研究變量與輔助變量的非線性關(guān)系而應(yīng)用非參數(shù)模型校準(zhǔn)估計(jì)的方法進(jìn)行總體信息的推斷。隨著衛(wèi)星遙感技術(shù)和大數(shù)據(jù)技術(shù)的應(yīng)用以及信息化水平的提高,在抽樣估計(jì)階段,可以通過(guò)模型輔助估計(jì)的方式充分利用有效的輔助信息來(lái)提高估計(jì)精度。當(dāng)研究變量與輔助變量之間呈非線性關(guān)系,且能夠掌握輔助變量的完全信息時(shí),就可以使用本文構(gòu)建的非參數(shù)模型校準(zhǔn)估計(jì)方法。下面以中國(guó)水資源質(zhì)量調(diào)查為例來(lái)介紹這套抽樣估計(jì)方法的具體應(yīng)用。

      水資源是人類(lèi)社會(huì)得以可持續(xù)發(fā)展的重要資源之一,目前,中國(guó)的水資源環(huán)境狀況不容樂(lè)觀,很多地區(qū)出現(xiàn)了水資源質(zhì)量問(wèn)題。黨的十八大以來(lái)特別強(qiáng)調(diào)了生態(tài)文明建設(shè),政府部門(mén)以及社會(huì)各界更加注重保護(hù)自然資源和生態(tài)環(huán)境,其中也包括水資源,因此,需要加強(qiáng)關(guān)于水資源環(huán)境狀況的調(diào)查工作。中國(guó)水資源類(lèi)型多樣、分布廣泛,通常適合采用抽樣調(diào)查形式來(lái)開(kāi)展實(shí)際調(diào)查工作。在水資源的環(huán)境調(diào)查中,水質(zhì)的狀況是最為重要的一項(xiàng)監(jiān)測(cè)目標(biāo),有關(guān)水質(zhì)標(biāo)準(zhǔn)的指標(biāo)眾多,其中反映酸堿性的PH值是一項(xiàng)比較重要且較為直觀的指標(biāo),按照《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》可知,PH值為6.5至8.5區(qū)間的水質(zhì)較好。PH值與水資源所在地的農(nóng)業(yè)用地情況、工業(yè)企業(yè)排放二氧化硫以及氮氧化物等污染物的情況、污水處理工廠的數(shù)量與規(guī)模等周邊的工、農(nóng)業(yè)發(fā)展的輔助信息高度相關(guān),且通常呈現(xiàn)非線性的關(guān)系。因此,在抽樣估計(jì)推斷中,我們首先可以利用衛(wèi)星遙感技術(shù)得到水源地附近農(nóng)業(yè)用地情況和具體的位置信息,并利用政府部門(mén)的行政記錄以及工業(yè)企業(yè)大數(shù)據(jù)信息獲取水源地附近工廠的數(shù)量、排污規(guī)模以及污水處理情況等輔助信息;然后利用水的PH值與農(nóng)業(yè)用地比例、工廠數(shù)量、排污規(guī)模和污水處理率之間的關(guān)系,可建立合適的超總體回歸模型;接下來(lái)考慮到研究變量與輔助變量之間呈非線性關(guān)系,利用本文所構(gòu)建的非參數(shù)模型校準(zhǔn)估計(jì)量對(duì)水的PH值進(jìn)行估計(jì),得到具有漸近無(wú)偏、一致且漸近正態(tài)等優(yōu)良統(tǒng)計(jì)性質(zhì)的估計(jì)量;最后利用本文所給出的方差估計(jì)量可以得到估計(jì)量的方差估計(jì),且這里的方差估計(jì)也具有設(shè)計(jì)一致性,根據(jù)方差估計(jì)量的數(shù)值可以評(píng)估和改進(jìn)抽樣估計(jì)的精度。

      中國(guó)政府部門(mén)主導(dǎo)的抽樣項(xiàng)目絕大多數(shù)都不是簡(jiǎn)單隨機(jī)抽樣,因此,本文在一階抽樣下得到的估計(jì)量仍需改進(jìn)以更貼合實(shí)際,目前中國(guó)的政府統(tǒng)計(jì)調(diào)查尚未充分利用完全輔助變量,利用非參數(shù)方法和模型校準(zhǔn)估計(jì)方法對(duì)輔助變量和研究變量建模在實(shí)際中的應(yīng)用還沒(méi)有,雖然我們?cè)诒疚奶岢隽司唧w應(yīng)用的展望,但是限于實(shí)際數(shù)據(jù)的可獲得性,未能進(jìn)行實(shí)際的估計(jì)推斷。總體而言,本文所構(gòu)建的非參數(shù)模型校準(zhǔn)估計(jì)量,在中國(guó)以后的抽樣估計(jì)實(shí)踐中將具有很強(qiáng)的應(yīng)用價(jià)值。

      猜你喜歡
      估計(jì)量總體輔助
      小議靈活構(gòu)造輔助函數(shù)
      倒開(kāi)水輔助裝置
      用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
      2020年秋糧收購(gòu)總體進(jìn)度快于上年
      外匯市場(chǎng)運(yùn)行有望延續(xù)總體平穩(wěn)發(fā)展趨勢(shì)
      直擊高考中的用樣本估計(jì)總體
      淺談估計(jì)量的優(yōu)良性標(biāo)準(zhǔn)
      減壓輔助法制備PPDO
      提高車(chē)輛響應(yīng)的轉(zhuǎn)向輔助控制系統(tǒng)
      基于配網(wǎng)先驗(yàn)信息的諧波狀態(tài)估計(jì)量測(cè)點(diǎn)最優(yōu)配置
      班玛县| 军事| 会宁县| 鹤峰县| 丰县| 旬阳县| 长宁县| 天柱县| 余姚市| 石家庄市| 金塔县| 万宁市| 仙居县| 嘉祥县| 富锦市| 凤台县| 浏阳市| 内黄县| 无为县| 嘉义县| 晋州市| 蚌埠市| 察隅县| 寿宁县| 夹江县| 九龙县| 孝义市| 清远市| 佳木斯市| 通山县| 新干县| 广饶县| 寻乌县| 恭城| 湘潭市| 喀什市| 进贤县| 高碑店市| 广德县| 凌云县| 山东|