楊春華 楊玲 李玲 王景艷
摘 要:文章首先介紹了部分回歸模型、空間變系數(shù)模型及估計(jì)方法等相關(guān)理論知識(shí)。通過對(duì)以前所研究的半?yún)?shù)模型,將單個(gè)自變量非線性函數(shù)與空間變系數(shù)模型進(jìn)行有效組合,提出了半?yún)?shù)空間變系數(shù)回歸模型兩步估計(jì)方法,并從試驗(yàn)設(shè)計(jì)、模擬試驗(yàn)結(jié)果分析兩個(gè)方面入手,對(duì)該估計(jì)方法運(yùn)用效果進(jìn)行模擬,結(jié)果具有較高的可靠性和穩(wěn)定性,實(shí)現(xiàn)了對(duì)常值系數(shù)的有效計(jì)算和估計(jì),為相關(guān)人員提供有效的借鑒和參考。
關(guān)鍵詞:半?yún)?shù)空間 變系數(shù) 回歸模型 兩步估計(jì)法
中圖分類號(hào):F224文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1004-4914(2023)09-021-03
一、引言
半?yún)?shù)模型除了表現(xiàn)出參數(shù)模型優(yōu)點(diǎn)外,還表現(xiàn)出非參數(shù)模型的優(yōu)點(diǎn),該模型被廣泛地應(yīng)用于生物、GPS定位等領(lǐng)域中,并取得了良好的應(yīng)用效果。最近幾年,趙珂等學(xué)者大膽提出一種新模型,即新型加權(quán)半?yún)?shù)模型,該模型在實(shí)際運(yùn)用中,可以對(duì)參數(shù)和半?yún)?shù)兩者所占比例進(jìn)行分析和比較,并對(duì)最終比較結(jié)果進(jìn)行加權(quán)處理,從而驗(yàn)證該新型模型的可靠性和優(yōu)越性;朱晉偉等學(xué)者充分應(yīng)用半?yún)?shù)模型誤差低等特點(diǎn),全面地分析企業(yè)運(yùn)營(yíng)、績(jī)效相關(guān)影響因素。現(xiàn)階段,大量學(xué)者均加入到半?yún)?shù)模型的研究中,該模型主要包含以下兩種模型,分別是線性模型和變系數(shù)模型,將這兩模型進(jìn)行組合,從而形成相應(yīng)的研究熱點(diǎn)。Zeger等人通過運(yùn)用迭代法,估計(jì)非參數(shù)部分,并運(yùn)用后移算法,對(duì)線性部分進(jìn)行有效估計(jì),然后,將該半?yún)?shù)模型與醫(yī)學(xué)領(lǐng)域研究進(jìn)行充分結(jié)合,從而發(fā)揮和利用該模型的應(yīng)用優(yōu)勢(shì);Lin等學(xué)者在研究半?yún)?shù)模型期間,主要運(yùn)用廣義估計(jì)方程,對(duì)線性模型進(jìn)行全面化分析和研究。He等人在對(duì)半?yún)?shù)模型進(jìn)行估計(jì)時(shí),主要采用M-估計(jì)法,對(duì)該模型線性部分進(jìn)行分析和研究,并采用回歸樣條方法,對(duì)該模型的非參數(shù)部分進(jìn)行分析和研究;封維波等學(xué)者嚴(yán)格遵循均方誤差等準(zhǔn)則,全面地分析和比較了半?yún)?shù)模型以下兩種估計(jì)方法,一種是兩步估計(jì)方法[1],另一種是最小二乘估計(jì)方法,同時(shí),所獲得的參數(shù)兩步估計(jì)結(jié)果精確性和真實(shí)性相對(duì)較高,遠(yuǎn)遠(yuǎn)超過最小二乘估計(jì)方法所獲得的估計(jì)結(jié)果。但是,運(yùn)用該模型分析和解決實(shí)際問題期間,部分變量在影響因變量時(shí),表現(xiàn)出一定的空間差異性,而其他變量在影響因變量時(shí),并沒有表現(xiàn)出空間差異性,而是表現(xiàn)非線性差異性。為此,本文通過對(duì)以前所研究的半?yún)?shù)模型內(nèi)部的線性部分進(jìn)行處理,并將線性部分處理和推廣為非線性函數(shù),然后,將單個(gè)自變量非線性函數(shù)與空間變系數(shù)模型進(jìn)行有效組合,從而提出相應(yīng)的半?yún)?shù)模型估計(jì)方法。
二、相關(guān)理論知識(shí)
(一)部分回歸模型
1.參數(shù)與非參數(shù)模型。在實(shí)際生活中,多個(gè)變量既相互獨(dú)立,又相互依賴。如果回歸系數(shù)函數(shù)形式不同,所獲得的模型為非參數(shù)回歸模型,該模型在實(shí)際運(yùn)用中,要優(yōu)先選用大樣本方法,同時(shí),還要結(jié)合檢驗(yàn)統(tǒng)計(jì)分布復(fù)雜性等特點(diǎn),選用極限分布法,對(duì)非參數(shù)進(jìn)行全面化統(tǒng)計(jì)。例如:使用直方圖估計(jì)密度函數(shù)期間,僅僅參考少量數(shù)據(jù),難以保證估計(jì)結(jié)果的精確性和真實(shí)性。在實(shí)際估計(jì)期間,適當(dāng)?shù)卦黾訑?shù)據(jù)數(shù)目,可以保證估計(jì)精確性得以大幅度提高,因此,需要將樣本容量設(shè)置在50以上,并采用直方圖法,對(duì)非參數(shù)模型進(jìn)行估計(jì)。
2.一元非參數(shù)回歸模型估計(jì)方法。在估計(jì)一元非參數(shù)回歸模型期間,為了保證回歸函數(shù)估計(jì)結(jié)果的精確性和真實(shí)性,要利用高階泰勒法,對(duì)其進(jìn)行有效估計(jì),并運(yùn)用最小二乘估計(jì)法,獲得各個(gè)點(diǎn)所對(duì)應(yīng)的估計(jì)值。這種估計(jì)方法被稱為“局部多項(xiàng)式光滑方法”。
3.變系數(shù)模型及估計(jì)方法。非參數(shù)回歸模型在實(shí)際運(yùn)用中,表現(xiàn)出一定的靈活性,但是,當(dāng)自變量維數(shù)增加一定程度時(shí),會(huì)增加估計(jì)計(jì)算難度,為了解決這一問題,現(xiàn)研發(fā)一種新型變系數(shù)模型,通過運(yùn)用該模型,可以降低自變量維數(shù),確保模型運(yùn)用的科學(xué)性和靈活性。目前,比較常用的變系數(shù)模型主要包含部分線性模型、變系數(shù)模型等多種模型。其中,變系數(shù)模型在實(shí)際運(yùn)用中,可以將參數(shù)系數(shù)直接設(shè)置為另一個(gè)自變量,可以有效地避免高維數(shù)問題,提高模型應(yīng)用靈活性和有效性。
(二)空間變系數(shù)模型及估計(jì)方法
在具體應(yīng)用實(shí)踐中,數(shù)據(jù)會(huì)變得越來越復(fù)雜,此時(shí),如果僅僅考慮回歸系數(shù),難以滿足實(shí)際應(yīng)用需求。以某城市房?jī)r(jià)為例,影響房?jī)r(jià)因素主要包含房子面積、地理位置等因素。另外,為了更好地預(yù)測(cè)房?jī)r(jià)變化趨勢(shì),除了考慮以上幾個(gè)因素外,還要在參照變系數(shù)模型,充分考慮空間因素。地理位置不同,所對(duì)應(yīng)的系數(shù)函數(shù)具有一定的差異,通過運(yùn)用該方法,不僅可以突破空間非平穩(wěn)性問題,還能確保所獲得的數(shù)據(jù)真實(shí)、有效地反映出實(shí)際情況,此時(shí),還要利用空間變系數(shù)模型,影響房?jī)r(jià)的空間位置因素進(jìn)行分析和研究,經(jīng)過分析發(fā)現(xiàn),通過將空間信息與空間變系數(shù)模型進(jìn)行有效結(jié)合,可以確定出相應(yīng)的回歸系數(shù)。此外,通過運(yùn)用回歸系數(shù)所對(duì)應(yīng)的估計(jì)值,可以預(yù)測(cè)和評(píng)估回歸系數(shù)未來空間變化趨勢(shì)。
三、半?yún)?shù)空間變系數(shù)回歸模型及估計(jì)
在構(gòu)建空間變系數(shù)回歸模型期間,當(dāng)空間位置出現(xiàn)變化時(shí),所允許的回歸系數(shù)也出現(xiàn)明顯變化,但是,在實(shí)際問題分析和解決中,需要做出以下合理假設(shè)[2];當(dāng)空間位置變化時(shí),回歸系數(shù)會(huì)出現(xiàn)改變,其他的系數(shù)為常數(shù),本文構(gòu)建半?yún)?shù)空間變系數(shù)回歸模型表達(dá)式如下:
y=β+βKx+βvx+ε(1)
在對(duì)空間變系數(shù)回歸模型進(jìn)行研究期間,通常會(huì)用到以上模型,通過運(yùn)用該迭代算法,對(duì)該模型進(jìn)行分析。該迭代算法在實(shí)際運(yùn)用中,會(huì)出現(xiàn)計(jì)算耗費(fèi)時(shí)間長(zhǎng)等問題,只能獲得常值系數(shù)近似估計(jì)值,而且在半?yún)?shù)空間變系數(shù)回歸模型的運(yùn)用過程中[3],會(huì)導(dǎo)致矩陣呈現(xiàn)出非對(duì)稱冪狀態(tài)。結(jié)合以上模型特點(diǎn)和存在的問題,本文提出一種行之有效的兩步估計(jì)方法,并運(yùn)用該方法,在指定的條件下,獲得精確的常值系數(shù)估計(jì)值。首先,利用常值系數(shù)向量,對(duì)模型進(jìn)行轉(zhuǎn)換處理,使其轉(zhuǎn)變?yōu)榭臻g變系數(shù)回歸模型[4],該回歸模型表達(dá)式如(1)式所示,,并采用GWR方法,對(duì)該模型進(jìn)行擬合處理,同時(shí),利用加權(quán)最小二乘法,對(duì)變系數(shù)進(jìn)行精確化計(jì)算。其次,結(jié)合變系數(shù)最終估計(jì)結(jié)果,確定出合適的線性回歸模型形式,并采用一般最小二乘法,對(duì)常值系數(shù)進(jìn)行估計(jì)。通過采用兩步估計(jì)方法,可以獲得良好的擬合效果。
四、模擬試驗(yàn)
與半?yún)?shù)回歸模型相比,保證常值系數(shù)估計(jì)的有效性,在確定各個(gè)自變量對(duì)因變量的影響程度以及相關(guān)空間位置變化情況等方面具有重要作用[5]。通過采用模擬試驗(yàn)方法,對(duì)該模型常值系數(shù)估計(jì)方法進(jìn)行驗(yàn)證,驗(yàn)證該方法的精確性和穩(wěn)定性。
(一)試驗(yàn)設(shè)計(jì)
在進(jìn)行模擬試驗(yàn)期間,需要將m-1個(gè)單位正方形進(jìn)行組合,從而形成相應(yīng)的空間區(qū)域,然后,觀察空間區(qū)域邊長(zhǎng)在m×m個(gè)格子點(diǎn)上,并計(jì)算各個(gè)格子點(diǎn)之間的距離,經(jīng)過計(jì)算,發(fā)現(xiàn)該距離值為一個(gè)長(zhǎng)度單位。然后,使用x、y別代表觀測(cè)點(diǎn)所對(duì)應(yīng)的橫坐標(biāo)和縱坐標(biāo),同時(shí),嚴(yán)格按照從左到右、從下到上的順序[6],對(duì)各個(gè)觀測(cè)點(diǎn)進(jìn)行有序排列。此外,還要模擬處理多個(gè)混合空間變系數(shù)回歸模型,該模型模擬所獲得的誤差項(xiàng)完全滿足正態(tài)分布N(0,σ2)規(guī)律,為了更好地分析和研究噪聲方差對(duì)估計(jì)值的影響程度,現(xiàn)將σ值分別設(shè)置為0.2,0.6,1。各個(gè)模型中,自變量值均滿足正態(tài)分布規(guī)律[7],在單個(gè)模型中,將σ分別設(shè)置為0.2,0.6,1,將m分別設(shè)置為6,7,8,9,10,然后,對(duì)其進(jìn)行科學(xué)模擬。當(dāng)m、σ和模型確定后,需要對(duì)誤差向量進(jìn)行改變[8],并將重復(fù)計(jì)算次數(shù)設(shè)置為500次,對(duì)于單個(gè)常值系數(shù)而言,可以獲得500個(gè)估計(jì)值[9],然后,對(duì)500個(gè)估計(jì)值求平均值,所獲得的平均值就是該常值系數(shù)的最終估計(jì)值,并用“■■”表示,獲得樣本標(biāo)準(zhǔn)差計(jì)算公式,通過運(yùn)用該公式,可以實(shí)現(xiàn)對(duì)該估計(jì)方法有效性和穩(wěn)定性的有效衡量。
(二)模擬試驗(yàn)結(jié)果
本次試驗(yàn),所獲得的試驗(yàn)結(jié)果如表1所示,從表1中的數(shù)據(jù)可以得出以下幾個(gè)結(jié)論:(1)模型不同,所對(duì)應(yīng)的m、σ也不同,通過運(yùn)用后向擬合法,可以獲得常值系數(shù)最終估計(jì)值,該估計(jì)值與其真實(shí)值相吻合,這表明該估計(jì)方法具有較高的有效性和穩(wěn)定性。(2)觀測(cè)點(diǎn)會(huì)隨著m的不斷增加而呈現(xiàn)出不斷增加的趨勢(shì),盡管估計(jì)精度并沒有明顯提高,但其穩(wěn)定性不斷提升。(3)當(dāng)σ越來越大時(shí),說明噪聲方差不斷增加,該模型表現(xiàn)出較高的干擾程度,估計(jì)精度并沒有出現(xiàn)明顯的變化,但其穩(wěn)定性有所下降。(4)該模型變系數(shù)項(xiàng)不斷增加時(shí),該模型中會(huì)出現(xiàn)兩個(gè)變系數(shù)項(xiàng),說明估計(jì)精度越來越低。
五、半?yún)?shù)空間變系數(shù)回歸模型及兩步估計(jì)方法在經(jīng)濟(jì)領(lǐng)域中的應(yīng)用
在經(jīng)濟(jì)水平的不斷提高下,通過運(yùn)用本文所提出的兩步估計(jì)方法,對(duì)某城市房?jī)r(jià)數(shù)據(jù)進(jìn)行定量分析,從而研究出該城市房?jī)r(jià)空間差異結(jié)構(gòu)及其影響因子,為房地產(chǎn)行業(yè)發(fā)展提供重要的依據(jù)和參考。
(一)數(shù)據(jù)收集
本文以某城市多個(gè)小區(qū)的空間數(shù)據(jù)為樣本,這些樣本部分?jǐn)?shù)據(jù)如表2。
(二)空間變系數(shù)模型建立
運(yùn)用相關(guān)性分析法,確定出小區(qū)的房齡、公交站個(gè)數(shù)、距地鐵站距離、距醫(yī)院距離,并將這些變量標(biāo)記為X=(X1,X2,X3,X4),使用(U,V)坐標(biāo)表示小區(qū)實(shí)際的空間地理位置;使用(x1,x2,x3,x4,μi,vi,Yi)表示第i個(gè)小區(qū)的觀測(cè)數(shù)據(jù),i=1,2,...,n。基于空間系數(shù)回歸模型如下:
Y=β(μ,v)X+εi (i=1,2,...,n)(2)
(3)式中β(μ,v)(m=1,2,...,p)代表(μ,v)觀測(cè)點(diǎn)位置處所對(duì)應(yīng)的影響因子系數(shù)參數(shù),εi代表正態(tài)誤差項(xiàng)。
(三)數(shù)值模擬
以小區(qū)的空間數(shù)據(jù)為樣本,運(yùn)用Matlab軟件編程法,對(duì)該空間數(shù)據(jù)進(jìn)行處理,模型自變量系數(shù)運(yùn)行結(jié)果如表3所示。
從表3中的數(shù)據(jù)可以看出,學(xué)校、醫(yī)院參(下轉(zhuǎn)第27頁)(上接第22頁)數(shù)變化幅度相對(duì)較大,其影響量級(jí)相對(duì)較高,這表明學(xué)校、醫(yī)院參數(shù)會(huì)對(duì)房?jī)r(jià)空間差異性產(chǎn)生明顯影響。地鐵參數(shù)變化幅度相對(duì)較小,并對(duì)房?jī)r(jià)空間差異性產(chǎn)生影響程度較小,這表明地鐵對(duì)房?jī)r(jià)整體影響程度較小。
六、結(jié)束語
綜上所述,本文結(jié)合半?yún)?shù)空間變系數(shù)回歸模型構(gòu)建情況,提出兩步估計(jì)方法,并確定出常值系數(shù)的精確估計(jì)表達(dá)式,通過對(duì)該方法進(jìn)行大量數(shù)值模擬,有效地驗(yàn)證了該方法的有效性、合理性。另外,通過運(yùn)用Bootstrap方法,實(shí)現(xiàn)對(duì)常值系數(shù)估計(jì)偏差和方差的有效研究。最后,將本文所提出的兩步估計(jì)方法被廣泛地應(yīng)用于房?jī)r(jià)空間差異性分析,應(yīng)用結(jié)果表明:影響房?jī)r(jià)空間差異性較大的因子是學(xué)校、醫(yī)院。但是,本文研究仍然需要進(jìn)一步優(yōu)化和完善,需要相關(guān)人員不斷創(chuàng)新和改革兩步估計(jì)方法,便于后期更好地推廣和應(yīng)用該方法。
[基金項(xiàng)目:云南省哲學(xué)社會(huì)科學(xué)規(guī)劃項(xiàng)目“復(fù)雜數(shù)據(jù)半?yún)?shù)分位數(shù)回歸模型方法在社會(huì)經(jīng)濟(jì)領(lǐng)域應(yīng)用研究”中期成果(項(xiàng)目編號(hào):YB2021096)]
參考文獻(xiàn):
[1] 陳建寶,喬寧寧.半?yún)?shù)變系數(shù)回歸模型的空間相關(guān)性檢驗(yàn)[J].統(tǒng)計(jì)研究,2015,32(07):87-92.
[2] 魏傳華,梅長(zhǎng)林.半?yún)?shù)空間變系數(shù)回歸模型的Back-Fitting估計(jì)[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2006,36(03):177-184.
[3] 程慧燕,朱道元.半?yún)?shù)空間變系數(shù)模型的局部線性二階段估計(jì)[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2017,47(07):292-296.
[4] 陳建寶,喬寧寧.半?yún)?shù)變系數(shù)空間誤差回歸模型的估計(jì)[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2017,34(04):129-146.
[5] 唐慶國(guó),晉鵬.空間半?yún)?shù)變系數(shù)部分線性分位數(shù)回歸中的B-樣條估計(jì)法[J].統(tǒng)計(jì)與信息論壇,2018,33(06):9-13.
[6] 袁芳.糾正傳統(tǒng)回歸誤差的半?yún)?shù)變系數(shù)估計(jì)模型設(shè)定及應(yīng)用[J].統(tǒng)計(jì)與決策,2018,34(03):20-24.
[7] 胡亞南,王金天,田茂再.半?yún)?shù)空間分位回歸模型的估計(jì)與變量選擇[J].數(shù)理統(tǒng)計(jì)與管理,2022,41(04):647-661.
[8] 曹連英,張博.非線性半?yún)?shù)空間變系數(shù)模型的兩步估計(jì)[J].統(tǒng)計(jì)與決策,2016(22):12-14.
[9] 梁永玉,田茂再.空間部分線性變系數(shù)模型的分位回歸估計(jì)[J].統(tǒng)計(jì)與決策,2022,38(09):36-41.