馬詠梅
摘要:在經(jīng)濟(jì)社會(huì)調(diào)查中,對(duì)空間的相關(guān)性應(yīng)用較為廣泛,傳統(tǒng)的抽樣設(shè)計(jì)已經(jīng)跟不上時(shí)代的發(fā)展。隨著時(shí)代衍生出來的空間平衡抽樣設(shè)計(jì)方案,對(duì)總體單元的空間信息考慮相對(duì)全面。文章主要通過分析經(jīng)濟(jì)社會(huì)調(diào)查中的空間相關(guān)性和空間平衡抽樣設(shè)計(jì)的概念,進(jìn)而研究經(jīng)濟(jì)社會(huì)調(diào)查中的空間平衡抽樣設(shè)計(jì)方法。
關(guān)鍵詞:經(jīng)濟(jì)社會(huì)調(diào)查;空間平衡;抽樣設(shè)計(jì)
一、經(jīng)濟(jì)社會(huì)調(diào)查中的空間相關(guān)性
經(jīng)濟(jì)社會(huì)調(diào)查中所需要研究的對(duì)象分布較為離散,雖然他們?cè)谝欢臻g內(nèi)也會(huì)相似,產(chǎn)生相關(guān)性,但是這種空間相關(guān)性會(huì)對(duì)抽樣設(shè)計(jì)產(chǎn)生一些影響:空間相關(guān)性的出現(xiàn)打破了傳統(tǒng)抽樣方法中總體的每個(gè)單元是相互獨(dú)立的假設(shè)前提;如果空間中的許多相似單元進(jìn)入樣本中,效率樣本空間,導(dǎo)致樣本信息出現(xiàn)大面積的重復(fù),從而降低樣本的代表性,產(chǎn)生估計(jì)結(jié)果偏差。所以,在抽樣調(diào)查中,應(yīng)該在抽樣設(shè)計(jì)過程中分析總體單元的空間信息,重視總體單元空間屬性對(duì)抽樣產(chǎn)生的影響。經(jīng)濟(jì)社會(huì)調(diào)查中的相關(guān)性所表現(xiàn)出來的是局部空間中的部分總體特征,說明了總體空間中各單元存在一定程度的聯(lián)系。
二、空間平衡抽樣設(shè)計(jì)
社會(huì)經(jīng)濟(jì)調(diào)查中,空間平衡抽樣設(shè)計(jì)具有一定的優(yōu)勢(shì),能夠提前分析單元所在的空間位置,在抽取樣本的時(shí)候,同一時(shí)間段內(nèi),盡量抽取到彼此相關(guān)性較弱所隔距離較遠(yuǎn)的單元,從而避免樣本信息重復(fù),達(dá)到樣本均勻分布的目的。為實(shí)現(xiàn)這一設(shè)計(jì),設(shè)計(jì)空間平衡的方法如下所述。
1. 構(gòu)造抽樣框?;镜某闃涌驊?yīng)具備總體單元的經(jīng)緯度坐標(biāo)信息,作為設(shè)計(jì)空間平衡的輔助信息,單元的經(jīng)緯度可以通過電腦端網(wǎng)絡(luò)地圖軟件、網(wǎng)絡(luò)在線預(yù)覽地圖軟件和專門的手機(jī)地圖APP來獲取。
2. 設(shè)定初始包含概率。采用等概率方法或者不等概率方法設(shè)計(jì)總體單元的初始包含概率。
3. 采用空間平衡抽樣算法選取樣本??臻g平衡抽樣算法主要包括空間相關(guān)泊松抽樣,局部樞軸法和空間雙重平衡抽樣三種。
空間平衡抽樣算法把設(shè)定的包含概率進(jìn)而發(fā)展成入樣指示變量,根據(jù)總體單元的經(jīng)緯度計(jì)算出各單元之間的空間距離,充分利用樣本空間的輔助信息??臻g相關(guān)泊松抽樣算法N次逐一地訪問總體單元,每一步的更新都取決于上一步包含概率更新的結(jié)果,如果一個(gè)單元成功入樣了,將會(huì)推動(dòng)空間上和它相鄰單元的包含概率的更新,相鄰單元的包含概率將會(huì)變得高度負(fù)相關(guān),并且這種算法主要在計(jì)算權(quán)重的過程中應(yīng)用空間輔助信息。
局部樞軸法簡稱LPM,主要分為LPM1和LPM2兩種,LPM1首先進(jìn)行隨機(jī)抽樣,選取樣本,然后根據(jù)空間輔助信息計(jì)算出空間中單元之間的距離,選出離得最近的兩個(gè)單元,然后對(duì)這兩個(gè)單元的進(jìn)行包含概率的更新,理論上的運(yùn)算次數(shù)超不過冪的三次方。LPM2首先也是進(jìn)行隨機(jī)抽樣,但是對(duì)于兩個(gè)單元之間的距離不做過多要求,而是利用樞軸法直接進(jìn)行兩個(gè)單元的包含概率的更新,所以其運(yùn)算的次數(shù)不超過冪的二次方,雖然LPM2的空間平衡性相對(duì)較差,但是所耗費(fèi)的時(shí)間和做運(yùn)算次數(shù)卻低于LPM1;空間雙重平衡抽樣簡稱DBSS,又叫做局部立體算法,這個(gè)算法主要是重復(fù)抽取總體空間里的子集,在所抽取的子集中抽取空間平衡樣本,對(duì)于算法中所涉及到的重復(fù)計(jì)算,首先需要在一個(gè)全新的集合中隨機(jī)抽取一個(gè)單元,將所抽取的單元和它附近的單元組成一個(gè)子集,并算出子集的中心點(diǎn)和每個(gè)單元與中心點(diǎn)距離的平方和,選出距離平方和最小的單元組成一個(gè)新的子集,并重復(fù)以上的計(jì)算,直到找出整個(gè)空間中距離平方和最小的單元為止,并得到最終的空間子集,其次,在所確定的空間子集中,對(duì)于平衡方程的構(gòu)造,需要把經(jīng)緯度坐標(biāo)當(dāng)做一個(gè)平衡變量,并利用立方體法中的起飛步進(jìn)行抽樣,然后不斷重復(fù),直到所剩余的單元樹不足以進(jìn)行計(jì)算為止,然后采用立方體法中的著陸步抽樣選取剩下的單元,空間雙重平衡抽樣算法利用了空間局部計(jì)算的方法所獲取的樣本具有空間平衡性。
4. 根據(jù)抽樣的結(jié)果進(jìn)行調(diào)查。分析調(diào)查的實(shí)際需求,匯總那些前往實(shí)地調(diào)研獲取的樣本單元的目標(biāo)變量或根據(jù)查閱資料所獲取的樣本單元的目標(biāo)變量。
5. 根據(jù)所得到的空間平衡樣本,進(jìn)行一系列的統(tǒng)計(jì)和推斷。包含概率更新后變成入樣指示向量,從一定程度上來講,更新包含概率就是選取樣本的過程。對(duì)于入樣指示向量的更新,是在空間輔助信息下,隨機(jī)的實(shí)現(xiàn)初始包含概率。所以,在估計(jì)的過程中,使用的是初始設(shè)計(jì)的包含概率,選取樣本的過程中應(yīng)用了空間輔助信息,而估計(jì)的過程中沒有使用。
三、空間平衡抽樣設(shè)計(jì)可以有效降低估計(jì)量的標(biāo)準(zhǔn)差
在多次重復(fù)抽樣過程中,空間平衡抽樣設(shè)計(jì)的方法可以獲取在空間中均勻分布的樣本,增強(qiáng)了穩(wěn)定性,確保了所抽取的樣本相對(duì)于空間總體具有一定的代表性,使得后續(xù)的統(tǒng)計(jì)推斷變得更加真實(shí)可靠??臻g平衡抽樣設(shè)計(jì)可以利用所計(jì)算出來的空間中單元之間的距離,來進(jìn)行總體單元包含概率的更新,減小那些距離較近的單元同時(shí)被抽取的可能,從而確保每次抽取的單元能夠在總體空間中離散的分布,使樣本更具代表性。在空間平衡抽樣中,由于所抽取的樣本在總體空間中都是均勻分布的,而且都是按照比例進(jìn)行抽取的,所以空間差異較小,可以很大程度的提高樣本的估計(jì)效率,減小估計(jì)量的相對(duì)誤差。
四、對(duì)于經(jīng)濟(jì)社會(huì)調(diào)查中空間平衡抽樣設(shè)計(jì)方法的探析
1.調(diào)查總體界定和總體特征
在經(jīng)濟(jì)社會(huì)調(diào)查中,需要獲取所要調(diào)查對(duì)象的實(shí)際數(shù)據(jù),得出目標(biāo)變量和輔助變量。將所獲得的輔助變量、空間信息和總體單元名錄編入抽樣框,選取合適的抽樣方法,并將局部空間內(nèi)的總體單元相似性表現(xiàn)出來,可以通過繪制圖像或圖表的方法更直觀地分析總體單元。
2.設(shè)計(jì)抽樣方法
對(duì)于抽樣框的抽樣可以采取以下三種方法:第一,分層隨機(jī)抽樣法。找出分層的標(biāo)志,并按比例劃分每一層的樣本量,增強(qiáng)估計(jì)量的統(tǒng)計(jì)性,從而提高所抽取樣本的代表性;第二,簡單隨機(jī)抽樣法,雖然簡單隨機(jī)抽樣比不上分層隨機(jī)抽樣,但是在實(shí)證分析中,不妨引入簡單隨機(jī)抽樣,參照它進(jìn)行估計(jì)效率的比較;第三,空間平衡抽樣法,在經(jīng)濟(jì)社會(huì)調(diào)查中,由于空間性較強(qiáng),可以計(jì)算出總體單元的經(jīng)緯度坐標(biāo),將其當(dāng)做空間的輔助信息,然后利用空間平衡的算法進(jìn)行單元間距離的計(jì)算,進(jìn)而抽取滿足該調(diào)查的空間平衡樣本,但是這類方法的計(jì)算量很大,需要借助軟件工具,可以幫助減小計(jì)算量,利用軟件優(yōu)化計(jì)算過程,更容易獲取空間平衡樣本,然后對(duì)所獲得的樣本進(jìn)行估計(jì)。
3.確定樣本含量
對(duì)于不固定的樣本量可以采取等概的抽樣設(shè)計(jì)法,設(shè)定初始包含概率,獲取在目標(biāo)容量上下波動(dòng)的樣本。
4.評(píng)估方法
在經(jīng)濟(jì)社會(huì)調(diào)查中,所采用的是傳統(tǒng)的HT估計(jì)量進(jìn)行估計(jì)。盡管HT估計(jì)量具有無偏性,但是最應(yīng)該注重的是進(jìn)行反復(fù)多次的抽樣后,所應(yīng)用的抽樣方法得到的估計(jì)結(jié)果表現(xiàn)出來的特征,然后對(duì)該抽樣方法進(jìn)行評(píng)估。對(duì)于經(jīng)濟(jì)社會(huì)調(diào)查來說,主要采用的評(píng)價(jià)估計(jì)效果的方法是相對(duì)均方根誤差。
5.估計(jì)結(jié)果并討論
(1)估計(jì)結(jié)果
在經(jīng)濟(jì)社會(huì)調(diào)查中,采用軟件需要編寫并運(yùn)行程序,從而達(dá)到重復(fù)抽樣的目標(biāo),估計(jì)目標(biāo)變量和減少計(jì)算量。應(yīng)當(dāng)采取空間雙重平衡抽樣,因?yàn)橄鄬?duì)于傳統(tǒng)的抽樣方法來說,這類方法能夠獲得更加精確的估計(jì)量,并且對(duì)于樣本容量少的情況,空間雙重平衡抽樣具有絕對(duì)的優(yōu)勢(shì)。
(2)空間信息對(duì)抽樣設(shè)計(jì)的改進(jìn)
對(duì)于總體單元,當(dāng)存在空間相關(guān)性時(shí),可以通過合理利用空間信息的方式,來改善抽樣設(shè)計(jì)??臻g雙重平衡抽樣算法通過計(jì)算出總體中單元間的距離實(shí)現(xiàn)對(duì)空間信息的利用,并結(jié)合平衡變量這個(gè)輔助信息,充分發(fā)揮二者的作用,提高所抽取的樣本對(duì)于總體單元的代表性。
在經(jīng)濟(jì)社會(huì)調(diào)查中,對(duì)于空間抽樣的設(shè)計(jì),通過專業(yè)地圖軟件獲取總體中各單元的經(jīng)緯度坐標(biāo)信息,把它們當(dāng)做平衡變量,用于局部立方體法中,把它們當(dāng)做空間輔助信息,用于計(jì)算空間距離中。雖然這樣做的估計(jì)效率較好,也充分考慮了平衡變量,但是卻沒有太大的改進(jìn)抽樣設(shè)計(jì)。所以,最好的方法還是需要把空間輔助信息當(dāng)做平衡變量用于局部立方體的計(jì)算,從而來確保所抽取的樣本能與總體保持一致,利用經(jīng)緯度坐標(biāo)完善空間輔助信息,可以確保所抽取的樣本在空間上是均勻分布的,進(jìn)而達(dá)到所抽取樣本是相對(duì)平衡的目的。
五、結(jié)語
綜上所述,空間平衡抽樣設(shè)計(jì)結(jié)合了空間抽樣設(shè)計(jì)把經(jīng)緯度坐標(biāo)信息當(dāng)做空間輔助信息的優(yōu)點(diǎn)和平衡抽樣設(shè)計(jì)把經(jīng)緯度坐標(biāo)信息當(dāng)做平衡變量的優(yōu)點(diǎn),結(jié)合空間多種類型的輔助信息,獲取代表性強(qiáng)又相對(duì)平衡的樣本,豐富了抽樣調(diào)查的理論方法體系,完善了抽樣調(diào)查的進(jìn)展流程。雖然在空間平衡抽樣算法中利用了空間信息,但是在估計(jì)的過程中卻沒有利用,多少有些可惜這些空間信息。對(duì)于樣本中的總體空間信息,如果進(jìn)行合理利用,不僅可以改善方差估計(jì)量的形式,還可以提高估計(jì)效率,獲得更加準(zhǔn)確的估計(jì)。但是如果樣本單元在空間中的距離很遠(yuǎn),無法集中的展開調(diào)查,將會(huì)極大地增加調(diào)查的人力、物力和財(cái)力,導(dǎo)致調(diào)查的成本急劇增加。因此,對(duì)于社會(huì)經(jīng)濟(jì)調(diào)查來說,在設(shè)計(jì)空間平衡抽樣的過程中,應(yīng)當(dāng)同時(shí)考慮調(diào)查成本和樣本代表性,盡量做到二者的統(tǒng)一與平衡,極大程度的減少成本投入。此外,對(duì)于空間輔助信息,還有很大的利用空間,可以在調(diào)查中加以利用,進(jìn)一步改進(jìn)對(duì)于估計(jì)量的使用。
參考文獻(xiàn):
[1]郝一煒,金勇進(jìn).經(jīng)濟(jì)社會(huì)調(diào)查中的空間平衡抽樣設(shè)計(jì)[J].統(tǒng)計(jì)與信息論壇,2018,33(11):3-10.
[2]李明陽,張向陽,吳文浩,等.基于GIS的森林資源調(diào)查空間平衡抽樣方法研究[J].林業(yè)資源管理,2008(04):137-142+150.
[3]李苑菱,陳宗鑄,雷金睿,等.??谑猩仲Y源調(diào)查空間平衡抽樣研究[J].林業(yè)資源管理,2019(02):47-53.
[4]趙文飛.基于居住-就業(yè)視角的南京老城區(qū)職住空間研究——以南京市主城區(qū)(城中片區(qū))控制性詳細(xì)規(guī)劃老城單元為例[D].江蘇:東南大學(xué),2018.
[5]李苑菱,陳宗鑄,雷金睿,等.基于GIS海南森林資源調(diào)查抽樣方法研究[J].熱帶林業(yè),2019,47(01):38-42.
[6]朱龍騰.建筑中水系統(tǒng)中的水量平衡與能耗分析——以北京市飯店行業(yè)為例[D].北京:中國科學(xué)院大學(xué),2013.
(作者單位:內(nèi)蒙古民族大學(xué))