徐媛媛 臺(tái)婷婷
內(nèi)容提要:以2011年我國31個(gè)省市自治區(qū)和2012年部分省份的旅游外匯收入統(tǒng)計(jì)數(shù)據(jù)為基礎(chǔ),運(yùn)用多種估計(jì)方法,估計(jì)了2012年我國旅游外匯總收入、抽樣方差及在95%的概率保證程度下旅游外匯收入總量的置信區(qū)間。經(jīng)過對幾種方法的比較發(fā)現(xiàn).PPS抽樣估計(jì)值與當(dāng)年的外匯總值相當(dāng),說明在總體單元差異大的情況下,技術(shù)上采用PPs抽樣方法,可以以較低的成本完成更精確的估計(jì)
關(guān)鍵詞:抽樣技術(shù);PPS抽樣;旅游外匯收入
中圖分類號(hào):F590文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-4161(2015)01-0094-04
DOI:10.13483/j,cnki.kfyj.2015.01.022
旅游外匯收入也稱國際旅游收入,是指本國為人境的國際旅游者提供的商品及各種服務(wù)所得到的外匯收入。入境旅游是我國旅游“三大市場”中開發(fā)最早、發(fā)展最快的市場。據(jù)中國統(tǒng)計(jì)局公布的資料,1994年來華進(jìn)行人境旅游的外國人數(shù)僅4368.45萬人次,而旅游外匯收入也僅僅73.23億美元。而2012年,入境人數(shù)已達(dá)13240.53萬人次,旅游外匯收入500.28億美元,比1994年分別增長了203.1%和583.2%。我國的旅游業(yè)正以它強(qiáng)勁的創(chuàng)匯能力和快速發(fā)展的勢頭成為我國經(jīng)濟(jì)發(fā)展的支柱性產(chǎn)業(yè)之一。在這種情況下,有必要對旅游外匯收入進(jìn)行更加精確的估計(jì)。我們知道當(dāng)抽樣單位的大小與目標(biāo)變量之間相關(guān)時(shí),采用PPS抽樣方法,可以提高抽樣效率糾。本文通過分析2011年我國31個(gè)省市自治區(qū)和2012年部分省市自治區(qū)的旅游外匯收入統(tǒng)計(jì)數(shù)據(jù),對旅游外匯收入估計(jì)的PPS抽樣等三種方法進(jìn)行比較,尋求最佳的估計(jì)方法,以便為相關(guān)旅游政策的制定提供依據(jù)。
一、抽樣方法簡介
(一)簡單隨機(jī)抽樣及其估計(jì)量
1.簡單隨機(jī)抽樣概念
假設(shè)總體有N個(gè)單元,從中進(jìn)行逐個(gè)不放回的抽樣,抽取n個(gè)單元。這n個(gè)單元組成一個(gè)簡單隨機(jī)樣本,這種抽樣的方法稱為簡單隨機(jī)抽樣。
2.簡單隨機(jī)抽樣下總體均值和總體總值
(1)定義。在簡單隨機(jī)抽樣中,若總體有N個(gè)單元,抽取容量為n(n (二)分層抽樣及其估計(jì)量 1.分層抽樣概念 分層抽樣(stratified sampling)又叫類型抽樣或分類抽樣。分層抽樣是指將總體的N個(gè)單元?jiǎng)澐譃榛ゲ唤徊嬷丿B的L層,然后各層進(jìn)行獨(dú)立抽樣。若設(shè)各層所包含的單元數(shù)分別為Ni,顯然若各層均進(jìn)行簡單隨機(jī)抽樣,那么這種分層抽樣稱作分層隨機(jī)抽樣。設(shè)總樣本量為n,各層的樣本量分別為n1,n2,…,nL,顯然 2.分層隨機(jī)抽樣下總體均值和總體總量(1)定義 在分層抽樣下,分別根據(jù)各層樣本計(jì)算出各層均值Y,、的估計(jì)值Y,通過各層的權(quán)重Wn進(jìn)行加權(quán)平均,然后得到總體的均值Y的估計(jì)量。分層隨機(jī)抽樣下,記Y為l,層的樣本均值Yh,若將總體均值Y的簡單估計(jì)記為Yst則有分層隨機(jī)抽樣樣本均值Yst和總體總值Yst的方差分別為 (三)PPS抽樣及其估計(jì)量 1.PPs抽樣概念 放回不等概抽樣中,假設(shè)總體中第i個(gè)單元的大小或規(guī)模的度量為M。總體的總規(guī)模為每次抽樣中第i個(gè)單元被抽中的概率用zi表示,如果這種不等概抽樣就稱作PPs抽樣(probabilily proportional Lo size),即放回的與規(guī)模大小成比例的概率抽樣。 2.實(shí)施方法 本文采用規(guī)模累積等距抽選法實(shí)施PPS抽樣。設(shè)總體有N個(gè)單元,各單元規(guī)模度量分別為M1,M2,…,MN(整數(shù)),其中第i個(gè)單元相應(yīng)地分配Mi個(gè)代碼(i=l,…,N),總共有個(gè)代碼。若欲抽取容量為n的樣本,則須先確定等距抽樣的間隔。然后在l~K之間隨機(jī)抽取一數(shù)r,其所在代碼區(qū)間對應(yīng)的單元就作為第一個(gè)被抽中的單元,如此,r,r+K,…,r+(n-1)k等數(shù)字所在的代碼區(qū)間的相對應(yīng)的單元即為被抽中的單元。這種抽樣方法的特點(diǎn)是每個(gè)單元被抽中的概率與該單元M.的規(guī)模大小成比例。 3.PPs抽樣下總體總量和方差 (1)定義 漢森和赫維茨于1943年針對PPS抽樣方法給出了估計(jì)總體總量的無偏估計(jì)量,稱為漢森一赫維茨(Hensen-Hurvitz)估計(jì)量: 其中,Yi為樣本的第i個(gè)單元的變量值,而為人樣的第i個(gè)單元根據(jù)其規(guī)模大小入樣的概率。另外YHH是無偏的。 (2)方差 二、數(shù)據(jù)分析 (一)數(shù)據(jù)收集與處理 本文使用數(shù)據(jù)來自于《2013中國統(tǒng)計(jì)年鑒》,選取2011年和2012年各地區(qū)按旅游外匯收入(萬美元汁)總額的數(shù)據(jù)進(jìn)行分析。對數(shù)據(jù)進(jìn)行初步分析,我們發(fā)現(xiàn)2011年我國旅游外匯收入最大值與最小值之差為1389999萬美元,相差2242.934多倍,單位之間的差異非常大。下面我們分別用簡單隨機(jī)抽樣、分層抽樣、PPS抽樣來估計(jì)2012年我國旅游外匯收入的總額。 (二)總體總量的簡單隨機(jī)抽樣估計(jì) 給我國31個(gè)省市自治區(qū)分別編號(hào)為01~31,利用隨機(jī)數(shù)表抽取13個(gè)地區(qū)作為樣本,抽中的13個(gè)地區(qū)如下表l所示。下面以這13個(gè)地區(qū)的旅游外匯收入來估計(jì)2012年我國31個(gè)省、市、自治區(qū)的旅游外匯收入。 利用公式(2)得總體總量估計(jì): 利用公式(4)得總體方差估計(jì): 置信度為95 010的置信區(qū)間為: 2012年,全國的實(shí)際旅游外匯收入總額為5002800萬美元,位于置信區(qū)間內(nèi)。 (三)總體總量的分層估計(jì)
根據(jù)不同地區(qū)2011年旅游外匯收入總額,將31個(gè)地區(qū)分為四層,如表2所示。
各子層采用簡單隨機(jī)抽樣方法按比例抽取樣本,分別抽取4個(gè)(寧夏、青海、貴州、吉林)、3個(gè)(河北、內(nèi)蒙古、湖北)、3個(gè)(陜西、天津、山東)、2個(gè)(福建、江蘇)樣本,四層總計(jì)12個(gè)樣本。各層統(tǒng)計(jì)結(jié)果見表3。
利用公式(6)對我國2012年旅游外匯收入總額進(jìn)行估計(jì):
Yst=10x17337+7×86211.333+8x224917.667+6×526269.5=5733807.667。
由公式(8),可以得到總體方差估計(jì):
置信度為95%的置信區(qū)間為
2012年,全國的實(shí)際旅游外匯收入總額為5002800萬美元,位于置信區(qū)間內(nèi)。
(四)總體總量的PPS抽樣估計(jì)
以各地區(qū)為單元,以其2011年旅游外匯收入額作為各單元規(guī)模,并進(jìn)行累計(jì),得到表4。采用規(guī)模累積等距抽選方法抽取10個(gè)樣本地區(qū)。將Mo:EMi=5968204除以樣本量n=10,得到抽樣間隔K在1~K之間抽取一個(gè)隨機(jī)數(shù)r=259895,顯然處于北京的代碼范圍,因而北京入樣。然后選取r+K,r+2K,…,r+(n-1)k的地區(qū):依次是內(nèi)蒙古、上海、江蘇、浙江、福建、湖南、廣東(計(jì)入2次)云南,總共10個(gè)樣本9個(gè)省市入選。
這10個(gè)樣本地區(qū)入樣的概率用計(jì)算,結(jié)果見表5。
用這10個(gè)樣本省的旅游外匯收入來估計(jì)2012年全國旅游外匯收入總額,由公式(9)漢森一赫維茨估計(jì)量得:
故推斷,全國31個(gè)省市2012年全國旅游外匯收入總額為4975896.243萬美元。
由公式(11)得總體總值方差估計(jì)為置信度為95%的置信區(qū)間為
2012年,全國的實(shí)際旅游外匯收入總額為5005800萬美元,位于置信區(qū)間內(nèi)。
(五)三種估計(jì)方法的比較
1.總體總值估計(jì)的比較
一般抽樣調(diào)查中取得的樣本數(shù)越多,成本就越高,但得到的結(jié)果會(huì)越精確。簡單隨機(jī)抽樣、分層抽樣和PPS抽樣分別抽取了13、12和10個(gè)樣本,樣本數(shù)逐漸遞減。其中,盡管PPS抽樣抽取了最少量(10個(gè))的樣本,但其對總體總值的估計(jì)值4975896.243萬美元最為接近2012年旅游外匯收入的實(shí)際值5002800萬美元。
2.抽樣效果的比較
簡單隨機(jī)抽樣、分層抽樣和PPs抽樣三者的總體方差以PPS抽樣方法下的方差最小,為2.855×10l,在95%的置信度下的置信區(qū)間為(3928550.007,6023242.478),為三者中范圍最小。這表明PPS抽樣方法相比其他兩種方法更加精確。
綜上所述,PPS抽樣方法能以較低的調(diào)查成本得到較好的抽樣效果。
三、結(jié)論
通過對2011年我國31個(gè)省市自治區(qū)旅游外匯收入進(jìn)行PPS抽樣,利用2012年部分省區(qū)數(shù)據(jù)估計(jì)出2012年全國旅游外匯收入總額為4975896.243萬美元,95%的置信程度下的置信區(qū)間為(3928550.007,6023242.478)。2012年實(shí)際值為5002800萬美元,處于置信區(qū)間內(nèi)。通過對簡單隨機(jī)抽樣、分層抽樣與PPS抽樣三種方法進(jìn)行比較,發(fā)現(xiàn)不論是對總體總量的估計(jì)還是其抽樣誤差大小來說,PPS抽樣對我國旅游外匯收入估計(jì)的精確度更高,而且由于抽取了較少的樣本,抽樣成本會(huì)更低,總體效果要由于前兩者。所以,當(dāng)需要對各單元之間差異比較大的總體i井行估計(jì)時(shí),宜采用PPS抽樣。