王義鬧
(溫州大學數(shù)理學院,浙江溫州 325035)
考慮隨機解釋變量問題:
式中,b0,1b為常數(shù),x為隨機解釋變量,u為隨機誤差項,x與u線性相關(guān).
我們知道,對(x,u)的容量為n的簡單隨機樣本
有
參數(shù)1b的最小二乘(OLS)估計量
不是一致估計量;參數(shù)1b的工具變量(IV)估計量
是一致估計量,其中w是x的工具變量[1].因此,只要樣本容量足夠大,就一定有:
上述結(jié)論也意味著,樣本容量不夠大時,上式不一定成立.本文進一步給出了樣本容量確定時,
成立的一個充分條件,即最小二乘估計量優(yōu)于工具變量法估計量的一個充分條件.
對x的任一工具變量w,參數(shù)1b的工具變量估計量
式中,
為工具變量w與隨機誤差項u的樣本相關(guān)系數(shù),
為工具變量w與隨機解釋變量x的樣本相關(guān)系數(shù).再記樣本標準差
則由(8)式可見,參數(shù)1b的工具變量估計量的絕對誤差為:
因此,當我們選取的解釋變量的樣本觀察值越分散,工具變量與隨機解釋變量的樣本相關(guān)系數(shù)的絕對值越大時,誤差越?。?/p>
參數(shù)1b的最小二乘估計量為:
其中
為隨機解釋變量x與隨機誤差項u的樣本相關(guān)系數(shù),于是最小二乘估計量的絕對誤差為:
故有下面引理1.
引理1 當
時,工具變量估計量的絕對誤差小于最小二乘估計量的絕對誤差,否則,最小二乘估計量更好.
1915年Fisher找到了樣本相關(guān)系數(shù)的精確分布[2]:
在X,Y服從二維正態(tài)分布,相關(guān)系數(shù)的假設下,當樣本容量n≥3時,樣本相關(guān)系數(shù)rXY的概率密度為:
其中v=n-2是自由度.
據(jù)此對不同樣本容量n,可求得0.75分位數(shù)x0.75使
定理1 設工具變量w與隨機干誤差項u服從二維正態(tài)分布樣本容量則工具變量估計量的絕對誤差小于OLS估計量的絕對誤差的概率為:
證明:由于工具變量w與隨機干擾項u服從二維正態(tài)分布,樣本容量n≥3,且工具變量w與隨機干擾項u不相關(guān),所以樣本相關(guān)系數(shù)rwu的概率密度為(14)式,再由引理1知,工具變量估計量的絕對誤差小于OLS估計量的絕對誤差的概率為:
再由(13)式可知,上式意味著工具變量估計量的絕對誤差小于OLS估計量的絕對誤差的概率大于0.5;當時,
上式意味著OLS估計量的絕對誤差小于工具變量法估計量的絕對誤差的概率大于0.5.
為查閱方便,將根據(jù)(14)式計算的樣本相關(guān)系數(shù)的0.75分位數(shù)x0.75列于表1.
表1 樣本相關(guān)系數(shù)的0.75分位點
由定理1及表1可見,當樣本容量為10時,如果|rwxrxu|大于0.242,則工具變量法估計值優(yōu)于OLS估計值的概率大于0.5,我們應該應用工具變量法估計參數(shù);如果|rwxrxu|小于0.242,就應該用最小二乘法估計參數(shù).而當樣本容量為100時,哪怕解釋變量與隨機干擾項u的樣本相關(guān)系數(shù)小到只有0.1,只要|rwxrxu|大于0.068,應用工具變量法估計參數(shù)仍然優(yōu)于最小二乘法.
在實際問題中,隨機干擾項u的取值觀察不到,無法驗證是否成立.但是,由于可以由觀察值計算,如果就必有應該用最小二乘法估計參數(shù).這個結(jié)論就是定理1的一個推論:
推論1給出了一個判斷最小二乘法估計量優(yōu)于工具變量法估計量的充分條件,實際問題中這一充分條件是否滿足,很容易通過計算隨機解釋變量與其工具變量之間的樣本相關(guān)系數(shù)判斷.