工具變量的一個(gè)性質(zhì)

2020-06-28 01:46:34王義鬧

溫州大學(xué)學(xué)報(bào)(自然科學(xué)版) 2020年2期

王義鬧

(溫州大學(xué)數(shù)理學(xué)院，浙江溫州 325035)

考慮隨機(jī)解釋變量問(wèn)題：

其中 b0,b1為常數(shù)， x,u為隨機(jī)變量，其相關(guān)系數(shù) r(x,u ) = rxu≠0 ,E (u ) = 0 ，并有容量為n的簡(jiǎn)單隨機(jī)樣本(yi, xi, ui) ,i = 1 ,2,… ,n ，于是 r(xi, ui) = rxu≠0 , i = 1 ,2,… ,n ，即隨機(jī)解釋變量x與隨機(jī)干擾項(xiàng)u同期線性相關(guān).

我們知道，用最小二乘法（Ordinary Least Squares, OLS）估計(jì)模型（1）中的參數(shù) b1，得到的是有偏的、不一致的估計(jì)量，用工具變量法（Instrumental Variable, IV）可以得到有偏的、一致估計(jì)量[1].于是只要有足夠的樣本，工具變量法估計(jì)值優(yōu)于最小二乘法估計(jì)值的概率就足夠大.工具變量法已經(jīng)成為一種重要方法.本文對(duì)工具變量進(jìn)行研究，證明了工具變量有如下性質(zhì)：

存在

其中 ux,為（1）式中變量，使

即存在與u不相關(guān)，與x相關(guān)性最強(qiáng)的隨機(jī)變量v（以下稱為理想工具變量），且這樣的理想工具變量滿足

為敘述方便，以下稱工具變量的這一性質(zhì)為理想工具變量存在性.

以依次表示隨機(jī)解釋變量x與工具變量w的樣本相關(guān)系數(shù)、工具變量w與隨機(jī)干擾項(xiàng)u的樣本相關(guān)系數(shù)，以 σxs, σus依次表示隨機(jī)解釋變量x與隨機(jī)干擾項(xiàng)u的樣本標(biāo)準(zhǔn)差，則工具變量法估計(jì)值為

最小二乘法估計(jì)值為

由理想工具變量存在性易見，x的任一工具變量w滿足 ( r(x,w) )2≤1- ( r(x,u))2，這表明隨機(jī)解釋變量x與隨機(jī)干擾項(xiàng)u高度相關(guān)時(shí)，任一工具變量w必與解釋變量x低度相關(guān)，進(jìn)而將會(huì)因?yàn)?rwus不等于0的概率為1、并且 rxws接近0的概率較大，從而由（5）式可見，工具變量法估計(jì)值b?1偏離真值b1較遠(yuǎn)的概率較大.

這就提示我們，當(dāng)隨機(jī)解釋變量x與隨機(jī)干擾項(xiàng)u高度相關(guān)時(shí)，隨機(jī)解釋變量x與工具變量w必然低度相關(guān)，如果樣本容量不夠大，要慎重應(yīng)用工具變量法估計(jì)值分析問(wèn)題.

另一方面，當(dāng)隨機(jī)解釋變量x與工具變量w高度相關(guān)時(shí)，由理想工具變量存在性易見，一定很小，從而由（5）式和（6）式知工具變量法估計(jì)值優(yōu)于最小二乘法估計(jì)值的概率不一定很小.如果樣本容量不夠大，也要慎重應(yīng)用工具變量法估計(jì)值分析問(wèn)題.

下面嚴(yán)格證明理想工具變量存在性，并通過(guò)數(shù)值模擬對(duì)工具變量法估計(jì)值與最小二乘法估計(jì)值的精度作一直觀比較.為證明（2）式的存在性，先討論兩個(gè)隨機(jī)變量線性相關(guān)與一元線性回歸之間的關(guān)系.

1 線性相關(guān)與線性回歸的一點(diǎn)關(guān)系

為下文引用方便，重述文[2]給出的結(jié)果.

定理1 當(dāng)變量 x ,y都是隨機(jī)變量，且二者線性相關(guān)系數(shù) r ( x ,y)≠0時(shí)，必存在唯一一組常數(shù)

以及隨機(jī)變量 xbbyu10--= ，使

證明見文[2].

定理2 設(shè)被解釋變量y與隨機(jī)解釋變量x及隨機(jī)干擾項(xiàng)u之間有如下總體規(guī)律：

其中 x ,u線性無(wú)關(guān)，V ar(x) = σx2≠0 ,E (u) = 0 ,Var(u ) = σu2,b1≠0，則其中常數(shù) b0,b1及隨機(jī)變量u是唯一的，且 y ,x線性相關(guān)， y ,u線性相關(guān)，相關(guān)系數(shù)為

且有 [r (y,x) ]2+ [ r(y,u)]2=1.

證明：若存在常數(shù) c0,c1及零均值隨機(jī)變量v，使 y = c0+c1x+v，且x與v線性無(wú)關(guān)，則與（1）式相減得

求x與（10）式兩端的協(xié)方差得 (b1-c1)2σx2=0，由Var(x) = σx2≠0知c1=b1.于是（10）式成為 b0- c0+ u - v = 0 ，兩邊取數(shù)學(xué)期望，由 E ( u )= 0 =E(v)得 b0= c0，進(jìn)而得 u = v .這就證明了 y = b0+b1x+u中常數(shù) b0,b1及隨機(jī)變量u是唯一的.且有

定理2表明，在解釋變量是隨機(jī)變量的一元線性回歸問(wèn)題中，在隨機(jī)干擾項(xiàng)均值為0，解釋變量方差大于0且與隨機(jī)干擾項(xiàng)線性無(wú)關(guān)的條件下，總體規(guī)律的表達(dá)式是唯一的，且 yx,必線性相關(guān).

定理1表明，線性相關(guān)的隨機(jī)變量 yx,之間一定有形如（8）式的唯一線性表示；定理2表明隨機(jī)被解釋變量y與隨機(jī)解釋變量x滿足關(guān)系式（8）且隨機(jī)解釋變量x與隨機(jī)干擾項(xiàng)線性無(wú)關(guān)時(shí)， yx,之間的關(guān)系式（8）是唯一的，且隨機(jī)變量 yx,之間一定線性相關(guān)，相關(guān)系數(shù)由（9）式給出.這就是線性回歸分析與線性相關(guān)分析的一點(diǎn)聯(lián)系.

2 隨機(jī)解釋變量問(wèn)題的理想工具變量

考慮只有一個(gè)隨機(jī)解釋變量的問(wèn)題（1）：

式中，10,bb 為常數(shù)，u為0均值隨機(jī)干擾項(xiàng)，x與u同期線性相關(guān)（ix與iu線性相關(guān)）.理想的工具變量z是與u線性無(wú)關(guān)，與x的線性相關(guān)系數(shù)達(dá)到最大的隨機(jī)變量.

由于x與u線性相關(guān)，故由定理1及u為0均值知，存在

使

下面推導(dǎo)理想的工具變量z與x的線性相關(guān)系數(shù)的上界.由于z與x線性相關(guān)，根據(jù)定理 1可設(shè)

我們的目標(biāo)是在滿足 r ( z ,u)=0的條件下，尋找合適的 a0, a1,w，使 r ( z ,x)達(dá)到最大.由

與（11）式知， r ( z ,u)=0的條件等價(jià)于（13）式分子為0，即

亦即w與u是線性相關(guān)的，且相關(guān)系數(shù)由（14）式給出.于是由定理1及 wu, 為0均值知，存在

其中隨機(jī)變量t滿足 E (t ) = 0 ,r(u,t)=0.代入（11）式得工具變量z應(yīng)滿足

并且其中 wx,應(yīng)滿足

從而 tv,應(yīng)滿足

即 tv,必須線性相關(guān)且相關(guān)系數(shù)如（17）式.從而存在與v線性無(wú)關(guān)的隨機(jī)變量s，使

由（11）式、（16）式和（18）式得

其中 d0,d1∈ R ,d1≠0.由工具變量與隨機(jī)干擾項(xiàng)不相關(guān)的基本要求 r ( z ,u)=0以及（12）式r( u ,v)=0知，工具變量z的表達(dá)式（19）中s還應(yīng)滿足

至此，我們得到工具變量z必須滿足的條件為（19）式和（20）式.這樣的工具變量z與x的線性相關(guān)系數(shù)的絕對(duì)值

其中σs=0，即工具變量z以概率1等于（19）式中d0+d1v時(shí)，|r(z,x)|取到最大值σvσx，我們稱這樣的工具變量z為x的理想工具變量.特別，當(dāng) d0= 0 , d1=1時(shí)， z = v 即x中分解出的與u不相關(guān)的v就是x的一個(gè)理想工具變量.

在實(shí)際問(wèn)題中，隨機(jī)誤差項(xiàng)u是觀測(cè)不到的，因此x的理想分解式（11）就得不到，所以我們稱 d0+ d1v為x的理想工具變量.雖然理想工具變量在現(xiàn)實(shí)中難以得到，但我們可以用它分析工具變量法估計(jì)量的估計(jì)效果.上面的討論可總結(jié)成如下定理.

定理3 對(duì)只有一個(gè)隨機(jī)解釋變量的問(wèn)題：

式中， b0,b1為常數(shù)，u為0均值隨機(jī)誤差項(xiàng).對(duì)簡(jiǎn)單隨機(jī)樣本 { (yi,xi)｜i=1,2,…,n}，隨機(jī)解釋變量 xi與 ui同期線性相關(guān).則存在 c0= μx, c1= r (x,u)σxσu,v = x - c0- c1u ，使

即x的任一工具變量z與x的線性相關(guān)系數(shù)的平方小于或等于1減去隨機(jī)解釋變量x與隨機(jī)誤差項(xiàng)的相關(guān)系數(shù)的平方.

（23）式表明，當(dāng)隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)高度相關(guān)時(shí)，只存在與隨機(jī)解釋變量中低度相關(guān)的工具變量，不存在與隨機(jī)解釋變量高度相關(guān)的工具變量.例如任一工具變量z與x的線性相關(guān)系數(shù)的絕對(duì)值 r(x,z)|≤0 .1；一工具變量z與x的線性相關(guān)系數(shù)的絕對(duì)值 | r (x,z )|≤0.3；當(dāng) r (x ,u)=0.8時(shí)，任一工具變量z與x的線性相關(guān)系數(shù)的絕對(duì)值 | r (x,z)|≤0.6.另一方面，存在與隨機(jī)解釋變量高度相關(guān)的工具變量時(shí)，隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)必然是中低度相關(guān)的.例如文[1] P151例題中，隨機(jī)解釋變量與工具變量的樣本相關(guān)系數(shù)高達(dá)0.994 295，則隨機(jī)解釋變量與工具變量的相關(guān)系數(shù)大于0.953 9的概率較大，進(jìn)而隨機(jī)解釋變量與理想工具變量的相關(guān)系數(shù)大于0.953 9的概率更大，故由（23）式可知，隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)的相關(guān)系數(shù)絕對(duì)值小于0.3的概率較大.

由隨機(jī)解釋變量與工具變量的相關(guān)性可以推斷隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)相關(guān)程度的范圍.

3 工具變量法估計(jì)量與最小二乘估計(jì)量的誤差的數(shù)值模擬分析

在實(shí)際問(wèn)題中，我們通過(guò)定性分析可以確定隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)線性相關(guān)，但相關(guān)程度有多大并不清楚.雖然可以把隨機(jī)解釋變量與工具變量的樣本相關(guān)系數(shù)作為總體相關(guān)系數(shù)的估計(jì)，進(jìn)而由（23）式估計(jì)隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)線性相關(guān)系數(shù)的絕對(duì)值的上限，但我們?nèi)匀粵]辦法估計(jì)下限.由（5）式（6）式可見，中小樣本并且隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)低度線性相關(guān)的情況下，工具變量法估計(jì)值的誤差很可能大于最小二乘估計(jì)值的誤差.下面用數(shù)值模擬方法給出三個(gè)直觀的示例來(lái)驗(yàn)證這一推斷.

例1 為模擬隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)高度相關(guān)的情況，問(wèn)題（1）中 b0,b1為常數(shù)，取為b0= 2 , b1=1；隨機(jī)解釋變量x取為服從3 + 4 × N ( 0,1)的一組容量為n的樣本，記為 x1.u為0均值隨機(jī)干擾項(xiàng)，與x線性相關(guān)，取為

其中 v1～ N ( 0,0.12)由程序隨機(jī)函數(shù)生成一組容量為n的樣本，由程序生成的隨機(jī)數(shù)具有良好的獨(dú)立性，于是可以認(rèn)為能滿足 v1與 x1不相關(guān)的要求（或進(jìn)一步檢驗(yàn)獨(dú)立性，符合要求就用）.則，11,xu高度線性相關(guān)；理想工具變量 v1與 x1的相關(guān)系數(shù)r(x1, v1)= 1 65 ≈ 0 .1 2403473，由定理1有

即在x取定一組觀察值的條件下，理想工具變量v觀察值完全由隨機(jī)干擾項(xiàng)u的觀察值所確定，最后再由

生成y的觀察值.然后依次用最小二乘法、工具變量法估計(jì)參數(shù)，循環(huán)1 000次，統(tǒng)計(jì)估計(jì)值的均值、與設(shè)定參數(shù)值相比的均方根誤差，以及工具變量法估計(jì)值更接近真值的比例，列于表1 - 3的第1 - 2行.

例2 為模擬隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)中度相關(guān)的情況，取

u取為 u2=-0 .6 + 0 .2x2+ v2，其中v2～ N ( 0,32)由程序隨機(jī)函數(shù)生成，則 x2～ N ( 3,102)，想工具變量，為使模擬更符合實(shí)際，取工具變量2w與隨機(jī)解釋變量的相關(guān)系數(shù)為 0.6，可設(shè)為

由程序隨機(jī)函數(shù)生成t，則它與程序隨機(jī)函數(shù)生成的 v2、 x2都線性無(wú)關(guān)，這也就滿足了z與x2線性無(wú)關(guān)的要求.為滿足 w2與 x2相關(guān)系數(shù)為0.6的要求，可通過(guò)適當(dāng)選取（27）式中的 d1和t的方差實(shí)現(xiàn)：

然后依次用最小二乘法、工具變量法估計(jì)參數(shù)，循環(huán)1 000次，統(tǒng)計(jì)估計(jì)值的均值，與設(shè)定參數(shù)值相比的均方根誤差，以及工具變量法估計(jì)值更接近真值的比例，列于表1 - 3的第3 - 5行.

例3 為模擬隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)低度相關(guān)的情況，取

其中u,v2線性無(wú)關(guān)，則低度線性相關(guān).理想工具變量 v3與 x3的相關(guān)系數(shù)假定實(shí)際上取得與 x3中度線性相關(guān)的工具變量

然后依次用最小二乘法、工具變量法估計(jì)參數(shù)，循環(huán)1 000次，統(tǒng)計(jì)估計(jì)值的均值、與設(shè)定參數(shù)值相比的均方根誤差，以及工具變量法估計(jì)值更接近真值的比例，列于表1 - 3的第6 - 10行.

表1 - 3依次列出了樣本容量為10、30、100，對(duì)參數(shù) b1=1進(jìn)行1 000次模擬估計(jì)的結(jié)果：

表2 樣本容量為30的1 000次模擬估計(jì)結(jié)果

表1 - 3中各行、列的意義如下：

x1ols行表示用最小二乘法和數(shù)據(jù) x1, y1估計(jì)參數(shù) b1=1的估計(jì)結(jié)果；

x1ivv行表示用工具變量法、理想工具變量和數(shù)據(jù) x1, y1的估計(jì)結(jié)果；

x2ols行表示用最小二乘法和數(shù)據(jù) x2,y2的估計(jì)結(jié)果；

x2ivv行表示用工具變量法、理想工具變量和數(shù)據(jù) x2,y2的估計(jì)結(jié)果；

表3 樣本容量為100的1 000次模擬估計(jì)結(jié)果

x2ivw2行表示用工具變量法、由（27）式生成的與解釋變量的相關(guān)系數(shù)為0.6的工具變量 w2和數(shù)據(jù) x2, y2的估計(jì)結(jié)果；

x3ols行表示用最小二乘法和數(shù)據(jù) x3, y3的估計(jì)結(jié)果；

x3ivv行表示用工具變量法、理想工具變量和數(shù)據(jù) x3, y3的估計(jì)結(jié)果；

x3ivw3行表示用工具變量法、由（30）式生成的與解釋變量的相關(guān)系數(shù)為0.48的工具變量和數(shù)據(jù) x3, y3的估計(jì)結(jié)果；

x3ivw4行表示用工具變量法、由（31）式生成的與解釋變量的相關(guān)系數(shù)為0.30的工具變量和數(shù)據(jù) x3, y3的估計(jì)結(jié)果；

x3ivw5行表示用工具變量法、由（32）式生成的與解釋變量的相關(guān)系數(shù)為0.91的工具變量和數(shù)據(jù) x3, y3的估計(jì)結(jié)果；

均值列表示用不同估計(jì)方法和數(shù)據(jù)估計(jì)參數(shù) b1=1的估計(jì)值的平均值；

均方誤差列表示用不同估計(jì)方法和數(shù)據(jù)估計(jì)參數(shù) b1=1的估計(jì)值的均方誤差；

較好頻率列的x1ivv行表示用工具變量法、理想工具變量和數(shù)據(jù) x1, y1估計(jì)參數(shù) b1=1的估計(jì)值好于用最小二乘法和數(shù)據(jù) x1, y1估計(jì)參數(shù) b1=1的估計(jì)值的頻率，其他行也是與最小二乘法比較的結(jié)果；

非弱iv頻數(shù)這一列是1 000次模擬中工具變量不是弱工具變量[3]的次數(shù)；

非弱iv較好頻率這一列是當(dāng)工具變量不是弱工具變量時(shí)，工具變量法好于最小二乘法的頻率.

模擬結(jié)果分析顯示：

對(duì)表1 - 3中的x1ols行比較可見OLS估計(jì)對(duì)樣本容量不太敏感，對(duì)表1 - 3中的x2ols、x3ols行比較可見同樣現(xiàn)象.

對(duì)表1 - 3中的x1ivv行比較可見，當(dāng)隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)高度相關(guān)時(shí)，IV估計(jì)隨樣本容量增大改進(jìn)不明顯.

對(duì)表1 - 3中的x2ivv、x3ivv兩行比較可見，當(dāng)隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)中、低度相關(guān)時(shí)，用理想工具變量估計(jì)的平均值很接近參數(shù) b1的設(shè)定值，且隨樣本容量增大均方誤差明顯減小，體現(xiàn)了工具變量估計(jì)的一致性.

對(duì)同一表格的x1ivv、x2ivv、x3ivv行比較可見，當(dāng)隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)高度相關(guān)時(shí)，理想IV估計(jì)較差，當(dāng)隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)中、低度相關(guān)時(shí)，理想IV估計(jì)較好.

對(duì)同一表格的x2ivw2、x3ivw3兩行與x2ols、x3ols兩行比較可見，當(dāng)隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)中、低度相關(guān)時(shí)，用與隨機(jī)解釋變量中度相關(guān)的工具變量估計(jì)的均值與OLS估計(jì)均值相近，但對(duì)不同表格比較可見，隨著樣本容量增大，IV估計(jì)值好于OLS估計(jì)值的頻率，由明顯低于0.5增大到0.5左右，均方誤差明顯減小.

由3個(gè)表的x3ivw4行可見，當(dāng)隨機(jī)解釋變量與隨機(jī)干擾項(xiàng)低度相關(guān)時(shí)，如果選用的工具變量與隨機(jī)解釋變量也低度相關(guān)，則在樣本容量小的情況下，工具變量估計(jì)值沒有參考價(jià)值；在樣本容量較大（模擬實(shí)驗(yàn)中為100）的情況下，工具變量估計(jì)值與OLS估計(jì)值相近，IV估計(jì)值的均方誤差也較小，但1 000次模擬中優(yōu)于OLS估計(jì)值的次數(shù)仍小于一半.

綜上可見，模擬結(jié)果顯示，當(dāng)樣本容量不超過(guò)100時(shí)，如果選用的工具變量與隨機(jī)解釋變量中、低度相關(guān)，則工具變量法估計(jì)值比OLS估計(jì)值更接近設(shè)定值的頻率在0.3至0.7之間.這就提醒我們，要注意檢驗(yàn)所選工具變量與隨機(jī)解釋變量是否高度相關(guān)！