• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      SPSS進(jìn)行面板數(shù)據(jù)分析的基本方法

      2021-12-06 03:25:14李國柱李子寧李從欣
      內(nèi)蒙古統(tǒng)計(jì) 2021年4期
      關(guān)鍵詞:估計(jì)量組內(nèi)對話框

      ○ 文/李國柱 李子寧 李從欣

      文章梳理了面板數(shù)據(jù)尤其是短面板數(shù)據(jù)的估計(jì)方法,提出了用SPSS軟件進(jìn)行了混合回歸、組間估計(jì)、組內(nèi)估計(jì)、一階差分估計(jì)、最小二乘虛擬變量估計(jì)的操作流程,并與STATA軟件的估計(jì)結(jié)果進(jìn)行了對比。結(jié)果證實(shí),用SPSS估計(jì)面板數(shù)據(jù)可以得到與STATA完全相同的結(jié)果,拓展了SPSS軟件的使用范圍。

      SPSS是世界上應(yīng)用最廣泛的統(tǒng)計(jì)軟件之一,其特點(diǎn)是操作簡單、統(tǒng)計(jì)方法比較齊全,在視窗版軟件中得到廣大用戶的認(rèn)可。但SPSS軟件也有一個(gè)大的缺點(diǎn),其包括的統(tǒng)計(jì)方法主要是基于截面數(shù)據(jù)的統(tǒng)計(jì)方法,在時(shí)間序列數(shù)據(jù)方面僅包括自相關(guān)圖、互相關(guān)圖、專家建模器等,沒有單位根檢驗(yàn)、協(xié)整分析、向量自回歸模型等估計(jì)方法,而對于面板數(shù)據(jù)更是絲毫沒有涉及。面板數(shù)據(jù)由于可以解決遺漏變量問題、提供更多動(dòng)態(tài)行為信息以及使樣本容量增大,在實(shí)證研究中得到越來越廣泛的應(yīng)用。那么能否用SPSS進(jìn)行面板數(shù)據(jù)分析呢?雖然不能直接估計(jì),但只要熟知面板數(shù)據(jù)的估計(jì)方法,通過適當(dāng)?shù)牟僮?,SPSS也可以估計(jì)面板數(shù)據(jù)。

      一、SPSS輸入面板數(shù)據(jù)的方法

      SPSS默認(rèn)輸入的是截面數(shù)據(jù),當(dāng)輸入時(shí)間序列數(shù)據(jù)時(shí),必須首先通過“數(shù)據(jù)/定義日期”過程定義時(shí)間變量,然后通過“轉(zhuǎn)換/創(chuàng)建時(shí)間序列”功能創(chuàng)建一個(gè)新的時(shí)間序列。而對于面板數(shù)據(jù),可采用類似STATA軟件的輸入方式,除包括建模的變量外,還需要?jiǎng)?chuàng)建一個(gè)日期變量和截面變量。本文以2010-2017年我國31個(gè)?。ㄗ灾螀^(qū)、直轄市)的數(shù)據(jù)為例,說明面板數(shù)據(jù)的輸入方法以及各種估計(jì)方法。

      SPSS面板數(shù)據(jù)輸入格式

      假定要分析投資對國內(nèi)生產(chǎn)總值的影響,需要在SPSS中新建四個(gè)變量,其中province代表不同的省份(即截面單元),year代表年份(即時(shí)間單元),gdp代表國內(nèi)生產(chǎn)總值,invest代表投資。上圖是與STATA軟件相同的輸入格式。

      當(dāng)然,也可以把上圖中的數(shù)據(jù)格式按變量year進(jìn)行排序,此時(shí)數(shù)據(jù)中前31行為2010年各省份的數(shù)據(jù),32-62行是2011年各省份的數(shù)據(jù),以此類推。面板數(shù)據(jù)的兩種排列方式并不影響分析結(jié)果。

      二、混合回歸模型的參數(shù)估計(jì)

      如果從時(shí)間上看,不同個(gè)體之間不存在顯著差異,從截面上看,不同個(gè)體之間也不存在顯著差異,這種模型與一般回歸模型無本質(zhì)差異,只要滿足經(jīng)典回歸基本假定條件,就可以把所有數(shù)據(jù)放在一起進(jìn)行混合最小二乘估計(jì),估計(jì)量具有線性、無偏和有效性。

      SPSS進(jìn)行混合回歸很簡單,在菜單中依次選擇“分析/回歸/線性回歸”,在彈出的對話框中,因變量選擇gdp,解釋變量選擇invest,其他選擇默認(rèn)設(shè)置,點(diǎn)“確定”按鈕即可得到混合回歸結(jié)果,匯總?cè)绫?所示。

      表1 SPSS與STATA混合回歸結(jié)果

      由表1可以看出,SPSS混合回歸結(jié)果和STATA混合回歸結(jié)果相同,解釋變量invest的系數(shù)均為1.323,t統(tǒng)計(jì)量值均為25.535,p值均為0。

      三、固定效應(yīng)模型的參數(shù)估計(jì)

      面板數(shù)據(jù)模型可表示為:

      其中,yit是被解釋變量,xit是隨個(gè)體和時(shí)間而變化的解釋變量,zi是不隨時(shí)間而變的個(gè)體特征;不可觀測的隨機(jī)變量αi代表個(gè)體異質(zhì)性,隨個(gè)體變化,但不隨時(shí)間變化,即個(gè)體效應(yīng);β是回歸系數(shù),對于不同個(gè)體回歸系數(shù)β是相同的;uit是隨機(jī)誤差項(xiàng)。在以后的實(shí)證分析中,將用具體變量名代替yit和xit。

      若αi與某個(gè)解釋變量相關(guān),則稱為固定效應(yīng)模型;若αi與xit和zi均不相關(guān),則稱為隨機(jī)效應(yīng)模型。因此固定效應(yīng)模型和隨機(jī)效應(yīng)模型在表達(dá)式上是相同的,都是模型(1),只是根據(jù)個(gè)體效應(yīng)與解釋變量是否相關(guān)區(qū)分為固定效應(yīng)模型和隨機(jī)效應(yīng)模型。

      (一)組內(nèi)估計(jì)量

      對于固定效應(yīng)模型,由于αi與某個(gè)解釋變量相關(guān),故OLS不是一致的估計(jì)。解決方法之一是對面板數(shù)據(jù)中每個(gè)個(gè)體的觀測值針對時(shí)間求其平均值,利用離差變換消掉個(gè)體效應(yīng)αi,采用OLS方法估計(jì)模型回歸系數(shù)β。

      給定個(gè)i體,將模型(1)兩邊對時(shí)間求平均可得:

      將模型(1)減模型(2)可得:

      在采用SPSS計(jì)算組內(nèi)估計(jì)量時(shí),共需要三個(gè)步驟。第一步要計(jì)算每個(gè)地區(qū)的均值,在菜單中依次選擇“數(shù)據(jù)/分類匯總”,在彈出的對話框中,將provicne選入“分組變量”復(fù)選框,將gdp和invest選入“匯總變量”復(fù)選框。點(diǎn)擊“確定”按鈕后,SPSS數(shù)據(jù)窗口增加了兩個(gè)均值變量,均值變量名SPSS默認(rèn)為gdp_mean和invest_mean。第二步在菜單中依次選擇“轉(zhuǎn)換/計(jì)算變量”,在彈出的對話框中將目標(biāo)變量定義為gdpstar,數(shù)學(xué)表達(dá)式定義為“gdp-gdp_mean”,點(diǎn)擊“確定”后可得到中心化后的因變量值;按類似的方法可得到invest中心化后的變量investstar。第三步在菜單中依次選擇“分析/回歸/線性回歸”,在彈出的對話框中,因變量選擇gdpstar,解釋變量選擇investstar,其他選擇默認(rèn)設(shè)置,點(diǎn)“確定”按鈕即可得到組內(nèi)估計(jì)量結(jié)果,匯總?cè)绫?所示。

      表2 SPSS與STATA組內(nèi)估計(jì)量

      由表2可知,SPSS計(jì)算的組內(nèi)估計(jì)量中,解釋變量的系數(shù)為0.845,t統(tǒng)計(jì)量值為26.743,p值為0;STATA計(jì)算的組內(nèi)估計(jì)量中,解釋變量的系數(shù)為0.845,t統(tǒng)計(jì)量值為25.06,p值為0;除了t統(tǒng)計(jì)量值稍有差異外,系數(shù)估計(jì)值與p值完全相同。需要注意的是,兩種軟件對常數(shù)項(xiàng)的估計(jì)并不相同,原因在于兩種軟件對常數(shù)項(xiàng)的定義不同。在用SPSS進(jìn)行組內(nèi)估計(jì)時(shí),由于采用按時(shí)間平均然后中心化,個(gè)體效應(yīng)已經(jīng)被消掉了,也就是組內(nèi)回歸沒有常數(shù)項(xiàng),這也是SPSS組內(nèi)估計(jì)結(jié)果常數(shù)項(xiàng)的p值為1的原因。而STATA結(jié)果中的常數(shù)項(xiàng)實(shí)際上是個(gè)體效應(yīng)的均值,即,各個(gè)地區(qū)的個(gè)體效應(yīng)為,根據(jù)離差和恒等于零的性質(zhì),個(gè)體效應(yīng)之和等于零,因此STATA結(jié)果和SPSS結(jié)果并不矛盾。

      (二)一階差分估計(jì)量

      削掉個(gè)體效應(yīng)的另外一種方法是一階差分法。對于模型(1),取其滯后一期的關(guān)系式,得

      將模型(1)減模型(4)可得:

      SPSS只有定義時(shí)間序列變量后才能產(chǎn)生滯后變量和差分變量,而對于面板數(shù)據(jù),SPSS很難直接產(chǎn)生滯后變量和差分變量,可以借助STATA軟件產(chǎn)生差分變量,然后復(fù)制到SPSS軟件中,當(dāng)然也可以采用EXCEL,只不過稍微繁瑣一點(diǎn)。令gdp差分后的變量為dgdp,invest差分后的變量為dinvest。在菜單中依次選擇“分析/回歸/線性回歸”,在彈出的對話框中,因變量選擇dgdp,解釋變量選擇dinvest,然后點(diǎn)擊“選項(xiàng)”按鈕,將“包含常數(shù)項(xiàng)”前面的對鉤去掉,表示模型不包含常數(shù)項(xiàng);其他選擇默認(rèn)設(shè)置,點(diǎn)“確定”按鈕即可得到一階差分估計(jì)量結(jié)果,匯總?cè)绫?所示。

      表3 SPSS與STATA一階差分估計(jì)量

      由表3可以看出,SPSS與STATA一階差分估計(jì)結(jié)果完全相同。應(yīng)當(dāng)注意的是此處STATA軟件估計(jì)采用的是因變量差分對解釋變量差分直接回歸的方法,如果采用xtserial命令,系數(shù)估計(jì)值和SPSS方法完全相同,但由于該命令采用了穩(wěn)健標(biāo)準(zhǔn)誤,計(jì)算出來的t統(tǒng)計(jì)量值會(huì)有所不同。

      (三)最小二乘虛擬變量回歸

      對于固定效應(yīng)模型(1)中的個(gè)體固定效應(yīng)αi,將其視為個(gè)體i的截矩項(xiàng),即個(gè)體i的待估參數(shù)。對于n位個(gè)體的n個(gè)不同的截矩項(xiàng),可以通過在模型 (1)中引入n-1個(gè)虛擬變量來估計(jì)截矩項(xiàng),估計(jì)模型如下:

      常數(shù)項(xiàng)α1表示被遺漏的虛擬變量D1所對應(yīng)個(gè)體1的截矩項(xiàng),而個(gè)體i(i>1)的截矩項(xiàng)是α1+αi。

      對模型(6)采用OLS方法估計(jì),稱為“最小二乘虛擬變量法”。如果模型是正確設(shè)定的,且符合模型全部假定條件。則回歸系數(shù)估計(jì)量是無偏的、有效的、一致的估計(jì)。

      在SPSS主菜單中選擇“轉(zhuǎn)換/創(chuàng)建虛擬變量”,在彈出的“創(chuàng)建虛擬變量”對話框中,在“針對下列變量創(chuàng)建虛擬變量”框下選入變量province,在“主效應(yīng)虛擬變量-根名稱”下輸入“D”,表示虛擬變量,變量名以D開頭,點(diǎn)擊“確定”按鈕后,在SPSS中變量窗口即會(huì)出現(xiàn)31個(gè)虛擬變量。虛擬變量名和數(shù)據(jù)中省份的輸入順序有關(guān),上海對應(yīng)的虛擬變量為D_1,云南對應(yīng)的虛擬變量為D_2,以此類推。在采用虛擬變量回歸時(shí),如果回歸方程包括常數(shù)項(xiàng),為了避免“虛擬變量陷阱”,31個(gè)省份只能加入30個(gè)虛擬變量。STATA默認(rèn)將數(shù)據(jù)集中的第一個(gè)省份(本例為上海)作為比較的基礎(chǔ),因此為了和STATA估計(jì)結(jié)果進(jìn)行比較,在使用SPSS進(jìn)行最小二乘虛擬變量回歸時(shí),不包括虛擬變量D_1。在菜單中依次選擇“分析/回歸/線性回歸”,在彈出的對話框中,因變量選擇gdp,解釋變量依次選擇invest以及D_2-D_31,其他選擇默認(rèn)設(shè)置,點(diǎn)“確定”按鈕即可得到最小二乘虛擬變量回歸結(jié)果(如表4)。

      表4 SPSS與STATA最小二乘虛擬變量回歸

      由表4可以看出,除個(gè)別系數(shù)因計(jì)算精度和四舍五入原因稍有差異外,SPSS最小二乘虛擬變量回歸結(jié)果和STATA結(jié)果完全相同。表中的常數(shù)項(xiàng)18243.87代表上海市的截距,其他省份對應(yīng)的系數(shù)代表與上海的差距,如云南對應(yīng)的系數(shù)-1578.25代表云南比上海低1578.25。由表中p值可知只有浙江和上海沒有顯著性差異,江蘇、廣東、山東顯著高于上海。另外,最小二乘虛擬變量回歸在解釋變量invest的估計(jì)上和組內(nèi)估計(jì)量相同,均為0.845。

      四、隨機(jī)效應(yīng)模型的參數(shù)估計(jì)

      隨機(jī)效應(yīng)模型的參數(shù)估計(jì)方法包括廣義最小二乘法和組間估計(jì)法。雖然廣義最小二乘法最小效,但該方法涉及復(fù)雜的矩陣運(yùn)算和較多參數(shù)估計(jì),使用SPSS比較繁瑣,此處僅介紹組間估計(jì)方法。

      對于模型(1),如果對每個(gè)個(gè)體取時(shí)間平均值,得如下模型:

      對模型(7)使用OLS進(jìn)行參數(shù)估計(jì),得到的估計(jì)量稱為組間估計(jì)量,記為。由于包含了xit的信息,如果αi與解釋變量{xit,zi}相關(guān),則不一致。因此不能在固定效應(yīng)模型下使用組間估計(jì)法。組間估計(jì)法相當(dāng)于面板數(shù)據(jù)被壓縮為截面數(shù)據(jù)。

      在采用組內(nèi)估計(jì)量時(shí),已經(jīng)通過“分類匯總”功能得到各省在gdp和invest兩個(gè)變量上的均值gdp_mean和invest_mean,但我們并不能采用這兩個(gè)變量直接回歸,原因在于每個(gè)省的均值都有8個(gè)相同的值(從2010年至2018年),可以采用等距抽樣的方法使每個(gè)省只有一個(gè)均值。為了避免觀測順序打亂,首先在數(shù)據(jù)集增加一個(gè)編號(hào)變量(ID),打開需要添加ID號(hào)的數(shù)據(jù)集,選擇“文件/新建/語法”,打開彈出的“語法”窗口,并輸入以下語句:

      DATASET ACTIVATE 數(shù)據(jù)集名.

      點(diǎn)執(zhí)行按鈕。返回到原先的數(shù)據(jù)集窗口,則可以看到id號(hào)變量了。點(diǎn)擊“轉(zhuǎn)換/計(jì)算變量”,彈出計(jì)算變量對話框,在“目標(biāo)變量”的空白框中輸入新變量名newid,在“函數(shù)組”選項(xiàng)框中點(diǎn)擊all,在“函數(shù)和特殊變量”選項(xiàng)框中點(diǎn)擊mod,把mod送入“數(shù)字表達(dá)式”空白框中,把mod(?,?)的第一個(gè)問號(hào)改為id-4(由于前8個(gè)數(shù)值相同,用id減去1-8中的任意一個(gè)數(shù)均不會(huì)影響最終結(jié)果),第二個(gè)問號(hào)改為8。點(diǎn)擊“確定”按鈕,數(shù)據(jù)集中newid為0的即是要抽選的樣本單元。

      選擇“數(shù)據(jù)/選擇個(gè)案”,打開選擇個(gè)案對話框,選擇第二項(xiàng)“如果條件滿足”,單擊“如果”按鈕后彈出If對話框,將其中的條件設(shè)置為“newid=0”,即可得到等距抽樣的所有樣本,該樣本即為進(jìn)行組間估計(jì)的樣本。在該樣本范圍內(nèi)依次選擇“分析/回歸/線性回歸”,在彈出的對話框中,因變量選擇gdp_mean,解釋變量選擇invest_mean,其他選擇默認(rèn)設(shè)置,點(diǎn)“確定”按鈕即可得到組間估計(jì)回歸結(jié)果,匯總?cè)绫?所示。

      表5 SPSS與STATA組間估計(jì)量

      從表5可以看出,SPSS與STATA估計(jì)組間估計(jì)量的結(jié)果相同。

      五、結(jié)論與啟示

      從實(shí)證研究結(jié)果來看,在混合回歸、組內(nèi)估計(jì)、組間估計(jì)、一階差分估計(jì)、最小二乘虛擬變量回歸方面,SPSS可以得到與STATA軟件相同的結(jié)果。只不過STATA等軟件有內(nèi)嵌的命令,操作起來很簡單,而SPSS由于沒有內(nèi)嵌選項(xiàng),操作起來相對復(fù)雜而已。實(shí)際上只要理解各種統(tǒng)計(jì)方法的基本原理,以及熟悉SPSS的基本操作,就可以使用SPSS解決大多數(shù)沒有內(nèi)嵌的統(tǒng)計(jì)方法。

      猜你喜歡
      估計(jì)量組內(nèi)對話框
      用心說題 提高效率 培養(yǎng)能力
      正常恢復(fù)虛擬機(jī)
      Bootlace Worms’Secret etc.
      淺談估計(jì)量的優(yōu)良性標(biāo)準(zhǔn)
      合作學(xué)習(xí)組內(nèi)交流討論時(shí)間的遵循原則
      合作學(xué)習(xí)“組內(nèi)交流討論時(shí)間”注意問題
      基于配網(wǎng)先驗(yàn)信息的諧波狀態(tài)估計(jì)量測點(diǎn)最優(yōu)配置
      電測與儀表(2015年6期)2015-04-09 12:00:50
      合作學(xué)習(xí)組內(nèi)交流討論時(shí)間探究
      負(fù)極值指標(biāo)估計(jì)量的漸近性質(zhì)
      使用變異系數(shù)和Kurtosis系數(shù)的雙輔助變量的比估計(jì)
      营山县| 阳江市| 平原县| 青河县| 微山县| 武宣县| 隆子县| 镇江市| 淮南市| 偃师市| 凤山县| 雷州市| 沅陵县| 京山县| 宁远县| 枣阳市| 泗水县| 大田县| 沅江市| 郧西县| 绍兴市| 古交市| 揭西县| 通山县| 隆林| 荔波县| 鄢陵县| 江源县| 祁连县| 广宁县| 呼伦贝尔市| 唐海县| 盐边县| 赣榆县| 龙陵县| 高安市| 太白县| 海伦市| 海口市| 尼勒克县| 绥宁县|