農林漁牧網

您現在的位置是:首頁 > 農業

「SPSS」面板GMM估計

2022-09-26由 資料分析發燒友 發表于 農業

什麼叫依可測變數

1 內生性概述

1。1 什麼是內生性?

對於一個迴歸方程,

內生性就是自變數 x1 與擾動項

存在相關性,存在內生性那麼用OLS就無法得到無偏估計,結論就不可靠。

1。2 為什麼會產生內生性?

1。21 X變數遺漏

如果對研究物件的影響因素考慮不全面,或者對影響因素資訊的不可觀測,這可能導致迴歸模型遺漏了重要的解釋變數。比如要評價一個人的健康狀況,已知變數身高,體重,血壓,肺活量,若遺漏了體重,那麼體重會體現在擾動項 ε 上,我們知道血壓和肺活量跟體重是相關的,也就產生了內生性。

1。22 測量誤差

由於測量誤差導致某變數與真實值偏離,那麼這個變數的偏離就會影響到擾動項的大小,從而產生相關性。比如用心理學問卷來測量一個人的智商水平。

1。23 XY雙向影響

解釋變數與被解釋變數互為因果。比如工資受工作年限影響,反過來工作年限受工資影響。

1。3 為什麼要解決內生性問題?

內生性會破壞引數估計的“一致性”。

一致性:當樣本量很大時,用樣本估計出的引數會無限趨近於總體的真實引數。

簡單理解就是:因為Y同時受到x和擾亂項的影響,若x對誤差項有影響,則x對y的影響說不清了。

2 GMM概述

2。1 概念

GMM 估計和 TSLS 兩階段最小二乘迴歸都用於解決內生性問題的一種方法,如果存在異方差 GMM 的效率會優於 TSLS,但通常情況下二者結論相似,很多時候研究者會認為資料或多或少存在異方差問題,因而可直接使用 GMM 估計。

如果模型為恰好識別(即工具變數個數等於內生變數個數),則 GMM 完全等價於兩階段迴歸 2SLS,故使用 2SLS 就夠了。

在過度識別(工具變數多於內生變數)的情況下,GMM 的優勢在於,它在異方差的情況下比 2SLS 更有效率。由於資料或多或少存在一點異方差,故在過度識別情況下,一般使用 GMM。

2。2 變數介紹

GMM估計中涉及到內生變數、外生變數、工具變數,其中內生變數和外生變數都是解釋變數。

2。21外生變數

可以直接完全對因變數產生影響的解釋變數。比如人們收入(因變數)受工作年限(自變數)影響。

2。22 內生變數

可以直接但不完全對因變數產生影響的解釋變數,這些內生變數是會產生內生性問題。比如人們收入受學習年限影響,但是收入同樣也會對學習年限產生影響,這樣的話,學習年限(內生變數)對收入(因變數)產生的影響是不完全的。

2。23 工具變數

與內生變數 X1 有著強相關,但其與因變數 Y 有著弱相關的那些變數。比如家庭經濟(工具變數)對收入(因變數)無關,但是與學習年限(內生變數)有著強相關的。

總的來看,GMM估計的原理是由於

解釋變數的內生變數不能對因變數直接完全地進行解釋,所以需要引入工具變數來把內生變數中能對因變數的產生影響的那部分過濾出來,從而解決內生性問題。

2。3

GMM估計前提

2。31 內生性檢驗

透過內生性檢驗判斷內生變數是否具有內生性(內生性通常是指X變數遺漏、X->Y時X與Y沒有相關關係、XY雙向影響三類產生),若存在內生變數具有內生性,建議使用 GMM 估計;否則,建議使用最小二乘迴歸。

2。32 過度識別檢驗

當工具變數個數大於內生變數個數時,可以透過過度識別檢驗判斷工具變數是否具有外生性,工具變數的外生性是指要說明Z要透過內生變數X1才能對Y產生影響,不能直接對Y產生影響。若工具變數全都是外生的,說明工具變數是有效的;否則,說明工具變數是無效的。

在通過了以上兩個檢驗後,根據因變數、解釋變數(內生變數+外生變數)、工具變數等建立 GMM 估計模型並得到輸出結果並驗證模型的有效性。

3 案例介紹

想要研究

影響工資收入

的因素,我們根據理論知識,選用能力、受教育年限、是否居住於大城市、在現單位工作年限作為自變數。

但是我們很快面臨了一個問題,就是這個

能力

變數無法獲得,因為一個人的能力我們很難了解,也很難衡量,這就是遺漏變數問題。

解決方法

:我們可以引入代理變數的概念,選擇

智商

作為“能力”的一個代理變數, 智商解釋了能力的一部分,這個是符合常理的,但由於智商不能完全度量能力,依舊是存在內生性問題。所以選用智商作為內生變數,並且由理論基礎可以知道,在校成績、母親受教育水平與智商相關,與收入相關不大,由此選用這兩個因素作為工具變數,建立 GMM 估計。

「SPSS」面板GMM估計

4 軟體操作及結果解讀

4。1 軟體操作

「SPSS」面板GMM估計

工具變數 Z 為定量變數,且個數要大於等於內生變數個數。

外生變數 X2 要求為定量變數,若為定類變數,建議自行對其進行啞變數化後再進行處理。

4。2 結果解讀

1)變數型別

「SPSS」面板GMM估計

內生變數和外生變數都是解釋變數。外生變數指可以直接完全對因變數產生影響的解釋變數;內生變數是指可以直接但不完全對因變數產生影響的解釋變數(通常包括有出現 X 變數遺漏、X 存在測量誤差、XY 雙向影響這三種情況的變數)。

工具變數是為了把內生變數中能對因變數的產生影響的那部分過濾出來。工具變數通常選取與內生變數 X1 有著強相關,但其與因變數 Y 有著弱相關的那些變數。

2)內生性檢驗

「SPSS」面板GMM估計

上表格展示了內生性檢驗結果,顯著性 P 值為 0。022**,水平上呈現顯著性,拒絕原假設,選中的內生變數中具有內生性。

3)過度識別檢驗

「SPSS」面板GMM估計

上圖展示了過度識別檢驗結果,顯著性 P 值為 0。732,水平上不呈現顯著性,不能拒絕原假設,工具變數全為外生。

4)GMM 估計結果

「SPSS」面板GMM估計

上表格展示了 GMM 估計的引數結果及檢驗結果,wald 值為 270。913,其顯著性 P 值為 0。000***,水平上呈現顯著性,拒絕原假設,說明解釋變數中至少有一個變數會對被解釋變數產生顯著影響。

注意:

內生性問題首先是理論模型,需要根據理論研究來發現可能存在的內生性問題,其次才是統計模型,在發現可能存在的內生性問題後用統計模型去驗證。所以內生性問題不是靠統計發現的,是要自己去發掘的。