工具变量

Last updated on Sep 25, 2019 4 min read R

效應評估模型

\[Y_{i}={Y}_{-p,i}+\beta_i P_{i}\]

\[ Y_i=Y_{-P,i}+\beta^* P_i \]

\[ \begin{equation} Y_i=\beta_0+\beta_1P_i+w_i'\gamma+\varepsilon \tag{3.2} \end{equation} \]

在$w_{i}$條件下，「香煙售價」$P_{i}$必需要與「非價格效應的香煙銷售量」$Y_{-P}$獨立，即：$P_i\perp Y_{-p,i} | w_i$ 另一個同義說法是：「香煙售價」$P_{i}$必需要與「控制$w_{i}$條件後的非價格效應香煙銷售量」獨立。

对$Y_{-P}$进行$rincome$下分解 $ \begin{equation} Y_{i}=Y_{-P,i}-\mathbb{E}(Y_{-P,i}|rincome_{i})+\beta^{*}P_{i}+\mathbb{E}(Y_{-P,i}|rincome_{i}) \tag{3.3} \end{equation} $

把資料依$w_{i}$條件變數不同, 分群觀察「香煙售價」$P_{i}$與「香煙銷售量」$Y_{i}$之間的斜率。如果$w_{i}$變數選得好，同一群資料$P_{i}$與$Y_{i}$間的關連會反映應有的效應斜率——雖然有時$Y_{i}$會因為$Y_{-P,i}$的干擾影響我們對斜率高低的觀察，但因為$Y_{-P,i}$不會與$P_{i}$有關了，這些觀察干擾在大樣本下會互相抵消掉而還原應有的效應斜率值。

如果不管我們怎麼選擇$w_{i}$還是無法控制住$Y_{-P,i}$對與關連$Y_{i}$的干擾，那我們就要進行【資料轉換】直接從原始資料中【去除這些干擾】，其中最常見的兩種去除法為：工具變數法、追蹤資料固定效果模型。

工具變數法：透過工具變數留下$P_{i}$不與$Y_{-P,i}$相關的部份。
追蹤資料：透過變數轉換去除$P_{i}$中與$Y_{-P,i}$相關的部份。

\[ Y_i=Y_{-p,i}+\beta\mathbb{E}(P_i|z_i)+\beta (P_i-\mathbb{E}(P_i|z_i)) \]

Relevance condition

$\mathbb{E}(P|z)\neq 常数$即$z$对$P$具有解释力

Exclusion condition

$Y_{-p,i}+\beta(P_i-\mathbb{E}(P_i|z_i))$与$z_{i}$无关

三个假设

\[ \begin{equation} Y_i=\beta_0+\beta_1 P_i + \gamma_1 rincome_i + \epsilon_i \tag{3.5} \end{equation} \]

Q1: 我的工具變數有滿足排除條件（或外生條件）嗎?

香煙稅是否與控制條件下的「非售價因素銷售」無關？

\[ Y =\underset{(\times k)}{X}\beta+\underset{(\times p)}{W}\gamma +\epsilon \]

其中$X$為要進行效應評估的變數群，$W$為控制變數群，故$ϵ$為「$W$控制條件下排除$X$效果的Y值」。另外，我們額外找了工具變數: $\underset{\times m)}{Z}$, 要驗證：

$H_{0}$: 工具變數$Z$與迴歸模型誤差項$ϵ$無關

進行TSLS，取得 $ \hat{\epsilon}_{_{TSLS}}=Y-\hat{Y}_{TSLS} $.
將 $ \hat{\epsilon}_{_{TSLS}} $ 迴歸在總工具變數群（即$Z$與$W$）並進行所有係數為0的聯立檢定，計算檢定量 $J=mF\sim\chi^{2}(m-k)$，其中F係數聯立檢定的F檢定值。

此檢定的自由度為$m−k$，所以$m$要大於$k$。“等於”時是無法進行檢定的。

Q2: 我的工具變數關聯性夠強嗎？

香煙稅真的與「售價」很有關連嗎？

工具變數$Z$必需要與效應解釋變數$X$有「足夠強」的關聯，否則$\hat{\beta}_{_{TSLS}}$的大樣本漸近分配不會是常態分配。

考慮TSLS中的第一階段迴歸模型：$X=Z\alpha_z+W\alpha_w+u$我們希望$\alpha_z$聯立夠顯著。

檢定原則

$H_0$:$Z$ 工具變數只有微弱關聯性。

$X$迴歸在「總」工具變數群($Z$,$W$)，進行$\alpha_z=0$的聯立F檢定。
$F>10$拒絕$H_0$。

Q3: 我對遺漏變數偏誤(OVB)的擔心是否多餘？

或許根本沒有必要用工具變數，在(3.5)迴歸模型下，PP早已和ϵϵ（即「控制條件下的非售價因素銷售」）無關——直接對(3.5)進行最小平方法估計即可。 $ \begin{equation} Y =X\beta+W\gamma +\epsilon \tag{3.6} \end{equation} $ $H_0 $: 迴歸模型(3.6)中的$\beta$係數估計「沒有」面臨OVB: 用OLS或TSLS都可以: 在大樣本下，$\\hat{\beta}_{OLS}\approx\hat{\beta}_{TSLS}$。

$H_1 $: 迴歸模型(3.6)中的$\beta$係數估計「有」面臨OVB: 只能用TSLS :在大樣本下，$\\hat{\beta}_{OLS}\neq \hat{\beta}_{TSLS}$。

Hausman檢定統計量: $ H\equiv\left(\hat{\beta}_{IV}-\hat{\beta}_{OLS}\right)^{'}\left[V(\hat{\beta}_{IV}-\hat{\beta}_{OLS})\right]^{-1}\left(\hat{\beta}_{IV}-\hat{\beta}_{OLS}\right)\sim\chi_{(df)}^{2}. $ – df： $\beta$係數個數.

當$H>\chi_{(df)}^{2}(\alpha)$才拒絕$H_0$。

econometrics-with-r

Yihong WANG

Wayfaring Stranger