工具变量
效應評估模型
\[Y_{i}={Y}_{-p,i}+\beta_i P_{i}\]
\[ Y_i=Y_{-P,i}+\beta^* P_i \]
\[ \begin{equation} Y_i=\beta_0+\beta_1P_i+w_i'\gamma+\varepsilon \tag{3.2} \end{equation} \]
在$w_{i}$條件下,「香煙售價」$P_{i}$必需要與「非價格效應的香煙銷售量」$Y_{-P}$獨立,即:\(P_i\perp Y_{-p,i} | w_i\) 另一個同義說法是:「香煙售價」$P_{i}$必需要與「控制$w_{i}$條件後的非價格效應香煙銷售量」獨立。
对$Y_{-P}$进行$rincome$下分解 \( \begin{equation} Y_{i}=Y_{-P,i}-\mathbb{E}(Y_{-P,i}|rincome_{i})+\beta^{*}P_{i}+\mathbb{E}(Y_{-P,i}|rincome_{i}) \tag{3.3} \end{equation} \)
把資料依$w_{i}$條件變數不同, 分群觀察「香煙售價」$P_{i}$與「香煙銷售量」$Y_{i}$之間的斜率。如果$w_{i}$變數選得好,同一群資料$P_{i}$與$Y_{i}$間的關連會反映應有的效應斜率——雖然有時$Y_{i}$會因為$Y_{-P,i}$的干擾影響我們對斜率高低的觀察,但因為$Y_{-P,i}$不會與$P_{i}$有關了,這些觀察干擾在大樣本下會互相抵消掉而還原應有的效應斜率值。
如果不管我們怎麼選擇$w_{i}$還是無法控制住$Y_{-P,i}$對與關連$Y_{i}$的干擾,那我們就要進行【資料轉換】直接從原始資料中【去除這些干擾】,其中最常見的兩種去除法為:工具變數法、追蹤資料固定效果模型。
- 工具變數法:透過工具變數留下$P_{i}$不與$Y_{-P,i}$相關的部份。
- 追蹤資料:透過變數轉換去除$P_{i}$中與$Y_{-P,i}$相關的部份。
\[ Y_i=Y_{-p,i}+\beta\mathbb{E}(P_i|z_i)+\beta (P_i-\mathbb{E}(P_i|z_i)) \]
Relevance condition
$\mathbb{E}(P|z)\neq 常数$即$z$对$P$具有解释力
Exclusion condition
\(Y_{-p,i}+\beta(P_i-\mathbb{E}(P_i|z_i))\)与\(z_{i}\)无关
三个假设
\[ \begin{equation} Y_i=\beta_0+\beta_1 P_i + \gamma_1 rincome_i + \epsilon_i \tag{3.5} \end{equation} \]
- Q1: 我的工具變數有滿足排除條件(或外生條件)嗎?
香煙稅是否與控制條件下的「非售價因素銷售」無關?
\[ Y =\underset{(\times k)}{X}\beta+\underset{(\times p)}{W}\gamma +\epsilon \]
其中$X$為要進行效應評估的變數群,$W$為控制變數群,故$ϵ$為「$W$控制條件下排除$X$效果的Y值」。另外,我們額外找了工具變數: $\underset{\times m)}{Z}$, 要驗證:
$H_{0}$: 工具變數$Z$與迴歸模型誤差項$ϵ$無關
- 進行TSLS,取得 \( \hat{\epsilon}_{_{TSLS}}=Y-\hat{Y}_{TSLS} \).
- 將 \( \hat{\epsilon}_{_{TSLS}} \) 迴歸在總工具變數群(即$Z$與$W$)並進行所有係數為0的聯立檢定,計算檢定量 $J=mF\sim\chi^{2}(m-k)$,其中F係數聯立檢定的F檢定值。
此檢定的自由度為$m−k$,所以$m$要大於$k$。“等於”時是無法進行檢定的。
- Q2: 我的工具變數關聯性夠強嗎?
香煙稅真的與「售價」很有關連嗎?
工具變數$Z$必需要與效應解釋變數$X$有「足夠強」的關聯,否則\(\hat{\beta}_{_{TSLS}}\)的大樣本漸近分配不會是常態分配。
考慮TSLS中的第一階段迴歸模型:$X=Z\alpha_z+W\alpha_w+u$我們希望$\alpha_z$聯立夠顯著。
檢定原則
$H_0$:$Z$ 工具變數只有微弱關聯性。
- $X$迴歸在「總」工具變數群($Z$,$W$),進行$\alpha_z=0$的聯立F檢定。
- $F>10$拒絕$H_0$。
- Q3: 我對遺漏變數偏誤(OVB)的擔心是否多餘?
或許根本沒有必要用工具變數,在(3.5)迴歸模型下,PP早已和ϵϵ(即「控制條件下的非售價因素銷售」)無關——直接對(3.5)進行最小平方法估計即可。 \( \begin{equation} Y =X\beta+W\gamma +\epsilon \tag{3.6} \end{equation} \) $H_0 $: 迴歸模型(3.6)中的$\beta$係數估計「沒有」面臨OVB: 用OLS或TSLS都可以: 在大樣本下,\(\\hat{\beta}_{OLS}\approx\hat{\beta}_{TSLS}\)。
$H_1 $: 迴歸模型(3.6)中的$\beta$係數估計「有」面臨OVB: 只能用TSLS :在大樣本下,\(\\hat{\beta}_{OLS}\neq \hat{\beta}_{TSLS}\)。
Hausman檢定統計量: \( H\equiv\left(\hat{\beta}_{IV}-\hat{\beta}_{OLS}\right)^{'}\left[V(\hat{\beta}_{IV}-\hat{\beta}_{OLS})\right]^{-1}\left(\hat{\beta}_{IV}-\hat{\beta}_{OLS}\right)\sim\chi_{(df)}^{2}. \) – df: $\beta$係數個數.
- 當$H>\chi_{(df)}^{2}(\alpha)$才拒絕$H_0$。