數學筆記

在本附錄中,我將總結一些關於從非實驗數據中以稍微更多的數學形式進行因果推斷的想法。有兩種主要方法:因果圖框架,大多數與Judea Pearl及其同事相關,以及潛在的結果框架,與Donald Rubin及其同事最相關。我將介紹潛在的成果框架,因為它與第3章和第4章末尾的數學筆記中的想法更緊密地聯繫。有關因果圖框架的更多信息,我推薦Pearl, Glymour, and Jewell (2016) (介紹性) )和Pearl (2009) (進階)。對於結合了潛在結果框架和因果圖框架的因果推理的書本長度處理,我推薦Morgan and Winship (2014)

本附錄的目的是幫助您熟悉潛在結果傳統的符號和風格,以便您可以轉換為針對該主題撰寫的一些更為技術性的材料。首先,我將描述潛在的結果框架。然後,我將用它來進一步討論自然實驗,如Angrist (1990)關於兵役對收入的影響。本附錄主要依據Imbens and Rubin (2015)

潛在的成果框架

潛在的結果框架有三個主要因素: 單位治療潛在結果 。為了說明這些元素,讓我們考慮一下Angrist (1990)提出的問題的程式化版本:軍事服務對收益的影響是什麼?在這種情況下,我們可以將單位定義為符合美國1970年草案資格的人,我們可以通過\(i = 1, \ldots, N\)為這些人編制索引。在這種情況下, 治療可以“在軍中服役”或“軍隊沒有投放。”我會打電話給這些治療和控制的條件下,我會寫\(W_i = 1\)如果人\(i\)處於處理狀態並且\(W_i = 0\)如果人\(i\)處於控制狀態。最後, 潛在的結果在概念上有點困難,因為它們涉及“潛在的”結果;可能發生的事情。對於每個有資格參加1970年選秀的人,我們可以想像如果他們在軍隊服役,他們將在1978年獲得的金額,我稱之為\(Y_i(1)\) ,以及他們將獲得的金額。 1978年如果他們沒有在軍隊服役,我會稱之為\(Y_i(0)\) 。在潛在結果框架中, \(Y_i(1)\)\(Y_i(0)\)被認為是固定數量,而\(W_i\)是隨機變量。

單位,治療和結果的選擇至關重要,因為它定義了從研究中可以學習和不能學習的內容。選擇符合1970年草案資格的單位 - 不包括女性,因此如果沒有其他假設,本研究將不會告訴我們任何有關兵役對婦女的影響。關於如何定義治療和結果的決定也很重要。例如,感興趣的治療應該集中在軍隊服役還是經歷戰鬥?利益結果應該是收入還是工作滿意度?最終,單位,治療和結果的選擇應該由研究的科學和政策目標驅動。

考慮到單位,治療和潛在結果的選擇,治療對人的影響因素\(i\)\(\tau_i\) ,是

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]

換句話說,我們比較了多少人\(i\)服務多少人之後也能賺取\(i\)將不服務贏得。對我來說,eq。 2.1是定義因果效應的最明確的方法,雖然非常簡單,但這個框架在很多重要和有趣的方面都可以推廣(Imbens and Rubin 2015)

當使用潛在的結果框架時,我經常發現寫出一個表格顯示所有單位的潛在結果和治療效果是有幫助的(表2.5)。如果您無法為您的研究想像這樣的表格,那麼您可能需要更精確地定義您的單位,治療方法和潛在結果。

表2.5:潛在結果表
處理條件的收益 收益處於控制狀態 治療效果
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
意思 \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

然而,當以這種方式定義因果效應時,我們遇到了一個問題。幾乎在所有情況下,我們都沒有觀察到兩種可能的結果。也就是說,一個特定的人服務或不服務。因此,我們觀察到一個潛在的結果 - \(Y_i(1)\)\(Y_i(0)\) - 但不是兩者。無法觀察到這兩種潛在的結果是Holland (1986)稱之為因果推理基本問題的一個主要問題。

幸運的是,當我們進行研究時,我們不僅僅有一個人;相反,我們有很多人,這提供了一種繞過因果推理的基本問題的方法。我們可以估算所有單位的平均治療效果 ,而不是試圖估計個體水平的治療效果:

\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]

這個等式仍然用\(\tau_i\) ,這是不可觀察的,但有一些代數( Gerber and Green (2012)等式2.8 Gerber and Green (2012) ),我們得到

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]

這表明如果我們可以估計處理下的人口平均結果( \(N^{-1} \sum_{i=1}^N Y_i(1)\) )和人口平均結果得到控制( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ),然後我們可以估計平均治療效果,即使沒有估計任何特定人的治療效果。

現在我已經定義了我們的估計 - 我們試圖估計的事情 - 我將轉向我們如何用數據實際估計它。在這裡,我們直接遇到的問題是,我們只觀察到每個人的潛在結果之一;我們看到\(Y_i(0)\)\(Y_i(1)\) (表2.6)。我們可以通過比較服務人員的收入與未服務人員的收入來估算平均治療效果:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]

其中\(N_t\)\(N_c\)是治療和控制條件下的人數。如果治療分配與潛在結果無關,這種方法將有效,這種情況有時稱為無知性 。不幸的是,在沒有實驗的情況下,通常不會滿足無知性,這意味著在eq中的估計。 2.4不太可能產生良好的估計。考慮它的一種方法是,在沒有隨機分配治療的情況下,eq。 2.4不是喜歡比較;它是比較不同類型人的收入。或表達略有不同,沒有隨機分配治療,治療分配可能與潛在結果有關。

在第四章中,我將描述隨機對照實驗如何幫助研究人員進行因果估計,在這裡我將描述研究人員如何利用自然實驗,如草案抽籤。

表2.6:觀察到的結果表
處理條件的收益 收益處於控制狀態 治療效果
1 \(Y_1(0)\)
2 \(Y_2(1)\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\)
意思

自然實驗

在不進行實驗的情況下進行因果估計的一種方法是尋找世界上發生的隨機為您分配治療的事情。這種方法稱為自然實驗 。在許多情況下,遺憾的是,大自然不會隨意向感興趣的人群提供您想要的治療。但有時,大自然會隨機提供相關治療。特別是,我會考慮一些鼓勵人們接受初級治療的 二級 治療 。例如,該草案可被視為隨機分配的二級治療,鼓勵一些人接受在軍隊服役的初級治療。這種設計有時被稱為鼓勵設計 。我將描述處理這種情況的分析方法有時被稱為工具變量 。在這種情況下,通過一些假設,研究人員可以使用鼓勵來了解主要治療對特定單位子集的影響。

為了處理兩種不同的治療 - 鼓勵和初級治療 - 我們需要一些新的符號。假設某些人被隨機起草( \(Z_i = 1\) )或未起草( \(Z_i = 0\) );在這種情況下, \(Z_i\)有時被稱為樂器

在被起草的人中,有些人服務( \(Z_i = 1, W_i = 1\) ),有些人\(Z_i = 1, W_i = 0\)\(Z_i = 1, W_i = 0\) )。同樣,在未被選中的人中,有些人服務( \(Z_i = 0, W_i = 1\) )而有些人沒有( \(Z_i = 0, W_i = 0\) )。現在可以擴大每個人的潛在結果,以顯示他們在鼓勵和治療方面的狀態。例如,讓\(Y(1, W_i(1))\)成為人的收入\(i\)如果他被起草,其中\(W_i(1)\)是他的服務狀態(如果起草)。此外,我們可以將人口分為四組:編制者,從不採取者,誹謗者和總是採取者(表2.7)。

表2.7:四種類型的人
類型 起草時的服務 服務如果沒有起草
依從者 是的, \(W_i(Z_i=1) = 1\) 不, \(W_i(Z_i=0) = 0\)
永不考生 不, \(W_i(Z_i=1) = 0\) 不, \(W_i(Z_i=0) = 0\)
Defiers 不, \(W_i(Z_i=1) = 0\) 是的, \(W_i(Z_i=0) = 1\)
始終考生 是的, \(W_i(Z_i=1) = 1\) 是的, \(W_i(Z_i=0) = 1\)

在我們討論估計治療效果(即服兵役)之前,我們首先要確定鼓勵的兩種效果(即起草)。首先,我們可以確定鼓勵對初級治療的影響。其次,我們可以定義鼓勵對結果的影響。結果表明,這兩種效應可以結合起來,以估計治療對特定人群的影響。

首先,鼓勵對治療的影響可以定義為人\(i\)

\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]

此外,該數量可以在整個人口中定義為

\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]

最後,我們可以使用數據估算\(\text{ITT} _{W}\)

\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]

其中\(\bar{W}^{\text{obs}}_1\)是被鼓勵者和\(\bar{W}^{\text{obs}}_0\)的觀察治療率對未受鼓勵者的觀察治療率。 \(\text{ITT}_W\)有時也稱為攝取率

接下來,鼓勵對結果的影響可以定義為人\(i\)為:

\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]

此外,該數量可以在整個人口中定義為

\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]

最後,我們可以使用數據估算\(\text{ITT}_{Y}\)

\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]

其中\(\bar{Y}^{\text{obs}}_1\)是被鼓勵(例如,起草)和\(\bar{W}^{\text{obs}}_0\) \(\bar{Y}^{\text{obs}}_1\)的觀察結果(例如,收入) \(\bar{W}^{\text{obs}}_0\)是那些不被鼓勵的觀察結果。

最後,我們將注意力轉向利益的影響:初級治療(例如,兵役)對結果(例如,收入)的影響。不幸的是,事實證明,人們通常無法估計所有單位的這種影響。然而,通過一些假設,研究人員可以估計治療對編制者的影響(即,如果起草將會服務的人以及如果沒有起草將不服務的人,表2.7)。我將此編號稱為編譯器平均因果效應 (CACE)(有時也稱為局部平均治療效果 ,LATE):

\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]

其中\(G_i\)捐贈人群\(i\) (見表2.7)和\(N_{\text{co}}\)是編制者的數量。換句話說,eq。 2.11比較起草的\(Y_i(1, W_i(1))\)者的收入\(Y_i(1, W_i(1))\)而不是草擬\(Y_i(0, W_i(0))\) 。方程式中的estimand 2.11似乎很難從觀察到的數據中估算出來,因為不可能只使用觀察到的數據來識別編制者(要知道某人是否需要觀察他是否需要觀察他是否在起草時服務以及他是否在沒有選中時服務)。

事實證明 - 如果有任何編制者,那麼只要有三個額外的假設,就可以從觀察到的數據中估算出CACE。首先,必須假設治療的分配是隨機的。在選秀抽籤的情況下,這是合理的。然而,在自然實驗不依賴於物理隨機化的一些環境中,這種假設可能更成問題。其次,人們必須假設他們沒有叛逆者(這種假設有時也被稱為單調性假設)。在草案的背景下,似乎有理由假設很少有人如果起草就不會發球,如果沒有起草將會發球。第三,最後,最重要的假設是被稱為排除限制 。在排除限制下,必須假設治療分配的所有效果都通過治療本身。換句話說,人們必須假設鼓勵對結果沒有直接影響。例如,在草案抽籤的情況下,人們需要假設草案狀態對除了通過兵役之外的收入沒有影響(圖2.11)。例如,如果被起草的人在學校停留更多時間以避免服務或雇主不太可能僱用被起草的人,則可能違反排除限制。

圖2.11:排除限制要求鼓勵(選秀抽籤)僅通過治療(兵役)對結果(收入)產生影響。例如,如果被起草的人在學校停留更多時間以避免服務,並且這種增加的學習時間導致更高的收入,則可能違反排除限制。

圖2.11:排除限制要求鼓勵(選秀抽籤)僅通過治療(兵役)對結果(收入)產生影響。例如,如果被起草的人在學校停留更多時間以避免服務,並且這種增加的學習時間導致更高的收入,則可能違反排除限制。

如果滿足這三個條件(隨機分配到治療,沒有誹謗和排除限制),那麼

\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]

所以我們可以估算一下CACE:

\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]

考慮CACE的一種方法是,鼓勵和不鼓勵的人之間的結果差異,被吸收率誇大。

要記住兩個重要的警告。首先,排除限制是一個強有力的假設,需要根據具體情況進行證明,這通常需要主題領域的專業知識。排除限制不能通過鼓勵的隨機化來證明。其次,當鼓勵對治療的吸收幾乎沒有影響(當\(\text{ITT}_W\)很小時),工具變量分析會遇到一個常見的實際挑戰。這被稱為弱工具 ,它會導致各種各樣的問題(Imbens and Rosenbaum 2005; Murray 2006) 。考慮弱文書問題的一種方法是\(\widehat{\text{CACE}}\)可以對\(\widehat{\text{ITT}_Y}\)小偏差敏感 - 可能由於違反排除限制 - 因為這些偏見被一個小的\(\widehat{\text{ITT}_W}\) (見方程2.13)。粗略地說,如果自然分配的治療對您所關心的治療沒有太大影響,那麼您將很難了解您關心的治療方法。

有關此討論的更正式版本,請參閱Imbens and Rubin (2015)第23章和第24章。傳統的工具變量計量經濟學方法通常用估算方程而不是潛在結果來表示。有關其他觀點的介紹,請參閱Angrist and Pischke (2009) ,並對這兩種方法進行比較,請參閱Imbens and Rubin (2015)第24.6節。 Gerber and Green (2012)第6章提供了一種替代的,稍微不那麼正式的工具變量方法。有關排除限制的更多信息,請參閱D. Jones (2015)Aronow and Carnegie (2013)描述了一組可用於估計ATE而非CACE的假設。有關自然實驗如何解釋的更多信息,請參閱Sekhon and Titiunik (2012) 。有關自然實驗的更一般性介紹 - 不僅僅是工具變量方法,還包括回歸不連續等設計 - 請參閱Dunning (2012)