この付録では、私は因果推論を非実験データから少しだけ数学的な形で作ることに関するいくつかのアイデアを要約します。主要なアプローチには、主にJudea Pearlと同僚と関連した因果グラフの枠組みと、ドナルド・ルビン(Donald Rubin)とその同僚との関連がある可能性のあるアウトカムの枠組みがあります。因果関係の枠組みについては、 Pearl, Glymour, and Jewell (2016)をお勧めします(入門書)とPearl (2009) (上級)。潜在的成果の枠組みと因果関係のグラフの枠組みを組み合わせた因果推論の本の長さの扱いについては、 Morgan and Winship (2014)をお勧めします。
この付録の目的は、潜在的な結果の伝統の表記法やスタイルに慣れ親しみ、このトピックで書かれたより技術的な資料に移行できるようにすることです。まず、潜在的成果の枠組みについて説明します。それから私はそれを使って、 Angrist (1990)ような自然実験を兵役が収益に与える影響についてさらに議論します。この付録は、 Imbens and Rubin (2015)大きく依存しています。
潜在的成果のフレームワーク
潜在的アウトカムの枠組みには、3つの主な要素があります: 単位 、 治療法 、 潜在的アウトカム 。これらの要素を説明するために、 Angrist (1990)質問の様式化されたバージョンを考えてみましょう:兵役が収入に与える影響は何ですか?この例では、米国で1970年草案の対象となる人物をユニットと定義し、これらの人物を\(i = 1, \ldots, N\)索引付けすることができます。この場合の治療法は、私はこれらの治療とコントロール条件と呼ぶことにします「軍で奉仕ない」「軍事的に提供する」またはすることができ、そして私が書こうと思います\(W_i = 1\)人の場合は\(i\)が治療条件にあり、 \(i\)が制御条件にある場合には\(W_i = 0\)である。最後に、 潜在的な成果は、 潜在的な成果を伴うため、概念的に少し難しい。起こった可能性のある事柄。 1970年草案の対象となる人物のそれぞれについて、1978年に軍隊に派遣された場合に得た額を想像することができます。私は\(Y_i(1)\)と呼ぶでしょう。彼らが軍に奉仕していなかったら1978年、私は\(Y_i(0)\)と呼ぶ。潜在的成果フレームワークでは、 \(Y_i(1)\)と\(Y_i(0)\)は固定量とみなされ、 \(W_i\)は確率変数である。
単位、治療法、および結果の選択は、研究から学べるものとできないものとを定義しているため、重要である。 1970年の草案の対象となる人物の選択には女性が含まれていないため、追加の前提はなく、この研究は女性に対する軍事サービスの効果については何も教えてくれません。治療法と結果の定義方法に関する決定も重要です。例えば、軍事に従事したり、戦闘を経験することに関心のある扱いに焦点を当てるべきか?関心の結果は収入か職務満足か?最終的に、単位、治療法、および結果の選択は、研究の科学的および政策的目標によって推進されるべきである。
単位、治療法、および潜在的転帰の選択肢が与えられれば、人\(i\) 、 \(\tau_i\)に対する治療の因果関係は、
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
言い換えれば、我々はどのくらいの人の比較\(i\)どのくらいの人に務めた後、獲得しているだろう\(i\)サービス提供せずに獲得しているだろう。私には、eq。 2.1は因果関係を明確にするための最も明確な方法であり、非常にシンプルですが、このフレームワークは多くの重要かつ興味深い方法で一般化できることが分かりました(Imbens and Rubin 2015) 。
潜在的アウトカムの枠組みを使用する場合、潜在的なアウトカムとすべてのユニットの治療効果を示す表を書くことが役立つことがよくあります(表2.5)。あなたの研究のためにこのような表を想像することができない場合は、あなたのユニット、治療法、および潜在的な結果のより正確な定義が必要になるかもしれません。
人 | 治療条件における収入 | 制御条件における収益 | 治療効果 |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
平均 | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
しかし、このように因果関係を定義すると、問題が発生します。ほとんどの場合、両方の可能性のある結果を観察することはできません。すなわち、特定の人が奉仕したか、または奉仕しなかった。したがって、 \(Y_i(1)\)または\(Y_i(0)\)の可能性のある結果のいずれかを観察します。両方の潜在的成果を観察することができないことは、 Holland (1986) が「因果推論の根源的問題」と呼ぶ大きな問題である。
幸いにも、私たちが研究をしているとき、私たちはただひとりの人間を持つだけではありません。むしろ、私たちには多くの人がいます。これは、因果関係の根本的な問題を回避する方法を提供します。個々のレベルの治療効果を推定するのではなく、すべてのユニットの平均治療効果を推定することができます。
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
この方程式は観測できない\(\tau_i\)形で表現されますが、 Gerber and Green (2012)式2.8の代数を使って、
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
(これは治療下母集団平均結果を推定できる場合ことを示す\(N^{-1} \sum_{i=1}^N Y_i(1)\) )と制御下集団平均結果を( \(N^{-1} \sum_{i=1}^N Y_i(1)\) )、特定の人の治療効果を推定しなくても、平均治療効果を推定することができます。
私が推定しようとしている推定値を定義したので、実際にデータで推定する方法を見てみましょう。そして、ここでは、私たちが各人の潜在的な成果のうちの1つを観察するという問題に直接取り組んでいます。 \(Y_i(0)\)または\(Y_i(1)\) (表2.6)のいずれかが表示されます。平均治療効果は、サービスを提供した人々の収入と、提供しなかった人々の収入を比較することによって推定できます。
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
ここで、 \(N_c\) \(N_t\)と\(N_c\)は治療と管理の条件の人の数です。治療割り当ては、時々 ignorabilityと呼ばれる状態潜在的な結果とは独立している場合、このアプローチはうまく動作します。残念なことに、実験がない場合には、無視可能性はしばしば満足されない。 2.4は良い見積もりを生み出す可能性は低い。それについて考える一つの方法は、治療のランダム割り当てがなければ、式2.4は同じように比較していません。さまざまな種類の人々の収入を比較しています。あるいは、治療の無作為割付けを行わずにわずかに異なるように表現すると、治療の配分はおそらく潜在的な結果に関連している。
第4章では、無作為化された制御実験が研究者の因果推定を助ける方法を説明します。ここでは、研究者が宝くじドラフトなどの自然実験をどのように活用できるかについて説明します。
人 | 治療条件における収入 | 制御条件における収益 | 治療効果 |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
平均 | ? | ? | ? |
自然実験
実験を実行せずに因果推定を行う1つのアプローチは、ランダムに治療を割り当てた世界で起こっていることを探すことです。このアプローチは自然実験と呼ばれています。残念なことに、多くの状況において、自然はあなたが興味のある人口に望む治療法を無作為に提供するわけではありません。しかし、時には、自然がランダムに関連する治療を行います。特に、私は、人々に一次治療を受けることを奨励する二次治療がある場合を考える。例えば、この草案は、一部の人々が軍隊で働いていた一次治療を受けることを奨励したランダムに割り当てられた二次治療と見なすことができた。このデザインは、 奨励デザインと呼ばれることもあります。そして、この状況を扱うために説明する分析方法は、時々、 道具的変数と呼ばれます 。この設定では、いくつかの前提があり、研究者はこの奨励を使用して、特定のサブセットのユニットに対する一次治療の効果を知ることができます。
励ましと一次治療という2つの異なる治療法を扱うためには、いくつかの新しい表記が必要です。いくつかの人々が無作為に起草され( \(Z_i = 1\) )、起草されていない( \(Z_i = 0\) )と仮定しよう。この場合、 \(Z_i\)は時々 計器と呼ばれます 。
起草された者の中には、( \(Z_i = 1, W_i = 1\) )、( \(Z_i = 1, W_i = 0\) )ではないものもあった。同様に、起草されなかった人々の中には、( \(Z_i = 0, W_i = 1\) )、いくつかのもの( \(Z_i = 0, W_i = 0\) )もありました。各人の潜在的な成果を拡大して、励ましと治療の両方の状態を示すことができるようになりました。例えば、 \(Y(1, W_i(1))\)は、起案された場合は人\(i\) \(W_i(1)\)とし、 \(W_i(1)\)は起案された場合のサービス状態とする。さらに、人口を4つのグループに分けることができます:コンパイラー、決して受け入れない人、ディフアー、常設する人(表2.7)。
タイプ | 起草された場合のサービス | 起草されていない場合のサービス |
---|---|---|
コンプライアー | はい、 \(W_i(Z_i=1) = 1\) | いいえ、 \(W_i(Z_i=0) = 0\) |
決して奪う者 | いいえ、 \(W_i(Z_i=1) = 0\) | いいえ、 \(W_i(Z_i=0) = 0\) |
ディファイア | いいえ、 \(W_i(Z_i=1) = 0\) | はい、 \(W_i(Z_i=0) = 1\) |
常に募集している | はい、 \(W_i(Z_i=1) = 1\) | はい、 \(W_i(Z_i=0) = 1\) |
治療(すなわち兵役)の効果を見積もることについて議論する前に、最初に励ましの2つの効果を定義することができます(ドラフトされています)。まず、一次治療に対する励ましの効果を定義することができます。第二に、私たちは結果に対する励ましの効果を定義することができます。これらの2つの効果を組み合わせて、特定のグループの人々に対する治療効果の推定値を提供することができることが分かるであろう。
第一に、治療に対する励ましの効果は、人\(i\)に対して次のように定義することができる。
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
さらに、この量は以下のように母集団全体にわたって定義することができます。
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
最後に、データを使って\(\text{ITT} _{W}\)を推定することができます:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
ここで、 \(\bar{W}^{\text{obs}}_1\)奨励した人々の治療の観察された速度れる\(\bar{W}^{\text{obs}}_0\)であります奨励されていない人々の観察された治療率。 \(\text{ITT}_W\)は時には摂取率とも呼ばれます。
次に、結果に対する奨励の効果は、人\(i\)に対して次のように定義することができます。
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
さらに、この量は以下のように母集団全体にわたって定義することができます。
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
最後に、データを使って\(\text{ITT}_{Y}\)を推定することができます:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
ここで、 \(\bar{Y}^{\text{obs}}_1\)は奨励された(例:ドラフトされた)人物と\(\bar{W}^{\text{obs}}_0\)は、奨励されていない人々の観察結果です。
最後に、私たちは関心の効果、すなわち結果(例えば、収入)に対する一次治療(例えば兵役)の影響を注視する。残念ながら、一般に、この影響をすべてのユニットで推定することはできません。しかし、いくつかの仮定では、研究者は治療者(すなわち、起草された場合に奉仕する人、起草されなければ奉仕しない人、表2.7)に対する治療の効果を推定することができる。私はこの推定値とコンパイラ平均因果関係 (CACE)を呼ぶ(これは局所平均治療効果 LATEと呼ばれることもある)。
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
\(G_i\) \(i\)は人のグループ\(i\) (表2.7参照\(G_i\)寄付し、 \(N_{\text{co}}\)は補数の数です。言い換えれば、式2.11は、ドラフトされた\(Y_i(1, W_i(1))\)あり、ドラフトされていない\(Y_i(0, W_i(0))\)の利益を比較する。式観測されたデータのみを使用して被害者を特定することは不可能であるため、2.11は観測データから推定するのが難しいようである(誰かが納得しているかどうかを知るためには、
多少の驚くべきことには、ある種のコンプライアントが存在する場合、3つの追加の前提が用意されていれば、観察されたデータからCACEを推定することが可能です。まず、治療への割り当てがランダムであると仮定しなければならない。宝くじドラフトの場合、これは合理的です。しかし、自然実験が物理的ランダム化に依存しない設定では、この仮定はより問題になる可能性があります。第二に、彼らはディファイアではないと仮定しなければならない(この仮定は、単調性仮定と呼ばれることもある)。このドラフトの文脈では、起草された場合には奉仕しない人は少なく、起草されなければ奉仕する人はごくわずかであると仮定することは妥当であると思われる。最後に、 排除制限と呼ばれる最も重要な前提があります。除外の制限の下では、治療譲渡のすべての影響が治療自体を通ると仮定しなければならない。言い換えれば、成果への励ましの直接的な効果はないと仮定しなければならない。例えば、草案草案の場合、草案が兵役以外の利益に影響を及ぼさないと仮定する必要がある(図2.11)。例えば、徴収された人々が奉仕を避けるために学校でより多くの時間を過ごした場合、または雇用者が起草された人を雇う可能性が低い場合、除外の制限が破られる可能性があります。
これらの3つの条件(治療への無作為割付け、ディファイアおよび除外制限)が満たされた場合、
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
CACEを見積もることができます:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
CACEについて考えてみる一つの方法は、奨励された人と奨励されていない人の間で、摂取率によって膨らんだのは結果の違いであるということです。
心に留めておくべき2つの重要な警告があります。第一に、排除の制限は強力な前提であり、場合によっては主題分野の専門知識を必要とすることが正当化される必要があります。励ましの無作為化で除外の制限を正当化することはできません。第二に、奨励が治療の摂取にほとんど影響しない場合\(\text{ITT}_W\)が小さい場合)、器械的変数分析に関する共通の実際の課題が生じる。これは弱い計器と呼ばれ、さまざまな問題につながります(Imbens and Rosenbaum 2005; Murray 2006) 。弱い計器の問題を考える方法の1つは、 \(\widehat{\text{CACE}}\)は\(\widehat{\text{ITT}_Y}\)小さなバイアスに敏感であるということです。これらの偏りは小さな\(\widehat{\text{ITT}_W}\)によって拡大されるため、除外制限の違反となる(2.13参照)。おおまかに言えば、自然が割り当てた治療があなたが気にかけている治療に大きな影響を及ぼさなければ、あなたが気にかけている治療について学ぶのは難しいでしょう。
この議論のより正式なバージョンについては、 Imbens and Rubin (2015)第23章と第24章を参照してください。道具的変数に対する伝統的な計量的アプローチは、典型的には潜在的な結果ではなく、方程式の見積もりの観点から表される。この他の観点からの紹介については、 Angrist and Pischke (2009)参照し、2つのアプローチの比較については、 Imbens and Rubin (2015)セクション24.6 Imbens and Rubin (2015)参照してください。道具的変数のアプローチの代わりに、わずかに公式ではない方法が、 Gerber and Green (2012)第6章で提供されている。排除制限の詳細については、 D. Jones (2015)参照してください。 Aronow and Carnegie (2013)は、CACEではなくATEを推定するために使用できる追加の一連の前提を記述している。自然の実験がどのように解釈するのが難しいかについてはSekhon and Titiunik (2012)参照してください。自然実験のより一般的な導入については、単なる道具的変数のアプローチを超えて、回帰不連続性などの設計も含めるDunning (2012)参照してください。