Bit By Bit - 观察行为

这种翻译是由一个计算机创建。 ×

数学笔记

在本附录中，我将总结一些关于从非实验数据中以稍微更多的数学形式进行因果推断的想法。有两种主要方法：因果图框架，大多数与Judea Pearl及其同事相关，以及潜在的结果框架，与Donald Rubin及其同事最相关。我将介绍潜在的成果框架，因为它与第3章和第4章末尾的数学笔记中的想法更紧密地联系。有关因果图框架的更多信息，我推荐Pearl, Glymour, and Jewell (2016) （介绍性））和Pearl (2009) （进阶）。对于结合了潜在结果框架和因果图框架的因果推理的书本长度处理，我推荐Morgan and Winship (2014) 。

本附录的目的是帮助您熟悉潜在结果传统的符号和风格，以便您可以转换为针对该主题撰写的一些更为技术性的材料。首先，我将描述潜在的结果框架。然后，我将用它来进一步讨论自然实验，如Angrist (1990)关于兵役对收入的影响。本附录主要依据Imbens and Rubin (2015) 。

潜在的成果框架

潜在的结果框架有三个主要因素：单位，治疗和潜在结果 。为了说明这些元素，让我们考虑一下Angrist (1990)提出的问题的程式化版本：军事服务对收益的影响是什么？在这种情况下，我们可以将单位定义为符合美国1970年草案资格的人，我们可以通过 $i = 1, \ldots, N$ 为这些人编制索引。在这种情况下，治疗可以“在军中服役”或“军队没有投放。”我会打电话给这些治疗和控制的条件下，我会写 $W_i = 1$ 如果人 $i$ 处于处理状态并且 $W_i = 0$ 如果人 $i$ 处于控制状态。最后， 潜在的结果在概念上有点困难，因为它们涉及“潜在的”结果;可能发生的事情。对于每个有资格参加1970年选秀的人，我们可以想象如果他们在军队服役，他们将在1978年获得的金额，我称之为 $Y_i(1)$ ，以及他们将获得的金额。 1978年如果他们没有在军队服役，我会称之为 $Y_i(0)$ 。在潜在结果框架中， $Y_i(1)$ 和 $Y_i(0)$ 被认为是固定数量，而 $W_i$ 是随机变量。

单位，治疗和结果的选择至关重要，因为它定义了从研究中可以学习和不能学习的内容。选择符合1970年草案资格的单位 - 不包括女性，因此如果没有其他假设，本研究将不会告诉我们任何有关兵役对妇女的影响。关于如何定义治疗和结果的决定也很重要。例如，感兴趣的治疗应该集中在军队服役还是经历战斗？利益结果应该是收入还是工作满意度？最终，单位，治疗和结果的选择应该由研究的科学和政策目标驱动。

考虑到单位，治疗和潜在结果的选择，治疗对人的影响因素 $i$ ， $\tau_i$ ，是

$\tau_i = Y_i(1) - Y_i(0) \qquad(2.1)$

换句话说，我们比较了多少人 $i$ 服务多少人之后也能赚取 $i$ 将不服务赢得。对我来说，eq。 2.1是定义因果效应的最明确的方法，虽然非常简单，但这个框架在很多重要和有趣的方面都可以推广(Imbens and Rubin 2015) 。

当使用潜在的结果框架时，我经常发现写出一个表格显示所有单位的潜在结果和治疗效果是有帮助的（表2.5）。如果您无法为您的研究想象这样的表格，那么您可能需要更精确地定义您的单位，治疗方法和潜在结果。

表2.5：潜在结果表
人	处理条件的收益	收益处于控制状态	治疗效果
1	$Y_1(1)$	$Y_1(0)$	$\tau_1$
2	$Y_2(1)$	$Y_2(0)$	$\tau_2$
$\vdots$	$\vdots$	$\vdots$	$\vdots$
$N$	$Y_N(1)$	$Y_N(0)$	$\tau_N$
意思	$\bar{Y}(1)$	$\bar{Y}(0)$	$\bar{\tau}$

然而，当以这种方式定义因果效应时，我们遇到了一个问题。几乎在所有情况下，我们都没有观察到两种可能的结果。也就是说，一个特定的人服务或不服务。因此，我们观察到一个潜在的结果 - $Y_i(1)$ 或 $Y_i(0)$ - 但不是两者。无法观察到这两种潜在的结果是Holland (1986)称之为因果推理的基本问题的一个主要问题。

幸运的是，当我们进行研究时，我们不仅仅有一个人;相反，我们有很多人，这提供了一种绕过因果推理的基本问题的方法。我们可以估算所有单位的平均治疗效果 ，而不是试图估计个体水平的治疗效果：

$\text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)$

这个等式仍然用 $\tau_i$ ，这是不可观察的，但有一些代数（ Gerber and Green (2012)等式2.8 Gerber and Green (2012) ），我们得到

$\text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)$

这表明如果我们可以估计处理下的人口平均结果（ $N^{-1} \sum_{i=1}^N Y_i(1)$ ）和人口平均结果得到控制（ $N^{-1} \sum_{i=1}^N Y_i(1)$ ），然后我们可以估计平均治疗效果，即使没有估计任何特定人的治疗效果。

现在我已经定义了我们的估计 - 我们试图估计的事情 - 我将转向我们如何用数据实际估计它。在这里，我们直接遇到的问题是，我们只观察到每个人的潜在结果之一;我们看到 $Y_i(0)$ 或 $Y_i(1)$ （表2.6）。我们可以通过比较服务人员的收入与未服务人员的收入来估算平均治疗效果：

$\widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)$

其中 $N_t$ 和 $N_c$ 是治疗和控制条件下的人数。如果治疗分配与潜在结果无关，这种方法将有效，这种情况有时称为无知性 。不幸的是，在没有实验的情况下，通常不会满足无知性，这意味着在eq中的估计。 2.4不太可能产生良好的估计。考虑它的一种方法是，在没有随机分配治疗的情况下，eq。 2.4不是喜欢比较;它是比较不同类型人的收入。或表达略有不同，没有随机分配治疗，治疗分配可能与潜在结果有关。

在第四章中，我将描述随机对照实验如何帮助研究人员进行因果估计，在这里我将描述研究人员如何利用自然实验，如草案抽签。

表2.6：观察到的结果表
人	处理条件的收益	收益处于控制状态	治疗效果
1	？	$Y_1(0)$	？
2	$Y_2(1)$	？	？
$\vdots$	$\vdots$	$\vdots$	$\vdots$
$N$	$Y_N(1)$	？	？
意思	？	？	？

自然实验

在不进行实验的情况下进行因果估计的一种方法是寻找世界上发生的随机为您分配治疗的事情。这种方法称为自然实验 。在许多情况下，遗憾的是，大自然不会随意向感兴趣的人群提供您想要的治疗。但有时，大自然会随机提供相关治疗。特别是，我会考虑一些鼓励人们接受初级治疗的 二级治疗。例如，该草案可被视为随机分配的二级治疗，鼓励一些人接受在军队服役的初级治疗。这种设计有时被称为鼓励设计 。我将描述处理这种情况的分析方法有时被称为工具变量 。在这种情况下，通过一些假设，研究人员可以使用鼓励来了解主要治疗对特定单位子集的影响。

为了处理两种不同的治疗 - 鼓励和初级治疗 - 我们需要一些新的符号。假设某些人被随机起草（ $Z_i = 1$ ）或未起草（ $Z_i = 0$ ）;在这种情况下， $Z_i$ 有时被称为乐器。

在被起草的人中，有些人服务（ $Z_i = 1, W_i = 1$ ），有些人 $Z_i = 1, W_i = 0$ （ $Z_i = 1, W_i = 0$ ）。同样，在未被选中的人中，有些人服务（ $Z_i = 0, W_i = 1$ ）而有些人没有（ $Z_i = 0, W_i = 0$ ）。现在可以扩大每个人的潜在结果，以显示他们在鼓励和治疗方面的状态。例如，让 $Y(1, W_i(1))$ 成为人的收入 $i$ 如果他被起草，其中 $W_i(1)$ 是他的服务状态（如果起草）。此外，我们可以将人口分为四组：编制者，从不采取者，诽谤者和总是采取者（表2.7）。

表2.7：四种类型的人
类型	起草时的服务	服务如果没有起草
依从者	是的， $W_i(Z_i=1) = 1$	不， $W_i(Z_i=0) = 0$
永不考生	不， $W_i(Z_i=1) = 0$	不， $W_i(Z_i=0) = 0$
Defiers	不， $W_i(Z_i=1) = 0$	是的， $W_i(Z_i=0) = 1$
始终考生	是的， $W_i(Z_i=1) = 1$	是的， $W_i(Z_i=0) = 1$

在我们讨论估计治疗效果（即服兵役）之前，我们首先要确定鼓励的两种效果（即起草）。首先，我们可以确定鼓励对初级治疗的影响。其次，我们可以定义鼓励对结果的影响。结果表明，这两种效应可以结合起来，以估计治疗对特定人群的影响。

首先，鼓励对治疗的影响可以定义为人 $i$ 为

$\text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)$

此外，该数量可以在整个人口中定义为

$\text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)$

最后，我们可以使用数据估算 $\text{ITT} _{W}$ ：

$\widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)$

其中 $\bar{W}^{\text{obs}}_1$ 是被鼓励者和 $\bar{W}^{\text{obs}}_0$ 的观察治疗率对未受鼓励者的观察治疗率。 $\text{ITT}_W$ 有时也称为摄取率 。

接下来，鼓励对结果的影响可以定义为人 $i$ 为：

$\text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)$

此外，该数量可以在整个人口中定义为

$\text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)$

最后，我们可以使用数据估算 $\text{ITT}_{Y}$ ：

$\widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)$

其中 $\bar{Y}^{\text{obs}}_1$ 是被鼓励（例如，起草）和 $\bar{W}^{\text{obs}}_0$ $\bar{Y}^{\text{obs}}_1$ 的观察结果（例如，收入） $\bar{W}^{\text{obs}}_0$ 是那些不被鼓励的观察结果。

最后，我们将注意力转向利益的影响：初级治疗（例如，兵役）对结果（例如，收入）的影响。不幸的是，事实证明，人们通常无法估计所有单位的这种影响。然而，通过一些假设，研究人员可以估计治疗对编制者的影响（即，如果起草将会服务的人以及如果没有起草将不服务的人，表2.7）。我将此编号称为编译器平均因果效应 （CACE）（有时也称为局部平均治疗效果 ，LATE）：

$\text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)$

其中 $G_i$ 捐赠人群 $i$ （见表2.7）和 $N_{\text{co}}$ 是编制者的数量。换句话说，eq。 2.11比较起草的 $Y_i(1, W_i(1))$ 者的收入 $Y_i(1, W_i(1))$ 而不是草拟 $Y_i(0, W_i(0))$ 。方程式中的estimand 2.11似乎很难从观察到的数据中估算出来，因为不可能只使用观察到的数据来识别编制者（要知道某人是否需要观察他是否需要观察他是否在起草时服务以及他是否在没有选中时服务）。

事实证明 - 如果有任何编制者，那么只要有三个额外的假设，就可以从观察到的数据中估算出CACE。首先，必须假设治疗的分配是随机的。在选秀抽签的情况下，这是合理的。然而，在自然实验不依赖于物理随机化的一些环境中，这种假设可能更成问题。其次，人们必须假设他们没有叛逆者（这种假设有时也被称为单调性假设）。在草案的背景下，似乎有理由假设很少有人如果起草就不会发球，如果没有起草将会发球。第三，最后，最重要的假设是被称为排除限制 。在排除限制下，必须假设治疗分配的所有效果都通过治疗本身。换句话说，人们必须假设鼓励对结果没有直接影响。例如，在草案抽签的情况下，人们需要假设草案状态对除了通过兵役之外的收入没有影响（图2.11）。例如，如果被起草的人在学校停留更多时间以避免服务或雇主不太可能雇用被起草的人，则可能违反排除限制。

图2.11：排除限制要求鼓励（选秀抽签）仅通过治疗（兵役）对结果（收入）产生影响。例如，如果被起草的人在学校停留更多时间以避免服务，并且这种增加的学习时间导致更高的收入，则可能违反排除限制。

如果满足这三个条件（随机分配到治疗，没有诽谤和排除限制），那么

$\text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)$

所以我们可以估算一下CACE：

$\widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)$

考虑CACE的一种方法是，鼓励和不鼓励的人之间的结果差异，被吸收率夸大。

要记住两个重要的警告。首先，排除限制是一个强有力的假设，需要根据具体情况进行证明，这通常需要主题领域的专业知识。排除限制不能通过鼓励的随机化来证明。其次，当鼓励对治疗的吸收几乎没有影响（当 $\text{ITT}_W$ 很小时），工具变量分析会遇到一个常见的实际挑战。这被称为弱工具 ，它会导致各种各样的问题(Imbens and Rosenbaum 2005; Murray 2006) 。考虑弱文书问题的一种方法是 $\widehat{\text{CACE}}$ 可以对 $\widehat{\text{ITT}_Y}$ 小偏差敏感 - 可能由于违反排除限制 - 因为这些偏见被一个小的 $\widehat{\text{ITT}_W}$ （见方程2.13）。粗略地说，如果自然分配的治疗对您所关心的治疗没有太大影响，那么您将很难了解您关心的治疗方法。

有关此讨论的更正式版本，请参阅Imbens and Rubin (2015)第23章和第24章。传统的工具变量计量经济学方法通常用估算方程而不是潜在结果来表示。有关其他观点的介绍，请参阅Angrist and Pischke (2009) ，并对两种方法进行比较，请参阅Imbens and Rubin (2015)第24.6节。 Gerber and Green (2012)第6章提供了一种替代的，稍微不那么正式的工具变量方法。有关排除限制的更多信息，请参阅D. Jones (2015) 。 Aronow and Carnegie (2013)描述了一组可用于估计ATE而非CACE的假设。有关自然实验如何解释的更多信息，请参阅Sekhon and Titiunik (2012) 。有关自然实验的更一般性介绍 - 不仅仅是工具变量方法，还包括回归不连续等设计 - 请参阅Dunning (2012) 。