Dans cette annexe, je résumerai quelques idées sur l'inférence causale à partir de données non expérimentales sous une forme légèrement plus mathématique. Il y a deux approches principales: le cadre des graphes causaux, le plus associé à Judea Pearl et ses collègues, et le cadre de résultats potentiels, le plus associé à Donald Rubin et ses collègues. Je présenterai le cadre des résultats possibles parce qu'il est plus étroitement lié aux idées contenues dans les notes mathématiques à la fin du chapitre 3 et 4. Pour en savoir plus sur le cadre des graphiques causaux, je recommande Pearl, Glymour, and Jewell (2016) ) et Pearl (2009) (avancé). Pour un traitement du livre de l'inférence causale qui combine le cadre des résultats potentiels et le cadre du graphe causal, je recommande Morgan and Winship (2014) .
Le but de cette annexe est de vous aider à vous familiariser avec la notation et le style de la tradition des résultats potentiels afin que vous puissiez passer à certains des documents les plus techniques écrits sur ce sujet. Je vais d'abord décrire le cadre de résultats potentiels. Ensuite, je l'utiliserai pour discuter plus avant des expériences naturelles comme celle d' Angrist (1990) sur l'effet du service militaire sur les gains. Cette annexe s'appuie fortement sur Imbens and Rubin (2015) .
Cadre de résultats potentiels
Le cadre de résultats potentiels comprend trois éléments principaux: les unités , les traitements et les résultats potentiels . Afin d'illustrer ces éléments, considérons une version stylisée de la question posée dans Angrist (1990) : Quel est l'effet du service militaire sur les gains? Dans ce cas, nous pouvons définir les unités pour être éligibles au projet de 1970 aux États-Unis, et nous pouvons indexer ces personnes par \(i = 1, \ldots, N\) . Les traitements dans ce cas peuvent être «servir dans l'armée» ou «ne pas servir dans l'armée». Je les appellerai les conditions de traitement et de contrôle, et j'écrirai \(W_i = 1\) si personne \(i\) est dans la condition de traitement et \(W_i = 0\) si la personne \(i\) est dans la condition de contrôle. Enfin, les résultats potentiels sont un peu plus difficiles sur le plan conceptuel parce qu'ils impliquent des résultats «potentiels»; des choses qui auraient pu arriver. Pour chaque personne éligible au tirage de 1970, on peut imaginer le montant qu'ils auraient gagné en 1978 s'ils servaient dans l'armée, que j'appellerai \(Y_i(1)\) , et le montant qu'ils auraient gagné en 1978 s'ils n'ont pas servi dans l'armée, que j'appellerai \(Y_i(0)\) . Dans le cadre des résultats potentiels, \(Y_i(1)\) et \(Y_i(0)\) sont considérés comme des quantités fixes, alors que \(W_i\) est une variable aléatoire.
Le choix des unités, des traitements et des résultats est essentiel car il définit ce que l'étude peut et ne peut pas apprendre. Le choix des unités - les personnes éligibles pour le projet de 1970 - n'inclut pas les femmes, et donc sans hypothèses supplémentaires, cette étude ne nous dira rien sur l'effet du service militaire sur les femmes. Les décisions sur la façon de définir les traitements et les résultats sont également importantes. Par exemple, le traitement d'intérêt devrait-il être axé sur le service militaire ou le combat? Le résultat d'intérêt devrait-il être la rémunération ou la satisfaction au travail? En fin de compte, le choix des unités, des traitements et des résultats devrait être déterminé par les objectifs scientifiques et politiques de l'étude.
Étant donné le choix des unités, des traitements et des résultats potentiels, l'effet causal du traitement sur la personne \(i\) , \(\tau_i\) , est
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
En d'autres termes, nous comparons combien de personne \(i\) aurait gagné après avoir servi à combien de personne \(i\) aurait gagné sans servir. Pour moi, eq. 2.1 est le moyen le plus clair de définir un effet causal, et bien que extrêmement simple, ce cadre s'avère généralisable de plusieurs manières importantes et intéressantes (Imbens and Rubin 2015) .
Lorsque j'utilise le cadre de résultats potentiels, je trouve souvent utile d'écrire un tableau montrant les résultats potentiels et les effets du traitement pour toutes les unités (tableau 2.5). Si vous n'êtes pas en mesure d'imaginer une table comme celle-ci pour votre étude, vous devrez peut-être être plus précis dans vos définitions de vos unités, traitements et résultats potentiels.
La personne | Gains en condition de traitement | Gains en condition de contrôle | Effet du traitement |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Signifier | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
En définissant l'effet causal de cette manière, cependant, nous rencontrons un problème. Dans presque tous les cas, nous n'observons pas les deux résultats potentiels. Autrement dit, une personne spécifique a servi ou n'a pas servi. Par conséquent, nous observons l'un des résultats potentiels - \(Y_i(1)\) ou \(Y_i(0)\) - mais pas les deux. L'incapacité d'observer les deux résultats potentiels est un problème si important que Holland (1986) appelé le problème fondamental de l'inférence causale .
Heureusement, quand nous faisons des recherches, nous n'avons pas seulement une personne; nous avons plutôt beaucoup de gens, ce qui offre un moyen de contourner le problème fondamental de l'inférence causale. Au lieu de tenter d'estimer l'effet du traitement au niveau individuel, nous pouvons estimer l' effet moyen du traitement pour toutes les unités:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Cette équation est toujours exprimée en termes de \(\tau_i\) , qui sont inobservables, mais avec une certaine algèbre (eq 2.8 de Gerber and Green (2012) ), nous obtenons
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Ceci montre que si nous pouvons estimer le résultat moyen de la population sous traitement ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) et le résultat moyen de la population sous contrôle ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), nous pouvons alors estimer l'effet moyen du traitement, même sans estimer l'effet du traitement pour une personne en particulier.
Maintenant que j'ai défini notre estimation - la chose que nous essayons d'estimer - je vais me tourner vers la façon dont nous pouvons l'estimer avec des données. Et ici nous rencontrons directement le problème que nous observons seulement l'un des résultats potentiels pour chaque personne; nous voyons soit \(Y_i(0)\) ou \(Y_i(1)\) (tableau 2.6). Nous pourrions estimer l'effet moyen du traitement en comparant les gains des personnes qui ont servi les gains des personnes qui n'ont pas servi:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
où \(N_t\) et \(N_c\) sont les nombres de personnes dans les conditions de traitement et de contrôle. Cette approche fonctionnera bien si l'assignation de traitement est indépendante des résultats potentiels, une condition parfois appelée ignorabilité . Malheureusement, en l'absence d'expérience, l'ignorabilité n'est pas souvent satisfaite, ce qui signifie que l'estimateur en éq. 2.4 n'est pas susceptible de produire une bonne estimation. Une façon d'y penser est qu'en l'absence d'assignation aléatoire du traitement, eq. 2.4 ne compare pas comme avec comme; c'est comparer les gains de différents types de personnes. Ou exprimé légèrement différent, sans assignation aléatoire de traitement, l'allocation de traitement est probablement liée à des résultats potentiels.
Dans le chapitre 4, je vais décrire comment des expériences contrôlées randomisées peuvent aider les chercheurs à faire des estimations causales, et je vais décrire ici comment les chercheurs peuvent tirer parti des expériences naturelles, comme le tirage au sort.
La personne | Gains en condition de traitement | Gains en condition de contrôle | Effet du traitement |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Signifier | ? | ? | ? |
Expériences naturelles
Une approche pour faire des estimations causales sans courir une expérience est de chercher quelque chose qui se passe dans le monde qui a assigné au hasard un traitement pour vous. Cette approche est appelée expériences naturelles . Dans de nombreuses situations, malheureusement, la nature ne fournit pas de manière aléatoire le traitement que vous voulez à la population d'intérêt. Mais parfois, la nature offre un traitement connexe au hasard. En particulier, je considérerai le cas où il existe un traitement secondaire qui encourage les gens à recevoir le traitement primaire . Par exemple, le projet pourrait être considéré comme un traitement secondaire assigné au hasard qui a encouragé certaines personnes à prendre le traitement primaire, qui servait dans l'armée. Cette conception est parfois appelée un design d'encouragement . Et la méthode d'analyse que je vais décrire pour gérer cette situation est parfois appelée variable instrumentale . Dans ce contexte, avec certaines hypothèses, les chercheurs peuvent utiliser l'encouragement pour se renseigner sur l'effet du traitement primaire pour un sous-ensemble particulier d'unités.
Afin de gérer les deux traitements différents - l'encouragement et le traitement primaire - nous avons besoin d'une nouvelle notation. Supposons que certaines personnes soient rédigées au hasard ( \(Z_i = 1\) ) ou non ( \(Z_i = 0\) ); dans cette situation, \(Z_i\) est parfois appelé un instrument .
Parmi ceux qui ont été rédigés, certains ont servi ( \(Z_i = 1, W_i = 1\) ) et d'autres non ( \(Z_i = 1, W_i = 0\) ). De même, parmi ceux qui n'ont pas été rédigés, certains ont servi ( \(Z_i = 0, W_i = 1\) ) et d'autres non ( \(Z_i = 0, W_i = 0\) ). Les résultats potentiels pour chaque personne peuvent maintenant être étendus pour montrer leur statut à la fois pour l'encouragement et le traitement. Par exemple, let \(Y(1, W_i(1))\) est le gain de la personne \(i\) s'il a été rédigé, où \(W_i(1)\) est son statut de service s'il est rédigé. En outre, nous pouvons diviser la population en quatre groupes: les complicateurs, les non-preneurs, les défenseurs et les toujours-preneurs (tableau 2.7).
Type | Service si rédigé | Service si non rédigé |
---|---|---|
Compléments | Oui, \(W_i(Z_i=1) = 1\) | Non, \(W_i(Z_i=0) = 0\) |
Jamais-preneurs | Non, \(W_i(Z_i=1) = 0\) | Non, \(W_i(Z_i=0) = 0\) |
Defiers | Non, \(W_i(Z_i=1) = 0\) | Oui, \(W_i(Z_i=0) = 1\) |
Toujours preneurs | Oui, \(W_i(Z_i=1) = 1\) | Oui, \(W_i(Z_i=0) = 1\) |
Avant de discuter de l'estimation de l'effet du traitement (c.-à-d. Le service militaire), nous pouvons d'abord définir deux effets de l'encouragement (c.-à-d. En cours de rédaction). Premièrement, nous pouvons définir l'effet de l'encouragement sur le traitement primaire. Deuxièmement, nous pouvons définir l'effet de l'encouragement sur le résultat. Il apparaîtra que ces deux effets peuvent être combinés pour fournir une estimation de l'effet du traitement sur un groupe spécifique de personnes.
Tout d'abord, l'effet de l'encouragement sur le traitement peut être défini pour la personne \(i\)
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
En outre, cette quantité peut être définie sur l'ensemble de la population
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Enfin, nous pouvons estimer \(\text{ITT} _{W}\) utilisant des données:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
où \(\bar{W}^{\text{obs}}_1\) est le taux de traitement observé pour ceux qui ont été encouragés et \(\bar{W}^{\text{obs}}_0\) le taux de traitement observé pour ceux qui n'ont pas été encouragés. \(\text{ITT}_W\) est aussi parfois appelé taux d'absorption .
Ensuite, l'effet de l'encouragement sur le résultat peut être défini pour la personne \(i\) comme:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
En outre, cette quantité peut être définie sur l'ensemble de la population
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Enfin, nous pouvons estimer \(\text{ITT}_{Y}\) utilisant des données:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
où \(\bar{Y}^{\text{obs}}_1\) est le résultat observé (par exemple, les gains) pour ceux qui ont été encouragés (par exemple, drafted) et \(\bar{W}^{\text{obs}}_0\) est le résultat observé pour ceux qui n'ont pas été encouragés.
Enfin, nous portons notre attention sur l'effet de l'intérêt: l'effet du traitement primaire (par exemple, le service militaire) sur le résultat (par exemple, les gains). Malheureusement, il s'avère que l'on ne peut, en général, estimer cet effet sur toutes les unités. Cependant, avec certaines hypothèses, les chercheurs peuvent estimer l'effet du traitement sur les complices (c.-à-d., Les personnes qui serviront si elles sont rédigées et celles qui ne serviront pas si elles ne sont pas rédigées, tableau 2.7). J'appellerai cette estimation l' effet causal moyen du complier (CACE) (que l'on appelle aussi parfois l' effet de traitement moyen local , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
où \(G_i\) fait don du groupe de personne \(i\) (voir tableau 2.7) et \(N_{\text{co}}\) est le nombre de compliants. En d'autres termes, eq. 2.11 compare les gains des compilateurs qui sont rédigés \(Y_i(1, W_i(1))\) et non rédigé \(Y_i(0, W_i(0))\) . Le estimand en éq. 2.11 semble difficile à estimer à partir des données observées car il n'est pas possible d'identifier les complices en utilisant uniquement les données observées (pour savoir si quelqu'un est compliant, il faudrait observer s'il servait lorsqu'il était rédigé et s'il servait lorsqu'il n'était pas rédigé).
Il s'avère - de façon quelque peu surprenante - que s'il y a des compléments, à condition de faire trois hypothèses supplémentaires, il est possible d'estimer CACE à partir des données observées. Premièrement, il faut supposer que l'assignation au traitement est aléatoire. Dans le cas du tirage au sort, cela est raisonnable. Cependant, dans certains contextes où les expériences naturelles ne reposent pas sur la randomisation physique, cette hypothèse peut être plus problématique. Deuxièmement, il faut supposer qu'il n'y a pas de défier (cette hypothèse est aussi parfois appelée l'hypothèse de la monotonie). Dans le contexte du projet, il semble raisonnable de supposer qu'il y a très peu de personnes qui ne serviront pas si elles sont rédigées et serviront si elles ne sont pas rédigées. Troisièmement, et finalement, vient l'hypothèse la plus importante qui est appelée la restriction d'exclusion . En vertu de la restriction d'exclusion, il faut supposer que tous les effets de l'affectation de traitement passent par le traitement lui-même. En d'autres termes, il faut supposer qu'il n'y a pas d'effet direct d'encouragement sur les résultats. Dans le cas du projet de loterie, par exemple, il faut supposer que le statut provisoire n'a aucun effet sur les gains autres que le service militaire (figure 2.11). La restriction d'exclusion pourrait être violée si, par exemple, les personnes qui étaient rédigées passaient plus de temps à l'école afin d'éviter le service ou si les employeurs étaient moins susceptibles d'embaucher des personnes qui étaient rédigées.
Si ces trois conditions (assignation aléatoire au traitement, aucun défieur, et la restriction d'exclusion) sont remplies, alors
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
donc nous pouvons estimer CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Une façon de penser à l'ACACE est que c'est la différence de résultats entre ceux qui ont été encouragés et ceux qui ne sont pas encouragés, gonflés par le taux d'adoption.
Il y a deux mises en garde importantes à garder à l'esprit. Premièrement, la restriction d'exclusion est une hypothèse forte, et elle doit être justifiée au cas par cas, ce qui nécessite souvent une expertise en la matière. La restriction d'exclusion ne peut pas être justifiée par la randomisation de l'encouragement. Deuxièmement, un défi pratique commun avec l'analyse des variables instrumentales survient lorsque l'encouragement a peu d'effet sur l'adoption du traitement (lorsque \(\text{ITT}_W\) est petit). C'est ce qu'on appelle un instrument faible , et cela entraîne divers problèmes (Imbens and Rosenbaum 2005; Murray 2006) . Une façon de penser au problème avec des instruments faibles est que \(\widehat{\text{CACE}}\) peut être sensible aux petits biais dans \(\widehat{\text{ITT}_Y}\) potentiellement dû à violations de la restriction d'exclusion - parce que ces biais sont amplifiés par un petit \(\widehat{\text{ITT}_W}\) (voir l'équation 2.13). Grosso modo, si le traitement que la nature attribue n'a pas un grand impact sur le traitement dont vous vous souciez, alors vous allez avoir du mal à apprendre sur le traitement qui vous intéresse.
Voir les chapitres 23 et 24 d' Imbens and Rubin (2015) pour une version plus formelle de cette discussion. L'approche économétrique traditionnelle des variables instrumentales est généralement exprimée en termes d'équations d'estimation et non de résultats potentiels. Pour une introduction de cette autre perspective, voir Angrist and Pischke (2009) , et pour une comparaison entre les deux approches, voir la section 24.6 d' Imbens and Rubin (2015) . Une présentation alternative, un peu moins formelle, de l'approche des variables instrumentales est présentée au chapitre 6 de Gerber and Green (2012) . Pour plus d'informations sur la restriction d'exclusion, voir D. Jones (2015) . Aronow and Carnegie (2013) décrivent un ensemble supplémentaire d'hypothèses qui peuvent être utilisées pour estimer ATE plutôt que CACE. Pour plus d'informations sur la manière dont les expériences naturelles peuvent être très difficiles à interpréter, voir Sekhon and Titiunik (2012) . Pour une introduction plus générale aux expériences naturelles - une approche qui va au-delà de l'approche des variables instrumentales pour inclure également des concepts tels que la discontinuité de la régression - voir Dunning (2012) .