Neste apéndice, vou resumir algunhas ideas sobre a inferencia causal a partir de datos non experimentais de forma algo máis matemática. Hai dous enfoques principais: o cadro do gráfico causal, máis asociado con Judea Pearl e os seus colegas, eo cadro de resultados potenciais, máis asociado con Donald Rubin e compañeiros. Vou presentar o marco de resultados potenciais porque está máis relacionado coas ideas nas notas matemáticas ao final do capítulo 3 e 4. Para máis información sobre o cadro de grafos causais, recoméndovos Pearl, Glymour, and Jewell (2016) (introdutorio ) e Pearl (2009) (avanzado). Para un tratamento de lonxitude de libro de inferencia causal que combina o cadro de resultados potenciais eo cadro do gráfico causal, recomendo Morgan and Winship (2014) .
O obxectivo deste apéndice é axudarche a estar cómodo coa notación e o estilo da tradición de resultados potenciais para que poidas transitar a algún dos materiais máis técnicos escritos neste tema. En primeiro lugar, describirei o marco de resultados potenciais. Entón, vou usalo para discutir máis sobre os experimentos naturais como o de Angrist (1990) sobre o efecto do servizo militar sobre as ganancias. Este apéndice baséase en Imbens and Rubin (2015) .
Marco de resultados potenciais
O marco de resultados potenciais ten tres elementos principais: unidades , tratamentos e resultados potenciais . Para ilustrar estes elementos, consideremos unha versión estilizada da pregunta abordada en Angrist (1990) : Cal é o efecto do servizo militar nas ganancias? Neste caso, podemos definir as unidades para ser persoas elixibles para o proxecto de 1970 en Estados Unidos, e podemos indexar estas persoas por \(i = 1, \ldots, N\) . Os tratamentos neste caso poden ser "servindo no exército" ou "non servindo no exército". Vou chamar a estes o tratamento e as condicións de control, e escribirei \(W_i = 1\) se a persoa \(i\) está na condición de tratamento e \(W_i = 0\) se a persoa \(i\) está na condición de control. Finalmente, os resultados potenciais son un pouco máis conceptualmente difíciles porque implican resultados "potenciais". cousas que poderían pasar. Para cada persoa subvencionable para o proxecto de 1970, podemos imaxinar o importe que terían obtido en 1978 se serviron no exército, o cal \(Y_i(1)\) , ea cantidade que terían obtido en 1978 si non serviron no exército, que \(Y_i(0)\) . No marco de resultados potenciais, \(Y_i(1)\) e \(Y_i(0)\) son considerados cantidades fixas, mentres que \(W_i\) é unha variable aleatoria.
A elección de unidades, tratamentos e resultados é fundamental porque define o que se pode e non se pode aprender do estudo. A elección das unidades-persoas elixibles para o proxecto de 1970- non inclúe mulleres, polo que sen suposicións adicionais, este estudo non nos informará sobre o efecto do servizo militar sobre as mulleres. As decisións sobre como definir os tratamentos e os resultados tamén son importantes. Por exemplo, se o tratamento de interese se centrase en servir no combate militar ou experimentado? En caso de que o resultado de interese sexan ganancias ou satisfacción laboral? En definitiva, a elección de unidades, tratamentos e resultados debe estar motivada polos obxectivos científicos e políticos do estudo.
Tendo en conta as opcións de unidades, tratamentos e resultados potenciais, o efecto causal do tratamento na persoa \(i\) , \(\tau_i\) , é
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Noutras palabras, nós comparar como persoa \(i\) tería gañado despois de servir a medida persoa \(i\) tería gañado sen servir. Para min, eq. 2.1 é a forma máis clara de definir un efecto causal e, aínda que moi sinxelo, este cadro resulta xeneralizable de moitas maneiras importantes e interesantes (Imbens and Rubin 2015) .
Ao usar o marco de resultados potenciais, a miúdo considero útil escribir unha táboa que mostra os resultados potenciais e os efectos do tratamento para todas as unidades (táboa 2.5). Se non podes imaxinar unha táboa como esta para o teu estudo, entón podes ter que ser máis preciso nas túas definicións das túas unidades, tratamentos e resultados potenciais.
Persoa | Ganancias na condición de tratamento | Ganancias en estado de control | Efecto do tratamento |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Media | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Ao definir o efecto causal deste xeito, non obstante, atopamos un problema. En case todos os casos, non chegamos a observar os dous resultados potenciais. É dicir, unha persoa específica serviu ou non serviu. Polo tanto, observamos un dos resultados potenciais: \(Y_i(1)\) ou \(Y_i(0)\) -both non os dous. A incapacidade de observar os dous resultados potenciais é un gran problema que Holland (1986) chamou o problema fundamental da inferencia causal .
Afortunadamente, cando facemos investigacións, non temos só unha persoa; En vez diso, temos moitas persoas, e isto ofrécenos un xeito de resolver o problema fundamental da inferencia causal. No canto de intentar estimar o efecto do tratamento a nivel individual, podemos estimar o efecto medio do tratamento para todas as unidades:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Esta ecuación aínda se expresa en términos de \(\tau_i\) , que non se poden observar, pero con algún álgebra (eq 2.8 de Gerber and Green (2012) ), obtemos
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Isto mostra que se podemos estimar o resultado medio da poboación baixo o tratamento ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) eo resultado medio da poboación baixo control ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), entón podemos estimar o efecto medio do tratamento, mesmo sen estimar o efecto do tratamento para calquera persoa en particular.
Agora que definín a nosa estimación -a cousa que intentamos estimar- vou averificar a forma na que podemos estimalo con datos. E aquí corremos directamente ao problema que só observamos un dos resultados potenciais para cada persoa; vemos ou \(Y_i(0)\) ou \(Y_i(1)\) (táboa 2.6). Poderiamos estimar o efecto medio do tratamento mediante a comparación das ganancias das persoas que serviron ás ganancias das persoas que non serviron:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
onde \(N_t\) e \(N_c\) son o número de persoas nas condicións de tratamento e control. Este enfoque funcionará ben se a asignación de tratamento é independente dos posibles resultados, unha condición que ás veces se denomina ignorabilidade . Desafortunadamente, a falta dun experimento, a ignorancia non se adoita satisfacer, o que significa que o estimador en eq. 2.4 é probable que non produza boas estimacións. Unha forma de pensar diso é que, en ausencia de asignación aleatoria de tratamento, a eq. 2.4 non se compara como con como; está a comparar as ganancias de diferentes tipos de persoas. Ou expresado un pouco diferente, sen asignación aleatoria de tratamento, a asignación de tratamento probablemente está relacionada cos resultados potenciais.
No capítulo 4, vou describir como os experimentos controlados aleatorios poden axudar aos investigadores a facer estimacións causais, e aquí vou describir como os investigadores poden aproveitar os experimentos naturais, como o proxecto de lotería.
Persoa | Ganancias na condición de tratamento | Ganancias en estado de control | Efecto do tratamento |
---|---|---|---|
1 | ¿? | \(Y_1(0)\) | ¿? |
2 | \(Y_2(1)\) | ¿? | ¿? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ¿? | ¿? |
Media | ¿? | ¿? | ¿? |
Experimentos naturais
Un enfoque para facer estimacións causais sen executar un experimento é buscar algo que suceda no mundo que teña asignado aleatoriamente un tratamento para ti. Este enfoque chámase experimentos naturais . En moitas situacións, desgraciadamente, a natureza non entrega aleatoriamente o tratamento que desexa á poboación de interese. Pero ás veces, a natureza aleatoriamente ofrece un tratamento relacionado. En particular, vou considerar o caso en que hai algún tratamento secundario que anime a xente a recibir o tratamento primario . Por exemplo, o borrador podería considerarse un tratamento secundario asignado aleatoriamente que animou a algunhas persoas a tomar o tratamento primario que servía no exército. Este deseño é ás veces chamado de estímulo . E o método de análise que describirei para manexar esta situación ás veces é chamado de variables instrumentais . Neste contexto, con algúns supostos, os investigadores poden usar o alento para coñecer o efecto do tratamento primario dun determinado subconxunto de unidades.
Para manexar os dous tratamentos diferentes: o estímulo eo tratamento primario, necesitamos unha notación nova. Supoña que algunhas persoas están redactadas aleatoriamente ( \(Z_i = 1\) ) ou non redactaron ( \(Z_i = 0\) ); nesta situación, \(Z_i\) ás veces chámase un instrumento .
Entre os que foron redactados, algúns serviron ( \(Z_i = 1, W_i = 1\) ) e algúns non ( \(Z_i = 1, W_i = 0\) ). Do mesmo xeito, entre os que non foron redactados, algúns serviron ( \(Z_i = 0, W_i = 1\) ) e algúns non ( \(Z_i = 0, W_i = 0\) ). Os resultados potenciais para cada persoa agora poden expandirse para mostrar o seu estado tanto para o estímulo como para o tratamento. Por exemplo, deixe que \(Y(1, W_i(1))\) sexan as ganancias da persoa \(i\) se foi redactado, onde \(W_i(1)\) é o seu estado de servizo se está redactado. Ademais, podemos dividir a poboación en catro grupos: complementarios, maiores, defensores e sempre-tomadores (táboa 2.7).
Tipo | Servizo redactado | Servizo non redactado |
---|---|---|
Compliantes | Si, \(W_i(Z_i=1) = 1\) | Non, \(W_i(Z_i=0) = 0\) |
Nunca tomadores | Non, \(W_i(Z_i=1) = 0\) | Non, \(W_i(Z_i=0) = 0\) |
Defiers | Non, \(W_i(Z_i=1) = 0\) | Si, \(W_i(Z_i=0) = 1\) |
Takers sempre | Si, \(W_i(Z_i=1) = 1\) | Si, \(W_i(Z_i=0) = 1\) |
Antes de discutir a estimación do efecto do tratamento (é dicir, o servizo militar), primeiro podemos definir dous efectos do alento (é dicir, sendo redactado). En primeiro lugar, podemos definir o efecto do alento no tratamento primario. En segundo lugar, podemos definir o efecto do alento no resultado. Resultará que estes dous efectos pódense combinar para proporcionar unha estimación do efecto do tratamento nun determinado grupo de persoas.
En primeiro lugar, o efecto do estímulo ao tratamento pódese definir para a persoa \(i\) como
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Ademais, esta cantidade pode definirse en toda a poboación como
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Finalmente, podemos estimar \(\text{ITT} _{W}\) usando datos:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
onde \(\bar{W}^{\text{obs}}_1\) é o tipo de tratamento observado para quen foi estimulado e \(\bar{W}^{\text{obs}}_0\) é a taxa observada de tratamento para aqueles que non foron alentados. \(\text{ITT}_W\) tamén se denomina ás veces a taxa de captación .
A continuación, o efecto do alento sobre o resultado pódese definir para a persoa \(i\) como:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Ademais, esta cantidade pode definirse en toda a poboación como
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Finalmente, podemos estimar \(\text{ITT}_{Y}\) usando datos:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
onde \(\bar{Y}^{\text{obs}}_1\) é o resultado observado (por exemplo, ganancias) para quen foi incentivado (por exemplo, redactado) e \(\bar{W}^{\text{obs}}_0\) é o resultado observado para aqueles que non foron animados.
Finalmente, chamamos a atención sobre o efecto de interese: o efecto do tratamento primario (por exemplo, o servizo militar) sobre o resultado (por exemplo, as ganancias). Desafortunadamente, resulta que non se pode, en xeral, estimar este efecto en todas as unidades. Non obstante, con algúns supostos, os investigadores poden estimar o efecto do tratamento nos complementos (é dicir, as persoas que servirán se están redactadas e as persoas que non servirán se non están redactadas, táboa 2.7). Vou chamar a este estimando o efecto causal promedio compatible (CACE) (que ás veces tamén se denomina efecto de tratamento promedio local , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
onde \(G_i\) doa ao grupo de persoa \(i\) (ver táboa 2.7) e \(N_{\text{co}}\) é o número de complementos. Noutras palabras, a eq. 2.11 compara as ganancias dos cumpridores que están redactadas \(Y_i(1, W_i(1))\) e non redactado \(Y_i(0, W_i(0))\) . A estimación en eq. 2.11 parece difícil estimar a partir de datos observados porque non se pode identificar aos adxudicatores usando só os datos observados (para saber se alguén é máis completo, necesitará observar se serviu cando se redactou e se serviu cando non foi redactado).
Resulta que, de algunha forma sorprendente, que se hai algún complementario, a continuación, sempre que se realice tres suposicións adicionais, é posible estimar CACE a partir de datos observados. En primeiro lugar, débese supoñer que a asignación ao tratamento é aleatoria. No caso do sorteo de lotería isto é razoable. Non obstante, nalgúns lugares onde os experimentos naturais non dependen da aleatorización física, esta suposición pode ser máis problemática. En segundo lugar, débese supoñer que os seus non son desertores (esta suposición ás veces tamén se denomina suposición de monotonía). No contexto do borrador parece razoable supoñer que hai moi poucas persoas que non servirán se estean redactadas e servirán se non están redactadas. En terceiro lugar, e finalmente, vén a suposición máis importante á que se denomina restrición de exclusión . Baixo a restrición de exclusión, débese supoñer que todo o efecto da asignación de tratamento pasa polo propio tratamento. Noutras palabras, hai que supoñer que non hai un efecto directo de alento nos resultados. No caso do proxecto de lotería, por exemplo, débese supoñer que o borrador non ten efecto sobre as ganancias que non sexan o servizo militar (figura 2.11). A restrición de exclusión pode verse violada se, por exemplo, as persoas que foron redactadas pasaron máis tempo na escola para evitar o servizo ou se os empresarios tiñan menos probabilidades de contratar persoas que foron redactadas.
Se estas tres condicións (asignación aleatoria ao tratamento, sen defiadores e restrición de exclusión) atópanse
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
polo que podemos estimar CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Unha forma de pensar sobre a CACE é que é a diferencia nos resultados entre os que se fomentaron e os que non se animaron, inflados pola taxa de absorción.
Hai dúas advertencias importantes para ter presente. En primeiro lugar, a restrición de exclusión é unha forte suposición, e debe ser xustificada caso por caso, o que frecuentemente esixe coñecementos sobre a área do tema. A restrición de exclusión non se pode xustificar coa aleatorización do alento. En segundo lugar, un desafío práctico común con análise instrumental variable provén cando o alento ten pouco efecto na toma de tratamento (cando \(\text{ITT}_W\) é pequeno). Isto chámase un instrumento débil e leva a unha variedade de problemas (Imbens and Rosenbaum 2005; Murray 2006) . Unha forma de pensar sobre o problema cos instrumentos débiles é que \(\widehat{\text{CACE}}\) pode ser sensible a pequenos prexuízos en \(\widehat{\text{ITT}_Y}\) -potencialmente debido a infraccións á restrición de exclusión -porque estes prexuízos se amplían cun pequeno \(\widehat{\text{ITT}_W}\) (véxase a ecuación 2.13). Aproximadamente, se o tratamento que a natureza asigna non ten un grande impacto sobre o tratamento que lle importan, entón terá dificultade para coñecer o tratamento que lle importan.
Vexa o capítulo 23 e 24 de Imbens and Rubin (2015) para unha versión máis formal desta discusión. O achegamento econométrico tradicional ás variables instrumentais normalmente exprésase en términos de ecuacións de estimación e non de resultados potenciais. Para unha introdución desde esta outra perspectiva, vexa Angrist and Pischke (2009) , e para unha comparación entre os dous enfoques, consulte a sección 24.6 de Imbens and Rubin (2015) . No capítulo 6 de Gerber and Green (2012) presenta unha presentación alternativa, pouco menos formal do enfoque de variables instrumentais. Para máis información sobre a restrición de exclusión, consulte D. Jones (2015) . Aronow and Carnegie (2013) describen un conxunto adicional de suposicións que se poden usar para estimar ATE en lugar de CACE. Para máis información sobre como os experimentos naturais poden ser moi difíciles de interpretar, vexa Sekhon and Titiunik (2012) . Para unha introdución máis xeral aos experimentos naturais -un que vai máis alá do enfoque de variables instrumentais- inclúe tamén debuxos como discontinuidade de regresión, ver Dunning (2012) .