I denna bilaga kommer jag att sammanfatta några idéer om att orsaka orsakssamband från icke-experimentella data i en något mer matematisk form. Det finns två huvudsakliga tillvägagångssätt: ramverket för kausala grafer, mest associerade med Judeas pärla och kollegor, och det potentiella ramverket för utfallet, mest associerade med Donald Rubin och kollegor. Jag kommer att introducera den potentiella resultatramen eftersom den är närmare kopplad till idéerna i de matematiska noterna i slutet av kapitel 3 och 4. För mer om kausala diagramramen rekommenderar jag Pearl, Glymour, and Jewell (2016) (inledande ) och Pearl (2009) (avancerad). För en boklängdsbehandling av orsakssammanhängande resultat som kombinerar det potentiella ramverket för utfallet och ramverket för kausala grafer rekommenderar jag Morgan and Winship (2014) .
Målet med denna bilaga är att hjälpa dig att bli bekväm med notationen och stilen i den potentiella utfallstraditionen så att du kan övergå till några av de mer tekniska material som skrivs om detta ämne. Först ska jag beskriva den potentiella ramen för resultat. Sedan använder jag den för att ytterligare diskutera naturliga experiment som Angrist (1990) om effekten av militärtjänst på resultat. Denna bilaga drar mycket på Imbens and Rubin (2015) .
Potentiella resultatramar
Den potentiella ramen för resultat har tre huvudelement: enheter , behandlingar och potentiella resultat . För att illustrera dessa element, låt oss överväga en stiliserad version av frågan som behandlas i Angrist (1990) : Vad är effekten av militärtjänsten på intäkterna? I det här fallet kan vi definiera enheter som är personer som är berättigade till utkastet från 1970 i USA, och vi kan indexera dessa personer med \(i = 1, \ldots, N\) . Behandlingarna i detta fall kan vara "tjäna i militären" eller "inte tjäna i militären." Jag ringer dessa behandlings- och kontrollförhållanden, och jag skriver \(W_i = 1\) om personen \(i\) är i behandlingsförhållandet och \(W_i = 0\) om personen \(i\) befinner sig i kontrollförhållandet. Slutligen är de potentiella resultaten lite mer konceptuellt svåra eftersom de involverar "potentiella" resultat. saker som kunde ha hänt. För varje person som är berättigad till förslaget till 1970 kan vi föreställa oss det belopp som de skulle ha tjänat år 1978 om de tjänstgjorde i militären, som jag kommer att kalla \(Y_i(1)\) och det belopp som de skulle ha tjänat i 1978 om de inte tjänade i militären, som jag kommer att kalla \(Y_i(0)\) . I potentialpotentialramen betraktas \(Y_i(1)\) och \(Y_i(0)\) fasta kvantiteter, medan \(W_i\) är en slumpmässig variabel.
Valet av enheter, behandlingar och resultat är kritiskt eftersom det definierar vad som kan och kan inte läras av studien. Valet av enheter - personer som är berättigade till 1970 års utkast - omfattar inte kvinnor, och så utan ytterligare antaganden, kommer den här studien inte att berätta någonting om hur militärtjänsten påverkar kvinnor. Beslut om hur man definierar behandlingar och resultat är också viktiga. Till exempel, bör behandlingen av intresse vara inriktad på att tjäna i militären eller uppleva strid? Bör utfallet av intresse vara resultat eller arbetsnöjdhet? I slutändan bör valet av enheter, behandlingar och resultat drivas av studiernas vetenskapliga och politiska mål.
Med tanke på valet av enheter, behandlingar och potentiella resultat är orsakssambandet av behandlingen på person \(i\) , \(\tau_i\) ,
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Med andra ord jämför vi hur mycket person \(i\) skulle ha tjänat efter att ha serverat hur mycket person \(i\) skulle ha tjänat utan att tjäna. För mig, ekv. 2.1 är det tydligaste sättet att definiera en orsakssammanfattning, och även om det är extremt enkelt, visar den här rammen att den är generaliserbar på många viktiga och intressanta sätt (Imbens and Rubin 2015) .
När du använder den potentiella rammen för utfallet, tycker jag ofta att det är bra att skriva ut ett bord som visar de potentiella resultaten och behandlingseffekterna för alla enheter (tabell 2.5). Om du inte kan föreställa dig ett bord som detta för din studie, kanske du behöver vara mer exakt i dina definitioner av dina enheter, behandlingar och potentiella resultat.
Person | Intäkter i behandlingsvillkor | Intäkter i kontrollvillkor | Behandlingseffekt |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Betyda | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
När vi definierar orsakseffekten på detta sätt kommer vi dock in i ett problem. I nästan alla fall får vi inte observera båda potentiella resultaten. Det vill säga en viss person tjänat antingen eller inte tjänade. Därför observerar vi ett av de potentiella resultaten- \(Y_i(1)\) eller \(Y_i(0)\) - men inte båda. Oförmågan att observera båda potentiella resultaten är ett så stort problem att Holland (1986) kallade det Grundläggande Problemet med Kausal Inferens .
Lyckligtvis, när vi forskar, har vi inte bara en person; Vi har snarare många människor, och det här erbjuder ett sätt kring det grundläggande problemet med orsakssamband. I stället för att försöka uppskatta individbehandlingseffekten kan vi beräkna den genomsnittliga behandlingseffekten för alla enheter:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Denna ekvation uttrycks fortfarande i form av \(\tau_i\) , som inte kan observeras, men med någon algebra (eq 2.8 av Gerber and Green (2012) ) får vi
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Detta visar att om vi kan uppskatta det genomsnittliga utfallet av befolkningen under behandling ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) och befolkningens genomsnittliga utfall under kontroll ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) , då kan vi uppskatta den genomsnittliga behandlingseffekten, även utan att uppskatta behandlingseffekten för en viss person.
Nu när jag har definierat vårt estimat-det vi försöker uppskatta-jag kommer att vända mig till hur vi faktiskt kan uppskatta det med data. Och här kör vi direkt in i problemet att vi bara observerar ett av de potentiella resultaten för varje person; vi ser antingen \(Y_i(0)\) eller \(Y_i(1)\) (tabell 2.6). Vi kunde uppskatta den genomsnittliga behandlingseffekten genom att jämföra resultatet för personer som tjänat till intäkterna för personer som inte tjänat:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
där \(N_t\) och \(N_c\) är antalet personer i behandlings- och kontrollförhållandena. Detta tillvägagångssätt fungerar bra om behandlingsuppgiften är oberoende av potentiella resultat, ett tillstånd som ibland kallas okunnighet . Tyvärr, i avsaknad av ett experiment, är ignorerbarhet inte ofta nöjd, vilket innebär att estimatorn i ekv. 2.4 kommer sannolikt inte att ge god uppskattning. Ett sätt att tänka på är att i avsaknad av slumpmässig tilldelning av behandling, ekv. 2,4 jämför inte lika med liknande; det jämnar inkomsten för olika typer av människor. Eller uttryckt något annorlunda, utan slumpmässig tilldelning av behandling, är behandlingstilldelningen troligen relaterad till potentiella resultat.
I kapitel 4 ska jag beskriva hur randomiserade kontrollerade experiment kan hjälpa forskare att göra kausala uppskattningar och här beskriver jag hur forskare kan dra nytta av naturliga experiment, som utkastet till lotteri.
Person | Intäkter i behandlingsvillkor | Intäkter i kontrollvillkor | Behandlingseffekt |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Betyda | ? | ? | ? |
Naturliga experiment
Ett sätt att göra kausala uppskattningar utan att köra ett experiment är att leta efter något som händer i världen som slumpmässigt har tilldelats en behandling för dig. Detta tillvägagångssätt kallas naturliga experiment . I många situationer levererar naturen inte slumpmässigt den behandling som du vill intressera befolkningen. Men ibland ger naturen slumpmässigt en relaterad behandling. I synnerhet ska jag överväga det fall där det finns någon sekundär behandling som uppmuntrar människor att få den primära behandlingen . Till exempel kan utkastet betraktas som en slumpmässigt tilldelad sekundär behandling som uppmuntrade vissa människor att ta den primära behandlingen som tjänstgjorde i militären. Denna design kallas ibland en uppmuntrande design . Och analysmetoden som jag beskriver för att hantera denna situation kallas ibland instrumentella variabler . I denna inställning, med vissa antaganden, kan forskare använda uppmuntran att lära sig om effekten av den primära behandlingen för en viss delmängd av enheter.
För att hantera de två olika behandlingarna - uppmuntran och primär behandling - behöver vi en ny notering. Antag att vissa personer slumpmässigt utarbetas ( \(Z_i = 1\) ) eller inte utarbetat ( \(Z_i = 0\) ); I denna situation kallas \(Z_i\) ibland ett instrument .
Bland de som utarbetades, tjänade vissa ( \(Z_i = 1, W_i = 1\) ) och vissa gjorde inte ( \(Z_i = 1, W_i = 0\) ). På samma sätt bland de som inte utarbetades tjänade vissa ( \(Z_i = 0, W_i = 1\) ) och vissa gjorde inte ( \(Z_i = 0, W_i = 0\) ). De potentiella resultaten för varje person kan nu utökas för att visa status för både uppmuntran och behandlingen. Till exempel, låt \(Y(1, W_i(1))\) vara intäkterna till person \(i\) om han utarbetades, där \(W_i(1)\) är hans tjänstestatus om han är utarbetad. Vidare kan vi dela upp befolkningen i fyra grupper: komplikatorer, aldrig-tagare, defiers och alltid-tagare (tabell 2.7).
Typ | Service om utarbetad | Tjänsten om inte utarbetad |
---|---|---|
compliers | Ja, \(W_i(Z_i=1) = 1\) | Nej, \(W_i(Z_i=0) = 0\) |
Never-tagare | Nej, \(W_i(Z_i=1) = 0\) | Nej, \(W_i(Z_i=0) = 0\) |
Defiers | Nej, \(W_i(Z_i=1) = 0\) | Ja, \(W_i(Z_i=0) = 1\) |
Alltid tagare | Ja, \(W_i(Z_i=1) = 1\) | Ja, \(W_i(Z_i=0) = 1\) |
Innan vi diskuterar hur effekten av behandlingen (dvs. militärtjänsten) kan bedömas, kan vi först definiera två effekter av uppmuntran (dvs. utarbetas). Först kan vi definiera effekten av uppmuntran till primärbehandling. För det andra kan vi definiera effekten av uppmuntran till resultatet. Det kommer att visa sig att dessa två effekter kan kombineras för att ge en uppskattning av effekten av behandlingen på en viss grupp människor.
Först kan effekten av uppmuntran på behandling definieras för person \(i\) som
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Vidare kan denna kvantitet definieras över hela befolkningen som
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Slutligen kan vi uppskatta \(\text{ITT} _{W}\) med data:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
där \(\bar{W}^{\text{obs}}_1\) är den observerade behandlingsgraden för dem som uppmuntrades och \(\bar{W}^{\text{obs}}_0\) är Den observerade behandlingsgraden för de som inte uppmuntrades. \(\text{ITT}_W\) kallas också ibland upptagningsfrekvensen .
Därefter kan effekten av uppmuntran på resultatet definieras för person \(i\) som:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Vidare kan denna kvantitet definieras över hela befolkningen som
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Slutligen kan vi uppskatta \(\text{ITT}_{Y}\) hjälp av data:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
där \(\bar{Y}^{\text{obs}}_1\) är det observerade resultatet (t.ex. intäkter) för dem som uppmuntrades (till exempel formulerade) och \(\bar{W}^{\text{obs}}_0\) är det observerade resultatet för dem som inte uppmuntrades.
Slutligen gör vi vår uppmärksamhet åt effekten av intresse: effekten av den primära behandlingen (t.ex. militärtjänsten) på resultatet (t.ex. intäkter). Tyvärr visar det sig att man inte i allmänhet kan uppskatta denna effekt på alla enheter. Men med vissa antaganden kan forskare bedöma effekten av behandlingen på komplikatorer (dvs. personer som ska tjäna om utarbetade och personer som inte kommer att tjäna om inte utarbetas, tabell 2.7). Jag ringer den här estimaten till den genomsnittliga orsakseffekten (CACE) (som också kallas ibland den lokala genomsnittliga behandlingseffekten , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
där \(G_i\) donerar gruppen av person \(i\) (se tabell 2.7) och \(N_{\text{co}}\) är antalet jämförare. Med andra ord, ekv. 2.11 jämför resultat av komparatorer som är utarbetade \(Y_i(1, W_i(1))\) och inte utarbetat \(Y_i(0, W_i(0))\) . Estimatet i ekv. 2.11 verkar svårt att uppskatta från observerade data eftersom det inte går att identifiera komplikatorer med hjälp av endast observerade data (för att veta om någon är complier du skulle behöva observera huruvida han tjänade när han utarbetades och om han tjänstgjorde när han inte utarbetades).
Det visar sig - något överraskande - att om det finns några komplikatorer, då tillhandahålls en gör tre ytterligare antaganden, är det möjligt att uppskatta CACE från observerade data. Först måste man anta att uppgiften till behandling är slumpmässig. I fallet med utkastet till lotteri är det rimligt. Men i vissa miljöer där naturliga experiment inte är beroende av fysisk randomisering kan detta antagande vara mer problematiskt. För det andra måste man anta att de inte är defiers (detta antagande kallas också ibland monotonicitetsantagandet). I sammanhanget med utkastet verkar det rimligt att anta att det finns mycket få personer som inte kommer att tjäna om utarbetade och kommer att tjäna om inte utarbetas. Tredje, och slutligen, kommer det viktigaste antagandet som kallas uteslutningsbegränsningen . Under uteslutningsbegränsningen måste man anta att all effekt av behandlingsuppgiften passerar genom själva behandlingen. Med andra ord måste man anta att det inte finns någon direkt effekt av uppmuntran till resultat. När det gäller utkastet till lotteri måste man till exempel anta att utkastet status inte påverkar resultatet annat än genom militär service (figur 2.11). Uteslutningsbegränsningen kan brytas om exempelvis personer som utarbetats spenderade mer tid i skolan för att undvika service eller om arbetsgivare hade mindre benägenhet att anställa personer som utarbetades.
Om dessa tre villkor (slumpmässigt tilldelning till behandling, inga defiers och uteslutningsbegränsningen) är uppfyllda, då
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
så vi kan uppskatta CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Ett sätt att tänka på CACE är att det är skillnaden i resultat mellan de som uppmuntras och de som inte uppmuntras, uppblåst av upptagningsgraden.
Det finns två viktiga försiktighetsåtgärder att tänka på. För det första är uteslutningsbegränsningen ett starkt antagande, och det måste motiveras från fall till fall, vilket ofta kräver ämnesområdena. Uteslutningsbegränsningen kan inte motiveras med slumpmässig uppmuntran. För det andra kommer en gemensam praktisk utmaning med instrumental variabel analys när uppmuntran har liten inverkan på behandlingens behandling (när \(\text{ITT}_W\) är liten). Detta kallas ett svagt instrument , och det leder till en rad olika problem (Imbens and Rosenbaum 2005; Murray 2006) . Ett sätt att tänka på problemet med svaga instrument är att \(\widehat{\text{CACE}}\) kan vara känsligt för små partiklar i \(\widehat{\text{ITT}_Y}\) överträdelser av uteslutningsbegränsningen - eftersom dessa förspänningar förstoras av en liten \(\widehat{\text{ITT}_W}\) (se ekv. 2.13). Grovt, om den behandling som naturen tilldelar inte har stor inverkan på behandlingen du bryr dig om, då kommer du att ha svårt att lära dig om den behandling du bryr dig om.
Se kapitel 23 och 24 i Imbens and Rubin (2015) för en mer formell version av denna diskussion. Det traditionella ekonometriska tillvägagångssättet till instrumentvariabler uttrycks typiskt när det gäller att uppskatta ekvationer, inte potentiella resultat. För en introduktion från detta andra perspektiv, se Angrist and Pischke (2009) , och för en jämförelse mellan de två tillvägagångssätten, se avsnitt Imbens and Rubin (2015) i Imbens and Rubin (2015) . En alternativ, något mindre formell presentation av instrumentvariablerna finns i kapitel 6 i Gerber and Green (2012) . För mer om uteslutningsbegränsningen, se D. Jones (2015) . Aronow and Carnegie (2013) beskriver en ytterligare uppsättning antaganden som kan användas för att uppskatta ATE snarare än CACE. För mer om hur naturliga experiment kan vara väldigt knepigt att tolka, se Sekhon and Titiunik (2012) . För en mer allmän introduktion till naturliga experiment-ett som går utöver bara instrumentella variablerna att även omfatta konstruktioner som regressionsdiskontinuitet-se Dunning (2012) .