Во овој прилог, ќе ги сумираме некои идеи за изработка на причинско-последични заклучоци од не-експериментални податоци во малку повеќе математичка форма. Постојат два главни пристапи: каузалната рамка, најмногу поврзана со Јудеја Перл и колегите, и рамката за потенцијални исходи, најмногу поврзани со Доналд Рубин и неговите колеги. Јас ќе ја воведам рамката за потенцијални исходи бидејќи таа е поблиску поврзана со идеите во математичките белешки на крајот од поглавјата 3 и 4. За повеќе во рамката за каузални графикони, препорачувам Pearl, Glymour, and Jewell (2016) (воведни ) и Pearl (2009) (напредно). За книговодствено третирање на причинско заклучување кое ги комбинира рамката за потенцијални исходи и каузалната рамка, препорачувам Morgan and Winship (2014) .
Целта на овој додаток е да ви помогне да се чувствувате удобно со нотација и стил на традицијата за потенцијални резултати, така што ќе можете да преминете на некои од техничките материјали напишани на оваа тема. Прво, ќе ја опишам рамката за можни исходи. Потоа, јас ќе го користам и понатаму да разговарам за природни експерименти, како оној од Angrist (1990) за ефектот на воената служба на заработувачката. Овој додаток во голема мера се потпира на Imbens and Rubin (2015) .
Потенцијални резултати
Рамката за потенцијални исходи има три главни елементи: единици , третмани и потенцијални исходи . Со цел да ги илустрираме овие елементи, ајде да ја разгледаме стилизираната верзија на прашањето опфатено во Angrist (1990) : Кој е ефектот на воената служба врз заработувачката? Во овој случај, ние можеме да ги дефинираме единиците за луѓе кои имаат право на предлог од 1970 година во Соединетите Држави и можеме да ги индексираме овие луѓе со \(i = 1, \ldots, N\) . Третманите во овој случај може да се "служат во војска" или "да не служат во војска". Ќе ги наречам овие услови за третман и контрола и ќе напишам \(W_i = 1\) ако личноста \(i\) е во условот за третирање и \(W_i = 0\) ако лицето \(i\) е во контролната состојба. Конечно, потенцијалните резултати се малку повеќе концептуално тешки, бидејќи тие вклучуваат "потенцијални" резултати; работи што можеа да се случат. За секое лице кое има право на предлог од 1970 година, можеме да замислиме сума која би ја заработиле во 1978 ако служеле во војската, која ќе ја наречам \(Y_i(1)\) , и износот што би го заработиле 1978, ако тие не служат во војската, што јас ќе го наречам \(Y_i(0)\) . Во рамката на потенцијалните резултати, \(Y_i(1)\) и \(Y_i(0)\) се сметаат за фиксни количини, додека \(W_i\) е случајна променлива.
Изборот на единиците, третманите и исходите е критичен бидејќи го дефинира она што може и не може да се научи од студијата. Изборот на единици - луѓе кои имаат право на предлог од 1970 година - не ги вклучуваат жените, и така без дополнителни претпоставки, оваа студија нема да ни каже ништо за ефектот на воената служба врз жените. Важни се и одлуките за тоа како да се дефинираат третманите и резултатите. На пример, дали третманот на интерес треба да се фокусира на служење во војска или доживување на борба? Доколку исходот од интерес е заработка или задоволство од работата? На крајот на краиштата, изборот на единици, третмани и резултати треба да биде поттикнат од научните и политичките цели на студијата.
Со оглед на изборот на единици, третмани и потенцијални исходи, каузалниот ефект на третманот врз лицето \(i\) , \(\tau_i\) , е
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Со други зборови, споредуваме колку лице \(i\) би можело да заработи откако ќе му служи на колку лице \(i\) би заработило без сервирање. За мене, eq. 2.1 е најјасен начин да се дефинира каузалниот ефект, и иако многу едноставно, оваа рамка се претвора во генерализирана на многу важни и интересни начини (Imbens and Rubin 2015) .
Кога ја користам рамката за потенцијални исходи, често ми е корисно да напишем табела која ги прикажува потенцијалните исходи и ефектите на третманот за сите единици (табела 2.5). Ако не сте во можност да замислите ваква табела за вашата студија, тогаш можеби ќе треба да бидете попрецизни во вашите дефиниции за вашите единици, третмани и потенцијални исходи.
Лице | Приходи во третман состојба | Приходи во контрола состојба | Ефект на третман |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Значи | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Меѓутоа, при дефинирањето на каузалниот ефект на овој начин, наидовме на проблем. Во речиси сите случаи, не можеме да ги набљудуваме и потенцијалните резултати. Тоа е, одредено лице или служело или не служело. Затоа, ние го набљудуваме еден од потенцијалните исходи - \(Y_i(1)\) или \(Y_i(0)\) - но не и двете. Неможноста да се набљудуваат и потенцијалните исходи е толку голем проблем што го нарече Holland (1986) како фундаментален проблем на причинско заклучување .
За среќа, кога правиме истражувања, немаме само една личност; Напротив, имаме многу луѓе, и ова нуди начин околу основниот проблем на причинско заклучување. Наместо да се обидеме да го процениме ефектот на третманот на индивидуално ниво, можеме да го процениме просечниот ефект на третман за сите единици:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Оваа равенка сè уште е изразена во однос на \(\tau_i\) , кои не се гледаат, но со некоја алгебра (eq 2.8 од Gerber and Green (2012) ), добиваме
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Ова покажува дека ако можеме да го процениме популациониот просечен исход под третманот ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) и просечниот исход на популацијата под контрола ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), тогаш можеме да го процениме просечниот ефект на третманот, дури и без да го процениме ефектот на третман за некое одредено лице.
Сега кога ги дефиниравме нашите проценки - она за што се обидуваме да ги процениме - ќе се свртам кон тоа како можеме да го процениме со податоци. И тука трчаме директно во проблемот што ние само го набљудуваме еден од потенцијалните исходи за секој човек; можеме да видиме или \(Y_i(0)\) или \(Y_i(1)\) (табела 2.6). Можеме да го процениме просечниот ефект на третманот со споредување на приходите на луѓето кои служеле за приходите на луѓе кои не служеле:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
каде што \(N_t\) и \(N_c\) се број на луѓе во третманот и контролните услови. Овој пристап ќе функционира добро ако назначувањето на третманот е независно од потенцијалните исходи, состојба која понекогаш се нарекува и неупотребливост . За жал, во отсуство на експеримент, нетолеранцијата често не е задоволена, што значи дека проценителот во eq. 2.4 не е веројатно да произведе добра проценка. Еден начин да се размислува за тоа е дека во отсуство на случајно доделување на третман, eq. 2.4 не е споредување како со слични; тоа е споредување на приходите на различни видови на луѓе. Или изразена малку поинаква, без случајно назначување на третманот, распределбата на третманот е веројатно поврзана со потенцијалните исходи.
Во поглавјето 4, ќе опишам како рандомизираните контролирани експерименти можат да им помогнат на истражувачите да прават каузални проценки, и тука ќе опишам како истражувачите можат да ги искористат предностите на природните експерименти, како што е нацрт-лотаријата.
Лице | Приходи во третман состојба | Приходи во контрола состојба | Ефект на третман |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Значи | ? | ? | ? |
Природни експерименти
Еден пристап за да се направат каузални проценки без да се изврши експеримент е да барате нешто што се случува во светот, кое случајно го назначи третманот за вас. Овој пристап се нарекува природни експерименти . Во многу ситуации, за жал, природата не случајно го дава третманот што го сакате на населението од интерес. Но, понекогаш, природата случајно обезбедува соодветен третман. Особено, јас ќе го разгледа случајот каде што има некој секундарен третман кој ги поттикнува луѓето да примаат примарен третман . На пример, нацртот може да се смета за случајно доделен секундарен третман кој ги поттикна некои луѓе да го преземат примарниот третман, кој служеше во војската. Овој дизајн понекогаш се нарекува охрабрувачки дизајн . А методот на анализа што јас ќе го опишам за да се справи со оваа ситуација понекогаш се нарекуваат инструментални променливи . Во оваа смисла, со некои претпоставки, истражувачите можат да го искористат поттик за да дознаат за ефектот од примарен третман за одредена подгрупа на единици.
Со цел да се справат со двата различни третмани - охрабрувањето и примарниот третман - ни требаат нови нотации. Да претпоставиме дека некои луѓе се изработуваат по случаен избор ( \(Z_i = 1\) ) или не се подготвени ( \(Z_i = 0\) ); во оваа ситуација, \(Z_i\) понекогаш се нарекува инструмент .
Меѓу оние што беа подготвени, некои служеа ( \(Z_i = 1, W_i = 1\) ), а некои не беа ( \(Z_i = 1, W_i = 0\) ). Исто така, кај оние кои не беа подготвени, некои служеа ( \(Z_i = 0, W_i = 1\) ), а некои не ( \(Z_i = 0, W_i = 0\) ). Потенцијалните резултати за секој човек сега можат да се прошират за да го покажат својот статус и за охрабрувањето и третманот. На пример, дозволете \(Y(1, W_i(1))\) биде заработувачка на лицето \(i\) ако тој бил подготвен, каде што \(W_i(1)\) е неговиот статус на услуга ако е изготвен. Понатаму, ние можеме да го поделиме населението во четири групи: комплитери, никогаш не купувачи, дефтери и постојано корисници (табела 2.7).
Тип | Услуга ако е изготвена | Сервисот, ако не е изготвен |
---|---|---|
Compliers | Да, \(W_i(Z_i=1) = 1\) | Не, \(W_i(Z_i=0) = 0\) |
Никогаш не земаат | Не, \(W_i(Z_i=1) = 0\) | Не, \(W_i(Z_i=0) = 0\) |
Defiers | Не, \(W_i(Z_i=1) = 0\) | Да, \(W_i(Z_i=0) = 1\) |
Секогаш киднапери | Да, \(W_i(Z_i=1) = 1\) | Да, \(W_i(Z_i=0) = 1\) |
Пред да расправаме за проценката на ефектот од третманот (т.е. воената служба), прво можеме да дефинираме два ефекти на поттикнување (т.е. да се подготви). Прво, можеме да го дефинираме ефектот на поттикнување на примарен третман. Второ, можеме да го дефинираме ефектот на охрабрувањето врз исходот. Ќе се покаже дека овие два ефекти може да се комбинираат за да се обезбеди проценка на ефектот на третманот врз одредена група на луѓе.
Прво, ефектот на поттикнување на третманот може да се дефинира за лицето \(i\) како
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Понатаму, оваа количина може да се дефинира преку целата популација како
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Конечно, може да се процени \(\text{ITT} _{W}\) користејќи податоци:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
каде што \(\bar{W}^{\text{obs}}_1\) е забележаната стапка на третман за оние кои беа охрабрени и \(\bar{W}^{\text{obs}}_0\) е забележаната стапка на третман за оние кои не беа охрабрени. \(\text{ITT}_W\) исто така, понекогаш се нарекува и стапка на навлегување .
Следно, ефектот на поттикнување на исходот може да се дефинира за лицето \(i\) како:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Понатаму, оваа количина може да се дефинира преку целата популација како
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Конечно, може да се процени \(\text{ITT}_{Y}\) користејќи податоци:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
каде што \(\bar{Y}^{\text{obs}}_1\) е набљудуваниот резултат (на пример, заработувачка) за оние кои беа охрабрени (на пример, нацртани) и \(\bar{W}^{\text{obs}}_0\) е набљудуваниот исход за оние кои не беа охрабрени.
Конечно, го свртуваме вниманието на ефектот на интерес: ефектот на примарен третман (на пример, воена служба) врз исходот (на пример, заработка). За жал, излегува дека не може, воопшто, да го процениме овој ефект врз сите единици. Сепак, со некои претпоставки, истражувачите можат да го проценат ефектот од третманот врз компликувачите (т.е. луѓето кои ќе служат ако се подготват и луѓето кои нема да служат ако не се подготвени, табела 2.7). Јас ќе го наречам овој процент и комплетниот причинско-последичен ефект (CACE) (кој понекогаш се нарекува и локален просечен ефект на третман , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
каде што \(G_i\) донира групата на лица \(i\) (види табела 2.7) и \(N_{\text{co}}\) е бројот на компликувачи. Со други зборови, eq. 2.11 ги споредува приходите на компликувачите кои се изготвени \(Y_i(1, W_i(1))\) и не се изготвени \(Y_i(0, W_i(0))\) . Проценките во eq. 2.11 изгледа тешко да се процени од набљудуваните податоци, бидејќи не е можно да се идентификуваат комплирите со користење само набљудувани податоци (да се знае дали некој е комплиер, ќе треба да набљудува дали тој служел кога бил подготвен и дали тој служел кога не е изготвен).
Излегува - малку изненадувачки - дека ако има било какви компликувања, тогаш доколку се создадат три дополнителни претпоставки, можно е да се процени CACE од забележани податоци. Прво, треба да се претпостави дека доделувањето на третманот е случајно. Во случај на нацрт лотарија ова е разумно. Сепак, во некои околности каде природните експерименти не се потпираат на физичка рандомизација, оваа претпоставка може да биде попроблематична. Второ, треба да се претпостави дека нивните не се дефразии (оваа претпоставка понекогаш се нарекува претпоставка за монотоност). Во контекст на нацртот се чини разумно да се претпостави дека има многу малку луѓе кои нема да послужат ако изготват и ќе служат ако не се изготвени. Трето, и конечно, доаѓа најважната претпоставка која се нарекува ограничување на исклучувањето . Според ограничувањето на исклучувањето, мора да се претпостави дека целиот ефект од третманот се пренесува преку самиот третман. Со други зборови, мора да се претпостави дека не постои директен ефект на поттикнување на исходите. Во случај на нацрт-лотарија, на пример, треба да се претпостави дека нацрт-статусот нема никакво влијание врз приходите, освен преку воена служба (слика 2.11). Ограничувањето на исклучувањето би можело да се прекрши ако, на пример, луѓето што биле подготвени поминуваат повеќе време во училиште за да избегнат услуга или, пак, ако работодавачите имаат помала веројатност да ангажираат луѓе кои биле подготвени.
Ако овие три услови (случаен доделувањето на третман, без дефибрии и ограничување на исклучувањето) се исполнети, тогаш
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
за да можеме да го процениме CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Еден начин да се размислува за КЕЦС е тоа што тоа е разликата во резултатите помеѓу оние кои беа охрабрени и оние кои не беа охрабрени, надуени од стапката на прифаќање.
Постојат две важни предупредувања кои треба да се имаат на ум. Прво, ограничувањето на исклучувањето е силна претпоставка, и треба да се оправда од случај до случај, што често бара експертиза за предметната област. Ограничувањето на исклучувањето не може да се оправда со рандомизирање на охрабрувањето. Второ, вообичаен практичен предизвик со инструментална променлива анализа доаѓа кога охрабрувањето има мал ефект врз прифаќањето на третманот (кога \(\text{ITT}_W\) е мал). Ова се нарекува слаб инструмент , и тоа доведува до различни проблеми (Imbens and Rosenbaum 2005; Murray 2006) . Еден начин да се размислува за проблемот со слабите инструменти е дека \(\widehat{\text{CACE}}\) може да биде чувствителен на мали предрасуди во \(\widehat{\text{ITT}_Y}\) -потенцијално поради прекршувања на ограничувањето на исклучувањето - затоа што овие предрасуди се зголемуваат со мал \(\widehat{\text{ITT}_W}\) (види ја 2.13). Грубо, ако третманот што природата го доделува нема големо влијание врз третманот за кој се грижите, тогаш ќе имате тешко време за учење за третманот за кој се грижите.
Види поглавја 23 и 24 од Imbens and Rubin (2015) за поформална верзија на оваа дискусија. Традиционалниот економетриски пристап кон инструменталните варијабли обично се изразува во однос на проценката на равенките, а не на потенцијалните исходи. За вовед од оваа друга перспектива, види Angrist and Pischke (2009) , и за споредба помеѓу двата пристапи, види дел 24.6 од Imbens and Rubin (2015) . Алтернативна, малку помалку формална презентација на пристапот на инструментални варијабли е дадена во поглавје 6 од Gerber and Green (2012) . За повеќе за ограничување на исклучувањето, видете D. Jones (2015) . Aronow and Carnegie (2013) опишуваат дополнителен сет на претпоставки кои можат да се користат за проценка на ATE, а не на CACE. За повеќе информации за тоа како природните експерименти може да бидат многу незгодни за толкување, видете Sekhon and Titiunik (2012) . За поопшта запознавање со природните експерименти - оној што оди подалеку од пристапот на инструментални варијабли, исто така, вклучува и дизајни како дисконтинуитет на регресија - видете Dunning (2012) .