Гэты дадатак я буду сумаваць некаторыя ідэі аб тым, што робіць прычынны вывад з неэкспериментальных дадзеных у крыху больш матэматычнай форме. Ёсць два асноўных падыходу: прычынная структура графа, найбольш цесна звязаныя з юдэямі Pearl і калегамі, а таксама патэнцыйная база вынікаў, найбольш цесна звязаныя з Дональдам Рубін і яго калегамі. Я прадстаўлю рамкі патэнцыйных зыходаў , паколькі яна больш цесна звязаны з ідэямі ў матэматычных заўвагах у канцы кіраўніка 3 і 4. Больш падрабязнай інфармацыі аб прычынных рамках графікаў, я рэкамендую Pearl, Glymour, and Jewell (2016) (уступныя ) і Pearl (2009) (прасунуты). Для кнігі даўжынёй лячэння прычыннай высновы , які спалучае ў сабе патэнцыйнай аснове вынікаў і прычынную структуру графа, я рэкамендую Morgan and Winship (2014) .
Мэта гэтага прыкладання, каб дапамагчы вам асвоіцца з пазначэннямі і стылем традыцыі патэнцыйных вынікаў, так што вы можаце перайсці да некаторых з больш тэхнічнага матэрыялу, напісанага на гэтую тэму. Па-першае, я апішу рамкі патэнцыйных вынікаў. Тады, я буду выкарыстоўваць яго для далейшага абмеркавання натурных эксперыментаў , як адзін за Angrist (1990) пра ўплыў ваеннай службы на заробках. Гэта дадатак у значнай ступені абапіраецца на Imbens and Rubin (2015) .
Рамкі Патэнцыйныя вынікі
Патэнцыйная база вынікаў складаецца з трох асноўных элементаў: блокі, працэдуры і магчымыя вынікі. Для таго , каб праілюстраваць гэтыя элементы, давайце разгледзім стылізаваную версію пытання , адрасаванага ў Angrist (1990) : Што такое ўплыў ваеннай службы на заробкі? У гэтым выпадку мы можам вызначыць адзінкі , каб людзі , якія маюць права на 1970 праект у Злучаных Штатах, і мы можам індэксаваць гэтыя людзі па \(i = 1, \ldots, N\) . Лячэнне ў гэтым выпадку можа быць «на ваеннай службе» або «не служыў у войску.» Я буду называць іх лячэння і кантролю умоў, і я буду пісаць \(W_i = 1\) , калі чалавек \(i\) знаходзіцца ў стане апрацоўкі і \(W_i = 0\) , калі чалавек \(i\) знаходзіцца ў стане кіравання. Нарэшце, патэнцыйныя вынікі з'яўляюцца крыху больш канцэптуальна цяжка , таму што яны звязаны з «патэнцыяльнымі» вынікі; рэчы, якія маглі б адбыцца. Для кожнага асобы , якая мае права на праект 1970 году, мы можам прадставіць сабе суму , якую яны зарабілі ў 1978 годзе , калі яны служылі ў войску, якую я буду называць \(Y_i(1)\) , і сумы , якую яны зарабілі б у 1978 , калі яны не служылі ў войску, якую я буду называць \(Y_i(0)\) . У рамках магчымых зыходаў, \(Y_i(1)\) і \(Y_i(0)\) лічацца фіксаванымі велічынямі, а \(W_i\) з'яўляецца выпадковай велічынёй.
Выбар адзінак, лячэння і вынікаў мае вырашальнае значэнне, паколькі ён вызначае, што можа-і не можа-быць вынята з даследавання. Выбар адзінкі-людзі, якія маюць права на 1970 скразнякі не ўключае ў сябе жанчына, і так без дадатковых здагадак, дадзенае даследаванне не кажа нам нічога пра ўплыў ваеннай службы на жанчынах. Рашэння аб тым, як вызначыць працэдуры і вынікі маюць важнае значэнне, а таксама. Напрыклад, калі лячэнне цікавасць будзе засяроджана на абслугоўванні ва ўзброеных сілах ці адчувае бой? У выпадку, калі вынік будзе цікавасць даходы або задавальненне ад працы? У канчатковым рахунку, выбар адзінак, лячэння і вынікі павінны вызначацца навуковымі і палітычнымі мэтамі даследавання.
Улічваючы выбар адзінак, метадаў лячэння, а таксама магчымых вынікаў, прычыннага ўплыву лячэння на чалавека \(i\) , \(\tau_i\) , з'яўляецца
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Іншымі словамі, мы параўнаем , колькі чалавек \(i\) зарабілі б пасьля адбыцьця таго , колькі чалавек \(i\) зарабілі б без абслугоўвання. Для мяне, ек. 2.1 найзыркі спосаб вызначыць прычынна - выніковую сувязь, і хоць вельмі просты, гэта структура абагульненым ў многіх важных і цікавых спосабах (Imbens and Rubin 2015) .
Пры выкарыстанні базы патэнцыйных вынікаў, я часта знаходжу, што карысна выпісаць табліцу, якая паказвае магчымыя вынікі і наступствы лячэння для ўсіх адзінак (табліца 2.5). Калі вы не ў стане ўявіць сабе табліцу, як гэта для вашага даследавання, то вам, магчыма, давядзецца быць больш дакладным у вызначэннях вашых адзінак, лячэння і магчымых зыходаў.
чалавек | Заробак у стане лячэння | Заробак у стане кіравання | вынік лячэння |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
сярэдняе | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Пры вызначэнні прычынна-следчай сувязі ў гэтым выпадку, аднак, мы сутыкнуліся з праблемай. Амаль ва ўсіх выпадках мы не атрымліваем назіраць як патэнцыйныя вынікі. То ёсць канкрэтны чалавек альбо служыў ці не служыў. Такім чынам, мы назіраем адзін з патэнцыйных outcomes- \ \(Y_i(1)\) або \(Y_i(0)\) бут ня абодва. Няздольнасць назіраць як патэнцыйныя вынікі такой сур'ёзнай праблема , якая Holland (1986) назвала гэта фундаментальнай праблемай прычынных высноў.
На шчасце, калі мы робім даследаванні, мы не толькі адзін чалавек; хутчэй, у нас ёсць шмат людзей, і гэта адкрывае шлях вакол фундаментальнай праблемы каузальных высноў. Замест таго каб паспрабаваць ацаніць эфект лячэння на індывідуальным узроўні, мы можам ацаніць сярэдні эфект лячэння для ўсіх адзінак:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Гэта раўнанне яшчэ выяўляецца ў тэрмінах \(\tau_i\) , якія з'яўляюцца невідавочнымі, але з некаторай алгебрай (ек 2.8 з Gerber and Green (2012) ), мы атрымліваем
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Гэта паказвае , што , калі мы зможам ацаніць насельніцтва сярэдняга выніку пры лячэнні ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) і насельніцтва сярэдняга выніку пад кантролем ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), то можна ацаніць сярэдні эфект лячэння, нават без ацэнкі эфекту лячэння для любога канкрэтнага чалавека.
Цяпер, калі я вызначыў нашу estimand-рэч мы спрабуем ацаніць-я звярнуцца да таго, як мы можам рэальна ацаніць яго з дадзенымі. І тут мы сутыкаемся непасрэдна ў праблему, што мы толькі назіраем адзін з магчымых вынікаў для кожнага чалавека; мы бачым , як \(Y_i(0)\) або \(Y_i(1)\) (табліца 2.6). Мы маглі б ацаніць сярэдні эфект лячэння, параўноўваючы прыбыткі людзей, якія служылі для заробку людзей, якія не служылі:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
дзе \(N_t\) і \(N_c\) з'яўляюцца колькасці людзей у лячэбных і кантрольных умовах. Такі падыход будзе працаваць добра , калі прызначэнне лячэння не залежыць ад патэнцыйных вынікаў, стан часам называюць ignorability. На жаль, у адсутнасць эксперыменту, ignorability не часта задавальняецца, што азначае, што ацэнка ў раўнанні. 2,4, хутчэй за ўсё, для атрымання добрай адзнакі няма. Адзін са спосабаў думаць пра гэта з'яўляецца тое, што ў адсутнасць рандомизации лячэння, ек. 2.4 ня параўноўваючы падобнае з падобным; яна параўноўвае заробкі розных людзей. Ці выяўлены нязначна адрозніваюцца, без рандомизации лячэння, прызначэнне лячэння, верагодна, звязана з патэнцыяльнымі вынікамі.
У разьдзеле 4 я апішу, як рандомізірованный кантраляваныя эксперыменты могуць дапамагчы даследчыкам зрабіць ацэнкі прычыннай, і тут я апішу, як даследчыкі могуць скарыстацца натурнымі эксперыментамі, такіх як праект латарэі.
чалавек | Заробак у стане лячэння | Заробак у стане кіравання | вынік лячэння |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
сярэдняе | ? | ? | ? |
натуральныя эксперыменты
Адзін з падыходаў да стварэння ацэнкі прычынных без правядзення эксперыменту, каб шукаць нешта, што адбываецца ў свеце, які рандомізірованный на лячэнне для Вас. Такі падыход называецца натурныя эксперыменты. У многіх выпадках, на жаль, прырода не выпадкова даставіць лячэнне, якое вы хочаце цікавасць насельніцтва. Але часам прырода выпадковым чынам забяспечвае адпаведную апрацоўку. У прыватнасці, я буду разглядаць выпадак , калі ёсць некаторая другасная апрацоўка , якая падахвочвае людзей атрымаць першасную апрацоўку. Напрыклад, праект можа разглядацца як рандомізірованного другаснай апрацоўкай, якая заахвочвала некаторыя чалавек узяць на сябе першасную апрацоўку, якая адбывала ў войску. Гэтая канструкцыя часам завецца дызайнам заахвочвання. І метады аналізу , які я апішу справіцца з гэтай сітуацыяй часам называюць інструментальныя зменнымі. У гэтых умовах, з некаторымі дапушчэннямі, даследчыкі могуць выкарыстоўваць падтрымку, каб даведацца пра ўплыў першаснай апрацоўкі для канкрэтнага падмноства адзінак.
Для таго, каб справіцца з двума рознымі апрацоўкамі-падбадзёрвання і першаснай апрацоўкай, нам патрэбныя новыя абазначэння. Выкажам здагадку , што некаторыя людзі выпадкова распрацаваны ( \(Z_i = 1\) ) або не падрыхтаваны ( \(Z_i = 0\) ); у гэтай сітуацыі, \(Z_i\) часам называюць інструментам.
Сярод тых , хто быў прызваны, некаторыя служылі ( \(Z_i = 1, W_i = 1\) ) і некаторыя з іх не зрабiў ( \(Z_i = 1, W_i = 0\) ). Акрамя таго, сярод тых , хто не былі падрыхтаваныя, некаторыя служылі ( \(Z_i = 0, W_i = 1\) ) і некаторыя з іх не ( \(Z_i = 0, W_i = 0\) ). Патэнцыйныя вынікі для кожнага чалавека зараз могуць быць пашыраныя, каб паказаць свой статус як для заахвочвання і лячэння. Напрыклад, хай \(Y(1, W_i(1))\) будзе заробак чалавека \(i\) , калі ён быў запісаны, дзе \(W_i(1)\) з'яўляецца яго статус службы , калі складзены. Акрамя таго, мы можам падзяліць насельніцтва на чатыры групы: законапаслухмяныя, ніколі не бяруць, defiers, і заўсёды бяручыя (табліца 2.7).
тып | Сэрвіс, калі падрыхтаваны | Паслугі, калі не складзены |
---|---|---|
законапаслухмяных | Так, \(W_i(Z_i=1) = 1\) | Няма, \(W_i(Z_i=0) = 0\) |
Ніколі-бяручыя | Няма, \(W_i(Z_i=1) = 0\) | Няма, \(W_i(Z_i=0) = 0\) |
Defiers | Няма, \(W_i(Z_i=1) = 0\) | Так, \(W_i(Z_i=0) = 1\) |
Заўсёды-бяручыя | Так, \(W_i(Z_i=1) = 1\) | Так, \(W_i(Z_i=0) = 1\) |
Перш чым мы абмяркуем ацэнкі эфекту лячэння (напрыклад, ваеннай службы), мы можам спачатку вызначыць два эфекты заахвочвання (гэта значыць, на стадыі распрацоўкі). Па-першае, мы можам вызначыць уплыў заахвочвання на першаснай апрацоўцы. Па-другое, мы можам вызначыць уплыў заахвочвання на вынік. Атрымаецца, што гэтыя два эфекту могуць быць аб'яднаныя, каб забяспечыць ацэнку ўплыву лячэння на пэўнай групе людзей.
Ва- першых, эфект заахвочвання на лячэнне можа быць вызначана для чалавека \(i\) як
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Акрамя таго, гэтая велічыня можа быць вызначана па ўсёй папуляцыі ў
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Нарэшце, мы можам ацаніць \(\text{ITT} _{W}\) з выкарыстаннем дадзеных:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
дзе \(\bar{W}^{\text{obs}}_1\) з'яўляецца назіраная хуткасць лячэння для тых , хто заахвочваў і \(\bar{W}^{\text{obs}}_0\) з'яўляецца назіраная хуткасць лячэння для тых, хто не заахвочваліся. \(\text{ITT}_W\) таксама часам называюць хуткасць паглынання.
Далей, эфект заахвочвання на вынік можа быць вызначаны для чалавека \(i\) , як:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Акрамя таго, гэтая велічыня можа быць вызначана па ўсёй папуляцыі ў
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Нарэшце, мы можам ацаніць \(\text{ITT}_{Y}\) з выкарыстаннем дадзеных:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
дзе \(\bar{Y}^{\text{obs}}_1\) з'яўляецца назіраны вынік (напрыклад, прыбытак) для тых , хто былі заахвочаны (напрыклад, распрацаваны) і \(\bar{W}^{\text{obs}}_0\) з'яўляецца назіраны вынік для тых , хто не заахвочваліся.
Нарэшце, звернем увагу на эфект цікавасці: эфект першаснага лячэння (напрыклад, ваенная служба) па выніках (напрыклад, прыбытак). На жаль, атрымліваецца, што адзін не можа, увогуле, ацаніць гэты эфект на ўсіх адзінках. Тым не менш, з некаторымі дапушчэннямі, даследчыкі могуць ацаніць эфект лячэння на законапаслухмяных (гэта значыць, людзі, якія будуць служыць, калі распрацаваны і людзі, якія не будуць служыць, калі не складзены, табліца 2.7). Я буду называць гэта estimand ў кампілятар сярэдняй прычынна - следчай сувязі (Стасе) (які таксама часам называюць мясцовы сярэдні эфект лячэння, пазней):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
дзе \(G_i\) ахвяруе групу чалавек \(i\) (табліца 2.7) і \(N_{\text{co}}\) ёсць лік законапаслухмяных. Іншымі словамі, экв. 2,11 параўноўвае даходы законапаслухмяных , якія распрацоўваюцца \(Y_i(1, W_i(1))\) і ня складзеныя \(Y_i(0, W_i(0))\) . Estimand ў раўнанні. 2,11 здаецца, цяжка ацаніць з назіраных дадзеных, таму што гэта не ўяўляецца магчымым вызначыць законапаслухмяныя, выкарыстоўваючы толькі дадзеныя назіранняў (каб ведаць, калі хто-то кампілятар вы павінны назіраць служыў ён калі падрыхтаваны і служыў ён, калі не падрыхтавана).
Аказваецца, што некалькі дзіўна, што калі ёсць якая-небудзь законапаслухмяныя, то пры ўмове, адзін робіць тры дадатковых здагадак, можна ацаніць CACE з назіраных дадзеных. Па-першае, трэба меркаваць, што прызначэнне лячэння з'яўляецца выпадковым. У выпадку праекта латарэі гэта разумна. Аднак, у некаторых месцах, дзе натуральныя эксперыменты не належаць на фізічных рандомизациях, гэта здагадка можа быць больш праблематычным. Па-другое, трэба меркаваць, што іх няма defiers (гэта здагадка таксама часам называюць манатоннасці здагадка). У кантэксце праекта ўяўляецца разумным выказаць здагадку, што існуе вельмі мала людзей, якія не будуць служыць, калі распрацаваны і будуць служыць, калі не падрыхтаваны. В- трэцяе, і , нарэшце, надыходзіць самы важны здагадка , якое называецца абмежаванне выключэнні. Пад абмежаваннем выключэння, трэба меркаваць, што ўсё дзеянне заданні апрацоўкі перадаецца праз само лячэнне. Іншымі словамі, трэба меркаваць, што не існуе прамой эфект стымулявання на выніках. У выпадку праекта латарэі, напрыклад, трэба меркаваць, што праект статус не мае ніякага ўплыву на іншых, чым праз ваенную службу (мал 2,11) прыбытак. Звужэнне выключэнне можа быць парушаны, калі, напрыклад, людзі, якія былі распрацаваны правёў больш часу ў школе, каб пазбегнуць службы або калі працадаўцы былі менш схільныя наймаць людзей, якія былі распрацаваны.
Калі гэтыя тры ўмовы (выпадковае размеркаванне для лячэння, без якіх-небудзь defiers, і абмежаванне выключэнні) выкананыя, то
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
такім чынам, мы можам ацаніць CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Адзін са спосабаў думаць пра CACE з'яўляецца тое, што розніца ў выніках паміж тымі, хто заахвочваў і тыя, якія не рэкамендуецца, завышаныя хуткасць паглынання.
Ёсць два важных перасцярог, каб мець на ўвазе. Па-першае, абмежаванне выключэння моцнае здагадка, і яно павінна быць абгрунтавана ў кожным канкрэтным выпадку на індывідуальнай аснове, якая часта патрабуе прадметна-вобласці ведаў. Абмежаванне выключэння не можа быць апраўдана з рандомизации заахвочвання. Ва- другое, агульная практычная задача з інструментальнай зменнай аналізу прыходзіць тады , калі заахвочванне аказвае нязначнае ўплыў на паглынанне лячэння (пры \(\text{ITT}_W\) мала). Гэта называецца слабым інструментам, і гэта прыводзіць да розных праблемах (Imbens and Rosenbaum 2005; Murray 2006) . Адзін з спосабаў думаць аб праблеме са слабымі інструментамі з'яўляецца тое , што \(\widehat{\text{CACE}}\) могуць быць адчувальныя да невялікіх ухілаў ў \(\widehat{\text{ITT}_Y}\) -potentially з - за парушэнні выключэння абмежаванні, таму што гэтыя ухілы атрымаць павялічаную невялікім \(\widehat{\text{ITT}_W}\) (гл. 2.13). Груба кажучы, калі лячэнне, што прырода спадкаемцы не аказвае вялікі ўплыў на лячэнні вы клапоціцеся о, то вы будзеце мець цяжкі час навучання аб лячэнні вы клапоціцеся аб.
Глядзіце раздзел 23 і 24 Imbens and Rubin (2015) для больш фармальнай версіі гэтай дыскусіі. Традыцыйны эканаметрычнага падыход да інструментальным пераменнаму, як правіла, выяўляюцца ў тэрмінах якія ацэньваюць раўнанняў, а не патэнцыйныя вынікаў. Для ўвядзення з гэтым іншага пункту гледжання, см Angrist and Pischke (2009) , а таксама для параўнання паміж гэтымі двума падыходамі, глядзіце раздзел 24.6 Imbens and Rubin (2015) . Альтэрнатывай, крыху менш за фармальная прэзентацыя падыход інструментальных зменных прыведзены ў главе 6 Gerber and Green (2012) . Больш падрабязную інфармацыю аб абмежаванні выключэнняў см D. Jones (2015) . Aronow and Carnegie (2013) апісваюць дадатковы набор дапушчэнняў , якія могуць быць выкарыстаны для ацэнкі Ату , а не CACE. Больш падрабязную інфармацыю аб тым , як натуральныя эксперыменты могуць быць вельмі складана інтэрпрэтаваць, см Sekhon and Titiunik (2012) . Для больш агульнае ўвядзенне ў натуральных эксперыментаў адзін год, які выходзіць за межы толькі інструментальных зменных падыходу таксама ўключаюць у сябе праекты , такія як рэгрэсіі разрыву, см Dunning (2012) .