В това допълнение ще обобщя някои идеи за вземане на причинно-следствена връзка от не-експериментални данни в малко по-математическа форма. Има два основни подхода: каузалната графична рамка, повечето свързани с Юдея Пърл и колегите, и рамката на потенциалните резултати, най-много свързани с Доналд Рубин и колегите му. Ще се запозная с рамката на потенциалните резултати, защото тя е по-тясно свързана с идеите в математическите бележки в края на глава 3 и 4. За повече информация относно рамката на каузалните графики аз препоръчвам Pearl, Glymour, and Jewell (2016) (уводна ) и Pearl (2009) (напреднали). За лечение на причинно-следствена връзка, която съчетава рамката на потенциалните резултати и рамката на каузалната графика, препоръчвам Morgan and Winship (2014) .
Целта на това приложение е да ви помогне да се чувствате комфортно с нотацията и стила на традицията за потенциалните резултати, така че да можете да преминете към някои от по-техническият материал, написан по тази тема. Първо, ще опиша рамката на потенциалните резултати. След това ще го използвам, за да обсъдим по-нататък естествените експерименти като този на Angrist (1990) относно ефекта на военната служба върху печалбите. Това допълнение привлича много от Imbens and Rubin (2015) .
Рамка на потенциалните резултати
Рамката за потенциалните резултати има три основни елемента: единици , лечение и потенциални резултати . За да илюстрираме тези елементи, нека разгледаме стилизираната версия на въпроса, зададен в Angrist (1990) : Какъв е ефектът от военната служба върху приходите? В този случай можем да определим единиците за хора, отговарящи на условията за проект от 1970 г. в Съединените щати, и можем да индексираме тези хора с \(i = 1, \ldots, N\) . Обработките в този случай могат да бъдат "служещи във военните" или "да не служат в армията". Аз ще нарека тези условия на лечение и контрол и ще напиша \(W_i = 1\) ако човек \(i\) е в състояние на лечение и \(W_i = 0\) ако човек \(i\) е в контролно състояние. И накрая, потенциалните резултати са малко по-концептуално трудни, защото включват "потенциални" резултати; неща, които можеха да се случат. За всяко лице, което отговаря на условията за проектозакона от 1970 г., можем да си представим сумата, която биха спечелили през 1978 г., ако са служили в армията, която ще нарека \(Y_i(1)\) и сумата, която биха спечелили 1978, ако не са служили в армията, която ще нарека \(Y_i(0)\) . В рамките на потенциалните резултати, \(Y_i(1)\) и \(Y_i(0)\) се считат за фиксирани величини, докато \(W_i\) е случайна променлива.
Изборът на единици, лечения и резултати е от решаващо значение, защото определя какво може и не може да се научи от изследването. Изборът на единици - хора, които отговарят на условията за проектозакона от 1970 г. - не включва жените, така че без допълнителни допускания това проучване няма да ни каже нищо за ефекта от военната служба върху жените. Решенията за това как да се определят леченията и резултатите са важни също. Например, ако третирането на интересите трябва да бъде фокусирано върху обслужването във военните или в битката? Трябва ли резултатът от интереса да бъде печалба или удовлетворение от работата? В крайна сметка изборът на единици, лечения и резултати следва да се ръководи от научните и политическите цели на проучването.
Предвид избора на единици, лечения и потенциални резултати, причинно-следственият ефект от лечението върху човек \(i\) , \(\tau_i\) е
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
С други думи, ние сравняваме колко човек \(i\) би получил след излежаване до колко човек \(i\) би получил без да го обслужват. За мен, ук. 2.1 е най-ясният начин за определяне на причинно-следствения ефект и макар и изключително просто, тази рамка се оказва обобщаваща по много важни и интересни начини (Imbens and Rubin 2015) .
Когато използвам рамката за потенциалните резултати, често ми е полезно да напиша таблица, показваща потенциалните резултати и ефектите от лечението за всички звена (таблица 2.5). Ако не сте в състояние да си представите такава маса за вашето изследване, тогава може да се наложи да сте по-точни във вашите дефиниции на вашите единици, лечения и потенциални резултати.
човек | Приходи в третиране | Печалбите в контролно състояние | Лечебен ефект |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Означава | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
При дефинирането на причинно-следствения ефект обаче, ние се сблъскваме с проблем. В почти всички случаи не можем да наблюдаваме и двата потенциални резултата. Тоест, конкретно лице, което е служило или не е служило. Затова наблюдаваме един от потенциалните резултати - \(Y_i(1)\) или \(Y_i(0)\) - но не и двете. Неспособността да се наблюдават и двата потенциални резултата е такъв важен проблем, който Holland (1986) нарече " Основен проблем на причинно-следствената връзка" .
За щастие, когато правим изследвания, не разполагаме само с един човек; по-скоро имаме много хора и това предлага начин около Основния проблем на причинно-следствената връзка. Вместо да се опитваме да оценим индивидуалния ефект на лечението, можем да оценим средния ефект на лечението за всички единици:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Това уравнение все още се изразява като \(\tau_i\) , които са непроследими, но с някаква алгебра (eq 2.8 на Gerber and Green (2012) ), получаваме
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Това показва, че ако може да оцени населението среден резултат при лечение ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) и среден резултат на населението под контрол ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), тогава можем да оценим средния ефект от лечението, дори и без да изчисляваме ефекта на лечение за конкретно лице.
Сега, след като определих оценката си - това, което се опитваме да изчислим - ще се обърна към това как всъщност можем да я оценим с данни. И тук ние се насочваме директно към проблема, който наблюдаваме един от потенциалните резултати за всеки човек; ние виждаме \(Y_i(0)\) или \(Y_i(1)\) (таблица 2.6). Бихме могли да изчислим средния ефект от лечението чрез сравняване на доходите на хората, които са служили за доходите на хора, които не са служили:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
където \(N_t\) и \(N_c\) са числата на хората в условията на лечение и контрол. Този подход ще работи добре, ако назначаването на лечението е независимо от потенциалните резултати, състояние, което понякога се нарича игнориране . За съжаление, при отсъствието на експеримент, невежеството често не е удовлетворено, което означава, че оценителят в еквивалент. 2.4 не е вероятно да доведе до добра оценка. Един от начините да се мисли за това е, че при отсъствието на случайно назначаване на лечение, напр. 2.4 не сравнява с подобни; сравнява печалбите на различни видове хора. Или изразени малко по-различно, без случайно разпределяне на лечението, разпределението на лечението вероятно е свързано с потенциалните резултати.
В глава 4 ще опиша как рандомизираните контролирани експерименти могат да помогнат на изследователите да направят причинно-следствени оценки и тук ще опиша как изследователите могат да се възползват от естествените експерименти, като например проекто лотарията.
човек | Приходи в третиране | Печалбите в контролно състояние | Лечебен ефект |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Означава | ? | ? | ? |
Природни експерименти
Един подход при вземането на каузални оценки, без да се провежда експеримент, е да се търси нещо, което се случва в света, който случайно е назначил лечение за вас. Този подход се нарича природни експерименти . В много ситуации, за съжаление, природата не доставя произволно лечението, което искате, на населението, представляващо интерес. Но понякога природата произвежда случайно свързано лечение. По-специално, ще разгледам случая, когато има някакво вторично лечение, което насърчава хората да получат основното лечение . Например проектът може да се разглежда като произволно присвоено вторично лечение, което насърчава някои хора да предприемат основно лечение, което служи в армията. Този дизайн понякога се нарича стимулиращ дизайн . И методът на анализ, който ще опиша, за да се справя с тази ситуация, понякога се нарича инструментални променливи . При тази настройка, с някои предположения, изследователите могат да използват насърчаването, за да научат за ефекта от първичното лечение за дадена подгрупа единици.
За да се справим с двете различни лечения - насърчаването и първичното лечение - имаме нужда от нова нотация. Да предположим, че някои хора са произволно подготвени ( \(Z_i = 1\) ) или не са изготвени ( \(Z_i = 0\) ); в тази ситуация, \(Z_i\) понякога се нарича инструмент .
Сред тези, които бяха изготвени, някои служеха ( \(Z_i = 1, W_i = 1\) ) и някои не ( \(Z_i = 1, W_i = 0\) ). Също така, сред тези, които не са били изготвени, някои служели ( \(Z_i = 0, W_i = 1\) ) и някои не ( \(Z_i = 0, W_i = 0\) ). Потенциалните резултати за всеки човек вече могат да бъдат разширени, за да покажат статуса си както за насърчаване, така и за лечение. Например, нека \(Y(1, W_i(1))\) е приходите на човек \(i\) ако той е изготвен, където \(W_i(1)\) е неговият сервизен статус. Освен това, можем да разделяме населението на четири групи: подчинени, никога не поемачи, потисници и винаги (таблица 2.7).
Тип | Услуга, ако е съставена | Услуга, ако не е изготвена |
---|---|---|
Compliers | Да, \(W_i(Z_i=1) = 1\) | Не, \(W_i(Z_i=0) = 0\) |
Никога вземащите | Не, \(W_i(Z_i=1) = 0\) | Не, \(W_i(Z_i=0) = 0\) |
Defiers | Не, \(W_i(Z_i=1) = 0\) | Да, \(W_i(Z_i=0) = 1\) |
Винаги вземащите | Да, \(W_i(Z_i=1) = 1\) | Да, \(W_i(Z_i=0) = 1\) |
Преди да обсъдим оценката на ефекта от лечението (т.е. военната служба), първо можем да определим два ефекта от насърчаването (т.е., подготвянето). Първо, можем да определим ефекта от насърчаването върху първичното лечение. Второ, можем да определим ефекта от насърчаването върху резултата. Ще се окаже, че тези два ефекта могат да бъдат комбинирани, за да се даде оценка на ефекта от лечението върху определена група хора.
Първо, ефектът от насърчаването върху лечението може да бъде определен за човек \(i\) като
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Освен това, това количество може да бъде определено за цялото население като
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Накрая, можем да преценим \(\text{ITT} _{W}\) като използваме данни:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
където \(\bar{W}^{\text{obs}}_1\) е наблюдаваната скорост на лечение за онези, които са били насърчени и \(\bar{W}^{\text{obs}}_0\) наблюдаваната скорост на лечение за тези, които не са били насърчавани. \(\text{ITT}_W\) понякога се нарича процент на усвояване .
След това, ефектът от насърчаването върху резултата може да бъде определен за човек \(i\) като:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Освен това, това количество може да бъде определено за цялото население като
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
И накрая, можем да преценим \(\text{ITT}_{Y}\) използвайки данните:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
където \(\bar{Y}^{\text{obs}}_1\) е наблюдаван изход (напр приходи) за тези, които са били насърчавани (например, изготвен) и \(\bar{W}^{\text{obs}}_0\) е наблюдаваният резултат за тези, които не са били насърчавани.
Накрая обръщаме вниманието си върху ефекта на интереса: ефектът от първичното лечение (напр. Военната служба) върху резултата (напр. Приходи). За съжаление се оказва, че по принцип не може да се оцени този ефект върху всички единици. Въпреки това, с някои предположения, изследователите могат да преценят ефекта от лечението върху съблазнителите (т.е. хората, които ще работят, ако са изготвени, и хората, които няма да служат, ако не са изготвени, таблица 2.7). Ще наричам това оценяване на средната причинно-следствена връзка (CACE) (която понякога се нарича местен ефект на средното лечение , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
където \(G_i\) дарява групата на човека \(i\) (виж таблица 2.7) и \(N_{\text{co}}\) е броят на компилаторите. С други думи, ур. 2.11 сравнява приходите на съставителите, които са изготвени \(Y_i(1, W_i(1))\) и не са изготвени \(Y_i(0, W_i(0))\) . Оценката в еквивалент. 2.11 изглежда трудно да се прецени от наблюдаваните данни, тъй като не е възможно да се идентифицират съставителите, използващи само наблюдаваните данни (за да разберете дали някой е съставител, трябва да се съобразите дали той служи при изготвянето му и дали е служил, когато не е изготвен).
Оказва се - донякъде изненадващо - че ако има съставители, тогава ако се направят три допълнителни предположения, е възможно да се изчисли CACE от наблюдаваните данни. Първо, човек трябва да приеме, че задачата за лечение е случайна. В случая на проекто лотарията това е разумно. Въпреки това, в някои ситуации, при които естествените експерименти не разчитат на физическа рандомизация, това предположение може да бъде по-проблематично. Второ, трябва да приемем, че техните не са погребващи (това предположение се нарича понякога и монотонното предположение). В контекста на проекта се оказва разумно да се приеме, че има много малко хора, които няма да служат, ако бъдат съставени и ще служат, ако не бъдат съставени. Трето и накрая идва най-важното предположение, което се нарича ограничение за изключване . Съгласно ограничението за изключване трябва да се приеме, че целият ефект от заданието за лечение се предава през самата терапия. С други думи, човек трябва да приеме, че няма директен ефект на насърчаване на резултатите. В случая на проекто лотария, например, трябва да се приеме, че проектът на статут няма влияние върху приходите, различни от военната служба (фигура 2.11). Ограничението за изключване би могло да бъде нарушено, ако например хората, които бяха изготвени, прекарваха повече време в училище, за да избегнат служене или ако работодателите имаха по-малка вероятност да наемат хора, които са били изготвени.
Ако тези три състояния (случайно присвояване на лечение, без почистващи средства и ограничение за изключване) са изпълнени, тогава
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
така че можем да изчислим CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Един от начините да се мисли за CACE е, че това е разликата в резултатите между онези, които са били насърчени и онези, които не са насърчавани, напомпани от степента на усвояване.
Има две важни предупреждения, които трябва да имате предвид. На първо място, ограничението за изключване е силно предположение и трябва да бъде обосновано за всеки отделен случай, което често изисква експертиза от областта. Ограничението на изключването не може да бъде обосновано с рандомизиране на насърчаването. Второ, общо практическо предизвикателство с инструментален променлив анализ идва, когато насърчаването оказва малко влияние върху усвояването на лечението (когато \(\text{ITT}_W\) е малък). Това се нарича слаб инструмент и води до редица проблеми (Imbens and Rosenbaum 2005; Murray 2006) . Един от начините да се мисли за проблема със слабите инструменти е, че \(\widehat{\text{CACE}}\) може да бъде чувствителен към малки предубеждения в \(\widehat{\text{ITT}_Y}\) нарушения на ограничението за изключване - защото тези отклонения се увеличават с малка \(\widehat{\text{ITT}_W}\) (виж уравнение 2.13). Приблизително, ако лечението, което природата възлага, няма голямо влияние върху лечението, за което се грижите, тогава ще имате трудно време да научите за лечението, което ви интересува.
Вижте глава 23 и 24 от Imbens and Rubin (2015) за по-формална версия на тази дискусия. Традиционният иконометричен подход към инструменталните променливи обикновено се изразява по отношение на оценката на уравненията, а не на потенциалните резултати. За въвеждане от тази друга гледна точка, вижте Angrist and Pischke (2009) , а за сравнение между двата подхода вижте раздел 24.6 от Imbens and Rubin (2015) . Алтернативно, малко по-малко формално представяне на подхода за инструменталните променливи е дадено в глава 6 от " Gerber and Green (2012) . За повече информация относно ограничението за изключване вижте D. Jones (2015) . Aronow and Carnegie (2013) описват допълнителен набор от предположения, които могат да се използват за оценка на ATE, а не на CACE. За повече информация относно това, как естествените експерименти могат да бъдат много трудни за интерпретация, вижте Sekhon and Titiunik (2012) . За по-общо внедряване на естествените експерименти - това, което надхвърля само инструменталните променливи, включва и проекти като регресионното прекъсване - вижте Dunning (2012) .