Природните експерименти имаат предност на случајни настани во светот. случаен настан + секогаш на систем за податоци = природен експеримент
Клучот за рандомизирани контролирани експерименти овозможување фер споредба е рандомизација. Сепак, понекогаш нешто се случува во светот, која суштински се доделува луѓе по случаен избор или речиси по случаен избор на различни третмани. Еден од најјасните примери на стратегијата на користење на природни експерименти доаѓа од истражувањето на Angrist (1990) , кој го мери ефектот на воени служби на приходи.
За време на војната во Виетнам, САД се зголеми големината на своите вооружени сили преку предлог. Со цел да се одлучи кој граѓаните ќе се нарече во употреба, американската влада одржана на лотарија. Секој датум на раѓање беше претставена на парче хартија, а овие документи беа ставени во голема стаклена тегла. Како што е прикажано на слика 2.5, овие изводи од хартија беа извлечени од тегла еден по еден да се одреди редоследот дека младите мажи ќе бидат повикани да служат (млади жени не биле предмет на нацрт). Врз основа на резултатите, луѓето родени на 14 септември се нарекуваа, луѓето родени на 24 април беа повикани вториот, и така натаму. На крајот на краиштата, во оваа лотарија, луѓето родени на 195 различни денови беа повикани на услуги, додека мажите родени на 171 дена не беа повикани.
И покрај тоа што не може да бидат веднаш видливи, нацрт лотарија има критична сличност со една рандомизирана контролирана експеримент: и во двете ситуации учесници по случаен избор да добијат третман. Во случај на нацрт-лотарија, ако ние сме заинтересирани да дознаете повеќе за ефектите на нацрт-подобност и воена служба за дополнителна заработка на пазарот на трудот, можеме да ги споредиме резултатите за луѓето чии birthdates беа под исклучување на лотарија (на пример, Септември 14, април 24, итн) со резултати за луѓето чии родендени беа по исклучување (на пример, февруари 20, 2 декември, итн.)
Со оглед дека овој третман на изготвување е по случаен избор, тогаш може да се измери ефектот на овој третман за било каква исход кој се мери. На пример, Angrist (1990) во комбинација со информации за тоа кој беше случајно избрани во нацрт со податоци приходи кои се собрани од страна на Управата за социјална сигурност да се заклучи дека приходите на бела ветерани беа околу 15% помалку во однос на приходите на споредливи не-ветерани . Други истражувачи се користи сличен трик, како и. На пример, Conley and Heerwig (2011) во комбинација со информации за тоа кој беше случајно избрани во нацрт со апарати за домаќинство собраните податоци од истражувањето во 2000 година пописот и 2005 година американската заедница и покажа дека толку долго по предлог, имаше малку долгорочен ефект на воена служба на различни резултати, како што се станови мандат (сопственик наспроти изнајмување) и станбени стабилност (веројатноста откако се пресели во претходните пет години).
Како овој пример ги илустрира, а понекогаш и социјални, политички, или природните сили создаде експерименти или во близина на експерименти, кои можат да бидат балон од страна на истражувачите. Често природни експерименти се најдобар начин да се процени причинско-последичните врски во подесувањата каде што не е етички или практично да се кандидира рандомизирани контролирани експерименти. Тие се важен стратегија за откривање на фер споредби во не-експериментални податоци. Ова истражување стратегија може да се сумира со равенката:
\ [\ текст {случаен избор (или како по случаен избор) настан} + \ текст {секогаш на податоци поток} = \ текст {природен експеримент} \ qquad (2.1) \]
Сепак, анализата на природни експерименти може да биде прилично слабо. На пример, во случај на нацрт Виетнам, не секој кој беше нацрт-право завршија служат (имаше голем број на исклучоци). И, во исто време, некои луѓе кои не беа нацрт-право доброволно за услугата. Тоа беше како во клиничко тестирање на новиот лек, некои луѓе во третманот група не ги преземе своите лекови и некои од луѓето во контролната група некако доби дрога. Овој проблем, наречен двострани неусогласеност, како и многу други проблеми, се опишани во детали во некои од Препорачана литература на крајот од ова поглавје.
Стратегијата за искористување на природно-настанатите случаен задача му претходи на дигиталната ера, но преваленцата на големи податоци ја прави оваа стратегија е многу полесно да го користите. Откако ќе сфатат некои третман е доделен случајно, големи извори на податоци може да обезбеди податоци за резултатите кои ви се потребни со цел да се споредат резултатите за луѓето во условите за третман и контрола. На пример, во неговата студија за ефектите на нацртот и на воената служба, Angrist направи употреба на приходи записи од Управата за социјална заштита; без овој исход податоци, неговата студија не би било можно. Во овој случај, Управата за социјална заштита е голем извор на податоци секогаш-на. Како што постојат се повеќе и повеќе автоматски собрани извори на податоци, ќе имаме повеќе исходот на податоци што може да се измери влијанието на промените создадена од егзогени варијација.
За да се илустрира оваа стратегија во дигиталната ера, ајде да се разгледа Мас и Морети е (2009) елегантен истражување на влијанието на врсниците врз продуктивноста. Иако на површината тоа може да изгледа различно од студијата Angrist во врска со ефектите од Предлог Виетнам, во структурата и двајцата го следат моделот во eq. 2.1.
Мас и Морети мери како врсниците влијае на продуктивноста на работниците. Од една страна, има напорна работа од врсниците може да доведе работниците да ја зголемат нивната продуктивност поради притисок од врсниците. Или, пак, од друга страна, напорниот работен врсниците може да доведе другите работници да гасена исклучени дури и повеќе. Најјасниот начин да учат врсниците ефекти врз продуктивноста ќе биде рандомизирани контролирани експеримент каде што работниците се случајно доделен на смени со работниците од различни нивоа на продуктивност, а потоа како резултат на продуктивноста се мери за секого. Истражувачи, сепак, не за контрола на распоред на работниците во која било вистинска бизнис, и така Мас и Морети мораше да се потпре на природен експеримент кој се одржа во еден супермаркет.
Исто како eq. 2.1, нивната студија имаше два дела. Прво, тие се користат на логови од системот на супермаркет исходот да имаат прецизна, индивидуална, и секогаш на мерка на продуктивноста: бројот на предмети скенирани во секунда. И, второ, поради начинот на кој распоред беше направено во овој супермаркет, тие се во близина случаен состав на врсници. Со други зборови, иако закажување на касиери не се утврдува со лотарија, тоа во суштина беше случаен. Во пракса, довербата што ја имаме во природни експерименти често зависи од однесувањето на тоа "како-да" случајни барање. Искористувајќи ја случајни варијации, Мас и Морети покажа дека работат со повисоки врсници продуктивност се зголемува продуктивноста. Понатаму, Мас и Морети користи големината и богатството на нивните базата да се движат надвор од проценка на причинско-последичниот да се истражуваат уште две важни и суптилни прашања: хетерогеност на овој ефект (за кои видови на работниците е ефектот поголем) и механизам зад ефект (зошто имаат висока продуктивност врсници доведе до поголема продуктивност). Ние ќе се врати на овие две важни прашања, хетерогеноста на третман ефекти и механизми во Поглавје 5 кога ќе дискутираме за експерименти во повеќе детали.
Генерализирање од студии за ефектот на Предлог Виетнам на приходите и проучување на влијанието на врсниците врз продуктивноста, Табела 2.3 ги сумира други студии кои ја имаат оваа иста структура: користење секогаш на извор на податоци за да се измери влијанието на некој настан . Како Табела 2.3 јасно, природни експерименти се насекаде ако само знаат како да се погледне за нив.
суштински фокус | Извор на природен експеримент | Секогаш на извор на податоци | цитат |
---|---|---|---|
Peer ефекти врз продуктивноста | распоред процес | исходот на податоци | Mas and Moretti (2009) |
формирање пријателство | урагани | Фејсбук | Phan and Airoldi (2015) |
Ширењето на емоции | дожд | Фејсбук | Coviello et al. (2014) |
Пер се воспостави економски трансфери | земјотрес | податоци за мобилни пари | Blumenstock, Fafchamps, and Eagle (2011) |
однесување лична потрошувачка | 2013 САД влада исклучување | лични финансии податоци | Baker and Yannelis (2015) |
Економското влијание на препораки системи | различни | прелистување податоци во Амазон | Sharma, Hofman, and Watts (2015) |
Ефектот на стрес на неродените бебиња | 2006 Израел и Хезболах војна | досиејата | Torche and Shwed (2015) |
однесување читање на Википедија | Сноуден откровенија | Википедија логови | Penney (2016) |
Во пракса, истражувачите користат две различни стратегии за наоѓање природни експерименти, од кои и двете може да биде плодна. Некои истражувачи се започне со извор на секогаш-на податоци и за случајни настани во светот; другите почнуваат со случајни настани во светот и за изворите на податоци кои ја доловуваат нивното влијание се погледне. Конечно, да се забележи дека силата на природни експерименти не доаѓа од софистицираноста на статистичка анализа, но од грижа за откривање на фер споредба создадена од страна среќна несреќа во историјата.