2.4.3.1 Přirozené experimenty

Přirozené experimenty využít náhodných jevů ve světě. náhodný jev + trvalé připojení k souborovému systému = přirozený experiment

Klíčem k randomizované kontrolované experimenty umožňující spravedlivé srovnání je randomizace. Nicméně, občas se něco děje ve světě, který v podstatě přiřazuje lidi náhodně nebo téměř náhodně na různé procedury. Jeden z nejjasnějších příkladů strategie použití přírodních experimenty pochází z výzkumu Angrist (1990) , který měří vliv vojenských služeb na zisku.

Během války ve Vietnamu, ve Spojených státech zvýšil o velikosti svých ozbrojených sil přes průvanu. Aby bylo možné rozhodnout, které občané by být povolán do služby, americká vláda uspořádala loterii. Každé datum narození byla zastoupena na kus papíru, a tyto dokumenty byly umístěny do velké skleněné nádoby. Jak ukazuje obrázek 2.5, tyto kousky papíru byly čerpány z nádoby jeden po druhém k ​​určení pořadí, že mladí lidé by se dalo nazvat sloužit (mladé ženy nebyly předmětem návrhu). Na základě výsledků, muži narodil 14. září byly volány první, muži narodil 24. dubna byl volán druhý, a tak dále. Nakonec, v této loterii, muži narozené ve 195 různých dnech byli povoláni ke službě zatímco muži narozené ve 171 dnech byly nepozval.

Obrázek 2.5: kongresman Alexander Pirnie (R-NY) sestavení první kapsle pro návrh Selective Service dne 1. prosince 1969. Joshua Angrist (1990) v kombinaci návrh loterii s údaji o příjmech ze správy sociálního zabezpečení odhadnout vliv vojenské služby na zisku. To je příklad výzkumu za použití přirozený experiment. Zdroj: Wikimedia Commons

Obrázek 2.5: kongresman Alexander Pirnie (R-NY) sestavení první kapsle pro návrh Selective Service dne 1. prosince 1969. Joshua Angrist (1990) v kombinaci návrh loterii s údaji o příjmech ze správy sociálního zabezpečení odhadnout vliv vojenské služby na zisku. To je příklad výzkumu za použití přirozený experiment. Zdroj: Wikimedia Commons

I když to nemusí být na první pohled patrné, návrh loterie má kritickou podobnost s randomizované kontrolované experimentu: v obou případech jsou účastníci randomizováni k ošetření. V případě návrhu loterie, máme-li zájem dozvědět se o účincích Draft-způsobilosti a vojenskou službu u následných zisků na trhu práce, můžeme porovnat výsledky pro osoby, jejichž data narození byli pod loterie cutoff (např 14. září, duben 24, atd.) s výsledky u lidí, jejichž narozeniny byly po hranici (např, 20. února, 2. prosince, atd.).

Vzhledem k tomu, že tato léčba je odveden bylo náhodně přiděleno, pak můžeme měřit účinek této léčby pro jakýkoli výsledek, který je měřen. Například Angrist (1990) kombinoval informace o tom, kdo byl náhodně vybrán v návrhu s údaji o příjmech, které byly shromážděny podle správy sociálního zabezpečení k závěru, že zisk bílých veteránů byly o 15% nižší než příjmy srovnatelných non-veteránů , Jiní výzkumníci používali podobné trik stejně. Například Conley and Heerwig (2011) kombinoval informace o tom, kdo byl náhodně vybrán v návrhu s daty domácnosti shromážděných od 2000 sčítání lidu a 2005 americká komunita průzkum a zjistil, že tak dlouho poté, co návrh, tam byl malý dlouhodobý efekt vojenská služba na odrůdě výsledků jako je bydlení držby (vlastnící proti pronájmu) a rezidenční stability (pravděpodobnost dosažení pohyboval v posledních pěti letech).

Jak ukazuje tento příklad, někdy i sociální, politické, či přírodními živly vytvořit experimenty nebo téměř experimenty, které lze využívat výzkumníci. Často přírodní experimenty jsou nejlepším způsobem, jak odhadnout příčiny a následku vztahy v prostředí, kde to není etické nebo praktické provozovat randomizované kontrolované experimenty. Jsou důležitou strategií pro objevování spravedlivé srovnání v non-experimentálními daty. Tato výzkumná strategie lze shrnout podle této rovnice:

\ [\ textu {random (nebo jako v případě náhodné) události} + \ textu {trvalé připojení k datovému toku} = \ {textový přirozený experiment} \ qquad (2,1) \]

Analýza však přirozených experimentů může být velmi obtížné. Například v případě návrhu Vietnamu, ne každý, kdo byl návrh způsobilé skončili porce (bylo jich celá řada výjimek). A ve stejné době, někteří lidé, kteří nebyli Draft-způsobilý se přihlásil do služby. Bylo to, jako by v klinickém hodnocení nového léku, někteří lidé v léčené skupině nevzal jejich lék a někteří lidé v kontrolní skupině nějak dostávali lék. Tento problém, tzv oboustranný nedodržení, stejně jako mnoho dalších problémů jsou popsány podrobněji v některém z doporučených hodnot na konci této kapitoly.

Strategie s využitím přirozeně se vyskytující náhodné přiřazení předchází digitálního věku, ale prevalence velkého dat je tato strategie mnohem jednodušší. Jakmile si uvědomíte, některé léčba byla přiřazena náhodně, mohou velké datové zdroje poskytují data, výsledek, který budete potřebovat, aby bylo možné porovnávat výsledky pro lidi v experimentálních a kontrolních podmínek. Například ve své studii o dopadech návrhu a vojenské službě, Angrist využila záznamů o příjmech z České správy sociálního zabezpečení; aniž by tento výsledek dat, jeho studie by nebylo možné. V tomto případě je správa sociálního zabezpečení je vždy-na velký zdroj dat. Stejně jako existují stále více a více automaticky sbírá datové zdroje, budeme mít více výsledek data, která mohou měřit účinky změn vytvořených exogenním variací.

Pro ilustraci této strategie v digitálním věku, uvažujme Mas a Moretti je (2009) elegantní výzkum o vlivu vrstevníků na produktivitu. I když na povrchu to může vypadat jinak, než studium Angrist je o účincích návrhu Vietnamu, ve struktuře oba následovat vzor v rovnici. 2.1.

Mas a Moretti měří, jak vrstevníci vliv na produktivitu pracovníků. Na jedné straně, které mají těžké pracovní peer může vést pracovníky ke zvýšení produktivity v důsledku vzájemného tlaku. Nebo, na druhé straně, tvrdě pracující peer může vést další pracovníky, aby slack off ještě více. Nejjasnější způsob, jak studovat peer vliv na produktivitu by bylo randomizované kontrolované experiment, kde zaměstnanci jsou náhodně rozděleni do směn s pracovníky různých úrovní produktivity a pak výsledná produktivita je měřena pro každého. Výzkumníci však nekontrolují plán pracovníků v nějakém skutečném podnikání, a tak Mas a Moretti musel spoléhat na přírodní experiment, který se konal v supermarketu.

Stejně jako ekv. 2.1 Jejich Studie měla dvě části. Za prvé, oni používají protokoly ze supermarketu pokladny systému mít přesné, individuální, a vždy-na míru produktivity: počet bodů nasnímaných za sekundu. A jednak z důvodu, aby plánování byla provedena v tomto supermarketu, mají v blízkosti náhodné složení vrstevníky. Jinými slovy, i když plánování pokladních není určena loterie, je to v podstatě náhodně. V praxi je důvěra máme v přirozených experimentů často závisí na věrohodnosti tohoto "jako kdyby" náhodné tvrzení. Využívat této náhodné variace, Mas a Moretti zjistil, že pracuje s vyšší produktivitou vrstevníky zvyšuje produktivitu. Dále Mas a Moretti používá velikost a bohatství jejich datové sady překonat odhadu příčiny a účinku, který má prozkoumat další dva důležité a jemné otázky: heterogenitu tohoto efektu (pro které druhy pracovníků je dopad větší) a mechanismus za účinku (proč mají vysoké produktivity vrstevníky vede k vyšší produktivitě). Vrátíme se k těmto dvěma důležitými otázkami-heterogenitu účinků léčby a mechanismů-v kapitole 5, když budeme diskutovat o experimenty ve větším detailu.

Zevšeobecňovat ze studií o vlivu návrhu Vietnamu o příjmech a studium vlivu vrstevníků na produktivitu, Tabulka 2.3 shrnuje další studie, které mají tuto přesně stejnou strukturu: za použití vždy-na zdroj dat s cílem zjistit dopad nějaké události , Jako Tabulka 2.3 objasňuje, přírodní experimenty jsou všude, stačí vědět, jestli, jak se dívat na ně.

Tabulka 2.3: Příklady přírodních experimentech s použitím velkých datových zdrojů. Všechny tyto studie sledují stejný základní recept: náhodný (nebo jako v případě náhodné události) + vždy-on datového systému. Viz Dunning (2012) pro další příklady.
věcného zaměření Zdroj z přírodního experimentu Always-on dat source Citace
Peer vliv na produktivitu plánování procesů Pokladna údaje Mas and Moretti (2009)
tvorba přátelství hurikány Facebook Phan and Airoldi (2015)
Šíření emocí déšť Facebook Coviello et al. (2014)
Peer to peer Ekonomické transfery zemětřesení mobile peněz údaje Blumenstock, Fafchamps, and Eagle (2011)
Chování Osobní spotřeba 2013 americká vláda vypnutí osobní finance údajů Baker and Yannelis (2015)
Ekonomický dopad doporučujícího systémů různý údaje o prohlížení v Amazonii Sharma, Hofman, and Watts (2015)
Vliv stresu na nenarozené děti 2006 Izraelem a Hizballáhem válka porodní záznamy Torche and Shwed (2015)
Čtení chování na Wikipedii Snowden odhalení protokoly Wikipedia Penney (2016)

V praxi, výzkumníci používají dvě různé strategie pro nalezení přirozených experimentů, z nichž oba mohou být plodné. Někteří výzkumníci začínají stále dostupného zdroje dat a hledat náhodné události ve světě; jiní začít s náhodnými událostmi ve světě a hledat pro datové zdroje, které zachycují jejich dopad. Nakonec si všimněte, že síla přirozených experimentů nepochází z propracovanosti statistické analýzy, ale z péče v objevování spravedlivé srovnání vystavený šťastnou náhodou historie.