2.4.3.1 Prirodzené experimenty

Prirodzené experimenty využiť náhodných javov vo svete. náhodný jav + trvalé pripojenie k súborovému systému = prirodzený experiment

Kľúčom k randomizovanej kontrolovanej experimenty umožňujúce spravodlivé porovnanie je náhodnosti. Avšak, občas sa niečo deje vo svete, ktorý v podstate priraďuje ľudí náhodne alebo takmer náhodne na rôzne procedúry. Jeden z najjasnejších príkladov stratégie použitia prírodných experimenty pochádza z výskumu Angrist (1990) , ktorý meria vplyv vojenských služieb na zisku.

Počas vojny vo Vietname, v Spojených štátoch zvýšil o veľkosti svojich ozbrojených síl cez prievanu. Aby bolo možné rozhodnúť, ktoré občania by byť povolaný do služby, americká vláda usporiadala lotérii. Každé dátum narodenia bola zastúpená na kus papiera, a tieto dokumenty boli umiestnené do veľkej sklenenej nádoby. Ako ukazuje obrázok 2.5, tieto kúsky papiera boli čerpané z nádoby jeden po druhom na určenie poradia, že mladí ľudia by sa dalo nazvať slúžiť (mladé ženy neboli predmetom návrhu). Na základe výsledkov, muži narodil 14. septembra boli volány prvé, muži narodil 24. apríla bol volaný druhý, a tak ďalej. Nakoniec, v tejto lotérii, muži narodené v 195 rôznych dňoch boli povolaní k službe zatiaľ čo muži narodené v 171 dňoch boli nepozval.

Obrázok 2.5: kongresman Alexander Pirnie (R-NY) zostavenia prvej kapsule pre návrh Selective Service 1. decembra 1969. Joshua Angrist (1990) v kombinácii návrh lotérii s údajmi o príjmoch zo správy sociálneho zabezpečenia odhadnúť vplyv vojenskej služby na zisku. To je príklad výskumu za použitia prirodzený experiment. Zdroj: Wikimedia Commons

Obrázok 2.5: kongresman Alexander Pirnie (R-NY) zostavenia prvej kapsule pre návrh Selective Service 1. decembra 1969. Joshua Angrist (1990) v kombinácii návrh lotérii s údajmi o príjmoch zo správy sociálneho zabezpečenia odhadnúť vplyv vojenskej služby na zisku. To je príklad výskumu za použitia prirodzený experiment. Zdroj: Wikimedia Commons

I keď to nemusí byť na prvý pohľad zrejmé, návrh lotérie má kritickú podobnosť s randomizovanej kontrolovanej experimentu: v oboch prípadoch sú účastníci randomizovaní na ošetrenie. V prípade návrhu lotérie, ak máme záujem dozvedieť sa o účinkoch Draft-spôsobilosti a vojenskú službu u následných ziskov na trhu práce, môžeme porovnať výsledky pre osoby, ktorých dátumy narodenia boli pod lotérie cutoff (napr 14. septembra, apríl 24, atď.) s výsledkami u ľudí, ktorých narodeniny boli po hranicu (napr, 20. februára, 2. decembra, atď.).

Vzhľadom na to, že táto liečba je odvedený bolo náhodne pridelené, potom môžeme merať účinok tejto liečby pre akýkoľvek výsledok, ktorý je meraný. Napríklad Angrist (1990) kombinoval informácie o tom, kto bol náhodne vybraný v návrhu s údajmi o príjmoch, ktoré boli zhromaždené podľa správy sociálneho zabezpečenia k záveru, že zisk bielych veteránov boli o 15% nižšie ako príjmy porovnateľných non-veteránov , Iní výskumníci používali podobné trik rovnako. Napríklad Conley and Heerwig (2011) kombinoval informácie o tom, kto bol náhodne vybraný v návrhu s dátami domácnosti zhromaždených od 2000 sčítanie ľudu a 2005 americká komunita prieskum a zistil, že tak dlho potom, čo návrh, tam bol malý dlhodobý efekt vojenská služba na odrode výsledkov ako je bývanie držby (vlastniaci proti prenájmu) a rezidenčné stability (pravdepodobnosť dosiahnutia pohyboval v posledných piatich rokoch).

Ako ukazuje tento príklad, niekedy aj sociálne, politické, či prírodnými živlami vytvoriť experimenty alebo takmer experimenty, ktoré možno využívať výskumníci. Často prírodné experimenty sú najlepším spôsobom, ako odhadnúť príčiny a následku vzťahy v prostredí, kde to nie je etické alebo praktické prevádzkovať randomizovanej kontrolovanej experimenty. Sú dôležitou stratégiou pre objavovanie spravodlivé porovnanie v non-experimentálnymi dátami. Táto výskumná stratégia možno zhrnúť podľa tejto rovnice:

\ [\ Texte {random (alebo ako v prípade náhodnej) udalosti} + \ texte {trvalé pripojenia toku} = \ {textový prirodzený experiment} \ qquad (2,1) \]

Analýza však prirodzených experimentov môže byť veľmi ťažké. Napríklad v prípade návrhu Vietnamu, nie každý, kto bol návrh oprávnené skončili porcia (bolo ich celá rada výnimiek). A v rovnakej dobe, niektorí ľudia, ktorí neboli Draft-spôsobilý sa prihlásil do služby. Bolo to, ako by v klinickom hodnotení nového lieku, niektorí ľudia v liečenej skupine nezobral ich liek a niektorí ľudia v kontrolnej skupine nejako dostávali liek. Tento problém, tzv obojstranný nedodržanie, rovnako ako mnoho ďalších problémov sú popísané podrobnejšie v niektorom z odporúčaných hodnôt na konci tejto kapitoly.

Stratégia s využitím prirodzene sa vyskytujúce náhodné priradenie predchádza digitálneho veku, ale prevalencia veľkého dát je táto stratégia oveľa jednoduchšie. Akonáhle si uvedomíte, niektoré liečba bola priradená náhodne, môžu veľké dátové zdroje poskytujú dáta, výsledok, ktorý budete potrebovať, aby bolo možné porovnávať výsledky pre ľudí v experimentálnych a kontrolných podmienok. Napríklad vo svojej štúdii o dopadoch návrhu a vojenskej službe, Angrist využila záznamov o príjmoch z Českej správy sociálneho zabezpečenia; bez toho, aby tento výsledok dát, jeho štúdie by nebolo možné. V tomto prípade je správa sociálneho zabezpečenia je vždy-na veľký zdroj dát. Rovnako ako existujú stále viac a viac automaticky zbiera dátové zdroje, budeme mať viac výsledok dáta, ktoré môžu merať účinky zmien vytvorených exogénnym variácií.

Pre ilustráciu tejto stratégie v digitálnom veku, uvažujme Mas a Moretti je (2009) elegantná výskum o vplyve rovesníkov na produktivitu. Aj keď na povrchu to môže vyzerať inak, než štúdium Angrist je o účinkoch návrhu Vietname, v štruktúre obaja nasledovať vzor v rovnici. 2.1.

Mas a Moretti meria, ako rovesníci vplyv na produktivitu pracovníkov. Na jednej strane, ktoré majú ťažké pracovné peer môže viesť pracovníkov k zvýšeniu produktivity v dôsledku vzájomného tlaku. Alebo, na druhej strane, tvrdo pracujúci peer môže viesť ďalších pracovníkov, aby slack off ešte viac. Najjasnejšie spôsob, ako študovať peer vplyv na produktivitu by bolo randomizovanej kontrolovanej experiment, kde zamestnanci sú náhodne rozdelení do smien s pracovníkmi rôznych úrovní produktivity a potom výsledná produktivita je meraná pre každého. Výskumníci však nekontrolujú plán pracovníkov v nejakom skutočnom podnikania, a tak Mas a Moretti musel spoliehať na prírodné experiment, ktorý sa konal v supermarkete.

Rovnako ako ekv. 2.1 Ich Štúdia mala dve časti. Po prvé, oni používajú protokoly zo supermarketu pokladne systému mať presné, individuálne, a vždy-na mieru produktivity: počet bodov nasnímaných za sekundu. A jednak z dôvodu, aby plánovanie bola vykonaná v tomto supermarkete, majú v blízkosti náhodné zložení rovesníkmi. Inými slovami, aj keď plánovanie pokladničných nie je určená lotérie, je to v podstate náhodne. V praxi je dôvera máme v prirodzených experimentov často závisí na vierohodnosti tohto "ako keby" náhodné tvrdenie. Využívať tejto náhodné variácie, Mas a Moretti zistil, že pracuje s vyššou produktivitou rovesníkmi zvyšuje produktivitu. Ďalej Mas a Moretti používa veľkosť a bohatstvo ich dátovej sady prekonať odhadu príčiny a účinku, ktorý má preskúmať ďalšie dva dôležité a jemné otázky: heterogénnosť tohto efektu (pre ktoré druhy pracovníkov je vplyv väčší) a mechanizmus za účinku (prečo majú vysoké produktivity rovesníkmi vedie k vyššej produktivite). Vrátime sa k týmto dvoma dôležitými otázkami-heterogénnosť účinkov liečby a mechanizmov-v kapitole 5, keď budeme diskutovať o experimenty vo väčšom detaile.

Zovšeobecňovať zo štúdií o vplyve návrhu Vietname o príjmoch a štúdium vplyvu rovesníkov na produktivitu, Tabuľka 2.3 sumarizuje ďalšie štúdie, ktoré majú túto presne rovnakú štruktúru: za použitia vždy-na zdroj dát s cieľom zistiť vplyv nejakej udalosti , Ako Tabuľka 2.3 objasňuje, prírodné experimenty sú všade, stačí vedieť, či, ako sa pozerať na ne.

Tabuľka 2.3: Príklady prírodných experimentoch s použitím veľkých dátových zdrojov. Všetky tieto štúdie sledujú rovnaký základný recept: náhodný (alebo ako v prípade náhodnej udalosti) + vždy-on dátového systému. Pozri Dunning (2012) pre ďalšie príklady.
vecného zamerania Zdroj z prírodného experimentu Always-on dát source citácie
Peer vplyv na produktivitu plánovanie procesov pokladňa údaje Mas and Moretti (2009)
tvorba priateľstva hurikány Facebook Phan and Airoldi (2015)
šírenie emócií dážď Facebook Coviello et al. (2014)
Peer to peer Hospodárske presuny zemetrasenie mobile peňazí údaje Blumenstock, Fafchamps, and Eagle (2011)
Správanie Osobné spotreba 2013 americká vláda vypnutie osobné financie údajov Baker and Yannelis (2015)
Ekonomický dopad odporúčacieho systémov rôzny údaje prehliadania v Amazónii Sharma, Hofman, and Watts (2015)
Vplyv stresu na nenarodené deti 2006 Izraelom a Hizballáhom vojna pôrodná záznamy Torche and Shwed (2015)
Čítanie správanie na Wikipédii Snowden odhalenie protokoly Wikipedia Penney (2016)

V praxi, výskumníci používajú dve rôzne stratégie pre nájdenie prirodzených experimentov, z ktorých oba môžu byť plodné. Niektorí výskumníci začínajú stále dostupného zdroja dát a hľadať náhodné udalosti vo svete; iní začať s náhodnými udalosťami vo svete a hľadať pre dátové zdroje, ktoré zachytávajú ich vplyv. Nakoniec si všimnite, že sila prirodzených experimentov nepochádza z prepracovanosti štatistické analýzy, ale z starostlivosti v objavovaní spravodlivé porovnaní vystavený šťastnou náhodou histórie.