2.4.3.1 Prirodne eksperimenti

Prirodni eksperimenti iskoristiti slučajnih događaja u svijetu. slučajni događaj + uvijek na sustav podataka = prirodni eksperiment

Ključ za randomiziranih kontroliranih pokusa koji omogućava objektivnu usporedbu je randomizacije. Međutim, povremeno se nešto događa u svijetu koja u osnovi pripisuje ljude nasumično ili gotovo nasumično na različite tretmane. Jedan od najjasnijih primjera strategije pomoću prirodnih eksperimenata dolazi od istraživanja Angrist (1990) koji mjeri učinak vojnih službi na zarade.

Tijekom rata u Vijetnamu, Sjedinjene Američke Države povećao veličinu svojih oružanih snaga kroz gazu. Kako bi odgovorili na kojima građani će biti pozvani u službu, američka vlada održala je lutrija. Svaki datum rođenja je zastupljena na komad papira, a ti radovi su bili smješteni u velikom staklenku. Kao što je prikazano na slici 2.5, ove gaćice od papira su izvučeni iz staklenke jedan po jedan kako bi se utvrdilo nalog da mladi ljudi će biti pozvan da služi (mlade žene nisu bile predmet nacrta). Na temelju dobivenih rezultata, ljudi rođeni 14. rujna bili pozvani prvi, ljudi rođeni 24. travnja bili pozvani drugi, i tako dalje. Na kraju, u ovoj lutriji, ljudi rođeni na 195 različitih dana bili pozvani na službu dok muškarci rođeni 171 dana nisu bili pozvani.

Slika 2.5: Kongresnik Alexander Pirnie (R-NY) crtanje prvu kapsulu za nacrtu selektivno usluga 1. prosinca, 1969. Joshua Angrist (1990) u kombinaciji nacrt lutrija s podacima o zaradi od Social Security Administration je procijeniti učinak vojnog roka na zaradu. Ovo je primjer istraživanja koristeći prirodni eksperiment. Izvor: Wikimedia Commons

Slika 2.5: Kongresnik Alexander Pirnie (R-NY) crtanje prvu kapsulu za nacrtu selektivno usluga 1. prosinca, 1969. Joshua Angrist (1990) u kombinaciji nacrt lutrija s podacima o zaradi od Social Security Administration je procijeniti učinak vojnog roka na zaradu. Ovo je primjer istraživanja koristeći prirodni eksperiment. Izvor: Wikimedia Commons

Iako to možda neće biti vidljivi odmah, nacrt lutrija ima kritičnu sličnost s randomiziranom kontroliranom pokusu: u oba slučaja sudionicima su nasumično podijeljeni primiti tretman. U slučaju lutriji nacrt, ako smo zainteresirani za učenje o učincima nacrta podobnosti i vojne službe o naknadnim tržištu rada zarade, možemo usporediti rezultate za osobe čiji birthdates su ispod lutrije prekidom (npr, 14. rujna travnja 24, itd) sa ishodima za ljude čiji su rođendani su nakon prekidom (npr, veljača 20, 2. prosinca, itd).

S obzirom da je ovaj tretman u fazi izrade je nasumično, onda bismo mogli izmjeriti učinak ovog tretmana za bilo koji ishod koji je mjeren. Na primjer, Angrist (1990) kombiniraju informacije o tome tko je slučajno odabranih u nacrtu s podacima o zaradi koji su prikupljeni od strane Uprave za socijalnu sigurnost zaključiti da je zarada od bijelih veterana bili oko 15% manje nego zarade usporedivih ne-veterana , Drugi istraživači su koristili sličan trik, kao dobro. Na primjer, Conley and Heerwig (2011) kombiniraju informacije o tome tko je slučajno odabran u nacrtu s podacima za domaćinstvo prikupljenih od 2000 Census i 2005 American Community Survey i utvrdili da se tako dugo nakon nacrtu, bilo je malo dugoročni učinak vojna služba na različitim ishodima poput stambenog zakupa (posjedovanje u odnosu na najam) i stambene stabilnosti (vjerojatnost da se preselio u posljednjih pet godina).

Kao što je ovaj primjer pokazuje, ponekad socijalne, političke ili prirodne sile stvaraju eksperimente ili gotovo eksperimente koji mogu utjecati od strane istraživača. Često prirodne eksperimenti su najbolji način za procjenu uzročno-posljedične veze u postavkama gdje to nije etično ili praktično izvoditi randomiziranih kontroliranih pokusa. Oni su važna strategija za otkrivanje poštene usporedbe u ne-eksperimentalnim podacima. Ovo istraživanje strategija može se sažeti u ovoj jednadžbi:

\ [\ text {slučajna (ili ako slučajna) događaju} + \ text {uvijek na tok podataka} = \ text {prirodni eksperiment} \ qquad (2.1) \]

Međutim, analiza prirodnih eksperimenata može biti vrlo zahtjevno. Na primjer, u slučaju nacrta Vijetnamu, nije svatko tko je bio nacrt-podobni završio posluživanje (bilo je raznih izuzeća). A, u isto vrijeme, neki ljudi koji nisu bili propuha pravo volontirala za uslugu. Kao da je u kliničkom ispitivanju novog lijeka, neki ljudi u liječenoj skupini nisu uzeti svoj lijek, a neki od ljudi u kontrolnoj skupini nekako dobio lijek. Ovaj problem se naziva obostrani neslaganju, kao i mnogi drugi problemi su opisane detaljnije u nekim od preporučenih očitanja na kraju ovog poglavlja.

Strategija iskorištavanjem prirodno slučajni raspored prethodi digitalno doba, ali je učestalost velikog podataka čini ovaj strategija puno lakše za korištenje. Jednom kada shvatite neke tretman je nasumično, veliki izvori podataka mogu pružiti podatke o ishodu koja vam je potrebna kako bi se usporedili rezultate za ljude u uvjetima liječenja i kontrole. Na primjer, u studiji o utjecaju nacrta i vojne službe, Angrist napravio korištenje podataka o zaradi od Social Security Administration; Bez tog ishoda podataka, njegov rad ne bi bio moguć. U tom slučaju, Social Security Administration je uvijek na veliki izvor podataka. Kao što postoji sve više i više automatski prikupljaju izvora podataka, mi ćemo imati više ishoda podataka koji može mjeriti učinke promjena nastalih egzogenog varijacija.

Da bi ilustrirali ovu strategiju u digitalno doba, razmotrimo Más Moretti je (2009) elegantnu istraživanja o utjecaju vršnjaka na produktivnost. Iako se na površini to može izgledati drugačije od Angrist studije o učincima Vijetnamskog Nacrta, u strukturi obojica slijede uzorak u ekv. 2.1.

Mas i Moretti mjeriti kako vršnjaci utječu na produktivnost radnika. S jedne strane, budući da je teško radni peer može dovesti radnike da povećaju svoju produktivnost, zbog peer pressure. Ili, s druge strane, marljiv peer može dovesti druge radnike preskočiti još više. Najjasniji način studiranja peer utjecaj na produktivnost će biti randomizirani kontrolirani pokus u kojem radnici su nasumično podijeljeni u smjenama s radnicima različitih razina produktivnosti, a zatim je rezultiralo produktivnost mjeri za svakoga. Istraživači, međutim, ne kontrolira raspored radnika u bilo kojem stvarnom poslu, i tako Mas i Moretti morao osloniti na prirodni eksperiment koji se održao u supermarketu.

Baš kao ekv. 2.1, njihovo istraživanje je imao dva dijela. Prvo, oni koriste logove od supermarketa naplata sustava imati preciznu i pojedinca, i uvijek na mjeru produktivnosti: broj predmeta skeniranih sekundi. I, drugo, zbog načina na koji raspored je učinjeno u ovom supermarketu, oni su u blizini slučajnim sastavu vršnjaka. Drugim riječima, iako je raspored blagajnama ne određuje lutrija, to je u biti slučajan. U praksi, povjerenje imamo u prirodnim eksperimentima često ovisi o vjerodostojnosti ovog "kao-ako" slučajnih zahtjeva. Iskorištavanjem ove slučajnih varijacija, Mas i Moretti otkrili da rade s višim vršnjacima produktivnosti povećava produktivnost. Nadalje, Mas i Moretti koristi veličinu i bogatstvo njihovog skupa podataka da se presele izvan procjenu uzroka i učinka istražiti još dvije važne i suptilne probleme: heterogenost u tom smislu (za koje vrste radnika je učinak veći) i mehanizam iza učinkom (zašto imaju visoku produktivnost kolege dovesti do veće produktivnosti). Mi ćemo se vratiti na ta dva važna pitanja-heterogenosti učinaka liječenja i mehanizmi-u 5. poglavlju, kada smo razgovarali o eksperimentima u više detalja.

Generaliziranja iz studija o utjecaju Vijetnamskom Nacrt zakona o plaćama i proučavanjem utjecaja vršnjaka na produktivnost, Tablica 2.3 sumira druge studije koje su to točno istu strukturu: korištenjem uvijek na izvoru podataka za mjerenje učinka neki događaj , Kao Tablica 2.3 daje jasne, prirodne eksperimenti su posvuda i ako samo znati kako to izgleda za njih.

Tablica 2.3: Primjeri prirodnih eksperimenata koji koriste velike izvore podataka. Sve ove studije prate isti osnovni recept: slučajan (ili kao da slučajna) Događaj + uvijek na sustav podataka. Pogledajte Dunning (2012) za više primjera.
materijalno fokus Izvor prirodnog eksperimenta Uvijek se na podacima izvor Citat
Peer učinak na produktivnost Postupak raspoređivanja naplata podataka Mas and Moretti (2009)
formiranje Prijateljstvo uragani Facebook Phan and Airoldi (2015)
Spread emocija kiša Facebook Coviello et al. (2014)
Peer to peer ekonomske transfere potres Podaci mobilni novac Blumenstock, Fafchamps, and Eagle (2011)
Osobna potrošnja ponašanje 2013 Američka vlada gašenje osobne podatke financije Baker and Yannelis (2015)
Ekonomski utjecaj se sustavima raznovrstan Podaci o pregledavanju na Amazonu Sharma, Hofman, and Watts (2015)
Utjecaj stresa na nerođene bebe 2006 Izrael-Hezbolah rat rodnih listova Torche and Shwed (2015)
Čitanje ponašanje na Wikipediji Snowden objave Wikipedia dnevnici Penney (2016)

U praksi, znanstvenici su koristili dvije različite strategije za pronalaženje prirodnih eksperimenata, od kojih oba mogu biti plodonosna. Neki istraživači početi s uvijek-na temelju podataka izvora i tražiti slučajnih događaja u svijetu; drugi početi sa slučajnim događajima u svijetu i tražiti izvore podataka koji hvatanje njihov utjecaj. Konačno, primijetiti da je snaga prirodnih eksperimenata ne dolazi od sofisticiranosti statističke analize, ali od brige u otkrivanju fer usporedba stvorio je nesreća u povijesti.