Esperimenti naturali approfittare di eventi casuali in tutto il mondo. evento casuale + always-on sistema di dati = esperimento naturale
La chiave per gli esperimenti randomizzati e controllati che permettono confronto equo è la randomizzazione. Tuttavia, di tanto in tanto succede qualcosa nel mondo che assegna essenzialmente le persone in modo casuale o quasi in modo casuale a diversi trattamenti. Uno degli esempi più chiari della strategia di utilizzo di esperimenti naturali proviene dalla ricerca di Angrist (1990) , che misura l'effetto dei servizi militari sui guadagni.
Durante la guerra del Vietnam, gli Stati Uniti ha aumentato le dimensioni delle sue forze armate attraverso un progetto. Per decidere quale i cittadini sarebbe stato chiamato in servizio, il governo degli Stati Uniti ha tenuto una lotteria. Ogni nascita era rappresentato su un pezzo di carta, e questi documenti sono stati collocati in un grande vaso di vetro. Come mostrato nella Figura 2.5, questi foglietti sono stati elaborati dal vaso uno alla volta per determinare l'ordine che i giovani sarebbero stati chiamati a servire (giovani donne non erano soggetti al progetto). Sulla base dei risultati, gli uomini nati il 14 settembre sono stati chiamati prima, gli uomini nati il 24 aprile sono stati chiamati secondo, e così via. In definitiva, in questa lotteria, uomini nati in 195 giorni diversi sono stati chiamati al servizio, mentre gli uomini nati in 171 giorni non sono stati chiamati.
Anche se potrebbe non essere immediatamente evidente, un progetto di lotteria ha una somiglianza fondamentale per un esperimento randomizzato controllato: in entrambe le situazioni i partecipanti sono assegnati in modo casuale a ricevere un trattamento. Nel caso del progetto di lotteria, se siamo interessati a conoscere gli effetti dei progetti di ineleggibilità e di servizio militare per successivi guadagni del mercato del lavoro, siamo in grado di confrontare i risultati per le persone la cui data di nascita erano sotto soglia lotteria (ad esempio, 14 settembre, Aprile 24, etc.) con i risultati per le persone i cui compleanni sono stati dopo il cut-off (ad esempio, 20 febbraio, il 2 dicembre, etc.).
Dato che questo trattamento di essere elaborato è stato assegnato a caso, possiamo poi misurare l'effetto di questo trattamento per qualsiasi risultato che è stata misurata. Ad esempio, Angrist (1990) combinate le informazioni su chi è stato selezionato in modo casuale nel progetto con i dati utili che è stato raccolto dal Social Security Administration per concludere che i guadagni dei veterani bianchi erano circa il 15% in meno rispetto ai guadagni di non-veterani comparabili . Altri ricercatori hanno usato un trucco simile pure. Ad esempio, Conley and Heerwig (2011) combinano le informazioni su chi è stato selezionato in modo casuale nel progetto con i dati domestici raccolti dal censimento del 2000 e il 2005 American Community Survey e ha scoperto che così a lungo dopo il progetto, c'era ben poco effetto a lungo termine di servizio militare per varietà di risultati quali l'alloggio mandato (che possiede rispetto a noleggio) e la stabilità residenziale (probabilità di aver spostato nei precedenti cinque anni).
Come questo esempio illustra, a volte le forze sociali, politiche, o naturali creano esperimenti o quasi esperimenti che possono essere sfruttati dai ricercatori. Spesso esperimenti naturali sono il modo migliore per stimare le relazioni di causa-effetto in ambienti dove non è etico o pratico per eseguire esperimenti randomizzati e controllati. Si tratta di una strategia importante per scoprire i confronti equi nei dati non sperimentali. Questa strategia di ricerca può essere riassunta da questa equazione:
\ [\ text {casuale (o come se casuale) evento} + \ text {always-on flusso di dati} = \ text {esperimento naturale} \ qquad (2.1) \]
Tuttavia, l'analisi di esperimenti naturali può essere abbastanza difficile. Ad esempio, nel caso del progetto di Vietnam, non tutti quelli che erano progetto ammissibili finito per servire (ci sono stati una serie di esenzioni). E, allo stesso tempo, alcune persone che non erano ammissibili draft-volontari per il servizio. Era come se in una sperimentazione clinica di un nuovo farmaco, alcune persone nel gruppo di trattamento non ha preso le medicine e alcune delle persone del gruppo di controllo in qualche modo hanno ricevuto il farmaco. Questo problema, chiamato noncompliance due lati, così come molti altri problemi sono descritti in maggior dettaglio in alcune delle letture raccomandate alla fine di questo capitolo.
La strategia di sfruttare naturale assegnazione casuale precede l'era digitale, ma la prevalenza di grandi dati rende questa strategia molto più facile da usare. Una volta che ci si rende conto qualche trattamento è stato assegnato in modo casuale, grandi fonti di dati in grado di fornire i dati risultato che è necessario al fine di confrontare i risultati per le persone nelle condizioni di trattamento e di controllo. Ad esempio, nel suo studio sugli effetti del progetto e servizio militare, Angrist fatto uso degli utili record dal Social Security Administration; Senza questi dati di outcome, il suo studio non sarebbe stato possibile. In questo caso, l'amministrazione della sicurezza sociale è la fonte di dati sempre attiva grande. Come esistono sempre più automaticamente raccolte fonti di dati, avremo più dati esito in grado di misurare gli effetti dei cambiamenti creati dalla variazione esogena.
Per illustrare questa strategia nell'era digitale, consideriamo Mas e Moretti (2009) la ricerca elegante sugli effetti dei pari sulla produttività. Anche se in superficie potrebbe apparire diverso da quello studio di Angrist circa gli effetti del progetto di Vietnam, nella struttura entrambi seguono il modello di eq. 2.1.
Mas e Moretti misurato quanto i coetanei influenzano la produttività dei lavoratori. Da un lato, con un pari lavoro duro potrebbe portare lavoratori di aumentare la produttività a causa della pressione dei pari. Oppure, invece, un peer lavorando duro potrebbe portare altri lavoratori stasi fuori ancora di più. Il modo più chiaro per studiare gli effetti sulla produttività pari sarebbe un esperimento randomizzato controllato in cui i lavoratori vengono assegnati in modo casuale a turni con i lavoratori di diversi livelli di produttività e quindi conseguente produttività viene misurata per tutti. I ricercatori, tuttavia, non controllare il calendario dei lavoratori in qualsiasi vero e proprio business, e così Mas e Moretti dovuto fare affidamento su un esperimento naturale che ha avuto luogo in un supermercato.
Proprio come eq. 2.1, il loro studio ha avuto due parti. Innanzitutto, hanno usato i registri dal sistema supermarket cassa avere una precisa, individuale, e sempre a misura della produttività: il numero di elementi analizzati al secondo. E, secondo, a causa del modo che la pianificazione è stato fatto a questo supermercato, hanno pressi composizione casuale di pari. In altre parole, anche se la schedulazione dei cassieri non è determinata da una lotteria, era essenzialmente casuale. In pratica, la fiducia che abbiamo in esperimenti naturali dipende spesso nella plausibilità di questo "come-se" pretesa casuale. Approfittando di questa variazione casuale, Mas e Moretti hanno scoperto che lavorare con i compagni di produttività più elevati aumenta la produttività. Inoltre, Mas e Moretti utilizzate le dimensioni e la ricchezza del loro set di dati di andare oltre la stima di causa-effetto per esplorare due questioni più importanti e sottili: l'eterogeneità di questo effetto (per i quali i tipi di lavoratori è l'effetto più grande) e il meccanismo dietro l'effetto (perché avendo coetanei ad alta produttività portano ad una maggiore produttività). Torneremo a questi due importanti questioni-eterogeneità degli effetti del trattamento e dei meccanismi-in Capitolo 5 quando discuteremo gli esperimenti in modo più dettagliato.
Generalizzando dagli studi sugli effetti del progetto di Vietnam sui guadagni e lo studio degli effetti dei pari sulla produttività, Tabella 2.3 riassume altri studi che hanno la stessa struttura esatta: utilizzando un always-on fonte di dati per misurare l'impatto di un evento . Come Tabella 2.3 chiarisce, esperimenti naturali sono ovunque se si sa come cercare per loro.
attenzione sostanziale | Fonte di esperimento naturale | Always-on dati di origine | Citazione |
---|---|---|---|
Peer effetti sulla produttività | processo di pianificazione | dati cassa | Mas and Moretti (2009) |
formazione amicizia | uragani | Phan and Airoldi (2015) | |
Diffusione di emozioni | pioggia | Coviello et al. (2014) | |
Peer to peer trasferimenti economici | terremoto | dati mobile soldi | Blumenstock, Fafchamps, and Eagle (2011) |
comportamenti di consumo personali | 2013 arresto del governo degli Stati Uniti | dati finanza personale | Baker and Yannelis (2015) |
Impatto economico dei sistemi di raccomandazione | vario | dati di navigazione su Amazon | Sharma, Hofman, and Watts (2015) |
Effetto dello stress sui bambini non ancora nati | Guerra del 2006 tra Israele e Hezbollah | atti di nascita | Torche and Shwed (2015) |
Lettura comportamento su Wikipedia | Snowden rivelazioni | i registri di Wikipedia | Penney (2016) |
In pratica, i ricercatori utilizzano due diverse strategie per la ricerca di esperimenti naturali, entrambi i quali possono essere fruttuoso. Alcuni ricercatori iniziano con la sorgente sempre attiva dei dati e cercare eventi casuali in tutto il mondo; altri iniziano ad eventi casuali in tutto il mondo e cercare fonti di dati che catturano il loro impatto. Infine, si noti che la forza di esperimenti naturali non proviene dalla sofisticazione del analisi statistiche, ma dalla cura nella scoperta di un confronto equo creato da un incidente fortunata della storia.