Els experiments naturals s'aprofiten dels esdeveniments a l'atzar en el món. esdeveniment a l'atzar + sempre-en el sistema de dades = experiment natural
La clau per a experiments controlats aleatoris que permetin la comparació equitativa és l'aleatorització. No obstant això, de tant en tant alguna cosa passa al món que assigna essencialment la gent a l'atzar o quasi a l'atzar a diferents tractaments. Un dels exemples més clars de l'estratègia d'utilitzar experiments naturals prové de la investigació de Angrist (1990) que mesura l'efecte dels serveis militars en els guanys.
Durant la guerra de Vietnam, els Estats Units va augmentar la mida de les seves forces armades a través d'un projecte. Per tal de decidir quins ciutadans es posa en servei, el govern d'Estats Units va dur a terme una loteria. Cada data de naixement va ser representada en un tros de paper, i aquests papers es van col·locar en un pot de vidre gran. Com es mostra a la Figura 2.5, aquestes tires de paper van ser extretes de la gerra d'un a la vegada per determinar l'ordre en què els joves serien cridats a servir (les dones joves no estaven subjectes al servei). Amb base en els resultats, els homes nascuts el 14 de setembre van ser cridats per primera vegada, els homes nascuts el 24 d'abril van ser cridats segona, i així successivament. Al final, en aquesta loteria, els homes nascuts a 195 dies diferents van ser cridats al servei, mentre que els homes nascuts a 171 dies no van ser cridats.
Tot i que podria no ser immediatament evident, un projecte de loteria té una similitud fonamental per a un experiment controlat aleatori: en ambdues situacions els participants són assignats a l'atzar per rebre un tractament. En el cas de la loteria del draft, si estem interessats en aprendre sobre els efectes del projecte d'elegibilitat i el servei militar en els guanys del mercat de treball posteriors, podem comparar els resultats per a les persones les dates de naixement estaven sota del punt de tall de la loteria (per exemple, 14 de setembre, abril 24, etc.) amb els resultats de les persones els aniversaris van ser després del tall (per exemple, 20 de febrer 2 de desembre, etc.).
Tenint en compte que aquest tractament de redacció ha estat assignat a l'atzar, llavors podem mesurar l'efecte d'aquest tractament per a qualsevol resultat que s'ha mesurat. Per exemple, Angrist (1990) va combinar la informació sobre qui va ser seleccionat a l'atzar en el projecte amb dades dels guanys que va ser recollit per l'Administració de Seguretat Social per a concloure que els guanys dels veterans blancs eren aproximadament un 15% menys que els ingressos dels no veterans comparables . Altres investigadors han utilitzat un truc similar també. Per exemple, Conley and Heerwig (2011) combinen la informació sobre qui va ser seleccionat a l'atzar en el projecte amb les dades de llars recollides de l'Enquesta del Cens 2000 i 2005 sobre la Comunitat Nord-americana i van trobar que tant de temps després que el projecte, hi va haver poc efecte a llarg termini de el servei militar a la varietat de resultats com la tinença de l'habitatge (la possessió davant del lloguer) i l'estabilitat residencial (probabilitat d'haver mogut en cinc anys anteriors).
Com il·lustra aquest exemple, de vegades les forces socials, polítiques o naturals creen experiments o quasi-experiments que poden ser aprofitats pels investigadors. Sovint, els experiments naturals són la millor manera d'estimar les relacions de causa i efecte en els entorns en els quals no és ètic ni pràctic dur a terme experiments controlats aleatoris. Són una important estratègia per a descobrir les comparacions justes en les dades no experimentals. Aquesta estratègia de recerca es pot resumir en la següent equació:
\ [\ Text {aleatòria (o com si l'atzar) esdeveniment} + \ text {sempre en flux de dades} = \ text {experiment natural} \ qquad (2.1) \]
No obstant això, l'anàlisi d'experiments naturals pot ser bastant complicat. Per exemple, en el cas del projecte de Vietnam, no tot el que era elegible projecte va acabar servint (hi havia una varietat d'excepcions). I, al mateix temps, algunes persones que no van ser Draft-elegibles com a voluntaris per al servei. Era com si en un assaig clínic d'un nou fàrmac, algunes persones en el grup de tractament no prenen els seus medicaments i algunes de les persones en el grup de control d'alguna manera van rebre el fàrmac. Aquest problema, denominat incompliment de dues cares, així com molts altres problemes es descriuen en més detall en algunes de les lectures recomanades al final d'aquest capítol.
L'estratègia de prendre avantatge d'origen natural assignació aleatòria precedeix a l'era digital, però la prevalença de grans volums de dades fa que aquesta estratègia molt més fàcil d'utilitzar. Una vegada que comprengui una certa tractament s'ha assignat a l'atzar, grans fonts de dades poden proporcionar les dades de resultat que necessita per tal de comparar els resultats per a les persones en les condicions de tractament i control. Per exemple, en el seu estudi sobre els efectes del projecte i el servei militar, Angrist va fer ús de registres d'ingressos de l'Administració de Seguretat Social; Sense aquestes dades de resultat, el seu estudi no hauria estat possible. En aquest cas, l'Administració de Seguretat Social és la font de dades gran sempre activa. Com ha més i més automàticament recollit fonts de dades, tindrem més dades dels resultats que es poden mesurar els efectes dels canvis creats per la variació exògena.
Per il·lustrar aquesta estratègia en l'era digital, considerem Mas i de Moretti (2009) la investigació sobre l'efecte elegant dels parells en la productivitat. Encara que en la superfície pot semblar diferent que l'estudi de Angrist sobre els efectes del projecte de Vietnam, en l'estructura que tots dos segueixen el patró en l'ec. 2.1.
Mas i Moretti van mesurar quins parells afecten la productivitat dels treballadors. D'una banda, tenir un company de treball dur pot portar els treballadors a augmentar la seva productivitat a causa de la pressió de grup. O, per contra, un company de treball dur pot donar lloc a altres treballadors per afluixar encara més. La forma més clara per estudiar els efectes sobre la productivitat de parells seria un experiment controlat aleatori on els treballadors són assignats a l'atzar als canvis amb els treballadors dels diferents nivells de productivitat i la productivitat es mesura a continuació, donant com a resultat per a tothom. Els investigadors, però, no controlar l'horari dels treballadors en qualsevol negoci real, i pel que Mas i Moretti hagut de dependre d'un experiment natural que va tenir lloc en un supermercat.
Igual eq. 2.1, el seu estudi tenia dues parts. En primer lloc, utilitza els registres del sistema de caixa del supermercat per tenir una precisa i individual, i sempre en mesura de la productivitat: el nombre d'elements analitzats per segon. I, en segon lloc, a causa de la forma en què la programació es realitza en aquest supermercat, tenen prop de composició aleatòria de parells. En altres paraules, tot i que la programació de les caixeres no està determinada per una loteria, que era essencialment aleatòria. A la pràctica, la confiança que tenim en experiments naturals depèn amb freqüència de la plausibilitat d'aquest "com si" reclam a l'atzar. Aprofitant aquesta variació a l'atzar, Mas i Moretti van trobar que el treball amb companys de major productivitat augmenta la productivitat. A més, Mas i Moretti utilitzen la mida i la riquesa del seu conjunt de dades per anar més enllà de l'estimació de la relació causa-efecte per explorar dues qüestions més importants i subtils: l'heterogeneïtat d'aquest efecte (per a quin tipus de treballadors és l'efecte més gran) i el mecanisme darrere de l'efecte (Per què tenir parells d'alta productivitat condueixen a una major productivitat). Tornarem a aquests dos importants qüestions heterogeneïtat dels efectes i mecanismes de tractament en el capítol 5, quan es discuteixen experiments amb més detall.
Generalitzar a partir dels estudis sobre l'efecte del Projecte de Vietnam en els guanys i l'estudi de l'efecte dels companys en la productivitat, la Taula 2.3 es resumeixen altres estudis que tenen aquesta mateixa estructura exacta: l'ús d'estar sempre en una font de dades per mesurar l'impacte d'algun esdeveniment . Com mostra la Taula 2.3 deixa clar, els experiments naturals són a tot arreu si només sap com mirar per a ells.
enfocament substantiu | Font de l'experiment natural | Sempre-en dades d'origen | citació |
---|---|---|---|
Peer efectes sobre la productivitat | procés de programació | dades de pagament i enviament | Mas and Moretti (2009) |
la formació de l'amistat | huracans | Phan and Airoldi (2015) | |
Propagació de les emocions | pluja | Coviello et al. (2014) | |
Intercanvi d'arxius transferències econòmiques | terratrèmol | Dades de diners mòbil | Blumenstock, Fafchamps, and Eagle (2011) |
el comportament de consum personal | 2013 tancament del govern dels EUA | dades de les finances personals | Baker and Yannelis (2015) |
Impacte econòmic dels sistemes de recomanació | diversos | les dades de navegació en Amazon | Sharma, Hofman, and Watts (2015) |
Efecte de l'estrès en els nadons per néixer | La guerra de 2006 entre Israel i Hezbollah | Les actes de naixement | Torche and Shwed (2015) |
La lectura de la conducta a la Viquipèdia | revelacions de Snowden | els registres de Wikipedia | Penney (2016) |
A la pràctica, els investigadors utilitzen dues estratègies diferents per trobar experiments naturals, els quals poden ser fructífer. Alguns investigadors comencen amb la font de dades sempre i busquen els esdeveniments a l'atzar en el món; altres comencen a successos aleatoris en el món i buscar fonts de dades que capturen el seu impacte. Finalment, es va adonar que la força d'experiments naturals no prové de la sofisticació de l'anàlisi estadística, sinó de l'atenció en el descobriment d'una comparació justa creat per un afortunat accident de la història.