Los experimentos naturales se aprovechan de los acontecimientos al azar en el mundo. evento al azar + siempre-en el sistema de datos = experimento natural
La clave para experimentos controlados aleatorios que permitan la comparación equitativa es la aleatorización. Sin embargo, de vez en cuando algo sucede en el mundo que asigna esencialmente la gente al azar o casi al azar a diferentes tratamientos. Uno de los ejemplos más claros de la estrategia de utilizar experimentos naturales proviene de la investigación de Angrist (1990) que mide el efecto de los servicios militares en las ganancias.
Durante la guerra de Vietnam, los Estados Unidos aumentó el tamaño de sus fuerzas armadas a través de un proyecto. Con el fin de decidir qué ciudadanos se pone en servicio, el gobierno de Estados Unidos llevó a cabo una lotería. Cada fecha de nacimiento fue representada en un pedazo de papel, y estos papeles se colocaron en un frasco de vidrio grande. Como se muestra en la Figura 2.5, estas tiras de papel fueron extraídas de la jarra de uno a la vez para determinar el orden en que los jóvenes serían llamados a servir (las mujeres jóvenes no estaban sujetos al servicio). Con base en los resultados, los hombres nacidos el 14 de septiembre fueron llamados por primera vez, los hombres nacidos el 24 de abril fueron llamados segunda, y así sucesivamente. En última instancia, en esta lotería, los hombres nacidos en 195 días diferentes fueron llamados al servicio, mientras que los hombres nacidos en 171 días no fueron llamados.
A pesar de que podría no ser inmediatamente evidente, un proyecto de lotería tiene una similitud fundamental para un experimento controlado aleatorio: en ambas situaciones los participantes son asignados al azar para recibir un tratamiento. En el caso de la lotería del draft, si estamos interesados en aprender acerca de los efectos del proyecto de elegibilidad y el servicio militar en las ganancias del mercado de trabajo posteriores, podemos comparar los resultados para las personas cuyas fechas de nacimiento estaban debajo del punto de corte de la lotería (por ejemplo, 14 de Septiembre, Abril 24, etc.) con los resultados de las personas cuyos cumpleaños fueron después del corte (por ejemplo, 20 de febrero 2 de diciembre, etc.).
Teniendo en cuenta que este tratamiento de redacción ha sido asignado al azar, entonces podemos medir el efecto de este tratamiento para cualquier resultado que se ha medido. Por ejemplo, Angrist (1990) combinó la información acerca de quién fue seleccionado al azar en el proyecto con datos de las ganancias que fue recogido por la Administración de Seguridad Social para concluir que las ganancias de los veteranos blancos eran aproximadamente un 15% menos que los ingresos de los no veteranos comparables . Otros investigadores han utilizado un truco similar también. Por ejemplo, Conley and Heerwig (2011) combinan la información sobre quién fue seleccionado al azar en el proyecto con los datos de hogares recogidos de la Encuesta del Censo 2000 y 2005 sobre la Comunidad Estadounidense y encontraron que tanto tiempo después de que el proyecto, hubo poco efecto a largo plazo de el servicio militar en la variedad de resultados como la tenencia de la vivienda (la posesión frente al alquiler) y la estabilidad residencial (probabilidad de haber movido en cinco años anteriores).
Como ilustra este ejemplo, a veces las fuerzas sociales, políticas o naturales crean experimentos o cuasi-experimentos que pueden ser aprovechados por los investigadores. A menudo, los experimentos naturales son la mejor manera de estimar las relaciones de causa y efecto en los entornos en los que no es ético ni práctico llevar a cabo experimentos controlados aleatorios. Son una importante estrategia para descubrir las comparaciones justas en los datos no experimentales. Esta estrategia de investigación se puede resumir en la siguiente ecuación:
\ [\ text {aleatoria (o como si al azar) evento} + \ text {siempre en flujo de datos} = \ text {experimento natural} \ qquad (2.1) \]
Sin embargo, el análisis de experimentos naturales puede ser bastante complicado. Por ejemplo, en el caso del proyecto de Vietnam, no todo el que era elegible proyecto terminó sirviendo (había una variedad de excepciones). Y, al mismo tiempo, algunas personas que no fueron Draft-elegibles como voluntarios para el servicio. Era como si en un ensayo clínico de un nuevo fármaco, algunas personas en el grupo de tratamiento no toman sus medicamentos y algunas de las personas en el grupo de control de alguna manera recibieron el fármaco. Este problema, denominado incumplimiento de dos caras, así como muchos otros problemas se describen en mayor detalle en algunas de las lecturas recomendadas al final de este capítulo.
La estrategia de tomar ventaja de origen natural asignación aleatoria precede a la era digital, pero la prevalencia de grandes volúmenes de datos hace que esta estrategia mucho más fácil de usar. Una vez que comprenda un cierto tratamiento se ha asignado al azar, grandes fuentes de datos pueden proporcionar los datos de resultado que necesita con el fin de comparar los resultados para las personas en las condiciones de tratamiento y control. Por ejemplo, en su estudio sobre los efectos del proyecto y el servicio militar, Angrist hizo uso de registros de ingresos de la Administración de Seguridad Social; Sin estos datos de resultado, su estudio no habría sido posible. En este caso, la Administración de Seguridad Social es la fuente de datos grande siempre activa. Como existen más y más automáticamente recogido fuentes de datos, vamos a tener más datos de los resultados que se pueden medir los efectos de los cambios creados por la variación exógena.
Para ilustrar esta estrategia en la era digital, consideremos Mas y de Moretti (2009) la investigación sobre el efecto elegante de los pares en la productividad. Aunque en la superficie puede parecer diferente que el estudio de Angrist acerca de los efectos del proyecto de Vietnam, en la estructura que ambos siguen el patrón en la ec. 2.1.
Mas y Moretti midieron qué pares afectan la productividad de los trabajadores. Por un lado, tener un compañero de trabajo duro puede llevar a los trabajadores a aumentar su productividad debido a la presión de grupo. O, por el contrario, un compañero de trabajo duro puede dar lugar a otros trabajadores para aflojar aún más. La forma más clara para estudiar los efectos sobre la productividad de pares sería un experimento controlado aleatorio donde los trabajadores son asignados al azar a los cambios con los trabajadores de los diferentes niveles de productividad y la productividad se mide a continuación, dando como resultado para todo el mundo. Los investigadores, sin embargo, no controlar el horario de los trabajadores en cualquier negocio real, y por lo que Mas y Moretti tenido que depender de un experimento natural que tuvo lugar en un supermercado.
Al igual eq. 2.1, su estudio tenía dos partes. En primer lugar, utiliza los registros del sistema de caja del supermercado para tener una precisa e individual, y siempre en medida de la productividad: el número de elementos analizados por segundo. Y, en segundo lugar, debido a la forma en que la programación se realiza en este supermercado, tienen cerca de composición aleatoria de pares. En otras palabras, a pesar de que la programación de las cajeras no está determinada por una lotería, que era esencialmente aleatoria. En la práctica, la confianza que tenemos en experimentos naturales depende con frecuencia de la plausibilidad de este "como si" reclamo al azar. Aprovechando esta variación al azar, Mas y Moretti encontraron que el trabajo con compañeros de mayor productividad aumenta la productividad. Además, Mas y Moretti utilizan el tamaño y la riqueza de su conjunto de datos para ir más allá de la estimación de la relación causa-efecto para explorar dos cuestiones más importantes y sutiles: la heterogeneidad de este efecto (para qué tipo de trabajadores es el efecto más grande) y el mecanismo detrás del efecto (¿Por qué tener pares de alta productividad conducen a una mayor productividad). Volveremos a estos dos importantes cuestiones heterogeneidad de los efectos y mecanismos de tratamiento en el capítulo 5, cuando se discuten experimentos con más detalle.
Generalizar a partir de los estudios sobre el efecto del Proyecto de Vietnam en las ganancias y el estudio del efecto de los compañeros en la productividad, la Tabla 2.3 se resumen otros estudios que tienen esta misma estructura exacta: el uso de estar siempre en una fuente de datos para medir el impacto de algún evento . Como muestra la Tabla 2.3 deja claro, los experimentos naturales están en todas partes si sólo sabe cómo mirar para ellos.
enfoque sustantivo | Fuente del experimento natural | Siempre-en datos de origen | Citación |
---|---|---|---|
Peer efectos sobre la productividad | proceso de programación | datos de pago y envío | Mas and Moretti (2009) |
la formación de la amistad | huracanes | Phan and Airoldi (2015) | |
Propagación de las emociones | lluvia | Coviello et al. (2014) | |
Intercambio de archivos transferencias económicas | terremoto | Datos de dinero móvil | Blumenstock, Fafchamps, and Eagle (2011) |
el comportamiento de consumo personal | 2013 cierre del gobierno de EE.UU. | datos de las finanzas personales | Baker and Yannelis (2015) |
Impacto económico de los sistemas de recomendación | varios | los datos de navegación en Amazon | Sharma, Hofman, and Watts (2015) |
Efecto del estrés en los bebés por nacer | La guerra de 2006 entre Israel y Hezbolá | Las actas de nacimiento | Torche and Shwed (2015) |
La lectura de la conducta en la Wikipedia | revelaciones de Snowden | los registros de Wikipedia | Penney (2016) |
En la práctica, los investigadores utilizan dos estrategias diferentes para encontrar experimentos naturales, los cuales pueden ser fructífero. Algunos investigadores comienzan con la fuente de datos siempre y buscan los acontecimientos al azar en el mundo; otros comienzan a sucesos aleatorios en el mundo y buscar fuentes de datos que capturan su impacto. Por último, se dio cuenta de que la fuerza de experimentos naturales no proviene de la sofisticación del análisis estadístico, sino de la atención en el descubrimiento de una comparación justa creado por un afortunado accidente de la historia.