2.4.3.1 experimentos naturais

Experiencias naturais aproveitar acontecementos aleatorios no mundo. aleatorio evento + always-on sistema de datos = experimento natural

A clave para experimentos aleatorios controlados que permitan comparación xusta é a randomização. Con todo, de cando en vez pasa algo no mundo que, esencialmente, atribúe a xente aleatoriamente ou case aleatoriamente a diferentes tratamentos. Un dos máis claros exemplos da estratexia de utilizar experimentos naturais vén de investigación de Angrist (1990) , que mide o efecto dos servizos militares sobre as ganancias.

Durante a guerra de Vietnam, EEUU aumentaron o tamaño das súas forzas armadas a través dun proxecto. Co fin de decidir os cidadáns serían chamados en servizo, o goberno de Estados Unidos realizou un sorteo. Cada data de nacemento foi representado sobre un anaco de papel, e estes artigos foron colocados nun frasco de vidro grande. Como se mostra na Figura 2.5, estes anacos de papel foron retirados do bote un de cada vez para determinar a orde que os mozos serían chamados a servir (as mulleres novas non estaban suxeitos ao proxecto). Con base nos resultados, os homes nacidos en 14 de setembro foron chamados en primeiro lugar, os homes nacidos en 24 de abril foron chamados segundo, e así por diante. En definitiva, neste sorteo, os homes nacidos en 195 días diferentes foron chamados para o servizo, mentres que os homes nacidos en 171 días non foron chamados.

Figura 2.5: O deputado Alexander Pirnie (R-NY) deseñando o primeiro cápsula para o proxecto de servizo selectivo en 1 de decembro de 1969 Joshua Angrist (1990) combinou o proxecto de lotería con ganancias datos da Administración da Seguridade Social para estimar o efecto do servizo militar sobre os beneficios. Este é un exemplo de investigación mediante un experimento natural. Fonte: Wikimedia Commons

Figura 2.5: O deputado Alexander Pirnie (R-NY) deseñando o primeiro cápsula para o proxecto de servizo selectivo en 1 de decembro de 1969 Joshua Angrist (1990) combinou o proxecto de lotería con ganancias datos da Administración da Seguridade Social para estimar o efecto do servizo militar sobre os beneficios. Este é un exemplo de investigación mediante un experimento natural. Fonte: Wikimedia Commons

Aínda que poida non ser inmediatamente aparente, un proxecto de lotería ten unha semellanza fundamental para un experimento controlado randomizado: en ambas situacións os participantes son designados aleatoriamente para recibir un tratamento. No caso de que o proxecto de lotería, se estamos interesados ​​en aprender sobre os efectos do proxecto de elixibilidade e do servizo militar sobre os beneficios do mercado de traballo posteriores, podemos comparar os resultados para as persoas cuxas datas de nacemento foron por baixo do límite de lotería (por exemplo, 14 de setembro, abril 24, etc.) cos resultados para as persoas cuxos aniversarios foron despois do corte (por exemplo, 20 de febreiro, 2 de decembro, etc.).

Dado que este tratamento de elaboración foi atribuída ao azar, que pode, a continuación, medir o efecto deste tratamento por calquera resultado que foi medido. Por exemplo, Angrist (1990) combinou a información sobre quen foi seleccionado aleatoriamente no proxecto con datos do salario que foron recollidos pola Administración da Seguridade Social para concluír que as ganancias dos veteranos brancos foron preto de 15% menos que os ingresos dos non-veteranos comparables . Outros investigadores usaron un truco similar tamén. Por exemplo, Conley and Heerwig (2011) combinou a información sobre quen foi seleccionado aleatoriamente no proxecto cos datos domésticos recollidos a partir da Procura Censo de 2000 e 2005 American Community e descubriu que tanto tempo despois do proxecto, houbo pouco efecto a longo prazo de o servizo militar na variedade de resultados, como a posesión de vivenda (posuír contra alugar) e estabilidade residencial (probabilidade de ter movido en cinco anos anteriores).

Como este exemplo ilustra, por veces, as forzas sociais, políticas ou naturais crear experiencias ou case-experimentos que poden ser aproveitados polos investigadores. Moitas veces experimentos naturais son a mellor forma para estimar relacións de causa e efecto en ambientes onde non é ético ou práctico para realizar experimentos aleatorios controlados. Son unha estratexia importante para descubrir comparacións xustas en datos non experimentais. Esta estratexia de investigación pode ser resumido pola seguinte ecuación:

\ [\ Text {aleatorio (ou como se chou) evento} + \ text {always-on fluxo de datos} = \ text {experimento natural} \ qquad (2.1) \]

Con todo, a análise das experiencias naturais pode ser moi complicado. Por exemplo, no caso de que o proxecto de Vietnam, non todo o mundo que se draft-elixibles acabou servindo (había unha variedade de exencións). E, ao mesmo tempo, algunhas persoas que non foron draft-elixibles ofreceu para prestar servizo. Era como se dun ensaio clínico dun novo medicamento, algunhas persoas no grupo de tratamento non tomar os medicamentos e algunhas das persoas do grupo de control de algunha maneira recibiron a droga. Este problema, chamada incumprimento de dous lados, así como moitos outros problemas son descritos en maior detalle a algunhas das lecturas recomendadas ao final deste capítulo.

A estratexia de aproveitar de ocorrencia natural asignación aleatoria precede a era dixital, pero a prevalencia de big data fai que esta estratexia moito máis doado de usar. Despois de entender algún tratamento foi concedido ao azar, fontes de datos grandes poden proporcionar os datos resultado que precisa, a fin de comparar os resultados para as persoas nas condicións de tratamento e control. Por exemplo, no seu estudo sobre os efectos do proxecto e servizo militar, Angrist fixo uso das ganancias rexistros da Administración da Seguridade Social; sen eses datos de resultado, o seu estudo non sería posible. Neste caso, a Administración da Seguridade Social é o sempre-en fonte de datos grande. Como hai máis e máis recollidas automaticamente fontes de datos, teremos máis datos resultado que pode medir os efectos dos cambios creadas pola variación esóxeno.

Para ilustrar esta estratexia na era dixital, imos considerar de Pero e Moretti (2009) busca elegante sobre o efecto dos pares sobre a produtividade. Aínda que na superficie pode parecer diferente do que o estudo de Angrist sobre os efectos do Proxecto de Vietnam, na estrutura ambos seguen o estándar na eq. 2.1.

Pero e Moretti medida como os pares afectar a produtividade dos traballadores. Por unha banda, ter un par traballando duro pode levar os traballadores a aumentar a súa produtividade por mor da presión dos pares. Ou, por outra banda, un disco de pares de traballo pode levar outros traballadores a afrouxar aínda máis. O xeito máis claro para estudar os efectos de pares sobre a produtividade sería un experimento controlado e randomizado, onde os traballadores son designados chou para quendas cos traballadores de diferentes niveis de produtividade e produtividade, entón resultante é medida para todos. Os investigadores, con todo, non controlar a axenda dos traballadores en calquera empresa real, e así Pero e Moretti debeu contar cun experimento natural que ocorreu nun supermercado.

Así como eq. 2.1, o estudo tivo dúas partes. En primeiro lugar, utilizaban os rexistros do sistema de supermercado para ter un precisas, individual e always-on medida de produtividade: o número de elementos verificados por segundo. E, en segundo lugar, por causa da maneira que a programación se fixo neste supermercado, eles teñen preto de composición aleatoria de pares. Noutras palabras, aínda que o axenda de caixas non está determinada por unha lotería, que era esencialmente aleatoria. Na práctica, a confianza que temos en experimentos naturais frecuentemente depende da plausibilidade desa "como se" reivindicación aleatoria. Aproveitando esta variación aleatoria, pero Moretti descubriron que traballar con compañeiros de produtividade máis elevado aumenta a produtividade. Ademais, Pero e Moretti usado o tamaño ea riqueza do seu conxunto de datos para ir máis alá da estimación de causa e efecto para explorar dúas cuestións máis importantes e sutís: a heteroxeneidade deste efecto (para os que tipo de traballadores é o efecto máis) e mecanismo detrás do efecto (por que ter compañeiros de alta produtividade levar a unha maior produtividade). Nós imos voltar a estes dous importantes problemas de heteroxeneidade de efectos e mecanismos-no Capítulo 5 de tratamento cando discutir experiencias en máis detalles.

Xeneralizando a partir dos estudos sobre o efecto do Proxecto de Vietnam sobre os rendementos eo estudo do efecto dos pares sobre a produtividade, a Táboa 2.3 resume outros estudos que esta mesma estrutura exacta: mediante unha always-on fonte de datos para medir o impacto de calquera evento . Como a Táboa 2.3 deixa claro, experimentos naturais están por todas partes se só sabe como mirar para eles.

Táboa 2.3: Exemplos de experimentos naturais que utilizan fontes de datos grandes. Todos estes estudos seguen a mesma receita básica: evento aleatorio (ou como se aleatorio) + always-on sistema de datos. Vexa Dunning (2012) para máis exemplos.
foco substancial Fonte do experimento natural Always-on de datos de orixe cita
Intercambio efectos sobre a produtividade proceso de axenda datos de checkout Mas and Moretti (2009)
formación amizade furacáns Facebook Phan and Airoldi (2015)
Difusión de emocións choiva Facebook Coviello et al. (2014)
Peer to peer transferencias económicas terremoto Datos de diñeiro móbil Blumenstock, Fafchamps, and Eagle (2011)
comportamento de consumo persoal 2013 paralización do goberno de Estados Unidos datos de finanzas persoais Baker and Yannelis (2015)
impacto económico das sistemas de recomendación vario datos de navegación en Amazon Sharma, Hofman, and Watts (2015)
Efecto do estrés sobre bebés en xestación 2006 guerra Israel-Hezbollah rexistros de nacemento Torche and Shwed (2015)
Lectura comportamento na Wikipedia revelacións Snowden rexistros de wikipedia Penney (2016)

Na práctica, os investigadores utilizan dúas estratexias diferentes para atopar experimentos naturais, sendo que ambos poden ser frutífera. Algúns investigadores comezar coa fonte always-on de datos e buscar eventos aleatorios en todo o mundo; outros comezan con eventos aleatorios en todo o mundo e buscar fontes de datos que captan o seu impacto. Finalmente, teña en conta que a forza dos experimentos naturais non vén da sofisticación da análise estatística, pero a partir do coidado en descubrir unha comparación xusta creada por un feliz casualidade da historia.