En el verano de 2009, los teléfonos móviles sonaban por toda Ruanda. Además de los millones de llamadas entre familiares, amigos y socios de negocios, cerca de 1.000 ruandeses recibieron una llamada de Joshua Blumenstock y sus colegas. Los investigadores estaban estudiando la riqueza y la pobreza mediante la realización de un estudio de las personas que habían sido incluidos en la muestra al azar de una base de datos de 1,5 millones de clientes de mayor proveedor de telefonía móvil de Ruanda. Blumenstock y sus colegas pidieron a los participantes si querían participar en una encuesta, explican la naturaleza de la investigación para ellos, y luego se les hizo una serie de preguntas acerca de sus características demográficas, sociales y económicas.
Todo lo que he dicho hasta ahora hace que este sonido como un estudio tradicional de las ciencias sociales. Pero, lo que viene a continuación no es tradicional, al menos no todavía. Se utilizaron los datos de la encuesta para entrenar un modelo de aprendizaje de máquina para predecir la riqueza de alguien de sus datos de llamada, y luego utilizaron este modelo para estimar la riqueza de los 1,5 millones de clientes. A continuación, se estima que el lugar de residencia de los 1,5 millones de clientes mediante el uso de la información geográfica incrustado en los registros de llamadas. Poner estas dos estimaciones juntos, la riqueza estimada y el lugar de residencia estimado-Blumenstock y sus colegas fueron capaces de producir estimaciones de alta resolución de la distribución geográfica de la riqueza en Ruanda. En particular, se podría producir una riqueza estimada para cada una de las células de Ruanda 2.148, la unidad administrativa más pequeña del país.
Era imposible para validar estas estimaciones porque nunca nadie había producido estimaciones para este tipo de áreas geográficas pequeñas en Ruanda. Pero, cuando Blumenstock y sus colegas agregan sus estimaciones para 30 distritos de Ruanda, se encontraron con que sus estimaciones fueron similares a las estimaciones de la Encuesta Demográfica y de Salud, el patrón oro de las encuestas en los países en desarrollo. A pesar de estos dos enfoques producen estimaciones similares en este caso, el enfoque de Blumenstock y sus colegas era aproximadamente 10 veces más rápido y 50 veces más barato que las encuestas demográficas y de salud tradicionales. Estas estimaciones de costos dramáticamente más rápidas e inferior crean nuevas posibilidades para los investigadores, gobiernos y empresas (Blumenstock, Cadamuro, and On 2015) .
Además de desarrollar una nueva metodología, este estudio es algo así como un test de Rorschach; lo que la gente ve depende de sus antecedentes. Muchos científicos sociales ven una nueva herramienta de medición que se puede utilizar para poner a prueba las teorías sobre el desarrollo económico. Muchos científicos de datos ven un problema nuevo y genial de aprendizaje automático. Muchos empresarios ven un enfoque poderoso para la puesta en valor de los datos de rastreo digital que ya han recogido. Muchos defensores de la privacidad ver un recordatorio de miedo de que vivimos en un tiempo de vigilancia masiva. Muchos los reguladores ven de manera que la nueva tecnología puede ayudar a crear un mundo mejor. De hecho, este estudio es todas esas cosas, y es por eso que es una ventana hacia el futuro de la investigación social.