En el verano de 2009, los teléfonos móviles estaban sonando en todo Rwanda. Además de los millones de llamadas de familiares, amigos y socios comerciales, unos 1.000 ruandeses recibieron una llamada de Joshua Blumenstock y sus colegas. Estos investigadores estaban estudiando la riqueza y la pobreza mediante la realización de una encuesta de una muestra aleatoria de personas de una base de datos de 1,5 millones de clientes del mayor proveedor de telefonía móvil de Ruanda. Blumenstock y sus colegas le preguntaron a las personas seleccionadas al azar si querían participar en una encuesta, les explicaron la naturaleza de la investigación y luego les hicieron una serie de preguntas sobre sus características demográficas, sociales y económicas.
Todo lo que he dicho hasta ahora hace que suene como una encuesta tradicional de ciencias sociales. Pero lo que sigue no es tradicional, al menos no todavía. Además de los datos de la encuesta, Blumenstock y sus colegas también tenían los registros completos de llamadas para todos los 1,5 millones de personas. Combinando estas dos fuentes de datos, utilizaron los datos de la encuesta para entrenar un modelo de aprendizaje automático para predecir el patrimonio de una persona en función de sus registros de llamadas. Luego, usaron este modelo para estimar la riqueza de todos los 1.5 millones de clientes en la base de datos. También estimaron los lugares de residencia de todos los 1,5 millones de clientes que utilizan la información geográfica incrustada en los registros de llamadas. Reuniendo todo esto -la riqueza estimada y el lugar de residencia estimado- pudieron producir mapas de alta resolución de la distribución geográfica de la riqueza en Ruanda. En particular, podrían producir una riqueza estimada para cada una de las 2.148 celdas de Rwanda, la unidad administrativa más pequeña del país.
Desafortunadamente, fue imposible validar la precisión de estas estimaciones porque nadie había producido estimaciones para áreas geográficas tan pequeñas en Ruanda. Pero cuando Blumenstock y sus colegas agregaron sus estimaciones a los 30 distritos de Rwanda, descubrieron que sus estimaciones eran muy similares a las estimaciones de la Encuesta Demográfica y de Salud, que es ampliamente considerada como el estándar de oro de las encuestas en los países en desarrollo. Aunque estos dos enfoques produjeron estimaciones similares en este caso, el enfoque de Blumenstock y sus colegas fue aproximadamente 10 veces más rápido y 50 veces más económico que las encuestas demográficas y de salud tradicionales. Estas estimaciones dramáticamente más rápidas y de menor costo crean nuevas posibilidades para los investigadores, los gobiernos y las empresas (Blumenstock, Cadamuro, and On 2015) .
Este estudio es como una prueba de inkblot de Rorschach: lo que ven las personas depende de sus antecedentes. Muchos científicos sociales ven una nueva herramienta de medición que puede usarse para probar teorías sobre el desarrollo económico. Muchos científicos de datos ven un nuevo y genial problema de aprendizaje automático. Muchos empresarios ven un enfoque poderoso para desbloquear el valor en los grandes datos que ya han recopilado. Muchos defensores de la privacidad ven un recordatorio aterrador de que vivimos en un momento de vigilancia masiva. Y finalmente, muchos legisladores ven una forma en que las nuevas tecnologías pueden ayudar a crear un mundo mejor. De hecho, este estudio es todas esas cosas, y debido a que tiene esta combinación de características, lo veo como una ventana hacia el futuro de la investigación social.