No verán de 2009, os teléfonos móbiles soaban en todo Ruanda. Ademais dos millóns de chamadas de familiares, amigos e socios comerciais, preto de 1.000 ruandeses recibiron unha chamada de Joshua Blumenstock e os seus colegas. Estes investigadores estiveron estudando riqueza e pobreza realizando unha enquisa sobre unha mostra aleatoria de persoas dunha base de datos de 1,5 millóns de clientes do maior proveedor de telefonía móbil de Rwanda. Blumenstock e colegas preguntaron ás persoas seleccionadas aleatoriamente se quixeron participar nunha enquisa, explicáronlles a natureza da investigación e logo preguntaron unha serie de preguntas sobre as súas características demográficas, sociais e económicas.
Todo o que dixen ata agora fai soar como unha enquisa tradicional de ciencias sociais. Pero o que vén a continuación non é tradicional, polo menos aínda non. Ademais dos datos da enquisa, Blumenstock e compañeiros tamén tiveron os rexistros de chamadas completos para todos os 1,5 millóns de persoas. Combinando estas dúas fontes de datos, utilizaron os datos da enquisa para formar un modelo de aprendizaxe automático para predecir a riqueza dunha persoa en función dos seus rexistros de chamadas. A continuación, utilizaron este modelo para estimar a riqueza de todos os 1,5 millóns de clientes na base de datos. Tamén estimaron os lugares de residencia de todos os 1,5 millóns de clientes usando a información xeográfica inserida nos rexistros de chamadas. Poñer todo isto en conxunto: a riqueza estimada eo lugar estimado de residencia, foron capaces de producir mapas de alta resolución sobre a distribución xeográfica da riqueza en Ruanda. En particular, poderían producir unha riqueza estimada para cada unha das 2.148 celas de Ruanda, a pequena unidade administrativa do país.
Desafortunadamente, era imposible validar a precisión destas estimacións porque ninguén produciu estimacións para esas pequenas áreas xeográficas en Ruanda. Pero cando Blumenstock e os seus colegas agregaron as súas estimacións aos 30 distritos de Rwanda, descubriron que as súas estimacións eran moi similares ás estimacións da Enquisa Demográfica e de Saúde, que é amplamente considerado o estándar dourado de enquisas en países en desenvolvemento. Aínda que estes dous enfoques produciron estimacións semellantes neste caso, o enfoque de Blumenstock e colegas foi aproximadamente 10 veces máis rápido e 50 veces máis barato que as tradicionales Demographic and Health Surveys. Estas estimacións de custos máis dramáticos e máis baixos crean novas posibilidades para investigadores, gobernos e empresas (Blumenstock, Cadamuro, and On 2015) .
Este estudo é semellante a unha proba de tinta de Rorschach: o que a xente ven depende do seu fondo. Moitos científicos sociais ven unha nova ferramenta de medición que se pode empregar para probar as teorías sobre o desenvolvemento económico. Moitos científicos de datos ven un problema novo e novo de aprendizaxe. Moitos empresarios ven un enfoque poderoso para desbloquear o valor nos grandes datos que xa recolectaron. Moitos defensores da privacidade ven un recordo de que vivimos nun momento de vixilancia masiva. E, finalmente, moitos fabricantes de políticas ven un xeito que a nova tecnoloxía poida axudar a crear un mundo mellor. De feito, este estudo é todas esas cousas e, dado que ten esta mestura de características, vexo como unha fiestra cara ao futuro da investigación social.