Nell'estate del 2009, i telefoni cellulari suonavano in tutto il Ruanda. Oltre ai milioni di chiamate tra familiari, amici e colleghi di lavoro, circa 1.000 ruandesi ha ricevuto una chiamata da Joshua Blumenstock e dei suoi colleghi. I ricercatori stavano studiando la ricchezza e la povertà conducendo un sondaggio di persone che erano state campionate in modo casuale da un database di 1,5 milioni di clienti dal più grande operatore di telefonia mobile del Ruanda. Blumenstock e colleghi hanno chiesto ai partecipanti se volevano partecipare a un sondaggio, ha spiegato la natura della ricerca di loro, e poi chiesto una serie di domande sulle loro caratteristiche demografiche, sociali ed economiche.
Tutto ciò che ho detto fino ad ora rende questo suono come una consueta indagine delle scienze sociali. Ma, ciò che viene dopo non è tradizionale, almeno non ancora. Hanno usato i dati dell'indagine di formare un modello di apprendimento automatico per prevedere la ricchezza di qualcuno dei loro dati delle chiamate, e poi hanno usato questo modello per stimare la ricchezza di tutti i 1,5 milioni di clienti. Successivamente, hanno stimato il luogo di residenza di tutti i 1,5 milioni di clienti, utilizzando le informazioni geografiche incorporato nei registri delle chiamate. Mettendo queste due stime insieme-la ricchezza stimata e il luogo di residenza stimata-Blumenstock e colleghi sono stati in grado di produrre stime ad alta risoluzione della distribuzione geografica della ricchezza attraverso il Ruanda. In particolare, essi potrebbero produrre un patrimonio stimato per ciascuno dei 2.148 cellule del Ruanda, l'unità amministrativa più piccola del paese.
Era impossibile per convalidare queste stime, perché nessuno aveva mai prodotto stime per piccole aree geografiche tali in Ruanda. Ma, quando Blumenstock e colleghi aggregati loro stime a 30 distretti del Ruanda, hanno trovato che le loro stime erano simili a quelle stimate dalla Demographic and Health Survey, il gold standard di indagini nei paesi in via di sviluppo. Anche se questi due approcci hanno prodotto stime simili in questo caso, l'approccio di Blumenstock e colleghi era di circa 10 volte più veloce e 50 volte in meno rispetto alle tradizionali indagini demografiche e sanitarie. Queste stime notevolmente più veloci e ridurre il costo di creare nuove possibilità per i ricercatori, i governi e le aziende (Blumenstock, Cadamuro, and On 2015) .
Oltre a sviluppare una nuova metodologia, questo studio è un po 'come un test di Rorschach inkblot; ciò che la gente vede dipende dal loro background. Molti scienziati sociali vedono un nuovo strumento di misurazione che può essere utilizzato per testare le teorie circa sviluppo economico. Molti scienziati dati vedono un nuovo problema di apprendimento automatico fresco. Molti uomini d'affari vedono un approccio potente per sbloccare il valore nei dati di traccia digitale che hanno già raccolto. Molti sostenitori della privacy vedono un ricordo spaventoso che viviamo in un tempo di sorveglianza di massa. Molti responsabili politici vedono un modo che le nuove tecnologie possono contribuire a creare un mondo migliore. In realtà, questo studio è tutte queste cose, e che è per questo che è una finestra sul futuro della ricerca sociale.