Nell'estate del 2009, i telefoni cellulari stavano suonando in tutto il Ruanda. Oltre ai milioni di chiamate da familiari, amici e colleghi di lavoro, circa 1.000 ruandesi hanno ricevuto una chiamata da Joshua Blumenstock e dai suoi colleghi. Questi ricercatori hanno studiato ricchezza e povertà conducendo un sondaggio su un campione casuale di persone da un database di 1,5 milioni di clienti del più grande fornitore di telefonia mobile del Ruanda. Blumenstock e colleghi hanno chiesto alle persone selezionate a caso se volevano partecipare a un sondaggio, hanno spiegato la natura della ricerca a loro, e poi hanno posto una serie di domande sulle loro caratteristiche demografiche, sociali ed economiche.
Tutto ciò che ho detto finora fa sembrare questo un sondaggio tradizionale sulle scienze sociali. Ma ciò che viene dopo non è tradizionale, almeno non ancora. Oltre ai dati del sondaggio, Blumenstock e colleghi hanno anche registrato tutti i record delle chiamate per tutti e 1,5 milioni di persone. Combinando queste due fonti di dati, hanno utilizzato i dati dell'indagine per formare un modello di apprendimento automatico per prevedere la ricchezza di una persona in base ai record delle chiamate. Successivamente, hanno utilizzato questo modello per stimare la ricchezza di tutti i 1,5 milioni di clienti nel database. Hanno inoltre stimato i luoghi di residenza di tutti i 1,5 milioni di clienti utilizzando le informazioni geografiche incorporate nei registri delle chiamate. Mettendo insieme tutto questo - la ricchezza stimata e il luogo di residenza stimato - sono stati in grado di produrre mappe ad alta risoluzione della distribuzione geografica della ricchezza in Ruanda. In particolare, potrebbero produrre una ricchezza stimata per ciascuna delle 2.148 cellule del Ruanda, la più piccola unità amministrativa del paese.
Sfortunatamente, era impossibile convalidare la precisione di queste stime perché nessuno aveva mai prodotto stime per aree geografiche così piccole in Ruanda. Ma quando Blumenstock e colleghi hanno aggregato le loro stime ai 30 distretti del Ruanda, hanno scoperto che le loro stime erano molto simili alle stime del Demographic and Health Survey, che è ampiamente considerato il gold standard delle indagini nei paesi in via di sviluppo. Sebbene questi due approcci abbiano prodotto stime simili in questo caso, l'approccio di Blumenstock e colleghi è stato circa 10 volte più veloce e 50 volte più economico rispetto ai tradizionali sondaggi demografici e sanitari. Queste stime notevolmente più rapide e dai costi inferiori creano nuove possibilità per ricercatori, governi e aziende (Blumenstock, Cadamuro, and On 2015) .
Questo studio è un po 'come un test inkblot di Rorschach: ciò che le persone vedono dipende dal loro background. Molti scienziati sociali vedono un nuovo strumento di misurazione che può essere utilizzato per testare le teorie sullo sviluppo economico. Molti scienziati informatici vedono un nuovo fantastico problema di apprendimento automatico. Molti uomini d'affari vedono un approccio potente per sbloccare il valore nei grandi dati che hanno già raccolto. Molti avvocati della privacy vedono un ricordo spaventoso che viviamo in un periodo di sorveglianza di massa. E infine, molti policy maker vedono un modo in cui la nuova tecnologia può aiutare a creare un mondo migliore. In realtà, questo studio è tutto questo e, poiché ha questo mix di caratteristiche, lo vedo come una finestra sul futuro della ricerca sociale.