Under sommaren 2009 har mobiltelefoner ringer hela Rwanda. Förutom de miljontals samtal mellan familj, vänner och affärsbekanta, fick ca 1000 rwandier ett samtal från Joshua Blumen och hans kollegor. Forskarna studerade rikedom och fattigdom genom att genomföra en undersökning av människor som hade slumpmässigt utvalda från en databas med 1,5 miljoner kunder från Rwanda största mobiloperatör. Blumen och kollegor frågade deltagarna om de ville delta i en undersökning, förklarade vilken typ av forskning till dem, och sedan frågade en rad frågor om deras demografiska, sociala och ekonomiska egenskaper.
Allt jag har sagt hittills gör detta låter som en traditionell samhällsvetenskaplig undersökning. Men, vad som kommer härnäst är inte traditionella, åtminstone inte ännu. De använde enkätdata för att utbilda en maskininlärning modell för att förutsäga någons rikedom från sina samtalsdata, och sedan de använde denna modell för att uppskatta den rikedom av alla 1,5 miljoner kunder. Därefter de uppskattade hemort alla 1,5 miljoner kunder med hjälp av geografisk information inbäddad i samtalsloggar. Att sätta dessa två uppskattningar tillsammans, beräknad rikedom och den beräknade bostadsort-Blumen och kollegor kunde producera högupplösta uppskattningar av den geografiska fördelningen av rikedom över Rwanda. Framför allt kan de producera en beräknad rikedom för var och en av Rwandas 2,148 celler, den minsta administrativa enheten i landet.
Det var omöjligt att bekräfta dessa uppskattningar eftersom ingen hade någonsin producerats uppskattningar för sådana små geografiska områden i Rwanda. Men när Blumen och kollegor samman sina beräkningar till Rwanda 30 distrikt, fann de att deras beräkningar liknade beräkningar från demografiska och hälsoundersökningen, den gyllene standarden för undersökningar i utvecklingsländerna. Även om dessa två metoder gav liknande beräkningar i det här fallet, att närma sig av Blumen och kollegor var ungefär 10 gånger snabbare och 50 gånger billigare än de traditionella demografiska och hälsoenkäter. Dessa dramatiskt snabbare och lägre kostnadsberäkningar skapar nya möjligheter för forskare, myndigheter och företag (Blumenstock, Cadamuro, and On 2015) .
Förutom att utveckla en ny metod, är denna studie ungefär som en Rorschach inkblot test; vad folk ser beror på deras bakgrund. Många samhällsvetare ser ett nytt mätverktyg som kan användas för att testa teorier om ekonomisk utveckling. Många data forskare ser en cool ny maskininlärningsproblem. Många företagare ser en kraftfull metod för att låsa värdet i den digitala spårningsdata som de redan har samlat. Många integritet förespråkar se en skrämmande påminnelse om att vi lever i en tid av massövervakning. Många beslutsfattare ser ett sätt att ny teknik kan bidra till att skapa en bättre värld. I själva verket är denna studie alla dessa saker, och det är därför det är ett fönster in i framtiden för social forskning.