Kesällä 2009 matkapuhelimet soivat ympäri Ruandaa. Miljoonien perheiden, ystävien ja liikekumppanien puhelujen lisäksi noin tuhat ruandalainen sai puhelun Joshua Blumenstockilta ja hänen kollegoiltaan. Nämä tutkijat tutkivat vaurautta ja köyhyyttä tekemällä kyselyn satunnaisesta näytteestä ihmisiltä, jotka ovat Ruandan suurimman matkapuhelinoperaattorin 1,5 miljoonan asiakkaan tietokannasta. Blumenstock ja kollegat kysyivät satunnaisesti valittuja ihmisiä, jos he halusivat osallistua kyselyyn, selvittivät tutkimuksen luonnetta ja kysyivät sitten joukon kysymyksiä demografisista, sosiaalisista ja taloudellisista ominaisuuksistaan.
Kaikki, mitä olen sanonut tähän mennessä, tekee tämän kuulostavan perinteisestä sosiaalitieteellisestä tutkimuksesta. Mutta seuraavaksi ei ole perinteistä - ainakaan vielä. Kyselytietojen lisäksi Blumenstockilla ja työtovereilla oli täydelliset puhelutiedot kaikista 1,5 miljoonasta ihmisestä. Yhdistämällä nämä kaksi tietolähdettä, he käyttivät kyselytietoa kouluttaakseen koneen oppimismallin ennustaakseen henkilön rikkautta heidän puhelutietokantaansa perustuen. Seuraavaksi he käyttivät tätä mallia arvioidakseen kaikkien tietokannan 1,5 miljoonan asiakkaan runsauden. He arvioivat myös kaikkien 1,5 miljoonan asiakkaan asuinpaikat käyttämällä puhelutietueisiin upotettuja maantieteellisiä tietoja. Kun kaikki tämä yhdessä - arvioitu vauraus ja arvioitu asuinpaikka - he pystyivät tuottamaan suurta resoluution karttoja Ruandan rikkauden maantieteellisestä jakautumisesta. Erityisesti ne voisivat tuottaa arvioidun vaurauden jokaiselle Ruandan 2,148 soluista, maan pienimmistä hallinnollisista yksiköistä.
Valitettavasti näiden arvioiden tarkkuutta ei voitu vahvistaa, koska kukaan ei ollut koskaan tuottanut arvioita tällaisista pienistä maantieteellisistä alueista Ruandassa. Mutta kun Blumenstock ja kollegat koottiin arviot Ruandan 30: lle alueelle, he havaitsivat, että heidän arviot olivat hyvin samankaltaisia kuin väestö- ja terveystutkimuksen arvioinnit, joita pidetään laajalti kehitysmaiden kyselytutkimuksina. Vaikka nämä kaksi lähestymistapaa tuottivat samanlaisia arvioita tässä tapauksessa, Blumenstockin ja työtovereiden lähestymistapa oli noin 10 kertaa nopeampi ja 50 kertaa halvempi kuin perinteiset väestö- ja terveyskatsaukset. Nämä dramaattisesti nopeammat ja alhaisemmat kustannusarviot luovat uusia mahdollisuuksia tutkijoille, hallituksille ja yrityksille (Blumenstock, Cadamuro, and On 2015) .
Tämä tutkimus on sellainen kuin Rorschachin musteblot-testi: sen, mitä ihmiset näkevät, riippuu niiden taustasta. Monet yhteiskuntatieteilijät näkevät uuden mittaustyökalun, jota voidaan käyttää testata taloudellisen kehityksen teorioita. Monet tiedemiehet näkevät viileän uuden koneoppimisongelman. Monet liikemiehet näkevät voimakkaan lähestymistavan arvojen lukemiseen suurista tiedoista, jotka he ovat jo keränneet. Monet yksityisyyden puolustajat näkevät pelottavan muistutuksen siitä, että elämme masennuksen aikana. Ja lopuksi monet päättäjät näkevät tapaa, jolla uusi teknologia voi auttaa luomaan paremman maailman. Itse asiassa tämä tutkimus on kaikki nämä asiat, ja koska sillä on tämä ominaisuuksien sekoitus, näen sen ikkunana sosiaalisen tutkimuksen tulevaisuudeksi.