Pada musim panas 2009, ponsel berdering di seluruh Rwanda. Selain jutaan panggilan antara keluarga, teman, dan rekan bisnis, sekitar 1.000 orang Rwanda menerima telepon dari Joshua Blumenstock dan rekan-rekannya. Para peneliti sedang mempelajari kekayaan dan kemiskinan dengan melakukan survei terhadap orang-orang yang telah secara acak sampel dari database 1,5 juta pelanggan dari operator telepon seluler terbesar Rwanda. Blumenstock dan rekan meminta para peserta jika mereka ingin berpartisipasi dalam survei, menjelaskan sifat penelitian mereka, dan kemudian meminta serangkaian pertanyaan tentang karakteristik demografi, sosial, dan ekonomi mereka.
Semua yang saya katakan sampai sekarang membuat suara ini seperti survei ilmu sosial tradisional. Tapi, apa yang terjadi berikutnya tidak tradisional, setidaknya belum. Mereka menggunakan data survei untuk melatih model pembelajaran mesin untuk memprediksi kekayaan seseorang dari data panggilan mereka, dan kemudian mereka menggunakan model ini untuk memperkirakan kekayaan dari semua 1,5 juta pelanggan. Selanjutnya, mereka memperkirakan tempat tinggal dari semua 1,5 juta pelanggan dengan menggunakan informasi geografis tertanam dalam log panggilan. Meletakkan dua perkiraan ini bersama-sama-estimasi kekayaan dan diperkirakan tempat tinggal-Blumenstock dan rekan mampu menghasilkan perkiraan resolusi tinggi dari distribusi geografis kekayaan di Rwanda. Secara khusus, mereka bisa menghasilkan kekayaan diperkirakan untuk masing-masing Rwanda 2148 sel, unit administrasi terkecil di negara ini.
Itu tidak mungkin untuk memvalidasi perkiraan ini karena tidak ada yang pernah diproduksi perkiraan untuk wilayah geografis kecil seperti di Rwanda. Tapi, ketika Blumenstock dan rekan dikumpulkan perkiraan mereka untuk Rwanda 30 kabupaten, mereka menemukan bahwa perkiraan mereka serupa dengan perkiraan dari Survei Demografi dan Kesehatan, standar emas dari survei di negara-negara berkembang. Meskipun kedua pendekatan diproduksi perkiraan yang sama dalam hal ini, pendekatan Blumenstock dan rekan adalah sekitar 10 kali lebih cepat dan 50 kali lebih murah daripada Survei Demografi dan Kesehatan tradisional. Ini perkiraan biaya secara dramatis lebih cepat dan lebih rendah membuat kemungkinan-kemungkinan baru bagi para peneliti, pemerintah, dan perusahaan (Blumenstock, Cadamuro, and On 2015) .
Selain mengembangkan metodologi baru, penelitian ini adalah jenis seperti tes noda tinta Rorschach; apa yang orang lihat tergantung pada latar belakang mereka. Banyak ilmuwan sosial melihat alat ukur baru yang dapat digunakan untuk menguji teori tentang pembangunan ekonomi. Banyak ilmuwan Data melihat masalah pembelajaran mesin baru keren. Banyak orang-orang bisnis melihat pendekatan yang kuat untuk membuka nilai dalam data jejak digital yang mereka telah dikumpulkan. Banyak pendukung privasi melihat pengingat menakutkan bahwa kita hidup dalam waktu pengawasan massa. Banyak pembuat kebijakan melihat cara bahwa teknologi baru dapat membantu menciptakan dunia yang lebih baik. Bahkan, penelitian ini adalah semua hal-hal, dan itulah mengapa itu adalah jendela ke masa depan penelitian sosial.