Pada musim panas tahun 2009, telepon seluler berdering di seluruh Rwanda. Selain jutaan panggilan dari keluarga, teman, dan rekan bisnis, sekitar 1.000 warga Rwanda menerima telepon dari Joshua Blumenstock dan rekan-rekannya. Para peneliti ini mempelajari kekayaan dan kemiskinan dengan melakukan survei terhadap sampel acak orang-orang dari database 1,5 juta pelanggan penyedia ponsel terbesar di Rwanda. Blumenstock dan koleganya menanyakan orang-orang yang dipilih secara acak apakah mereka ingin berpartisipasi dalam survei, menjelaskan sifat penelitian kepada mereka, dan kemudian mengajukan serangkaian pertanyaan tentang karakteristik demografi, sosial, dan ekonomi mereka.
Semua yang saya katakan sejauh ini membuat ini terdengar seperti survei ilmu sosial tradisional. Tetapi apa yang terjadi selanjutnya tidak tradisional — setidaknya belum. Selain data survei, Blumenstock dan rekan juga memiliki catatan panggilan lengkap untuk semua 1,5 juta orang. Menggabungkan dua sumber data ini, mereka menggunakan data survei untuk melatih model pembelajaran mesin untuk memprediksi kekayaan seseorang berdasarkan catatan panggilan mereka. Selanjutnya, mereka menggunakan model ini untuk memperkirakan kekayaan semua 1,5 juta pelanggan dalam basis data. Mereka juga memperkirakan tempat tinggal dari semua 1,5 juta pelanggan menggunakan informasi geografis yang tertanam dalam catatan panggilan. Menyatukan semua ini — perkiraan kekayaan dan perkiraan tempat tinggal — mereka mampu menghasilkan peta resolusi tinggi dari distribusi kekayaan geografis di Rwanda. Secara khusus, mereka dapat menghasilkan kekayaan yang diperkirakan untuk masing-masing 2.148 sel Rwanda, unit administrasi terkecil di negara ini.
Sayangnya, tidak mungkin untuk memvalidasi keakuratan perkiraan ini karena tidak ada yang pernah menghasilkan perkiraan untuk wilayah geografis kecil di Rwanda. Tetapi ketika Blumenstock dan rekannya mengumpulkan perkiraan mereka ke 30 distrik di Rwanda, mereka menemukan bahwa perkiraan mereka sangat mirip dengan perkiraan dari Survei Demografi dan Kesehatan, yang secara luas dianggap sebagai standar emas dari survei di negara berkembang. Meskipun kedua pendekatan ini menghasilkan perkiraan serupa dalam kasus ini, pendekatan Blumenstock dan rekannya sekitar 10 kali lebih cepat dan 50 kali lebih murah daripada Demografi dan Survei Kesehatan tradisional. Perkiraan biaya yang jauh lebih cepat dan lebih rendah ini menciptakan kemungkinan baru bagi para peneliti, pemerintah, dan perusahaan (Blumenstock, Cadamuro, and On 2015) .
Studi ini seperti tes Retschach inkblot: apa yang dilihat orang tergantung pada latar belakang mereka. Banyak ilmuwan sosial melihat alat pengukuran baru yang dapat digunakan untuk menguji teori tentang perkembangan ekonomi. Banyak ilmuwan data melihat masalah pembelajaran mesin baru yang keren. Banyak pelaku bisnis melihat pendekatan yang kuat untuk membuka kunci nilai dalam data besar yang telah mereka kumpulkan. Banyak pendukung privasi melihat pengingat menakutkan bahwa kita hidup dalam masa pengawasan massal. Dan akhirnya, banyak pembuat kebijakan melihat cara bahwa teknologi baru dapat membantu menciptakan dunia yang lebih baik. Kenyataannya, penelitian ini adalah semua hal itu, dan karena memiliki campuran karakteristik ini, saya melihatnya sebagai jendela ke masa depan penelitian sosial.