في صيف عام 2009 ، كانت الهواتف المحمولة تدق في جميع أنحاء رواندا. بالإضافة إلى ملايين المكالمات من العائلة والأصدقاء وشركاء الأعمال ، تلقى حوالي 1000 رواندي مكالمة من جوشوا بلومنستوك وزملائه. كان هؤلاء الباحثون يدرسون الثروة والفقر من خلال إجراء مسح لعينة عشوائية من الأشخاص من قاعدة بيانات تضم 1.5 مليون عميل من أكبر مزود للهاتف المحمول في رواندا. طلب Blumenstock وزملاؤه من الأشخاص الذين تم اختيارهم عشوائياً إذا كانوا يرغبون في المشاركة في الاستطلاع ، وشرح طبيعة البحث لهم ، ثم طرحوا سلسلة من الأسئلة حول خصائصهم السكانية والاجتماعية والاقتصادية.
كل ما قلته حتى الآن يجعل هذا يبدو وكأنه مسح تقليدي للعلوم الاجتماعية. لكن ما يأتي بعد ذلك ليس تقليديا - على الأقل ليس بعد. بالإضافة إلى بيانات الاستطلاع ، كان لدى Blumenstock وزملاؤه سجلات المكالمات الكاملة لكل 1.5 مليون شخص. الجمع بين هذين المصدرين للبيانات ، استخدموا بيانات المسح لتدريب نموذج التعلم الآلي للتكهن بثروة الشخص على أساس سجلات المكالمات الخاصة بهم. بعد ذلك ، استخدموا هذا النموذج لتقدير ثروة كل العملاء البالغ عددهم 1.5 مليون في قاعدة البيانات. كما قاموا أيضًا بتقدير أماكن إقامة جميع العملاء البالغ عددهم 1.5 مليون مستخدمًا للمعلومات الجغرافية المضمنة في سجلات المكالمات. وجمع كل ذلك معاً - الثروة المقدرة ومكان الإقامة المقدّر - تمكنوا من إنتاج خرائط عالية الدقة للتوزيع الجغرافي للثروة في رواندا. على وجه الخصوص ، يمكن أن تنتج ثروة تقديرية لكل واحد من 2148 خلية في رواندا ، أصغر وحدة إدارية في البلاد.
ومما يؤسف له أنه كان من المستحيل التحقق من دقة هذه التقديرات لأن أحدا لم يسبق أن قدم تقديرات لمثل هذه المناطق الجغرافية الصغيرة في رواندا. ولكن عندما جمع Blumenstock وزملاؤه تقديراتهم إلى ثلاثين مقاطعة في رواندا ، وجدوا أن تقديراتهم كانت متشابهة إلى حد كبير مع تقديرات المسح الديمغرافي والصحي ، الذي يعتبر على نطاق واسع هو المعيار الذهبي للمسوحات في البلدان النامية. على الرغم من أن هذين الأسلوبين قد قدما تقديرات متشابهة في هذه الحالة ، كان نهج Blumenstock وزملاؤه أسرع بنحو 10 مرات وأكثر 50 مرة أرخص من المسوحات الصحية والديموغرافية التقليدية. هذه التقديرات ذات التكلفة المنخفضة والأسرع بشكل كبير تخلق إمكانيات جديدة للباحثين والحكومات والشركات (Blumenstock, Cadamuro, and On 2015) .
هذه الدراسة تشبه اختبار رورسكش للحساسية: يعتمد ما يراه الناس على خلفيتهم. يرى العديد من علماء الاجتماع أداة قياس جديدة يمكن استخدامها لاختبار نظريات حول التنمية الاقتصادية. يرى العديد من علماء البيانات مشكلة جديدة في التعلم الآلي. يرى العديد من رجال الأعمال نهجًا قويًا لإلغاء القيمة في البيانات الكبيرة التي جمعوها بالفعل. يرى العديد من المدافعين عن الخصوصية تذكيرًا مخيفًا بأننا نعيش في زمن مراقبة جماعية. وأخيرًا ، يرى العديد من صانعي السياسة طريقة تساعد التكنولوجيا الجديدة على خلق عالم أفضل. في الواقع ، هذه الدراسة هي كل تلك الأشياء ، ولأنها تمتلك هذا المزيج من الخصائص ، أرى أنها نافذة في مستقبل البحث الاجتماعي.