在2009年的夏天,手机被响彻卢旺达。除了数以百万计的家庭,朋友和商业伙伴之间的呼叫,大约1000名卢旺达收到约书亚Blumenstock和他的同事的电话。这项研究是由导电的谁已随机抽取的150万客户提供从卢旺达最大的手机供应商的数据库采样人的调查研究财富与贫困。 Blumenstock和同事要求参与者如果他们想参与调查,解释了研究的性质给他们,然后问了一系列关于他们的人口,社会,经济等特点的问题。
我的一切都表示到现在为止,使这听起来像一个传统的社会科学调查。但是,随之而来的便是不是传统意义上,至少目前还没有。他们所使用的调查数据来训练机器学习模型从他们的呼叫数据预测一个人的财富,然后他们用这个模型来估算所有的150万客户的财富。接下来,他们通过使用嵌入在呼叫记录地理信息估计所有的150万客户的居住地。把这些两个估计在一起,估计财富和估计居住-Blumenstock和他的同事们能够创造财富的跨越卢旺达的地理分布的高分辨率估计。特别是,它们可以在国产生的估计的财富为每个卢旺达2148细胞,最小管理单位。
这是不可能的,因为从来没有人制作了在卢旺达这样的小地理区域的估计,以验证这些估计数据。但是,当Blumenstock和同事们汇总他们的估计卢旺达的30个地区,他们发现,他们的估计相似,从人口与健康调查,在发展中国家调查的黄金标准估算。虽然这两种方法产生在这种情况下类似的估计,Blumenstock和他的同事的做法是快10倍,比传统的人口与健康调查便宜50倍。这些显着更快和更低的成本估算创建的研究人员,政府新的可能性,和公司(Blumenstock, Cadamuro, and On 2015) 。
除了开发新的方法,这项研究是一种像一个罗夏墨迹测验;人们看到的内容取决于他们的背景。许多社会科学家看到一个新的测量工具,可以用来测试对经济发展理论。许多数据科学家看到一个很酷的新的机器学习问题。很多商务人士看到的,他们已经收集到的数字跟踪数据释放价值的强大方法。许多隐私倡导者看到,我们生活在群众监督的时候一个可怕的提醒。许多决策者看到的方式,新的技术可以帮助创造一个更美好的世界。事实上,这种研究是所有这些事情,这就是为什么它是一个窗口,进入社会研究的未来。