1.1インクブロット

2009年の夏、ルワンダ全域で携帯電話が鳴っていました。家族、友人、ビジネスアソシエートからの何百万もの呼びかけに加えて、ルワンダ人約1,000人がJoshua Blumenstockとその同僚からの電話を受けました。これらの研究者は、ルワンダ最大の携帯電話プロバイダー150万人のデータベースから、無作為抽出したサンプルを調査して、富と貧困を研究していました。 Blumenstockらは無作為抽出された人々に調査に参加したいのかどうかを尋ね、調査の性質を説明し、その後、人口統計、社会的、経済的特性について一連の質問をした。

これまで私が言ってきたことはすべて、伝統的な社会科学調査のようなものです。しかし、次に来るのは伝統的ではありません。調査データに加えて、Blumenstockらは、150万人のすべての人々の完全な通話記録も持っていました。これらの2つのデータソースを組み合わせて、調査データを使用して、マシンの学習モデルを訓練し、コールレコードに基づいて人の富を予測しました。次に、このモデルを使用して、データベース内のすべての150万人の顧客の富を推計しました。また、通話記録に埋め込まれた地理情報を使用して150万人の顧客すべての居住地を推定しました。これらすべてをまとめて、推定された富と推定された居住地は、ルワンダの富の地理的分布の高解像度地図を作り出すことができました。特に、ルワンダの2,148のセル(各国の最小行政単位)の推定富を生み出すことができる。

残念なことに、ルワンダのこのような小さな地域では誰も推定値を作成していなかったため、これらの推定値の精度を検証することは不可能でした。しかし、Blumenstockとその同僚がルワンダの30の地区に推定値を集計したところ、彼らの推定値は、開発途上国における調査のゴールドスタンダードと広く見なされている人口統計および健康調査の推定値に非常に類似していることがわかった。この2つのアプローチでも同様の推定値が得られましたが、Blumenstockとその同僚のアプローチは、従来の人口統計調査と比較して約10倍速く、50倍安かったです。これらの劇的に速く低コストの見積もりは、研究者、政府、企業(Blumenstock, Cadamuro, and On 2015)新たな可能性を生み出します。

この研究は、ロールシャッハインクブロット試験のようなものです。人々が見るのは、その背景に依存します。多くの社会科学者は、経済発展に関する理論をテストするために使用できる新しい測定ツールを見ています。多くのデータ科学者はクールな新しい機械学習問題を見ています。多くのビジネス担当者は、すでに収集している大規模データの価値を引き出す強力なアプローチを見ています。多くのプライバシー擁護派は、私たちが大量の監視の時代に住んでいるという恐ろしい思い出を見ています。最後に、多くの政策立案者は、新技術がより良い世界を創造する方法を見ています。実際には、この研究はすべてそのようなものであり、このような特徴が混在しているため、私はそれを社会研究の未来への窓口と見ています。