2009 년 여름, 르완다 전역에 휴대 전화가 울리고있었습니다. 가족, 친구 및 직장 동료로부터받은 수백만 건의 전화 외에도 약 1,000 명의 르완다 인들이 Joshua Blumenstock과 그의 동료들로부터 전화를 받았습니다. 이 연구원들은 르완다에서 가장 큰 이동 전화 공급자 인 150 만 고객의 데이터베이스에서 무작위 표본을 조사하여 부와 빈곤을 연구했습니다. Blumenstock과 동료들은 무작위로 선택된 사람들에게 설문 조사에 참여하기를 원하는지 물어보고 연구의 성격을 설명 한 다음 인구 통계 학적, 사회적 및 경제적 특성에 대한 일련의 질문을 제기했습니다.
지금까지 제가 말한 모든 것은이 소리를 전통적인 사회 과학 설문 조사처럼 만듭니다. 그러나 다음에 오는 것은 적어도 전통적이지 않습니다. 설문 조사 데이터 외에도 Blumenstock과 동료들 역시 150 만 명의 사람들에 대한 전체 통화 기록을 보유하고 있습니다. 이 두 가지 데이터 소스를 결합하여 설문 조사 데이터를 사용하여 통화 기록에 따라 사람의 부를 예측하는 기계 학습 모델을 교육했습니다. 다음으로이 모델을 사용하여 데이터베이스에있는 모든 150 만 고객의 자산을 예측했습니다. 또한 전화 기록에 포함 된 지리 정보를 사용하여 150 만 명의 모든 고객의 거주지를 추정했습니다. 이 모든 것들, 즉 추정 된 재산과 추정 거주지를 합치면 그들은 르완다에서 부의 지리적 분포의 고해상도지도를 만들 수있었습니다. 특히 르완다의 가장 작은 행정 단위 인 르완다의 2,148 개 셀에 대한 재화를 창출 할 수 있습니다.
불행히도 르완다의 작은 지리적 영역에 대한 추정치를 산출 한 사람이 없었기 때문에 이러한 추정치의 정확성을 검증하는 것은 불가능했습니다. 그러나 Blumenstock과 동료들이 르완다의 30 개 지구에 대한 추정치를 집계했을 때, 그들의 견적은 개발 도상국의 설문 조사의 황금 표준으로 널리 여겨지는 인구 통계 및 건강 조사의 견적과 매우 유사하다는 것을 발견했습니다. 이 두 가지 접근법이이 경우에도 유사한 추정치를 산출 했음에도 불구하고 Blumenstock과 동료의 접근 방식은 기존의 인구 통계 및 건강 조사보다 약 10 배 더 빠르고 50 배 저렴했습니다. 이러한 신속하고 저렴한 비용 견적은 연구자, 정부 및 기업 (Blumenstock, Cadamuro, and On 2015) 새로운 가능성을 창출합니다.
이 연구는 Rorschach inkblot 테스트와 비슷합니다. 사람이 보는 것은 배경에 따라 다릅니다. 많은 사회 과학자들은 경제 발전에 관한 이론을 테스트하는 데 사용할 수있는 새로운 측정 도구를보고 있습니다. 많은 데이터 과학자들은 시원한 새로운 기계 학습 문제를보고 있습니다. 많은 비즈니스 사람들 은 이미 수집 한 큰 데이터에서 가치를 창출하기위한 강력한 접근법을보고 있습니다. 많은 프라이버시 옹호 단체 들은 우리가 대규모 감시 시간에 살고 있다는 무서운 신호를 보았습니다. 마지막으로, 많은 정책 입안자 는 신기술이 더 나은 세상을 만드는 데 도움이되는 방법을 알고 있습니다. 사실,이 연구는 그러한 모든 것들이며, 이러한 특성의 혼합이 있기 때문에, 나는 이것을 사회 연구의 미래의 창으로 본다.