Летом 2009 года мобильные телефоны звонили по всей Руанде. В дополнение к миллионам звонков от семьи, друзей и деловых партнеров около 1000 руандийцев получили звонок от Джошуа Блюменстока и его коллег. Эти исследователи изучали богатство и бедность, проводя опрос случайной выборки людей из базы данных, состоящей из 1,5 млн. Клиентов крупнейшего оператора мобильной связи в Руанде. Блюменсток и его коллеги задавали случайным образом избранные люди, если они хотели участвовать в опросе, объясняли характер исследований для них, а затем задавали ряд вопросов об их демографических, социальных и экономических характеристиках.
Все, что я сказал до сих пор, звучит как традиционный социологический опрос. Но то, что происходит дальше, не является традиционным - по крайней мере, пока. В дополнение к данным опроса, Blumenstock и его коллеги также имели полный список звонков для всех 1,5 миллиона человек. Объединив эти два источника данных, они использовали данные опроса для обучения модели машинного обучения для прогнозирования богатства человека на основе записей своих звонков. Затем они использовали эту модель для оценки богатства всех 1.5 миллионов клиентов в базе данных. Они также оценили места проживания всех 1,5 миллиона клиентов, используя географическую информацию, встроенную в записи звонков. Объединив все это - приблизительное богатство и предполагаемое место проживания - они смогли подготовить карты географического распределения богатства в Руанде с высоким разрешением. В частности, они могут составить оценочное благосостояние для каждой из 2148 единиц Руанды, самой маленькой административной единицы в стране.
К сожалению, невозможно было достоверно оценить эти оценки, поскольку никто никогда не производил оценки для таких небольших географических районов в Руанде. Но когда Блюменшок и его коллеги обобщили свои оценки в 30 районах Руанды, они обнаружили, что их оценки очень похожи на оценки из Обзора демографии и здоровья, который широко считается золотым стандартом обследований в развивающихся странах. Хотя эти два подхода привели к подобным оценкам в этом случае, подход Блюменстока и его коллег был примерно в 10 раз быстрее и в 50 раз дешевле, чем традиционные демографические и медико-санитарные обследования. Эти значительно более быстрые и более низкие оценки затрат создают новые возможности для исследователей, правительств и компаний (Blumenstock, Cadamuro, and On 2015) .
Это исследование похоже на тест с чернилами Rorschach: то, что люди видят, зависит от их фона. Многие социологи видят новый инструмент измерения, который можно использовать для проверки теорий об экономическом развитии. Многие ученые-аналитики видят новую проблему с машинным обучением. Многие деловые люди видят мощный подход к раскрытию ценности в больших данных, которые они уже собрали. Многие сторонники защиты частной жизни видят страшное напоминание о том, что мы живем во время массового наблюдения. И, наконец, многие разработчики политики видят, как новые технологии могут помочь создать лучший мир. На самом деле, это исследование - все это, и поскольку у него есть это сочетание характеристик, я рассматриваю его как окно в будущее социальных исследований.