Связав обследование для цифровых следов может быть как спрашивать каждого , ваши вопросы в любое время.
Предложенная в целом идет по двум основным категориям: выборочных обследований и переписей населения. Выборочные обследования, где Вы можете получить доступ небольшое количество людей, может быть гибким, своевременным, и относительно дешево. Тем не менее, выборочных обследований, поскольку они основаны на выборке, часто ограничены в их решении; с выборочного обследования, часто бывает трудно сделать оценки о конкретных географических регионах или для конкретных демографических групп. Переписи, с другой стороны, попытка взять интервью у всех в популяции. Они имеют большое разрешение, но они , как правило , дорогие, узкие в фокусе (они включают в себя лишь небольшое количество вопросов), а не своевременно (они происходят по установленному графику, например, каждые 10 лет) (Kish 1979) . Теперь представьте себе, если бы исследователи могли бы объединить в себе лучшие характеристики выборочных обследований и переписей; представьте себе, если бы исследователи могли задать все вопросы всем каждый день.
Очевидно, что это постоянное, повсеместное, всегда на обследования является своего рода социальной науки фантазии. Но, оказывается , что мы можем начать , чтобы приблизить это путем объединения вопросов обследования из небольшого числа людей с цифровыми следами от многих людей. Я называю этот тип комбинации усиливается с просьбой. Если все сделано правильно, то это может помочь нам дает оценку, которые являются более локальными (для небольших географических районов), более зернистая (для конкретных демографических групп), а также более своевременно.
Одним из примеров усиливаемого спрашивать приходит от работы Джошуа Blumenstock, который хотел, чтобы собрать данные, которые помогли бы развитию руководство в бедных странах. Более конкретно, Blumenstock хотел создать систему для измерения богатства и благополучия , что в сочетании полноты переписи с гибкостью и частотой опроса (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . На самом деле, я уже описал работу Blumenstock ненадолго в главе 1.
Для того, чтобы начать, Blumenstock партнерские отношения с крупнейшим оператором мобильной связи телефона в Руанде. Компания предоставила ему анонимизированных записи транзакций от около 1,5 миллионов клиентов, охватывающих поведение с 2005 и 2009 Журналы содержат информацию о каждом сообщении вызова и текст, например, время начала, продолжительность и приблизительное географическое местоположение абонента и приемника. Перед тем, как начать говорить о статистических вопросов, то стоит отметить, что этот первый шаг может быть одним из самых трудных. Как описано в главе 2, большинство цифровых данных трассировки недоступна для исследователей. И многие компании оправданно не решаются делиться своими данными, поскольку она является частным; что их клиенты, вероятно, не ожидали, что их записи будут переданы в массе-с исследователями. В этом случае, исследователи взяли осторожные шаги, чтобы анонимизировать данных и их работа была под контролем третьей стороны (т.е. их IRB). Но, несмотря на эти усилия, эти данные, вероятно , до сих пор идентифицированы и они , вероятно , содержать секретную информацию (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Я вернусь к этим этическим вопросом в главе 6.
Напомним, что Blumenstock был заинтересован в измерении богатства и благополучия. Но эти черты не непосредственно в записях вызовов. Другими словами, эти записи вызовов являются неполными для данного исследования, общей особенностью цифровых следов , которые были подробно обсуждены в главе 2. Но, вполне вероятно , что записи вызовов , вероятно , имеют некоторую информацию о богатстве и благополучии. Таким образом, один из способов задавать вопрос Blumenstock мог бы быть: можно предсказать, как кто-то ответит на обследования на основе их цифровых данных трассировки? Если да, то, задав несколько человек, мы можем предположить, ответы всех остальных.
Для оценки этого эмпирически, Blumenstock и научных сотрудников из Кигали институт науки и техники называется образец около тысячи клиентов мобильных телефонов. Исследователи объяснили цели проекта участникам, просил их согласия связать ответов обследования для записей о вызовах, а затем задал им ряд вопросов для оценки их богатства и благополучия, такие, как "у вас есть сделать радио? "и" У вас есть велосипед? "(см Рисунок 3.11 для частичного списка). Все участники исследования были компенсированы в финансовом отношении.
Затем Blumenstock использовали процедуру двухступенчатой общего в науке данных: особенность инженерного последующим подконтрольного обучения. Во- первых, в особенность инженерной стадии, для всех, кто давал интервью, Blumenstock преобразованы записи вызовов в набор характеристик о каждом человеке; Ученые данных могли бы назвать эти характеристики "особенности" и социологи назвали бы их "переменными". Например, для каждого человека, Blumenstock рассчитывается общее количество дней с активностью, число различных людей, человек находился в контакте с, количество денег, потраченных на эфирное время, и так далее. Критически, хорошая особенность инженерного требует знания условий исследования. Например, если это важно различать внутренние и международные звонки (мы могли бы ожидать, что люди, которые называют на международном уровне, чтобы быть богаче), то это должно быть сделано на особенность инженерной стадии. Исследователь с небольшим пониманием Руанды не может включать в себя эту функцию, а затем прогнозный производительность модели будет страдать.
Далее, в подконтрольного стадии изучени, Blumenstock построили статистическую модель для прогнозирования ответ на опрос для каждого человека , в зависимости от их особенностей. В этом случае Blumenstock использовали логистическую регрессию с 10-кратным перекрестной проверки, но он мог бы использовать целый ряд других подходов статистических или машинного обучения.
Так, насколько хорошо это работало? Был Blumenstock в состоянии предсказать ответы на вопросы анкеты, как "У вас есть радио?" И "Есть ли у вас есть велосипед?", Используя функции, полученные из записей о вызовах? Вроде. Точность предсказаний были высоки для некоторых признаков (рис 3.11). Но, это всегда важно, чтобы сравнить комплексный метод прогнозирования против простой альтернативы. В этом случае, простой альтернативой является, чтобы предсказать, что каждый даст наиболее общий ответ. Например, 97,3% сообщили, владеющие радио, так что если Blumenstock предсказывали, что каждый будет сообщать о обладании радио он имел бы точность 97,3%, что удивительно похоже на исполнение его более сложной процедуры (точность 97,6%). Другими словами, все фантазии данные и моделирование повысило точность прогноза с 97,3% до 97,6%. Тем не менее, для других вопросов, таких, как "У вас есть велосипед?", Предсказания улучшилось с 54,4% до 67,6%. В более общем плане, на рисунке 3.12 показаны для некоторых признаков Blumenstock не улучшилось далеко за пределы просто сделать простой базовый прогноз, но и для других признаков есть некоторое улучшение.
На этом этапе вы можете подумать , что эти результаты являются немного разочаровывает, но только один год спустя, Blumenstock и двое его коллег-Габриэль Cadamuro и Роберт On-опубликовали статью в журнале Science с существенно лучшими результатами (Blumenstock, Cadamuro, and On 2015) , Существовали две основные технические причины для улучшения: 1) они использовали более сложные методы (то есть, новый подход к особенность техники и более сложную модель машинного обучения) и 2), а не пытаться вывести ответы на отдельные вопросы анкеты (например, "У вас есть радио?"), они попытались вывести индекс составного богатства.
Blumenstock и его коллеги продемонстрировали эффективность своего подхода двумя способами. Во-первых, они обнаружили, что для людей в их выборке, они могли бы сделать очень хорошую работу прогнозирования их богатства от записей о вызовах (Рисунок 3.14). Во-вторых, и еще более важно, Blumenstock и его коллеги показали, что их процедура может произвести оценку высокого качества географического распределения богатства в Руанде. Более конкретно, они использовали свою модель машинного обучения, который проходил подготовку по их выборке из около 1000 человек, чтобы предсказать благосостояние всего 1,5 миллиона человек, в записях вызовов. Кроме того, с геопространственных данных, встраиваемых в данные обработки вызовов (напомним, что данные вызова включает в себя расположение ближайшей ячейки башни для каждого вызова), исследователи смогли оценить примерное место жительства каждого человека. Соединяя эти две оценки вместе, исследование произвело оценку географического распределения абонентской богатства в чрезвычайно тонкой пространственной детализации. Например, они могли бы оценить среднее богатство в каждой из 2148 клеток Руанды (наименьшая административная единица в стране). Эти предсказанные значения богатства были настолько зернистое их было трудно проверить. Таким образом, исследователи агрегировать их результаты для получения оценок среднего богатства 30 районов Руанды. Эти оценки районного уровня были тесно связаны с оценками из золотого стандарта традиционного опроса, руандийская области демографии и здравоохранения (Рисунок 3.14). Хотя оценки из этих двух источников были похожи, оценки от Blumenstock и его коллеги были примерно в 50 раз дешевле и в 10 раз быстрее (когда стоимость в измеренные в терминах переменных затрат). Такое резкое снижение стоимости означает, что вместо того, чтобы бежать через каждые несколько лет, как это стандарт для демографических и медицинских обследований-гибрид небольшого обследования в сочетании с большими цифровыми данными трассировки может быть запущен каждый месяц.
В заключение Blumenstock-х амплифицировали с просьбой подход в сочетании данных обследования с цифровыми данными трассировки для получения оценок, сопоставимых с оценками обследования золотым стандартом. Этот частный пример также разъясняет некоторые компромиссы между усиливаемого задавать вопросы и традиционных методов обследования. Во-первых, амплифицированные с просьбой оценки были более своевременно, значительно дешевле, и более зернистая. Но, с другой стороны, в это время, не существует сильная теоретическая основа для такого рода усиливаемого спрашивать. То есть, этот пример не показывает, когда он будет работать и когда он не будет. Кроме того, усиленный запрашиваемая подход еще не имеют хорошие способы количественной оценки неопределенности вокруг своих оценок. Тем не менее, усиленный запрашиваемая имеет глубокие связи в трех крупных областей статистики-модель на основе пост-стратификации (Little 1993) , вменения (Rubin 2004) , а также оценки малой площади (Rao and Molina 2015) -И поэтому я ожидаю , что прогресс будет быть быстрым.
Усиленный запрашиваемая следует базовый рецепт, который можно адаптировать к вашей конкретной ситуации. Есть два компонента и два шага. Эти два компонента являются: 1) цифровой след набор данных, который широк, но тонкий (то есть, у него есть много людей, но не информацию, что вам нужно о каждом человек) и 2) обследование, которое узкая, но толстая (то есть, у него есть всего несколько человек, но у него есть информация, что вам нужно о тех людях). Затем, существует два этапа. Во-первых, для людей в обоих источниках данных, построить модель машинного обучения, которая использует цифровые данные трассировки для прогнозирования ответов опроса. Далее используйте эту модель машинного обучения для вменения опроса ответы каждого в цифровых данных трассировки. Таким образом, если есть какой-то вопрос, что вы хотите, чтобы попросить много людей, искать цифровых данных трассировки от тех людей, которые могут быть использованы для прогнозирования их ответ.
Сравнивая первую и вторую попытку Blumenstock по крайней проблеме также иллюстрирует важный урок о переходе от второй эры до третьего подходов эпохи для обследования исследований: начало не конец. То есть, во много раз, первый подход не будет лучшим, но если исследователи продолжают работать, все может стать лучше. В более общем плане, при оценке новых подходов к социальным исследованиям в эпоху цифровых технологий, важно, чтобы сделать два различных оценок: 1) насколько хорошо это работает сейчас, и 2) насколько хорошо вы думаете, что это может работать в будущем в качестве ландшафта данных изменения и как исследователи уделяют больше внимания к этой проблеме. Хотя исследователи обучены, чтобы сделать первый вид оценки (насколько хорошо эта конкретная часть исследования), во-вторых, часто более важно.