[ , ] В этой главе я очень позитивно оценил постстратификацию. Однако это не всегда улучшает качество оценок. Построить ситуацию, когда постстратификация может снизить качество оценок. (Подсказка, см. Thomsen (1973) .)
[ , , ] Разработайте и проведете опрос на случай непредвиденных обстоятельств на Amazon Mechanical Turk, чтобы спросить о собственности на пистолет и отношение к управлению оружием. Чтобы вы могли сравнить свои оценки с результатами, полученными из примера вероятности, скопируйте текст вопроса и варианты ответов непосредственно из высококачественного опроса, такого как те, которые проводятся Исследовательским центром Pew.
[ , , ] Goel и его коллеги (2016) провели 49 вопросов с множественным выбором, взятых из Общего социального опроса (GSS), и отбирали опросы Исследовательского центра Pew для опроса респондентов из группы Amazon Mechanical Turk. Затем они скорректировали на нерепрезентативность данных, используя модельную постстратификацию, и сравнили их скорректированные оценки с данными, полученными на основе оценок GSS и Pew на основе вероятности. Проведите тот же опрос на Amazon Mechanical Turk и попытайтесь воспроизвести фигуры 2a и рис. 2b, сравнив ваши скорректированные оценки с оценками из последних раундов опросов GSS и Pew. (См. Таблицу приложений A2 для списка из 49 вопросов.)
[ , , ] Во многих исследованиях используются данные о самообслуживании мобильных телефонов. Это интересная постановка, в которой исследователи могут сравнивать самооценку поведения с зарегистрированным поведением (см., Например, Boase and Ling (2013) ). Два общих поведения, о которых нужно спросить, - это вызов и текстовые сообщения, а два общих временных ранга - «вчера» и «на прошлой неделе».
[ , ] Schuman and Presser (1996) утверждают, что вопросные вопросы будут иметь значение для двух типов вопросов: вопросы с частичной детализацией, где два вопроса находятся на одном уровне специфичности (например, рейтинги двух кандидатов в президенты); и вопросы, касающиеся целого вопроса, когда общий вопрос следует более конкретному вопросу (например, спрашивая: «Насколько вы удовлетворены своей работой?», а затем «Насколько вы удовлетворены своей жизнью?»).
Они далее характеризуют два типа эффекта порядка запросов: эффекты согласованности возникают, когда ответы на более поздний вопрос приближаются (чем они были в противном случае) к тем, которые были заданы ранее; контрастные эффекты возникают, когда есть большие различия между ответами на два вопроса.
[ , ] Основываясь на работе Шумана и Пресса, Moore (2002) описывает отдельный аспект эффекта порядка вопроса: аддитивный и субтрактивный эффекты. В то время как эффекты контраста и согласованности возникают в результате оценки респондентами двух пунктов по отношению друг к другу, добавочные и субтрактивные эффекты возникают, когда респонденты становятся более чувствительными к более крупным рамкам, в которых задаются вопросы. Прочтите Moore (2002) , затем спроектируйте и проведйте эксперимент по исследованию на MTurk, чтобы продемонстрировать аддитивные или субтрактивные эффекты.
[ , ] Christopher Antoun и его коллеги (2015) провели исследование, сравнивающее удобные образцы, полученные из четырех различных онлайн-рекрутинговых источников: MTurk, Craigslist, Google AdWords и Facebook. Проведите простой опрос и набирайте участников, по крайней мере, двумя различными онлайн-рекрутинговыми источниками (эти источники могут отличаться от четырех источников, используемых в Antoun et al. (2015) ).
[ ] В целях прогнозирования результатов Референдума ЕС-2016 (т.е. Brexit), YouGov - интернет-маркетинговая исследовательская фирма, проводила онлайн-опросы группы из 800 000 респондентов в Великобритании.
Подробное описание статистической модели YouGov можно найти на странице https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Грубо говоря, YouGov разделил избирателей на типы, основанные на выборе всеобщего выбора голосов в 2015 году, возрасте, квалификации, полу и дате собеседования, а также избирательном округе, в котором они жили. Во-первых, они использовали данные, собранные от экспертов YouGov, чтобы оценить среди проголосовавших долю людей каждого типа избирателей, которые намеревались проголосовать «Оставить». Они подсчитали явку каждого типа избирателей, используя британское исследование по выборам (BES) 2015 года, опрос, проведенный после выборов, который подтвердил явку избирателей из избирательных списков. Наконец, они подсчитали, сколько людей было каждого типа избирателей в электорате на основе последней переписи и ежегодного опроса населения (с некоторой дополнительной информацией из других источников данных).
За три дня до голосования YouGov продемонстрировал двухточечное лидерство для «Отпуска». Накануне голосования опрос показал, что результат был слишком близок к разговору (49/51 Remain). Окончательное ежедневное исследование предсказало 48/52 в пользу Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Фактически эта оценка пропустила окончательный результат (52/48 Оставить) на четыре процентных пункта.
[ , ] Напишите симуляцию, чтобы проиллюстрировать каждую из ошибок представления на рисунке 3.2.
[ , ] Исследование Blumenstock и его коллег (2015) предполагало создание модели машинного обучения, которая могла бы использовать данные цифровой трассировки для прогнозирования ответов опроса. Теперь вы попытаетесь сделать то же самое с другим набором данных. Kosinski, Stillwell, and Graepel (2013) обнаружили, что Facebook любит предсказать индивидуальные черты и атрибуты. Удивительно, но эти прогнозы могут быть еще точнее, чем у друзей и коллег (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) использовали записи подробной информации о вызовах (CDR) с мобильных телефонов для прогнозирования совокупных тенденций безработицы.