мероприятия

  • Степень трудности: легкий легко , средний средний , жесткий жесткий , очень сложно очень сложно
  • требует математики ( требует математики )
  • требует кодирования ( требует кодирования )
  • Сбор данных ( Сбор данных )
  • мои любимые ( мой любимый )
  1. [ жесткий , требует математики ] В этой главе я очень позитивно оценил постстратификацию. Однако это не всегда улучшает качество оценок. Построить ситуацию, когда постстратификация может снизить качество оценок. (Подсказка, см. Thomsen (1973) .)

  2. [ жесткий , Сбор данных , требует кодирования ] Разработайте и проведете опрос на случай непредвиденных обстоятельств на Amazon Mechanical Turk, чтобы спросить о собственности на пистолет и отношение к управлению оружием. Чтобы вы могли сравнить свои оценки с результатами, полученными из примера вероятности, скопируйте текст вопроса и варианты ответов непосредственно из высококачественного опроса, такого как те, которые проводятся Исследовательским центром Pew.

    1. Сколько времени занимает ваш опрос? Сколько это стоит? Как демография вашего образца сравнивается с демографией населения США?
    2. Какова исходная оценка владения оружием с использованием вашей выборки?
    3. Исправьте нерепрезентативность вашего образца, используя постстратификацию или какую-либо другую технику. Теперь, какова оценка владения оружием?
    4. Как ваши оценки сравниваются с последней оценкой из образца, основанного на вероятности? Как вы думаете, что объясняет расхождения, если они есть?
    5. Повторите вопросы (b) - (d) для отношения к управлению оружием. Как ваши результаты отличаются?
  3. [ очень сложно , Сбор данных , требует кодирования ] Goel и его коллеги (2016) провели 49 вопросов с множественным выбором, взятых из Общего социального опроса (GSS), и отбирали опросы Исследовательского центра Pew для опроса респондентов из группы Amazon Mechanical Turk. Затем они скорректировали на нерепрезентативность данных, используя модельную постстратификацию, и сравнили их скорректированные оценки с данными, полученными на основе оценок GSS и Pew на основе вероятности. Проведите тот же опрос на Amazon Mechanical Turk и попытайтесь воспроизвести фигуры 2a и рис. 2b, сравнив ваши скорректированные оценки с оценками из последних раундов опросов GSS и Pew. (См. Таблицу приложений A2 для списка из 49 вопросов.)

    1. Сравните и сравните свои результаты с результатами от Pew и GSS.
    2. Сравните и сравните свои результаты с результатами опроса Mechanical Turk в Goel, Obeng, and Rothschild (2016) .
  4. [ средний , Сбор данных , требует кодирования ] Во многих исследованиях используются данные о самообслуживании мобильных телефонов. Это интересная постановка, в которой исследователи могут сравнивать самооценку поведения с зарегистрированным поведением (см., Например, Boase and Ling (2013) ). Два общих поведения, о которых нужно спросить, - это вызов и текстовые сообщения, а два общих временных ранга - «вчера» и «на прошлой неделе».

    1. Прежде чем собирать какие-либо данные, какие из показателей самоотчета вы считаете более точными? Зачем?
    2. Набирайте пятерых из ваших друзей, чтобы быть в вашем опросе. Пожалуйста, кратко изложите, как были отобраны эти пять друзей. Может ли эта процедура отбора проб вызвать определенные отклонения в ваших оценках?
    3. Задайте им следующие вопросы:
    • «Сколько раз вы использовали свой мобильный телефон, чтобы позвонить другим вчера?»
    • «Сколько текстовых сообщений вы отправили вчера?»
    • «Сколько раз вы использовали свой мобильный телефон для вызова других за последние семь дней?»
    • «Сколько раз вы использовали свой мобильный телефон для отправки или получения текстовых сообщений / SMS за последние семь дней?»
    1. После завершения этого микросекунга попросите проверить данные об использовании, зарегистрированные в их телефоне или поставщике услуг. Как использование саморекламы сравнивается с данными журнала? Что является наиболее точным, что является наименее точным?
    2. Теперь объедините данные, которые вы собрали, с данными других людей вашего класса (если вы делаете это упражнение для класса). С помощью этого большего набора данных повторите часть (d).
  5. [ средний , Сбор данных ] Schuman and Presser (1996) утверждают, что вопросные вопросы будут иметь значение для двух типов вопросов: вопросы с частичной детализацией, где два вопроса находятся на одном уровне специфичности (например, рейтинги двух кандидатов в президенты); и вопросы, касающиеся целого вопроса, когда общий вопрос следует более конкретному вопросу (например, спрашивая: «Насколько вы удовлетворены своей работой?», а затем «Насколько вы удовлетворены своей жизнью?»).

    Они далее характеризуют два типа эффекта порядка запросов: эффекты согласованности возникают, когда ответы на более поздний вопрос приближаются (чем они были в противном случае) к тем, которые были заданы ранее; контрастные эффекты возникают, когда есть большие различия между ответами на два вопроса.

    1. Создайте пару вопросов частичной части, которые, по вашему мнению, будут иметь большой эффект порядка вопроса; пара целых вопросов, которые, по вашему мнению, будут иметь эффект большого порядка; и пару вопросов, порядок которых, по вашему мнению, не имеет значения. Запустите обзорный эксперимент на Amazon Mechanical Turk, чтобы проверить ваши вопросы.
    2. Какой большой эффект частичной части вы могли бы создать? Было ли это согласованностью или контрастностью?
    3. Какой большой эффект целого целого вы могли создать? Было ли это согласованностью или контрастностью?
    4. Был ли эффект вопроса в вашей паре, где вы не думали, что порядок будет иметь значение?
  6. [ средний , Сбор данных ] Основываясь на работе Шумана и Пресса, Moore (2002) описывает отдельный аспект эффекта порядка вопроса: аддитивный и субтрактивный эффекты. В то время как эффекты контраста и согласованности возникают в результате оценки респондентами двух пунктов по отношению друг к другу, добавочные и субтрактивные эффекты возникают, когда респонденты становятся более чувствительными к более крупным рамкам, в которых задаются вопросы. Прочтите Moore (2002) , затем спроектируйте и проведйте эксперимент по исследованию на MTurk, чтобы продемонстрировать аддитивные или субтрактивные эффекты.

  7. [ жесткий , Сбор данных ] Christopher Antoun и его коллеги (2015) провели исследование, сравнивающее удобные образцы, полученные из четырех различных онлайн-рекрутинговых источников: MTurk, Craigslist, Google AdWords и Facebook. Проведите простой опрос и набирайте участников, по крайней мере, двумя различными онлайн-рекрутинговыми источниками (эти источники могут отличаться от четырех источников, используемых в Antoun et al. (2015) ).

    1. Сравните стоимость каждого новобранца - с точки зрения денег и времени - между разными источниками.
    2. Сравните состав образцов, полученных из разных источников.
    3. Сравните качество данных между образцами. Для получения информации о том, как измерять качество данных от респондентов, см. Schober et al. (2015) .
    4. Каков ваш предпочтительный источник? Зачем?
  8. [ средний ] В целях прогнозирования результатов Референдума ЕС-2016 (т.е. Brexit), YouGov - интернет-маркетинговая исследовательская фирма, проводила онлайн-опросы группы из 800 000 респондентов в Великобритании.

    Подробное описание статистической модели YouGov можно найти на странице https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Грубо говоря, YouGov разделил избирателей на типы, основанные на выборе всеобщего выбора голосов в 2015 году, возрасте, квалификации, полу и дате собеседования, а также избирательном округе, в котором они жили. Во-первых, они использовали данные, собранные от экспертов YouGov, чтобы оценить среди проголосовавших долю людей каждого типа избирателей, которые намеревались проголосовать «Оставить». Они подсчитали явку каждого типа избирателей, используя британское исследование по выборам (BES) 2015 года, опрос, проведенный после выборов, который подтвердил явку избирателей из избирательных списков. Наконец, они подсчитали, сколько людей было каждого типа избирателей в электорате на основе последней переписи и ежегодного опроса населения (с некоторой дополнительной информацией из других источников данных).

    За три дня до голосования YouGov продемонстрировал двухточечное лидерство для «Отпуска». Накануне голосования опрос показал, что результат был слишком близок к разговору (49/51 Remain). Окончательное ежедневное исследование предсказало 48/52 в пользу Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Фактически эта оценка пропустила окончательный результат (52/48 Оставить) на четыре процентных пункта.

    1. Используйте общую схему ошибок опроса, обсуждаемую в этой главе, чтобы оценить, что могло пойти не так.
    2. Ответ YouGov после выборов (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) объяснил: «В значительной степени это проявляется из-за явки - что-то, что мы сказали, что все это будет иметь решающее значение для результата такой сбалансированной расы. Наша модель явки была основана, в частности, на том, голосовали ли респонденты на последних всеобщих выборах, а уровень явки выше уровня всеобщих выборов нарушил модель, особенно на Севере. «Изменит ли это ваш ответ на часть (а)?
  9. [ средний , требует кодирования ] Напишите симуляцию, чтобы проиллюстрировать каждую из ошибок представления на рисунке 3.2.

    1. Создайте ситуацию, когда эти ошибки фактически сокращаются.
    2. Создайте ситуацию, когда ошибки соединяют друг друга.
  10. [ очень сложно , требует кодирования ] Исследование Blumenstock и его коллег (2015) предполагало создание модели машинного обучения, которая могла бы использовать данные цифровой трассировки для прогнозирования ответов опроса. Теперь вы попытаетесь сделать то же самое с другим набором данных. Kosinski, Stillwell, and Graepel (2013) обнаружили, что Facebook любит предсказать индивидуальные черты и атрибуты. Удивительно, но эти прогнозы могут быть еще точнее, чем у друзей и коллег (Youyou, Kosinski, and Stillwell 2015) .

    1. Прочитайте Kosinski, Stillwell, and Graepel (2013) и повторите цифру 2. Их данные можно найти по адресу http://mypersonality.org/
    2. Теперь повторите рисунок 3.
    3. Наконец, попробуйте свою модель на свои собственные данные в Facebook: http://applymagicsauce.com/. Насколько хорошо это работает для вас?
  11. [ средний ] Toole et al. (2015) использовали записи подробной информации о вызовах (CDR) с мобильных телефонов для прогнозирования совокупных тенденций безработицы.

    1. Сравните и сравните дизайн исследования Toole et al. (2015) с « Blumenstock, Cadamuro, and On (2015) .
    2. Считаете ли вы, что CDR должны заменять традиционные обследования, дополнять их или не использоваться вообще для правительственных политиков для отслеживания безработицы? Зачем?
    3. Какие доказательства убедят вас в том, что CDR могут полностью заменить традиционные меры по уровню безработицы?