мероприятия

Условные обозначения:

  • Степень сложности: легкий легко , средний средний , жесткий жесткий , очень сложно очень сложно
  • требует математику ( требует математику )
  • требует кодирования ( требует кодирования )
  • Сбор данных ( Сбор данных )
  • мои любимые ( мой любимый )
  1. [ жесткий , требует математику ] В этой главе, я был очень позитивно после стратификации. Тем не менее, это не всегда улучшает качество оценок. Построить такую ​​ситуацию, когда может постстратификация может снизить качество оценок. (Для получения подсказки см Thomsen (1973) ).

  2. [ жесткий , Сбор данных , требует кодирования ] Проектирование и провести обследование без вероятности на Amazon MTurk спросить о владения оружием ( "Есть ли у вас, или кто-нибудь в вашей семье, собственный пистолет, винтовку или пистолет? Разве что вы или кто-то в вашей семье?") И отношение к контроля над огнестрельным оружием ( "Что вы считаете более важным, чтобы защитить право американцев владеть оружием, или контролировать владение оружием?").

    1. Сколько времени ваш опрос займет? Сколько это стоит? Как демографию вашего образца по сравнению с демографией населения США?
    2. Что такое сырая оценка владения оружием, используя ваш образец?
    3. Правильное за неправославных репрезентативности вашего образца с использованием постстратификация или какой-либо другой техники. Теперь то, что оценка владения оружием?
    4. Как ваши оценки по сравнению с последней оценкой из Pew Research Center,? Как вы думаете, объяснить расхождения, если есть какие-либо?
    5. Повторите упражнение 2-5 для отношения к контроля над огнестрельным оружием. Как ваши выводы отличаются?
  3. [ очень сложно , Сбор данных , требует кодирования ] Гоел и его коллеги (2016) вводят без вероятности на основе опроса , состоящую из 49 множественного выбора отношенческими вопросов , взятых из общего социального обследования (GSS) и выберите обследований Научно - исследовательским центром Pew Research Center на Amazon MTurk. Затем они регулировался не-репрезентативности данных с использованием модели на основе постстратификация (г-Р), и сравнить скорректированные оценки с теми, оцениваются с использованием вероятности на основе ГСС / Пью обследований. Провести один и тот же опрос на MTurk и попытаться повторить рисунок 2a и 2b Рисунок, сравнивая свои уточненные оценки с оценками из самых последних раундов GSS / Pew (см Приложение Таблица А2 для списка из 49 вопросов).

    1. Сравните и сопоставьте ваши результаты с результатами Pew и ГСС.
    2. Сравните и сопоставьте ваши результаты с результатами опроса MTurk в Goel, Obeng, and Rothschild (2016) .
  4. [ средний , Сбор данных , требует кодирования ] Многие исследования используют меры самоотчета данных мобильных телефонов деятельности. Это интересный параметр , где исследователи могут сравнить самостоятельно сообщали поведение с регистрируемой поведения (смотри , например, Boase and Ling (2013) ). Два наиболее часто встречающиеся модели поведения, чтобы спросить о вызываете и текстовых сообщений, а также два общих временных рамок являются "вчера" и "на прошлой неделе."

    1. Перед сбором каких-либо данных, которые из самоотчета меры по вашему мнению, более точным? Зачем?
    2. Набираем 5 из ваших друзей, чтобы быть в вашем опросе. Просьба кратко суммировать, как были отобраны эти 5 друзей. Может эта процедура выборки вызывают определенные уклоны в ваших оценках?
    3. Пожалуйста, попросите их следующий микро-опрос:
    • "Сколько раз вы использовали мобильный телефон, чтобы позвонить другим вчера?"
    • "Сколько текстовых сообщений вы отправили вчера?"
    • "Сколько раз вы использовали свой мобильный телефон, чтобы позвонить другим в последние семь дней?"
    • "Сколько раз вы используете свой мобильный телефон, чтобы отправлять или получать текстовые сообщения / SMS в течение последних семи дней?" После того, как исследование завершено, попросите, чтобы проверить свои данные об использовании, как регистрируются по их телефону или поставщика услуг.
    1. Как использование самоотчета сравните данные журнала? Который является наиболее точным, который является наименее точным?
    2. Теперь объединить данные, которые вы собрали с данными других людей в вашем классе (если вы делаете это упражнение для класса). С помощью этого набора данных большего, повторить часть (d).
  5. [ средний , Сбор данных ] Шуман и Прижимная (1996) утверждают , что этот вопрос приказы будут иметь значение для двух типов отношений между вопросами: неполный часть вопросов , где два вопроса находятся на том же уровне специфичности (например , рейтинги двух кандидатов в президенты); и частично целые вопросы, где общий вопрос следует более конкретный вопрос (например, вопрос: "Насколько вы удовлетворены своей работой?", а затем "Насколько вы удовлетворены своей жизнью?").

    Кроме того, они характеризуют два типа эффекта порядка вопрос: консистенция эффекты возникают, когда ответы на более поздний вопрос приближены (чем они могли бы быть), приведенным на ранее заданный вопрос; контрастные эффекты возникают, когда существуют большие различия между ответами на два вопроса.

    1. Создать пару неполный часть вопросов, которые вы думаете, будет иметь большой эффект порядка вопрос, пару часть-целое вопросы, которые, по вашему мнению будет иметь большой эффект порядка, а еще пару вопросов, порядок вы думаете, не будет иметь значения. Выполнить обследование эксперимент на MTurk, чтобы проверить ваши вопросы.
    2. Насколько велика была часть-часть эффекта вы смогли создать? Было ли это консистенция или эффект контраста?
    3. Насколько велика была та часть, весь эффект вы смогли создать? Было ли это консистенция или эффект контраста?
    4. Был ли вопрос эффект порядок в вашей паре, где вы не думали, порядок будет иметь значение?
  6. [ средний , Сбор данных ] Основываясь на работе Шуманом и прижимная, Moore (2002) описывает отдельный аспект эффекта порядка вопрос: аддитивный и отнимающий. В то время как контраст и последовательность эффектов производятся как следствие оценок респондентов двух предметов по отношению друг к другу, добавки и вычитаемые эффекты получаются, когда респонденты становятся более чувствительными к более крупной структуры, в рамках которой ставятся вопросы. Читайте Moore (2002) , а затем разработать и запустить обзорную эксперимент по MTurk , чтобы продемонстрировать аддитивное или вычитательные эффекты.

  7. [ жесткий , Сбор данных ] Кристофер Antoun и его коллеги (2015) провели исследование , сравнивая образцы удобства , полученные из четырех различных источников в Интернете рекрутинг: MTurk, Craigslist, Google AdWords и Facebook. Дизайн простой опрос и привлечение участников по крайней мере двух различных источников в Интернете рекрутинга (они могут быть разные источники из четырех источников , используемых в Antoun et al. (2015) и Antoun et al. (2015) ).

    1. Сравните стоимость одного призывника, с точки зрения денег и времени, между различными источниками.
    2. Сравните состав образцов, полученных из различных источников.
    3. Сравните качество данных между образцами. Для получения представления о том , как измерить качество данных от респондентов, см Schober et al. (2015) и Schober et al. (2015) .
    4. Каков ваш предпочтительный источник? Зачем?
  8. [ средний ] YouGov, интернет на основе исследования рынка фирма, провела онлайн-опрос о панели около 800 000 респондентов в Великобритании и использовал г-н П., чтобы предсказать результат референдума ЕС (т.е. Brexit), где избиратели Великобритании голосовать либо остаться или покинуть Европейский Союз.

    Подробное описание статистической модели YouGov находится здесь (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Грубо говоря, YouGov разделяет избирателей на типы, основанные на 2015 всеобщих выборов выбора голосов, возраста, квалификации, пол, дата интервью, а также избирательному округу они живут. Во-первых, они использовали данные, собранные из членов комиссии YouGov для оценки, в том числе тех, кто голосует, доля людей каждого типа избирателей, которые намерены голосовать уйти. Они оценивают явку избирателей каждого типа с помощью 2015 британской избирательной исследования (BES) после выборов лицом к лицу обследования, которое подтверждено явку из списков избирателей. И, наконец, они оценивают, сколько людей есть каждого типа избирателей в избирателей на основании последней переписи населения и ежегодного обследования населения (с некоторыми капельную информации из BES, данные опроса YouGov со всего всеобщих выборов, а также информацию о том, как голосовали многие люди для каждая из сторон в каждом избирательном округе).

    За три дня до голосования, YouGov показал два очка для отпуска. Накануне голосования, опрос показал, слишком близко к телефону (49-51 Остаются). Окончательное исследование-день предсказывал 48/52 в пользу Остаются (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). На самом деле, эта оценка пропустила конечный результат (52-48 Leave) на четыре процентных пункта.

    1. Используйте общую структуру ошибки обследования, описанную в этой главе, чтобы оценить то, что могло пойти не так.
    2. ответ YouGov после выборов (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/~~HEAD=pobj) пояснил: "Это, кажется, в значительной степени из-за явки - то, что мы уже говорили все вместе будут иметь решающее значение для исхода такого перетока расы. Наша модель явка была основана, в частности, от того, респондентов проголосовали на последних всеобщих выборах и уровень явки выше, что всеобщих выборов опрокинуть модель, особенно на Севере. "Изменился ли ваш ответ на части (а)?
  9. [ средний , требует кодирования ] Напишите моделирование, чтобы проиллюстрировать каждую из ошибок представления на рисунке 3.1.

    1. Создать ситуацию, когда эти ошибки фактически сводят на нет.
    2. Создать ситуацию, когда ошибки соединение друг с другом.
  10. [ очень сложно , требует кодирования ] Исследование Blumenstock и его коллеги (2015) участвует построение модели машинного обучения , которые могли бы использовать цифровые данные трассировки для прогнозирования ответы на опрос. Теперь, вы собираетесь попробовать то же самое с другим набором данных. Kosinski, Stillwell, and Graepel (2013) обнаружили , что Facebook любит может предсказать индивидуальные черты и атрибуты. Удивительно, но эти прогнозы могут быть еще более точным , чем у друзей и коллег (Youyou, Kosinski, and Stillwell 2015) .

    1. Прочитайте Kosinski, Stillwell, and Graepel (2013) год Kosinski, Stillwell, and Graepel (2013) , и репликации Рисунок 2. Их данные доступны здесь: http://mypersonality.org/
    2. Теперь, повторить рисунок 3.
    3. И, наконец, попробовать свои модели на собственных данных Facebook: http://applymagicsauce.com/. Насколько хорошо это работает для вас?
  11. [ средний ] Toole et al. (2015) и Toole et al. (2015) подробно использование записей вызовов (CDR) с мобильных телефонов для прогнозирования общих тенденций безработицы.

    1. Сравните и дизайн Toole et al. (2015) и Toole et al. (2015) с Blumenstock, Cadamuro, and On (2015) .
    2. Как вы думаете, должны CDRs заменить традиционные опросы, дополнить их или не использовать вообще для правительственных директивных органов для отслеживания безработицы? Зачем?
    3. Какие доказательства бы убедить вас, что CDRs может полностью заменить традиционные меры уровня безработицы?