Діяльності

Умовні позначення:

  • Ступінь складності: легкий легко , середній середа , жорсткий жорсткий , дуже важкий дуже важкий
  • вимагає математику ( вимагає математику )
  • вимагає кодування ( вимагає кодування )
  • збір даних ( збір даних )
  • мої улюблені ( мій улюблений )
  1. [ жорсткий , вимагає математику ] В цьому розділі, я був дуже позитивно після стратифікації. Тим не менш, це не завжди покращує якість оцінок. Побудувати таку ситуацію, коли може постстратіфікація може знизити якість оцінок. (Для отримання підказки див Thomsen (1973) ).

  2. [ жорсткий , збір даних , вимагає кодування ] Проектування і провести обстеження без ймовірності на Amazon MTurk запитати про володіння зброєю ( "Чи є у вас, або хто-небудь у вашій родині, власний пістолет, гвинтівку або пістолет? Хіба що ви або хтось у вашій родині?") І ставлення до контролю над вогнепальною зброєю ( "Що ви вважаєте більш важливим, щоб захистити право американців володіти зброєю, або контролювати володіння зброєю?").

    1. Скільки часу ваш опитування займе? Скільки це коштує? Як демографію вашого зразка в порівнянні з демографією населення США?
    2. Що таке сира оцінка володіння зброєю, використовуючи ваш зразок?
    3. Правильне за неправославних репрезентативності вашого зразка з використанням постстратіфікація або будь-якої іншої техніки. Тепер те, що оцінка володіння зброєю?
    4. Як ваші оцінки в порівнянні з останньою оцінкою з Pew Research Center ,? Як ви думаєте, пояснити розбіжності, якщо є будь-які?
    5. Повторіть вправу 2-5 для відношення до контролю над вогнепальною зброєю. Як ваші висновки відрізняються?
  3. [ дуже важкий , збір даних , вимагає кодування ] Гоел і його колеги (2016) вводять без ймовірності на основі опитування , що складається з 49 множинного вибору отношенческой питань , взятих із загального соціального обстеження (GSS) і виберіть обстежень Науково - дослідним центром Pew Research Center на Amazon MTurk. Потім вони регулюватися не-репрезентативності даних з використанням моделі на основі постстратіфікація (г-Р), і порівняти скориговані оцінки з тими, оцінюються з використанням ймовірності на основі ГСС / П'ю обстежень. Провести один і той же опитування на MTurk і спробувати повторити малюнок 2a і 2b Малюнок, порівнюючи свої уточнені оцінки з оцінками з найостанніших раундів GSS / Pew (див Додаток Таблиця А2 для списку з 49 питань).

    1. Порівняйте і зіставте ваші результати з результатами Pew і ГСС.
    2. Порівняйте і зіставте ваші результати з результатами опитування MTurk в Goel, Obeng, and Rothschild (2016) .
  4. [ середа , збір даних , вимагає кодування ] Багато досліджень використовують заходи самозвіту даних мобільних телефонів діяльності. Це цікавий параметр , де дослідники можуть порівняти самостійно повідомляли поведінку з реєстрованої поведінки (дивись , наприклад, Boase and Ling (2013) ). Два найбільш часто зустрічаються моделі поведінки, щоб запитати про викликаєте і текстових повідомлень, а також два загальних часових рамок є "вчора" і "минулого тижня."

    1. Перед збором будь-яких даних, які з самозвіту заходи на вашу думку, більш точним? Чому?
    2. Набираємо 5 з ваших друзів, щоб бути у вашому опитуванні. Прохання коротко підсумувати, як були відібрані ці 5 друзів. Може ця процедура вибірки викликають певні ухили в ваших оцінках?
    3. Будь ласка, попросіть їх наступний мікро-опитування:
    • "Скільки разів ви використовували мобільний телефон, щоб зателефонувати іншим вчора?"
    • "Скільки текстових повідомлень ви відправили вчора?"
    • "Скільки разів ви використовували свій мобільний телефон, щоб зателефонувати іншим в останні сім днів?"
    • "Скільки разів ви використовуєте свій мобільний телефон, щоб надсилати та отримувати текстові повідомлення / SMS протягом останніх семи днів?" Після того, як дослідження завершено, попросіть, щоб перевірити свої дані про використання, як реєструються по їх телефону або постачальника послуг.
    1. Як використання самозвіту порівняйте дані журналу? Який є найбільш точним, який є найменш точним?
    2. Тепер об'єднати дані, які ви зібрали з даними інших людей у ​​вашому класі (якщо ви робите цю вправу для класу). За допомогою цього набору даних більшого, повторити частину (d).
  5. [ середа , збір даних ] Шуман і Притискна (1996) стверджують , що цей питання накази будуть мати значення для двох типів відносин між питаннями: неповний частина питань , де два питання знаходяться на тому ж рівні специфічності (наприклад , рейтинги двох кандидатів в президенти); і частково цілі питання, де загальне питання слід більш конкретне питання (наприклад, питання: "Наскільки ви задоволені своєю роботою?", а потім "Наскільки ви задоволені своїм життям?").

    Крім того, вони характеризують два типи ефекту порядку питання: консистенція ефекти виникають, коли відповіді на більш пізній питання наближені (чим вони могли б бути), наведеними на раніше поставлене запитання; контрастні ефекти виникають, коли існують великі відмінності між відповідями на два питання.

    1. Створити пару неповний частина питань, які ви думаєте, буде мати великий ефект порядку питання, пару частина-ціле питання, які, на вашу думку буде мати великий ефект порядку, а ще пару питань, порядок ви думаєте, не матиме значення. Виконати обстеження експеримент на MTurk, щоб перевірити ваші питання.
    2. Наскільки велика була частина-частина ефекту ви змогли створити? Чи було це консистенція або ефект контрасту?
    3. Наскільки велика була та частина, весь ефект ви змогли створити? Чи було це консистенція або ефект контрасту?
    4. Чи був питання ефект порядок у вашій парі, де ви не думали, порядок матиме значення?
  6. [ середа , збір даних ] Грунтуючись на роботі Шуманом і притискна, Moore (2002) описує окремий аспект ефекту порядку питання: адитивний і віднімає. У той час як контраст і послідовність ефектів виробляються як наслідок оцінок респондентів двох предметів по відношенню один до одного, добавки і віднімаються ефекти виходять, коли респонденти стають більш чутливими до більшої структури, в рамках якої ставляться питання. Читайте Moore (2002) , а потім розробити і запустити оглядову експеримент по MTurk , щоб продемонструвати аддитивное або вичітательние ефекти.

  7. [ жорсткий , збір даних ] Крістофер Antoun і його колеги (2015) провели дослідження , порівнюючи зразки зручності , отримані з чотирьох різних джерел в Інтернеті рекрутинг: MTurk, Craigslist, Google AdWords і Facebook. Дизайн простий опитування і залучення учасників принаймні двох різних джерел в Інтернеті рекрутингу (вони можуть бути різні джерела з чотирьох джерел , використовуваних в Antoun et al. (2015) і Antoun et al. (2015) ).

    1. Порівняйте вартість одного призовника, з точки зору грошей і часу, між різними джерелами.
    2. Порівняйте склад зразків, отриманих з різних джерел.
    3. Порівняйте якість даних між зразками. Для отримання уявлення про те , як виміряти якість даних від респондентів, см Schober et al. (2015) і Schober et al. (2015) .
    4. Який ваш кращий джерело? Чому?
  8. [ середа ] YouGov, інтернет на основі дослідження ринку фірма, провела онлайн-опитування про панелі близько 800 000 респондентів у Великобританії і використовував пан П., щоб передбачити результат референдуму ЄС (тобто Brexit), де виборці Великобританії голосувати або залишитися або залишити Європейський Союз.

    Детальний опис статистичної моделі YouGov знаходиться тут (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Грубо кажучи, YouGov розділяє виборців на типи, засновані на 2015 загальних виборів вибору голосів, віку, кваліфікації, стать, дата інтерв'ю, а також виборчому округу вони живуть. По-перше, вони використовували дані, зібрані з членів комісії YouGov для оцінки, в тому числі тих, хто голосує, частка людей кожного типу виборців, які мають намір голосувати піти. Вони оцінюють явку виборців кожного типу за допомогою 2015 британської виборчої дослідження (BES) після виборів лицем до лиця обстеження, яке підтверджено явку зі списків виборців. І, нарешті, вони оцінюють, скільки людей є кожного типу виборців в виборців на підставі останнього перепису населення та щорічного обстеження населення (з деякими крапельну інформації з BES, дані опитування YouGov з усього загальних виборів, а також інформацію про те, як голосували багато людей для кожна зі сторін у кожному виборчому окрузі).

    За три дні до голосування, YouGov показав два очки для відпустки. Напередодні голосування, опитування показало, занадто близько до телефону (49-51 Залишаються). Остаточне дослідження-день передбачав 48/52 на користь Залишаються (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Насправді, ця оцінка пропустила кінцевий результат (52-48 Leave) на чотири процентних пункти.

    1. Використовуйте загальну структуру помилки обстеження, описану в цьому розділі, щоб оцінити те, що могло піти не так.
    2. відповідь YouGov після виборів (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/~~HEAD=pobj) пояснив: "Це, здається, в значній мірі через явки - то, що ми вже говорили всі разом матимуть вирішальне значення для результату такого перетікання раси. Наша модель явка була заснована, зокрема, від того, респондентів проголосували на останніх загальних виборах і рівень явки вище, що загальних виборів перекинути модель, особливо на Півночі. "Чи змінився ваш відповідь на частини (а)?
  9. [ середа , вимагає кодування ] Напишіть моделювання, щоб проілюструвати кожну з помилок уявлення на малюнку 3.1.

    1. Створити ситуацію, коли ці помилки фактично зводять нанівець.
    2. Створити ситуацію, коли помилки з'єднання один з одним.
  10. [ дуже важкий , вимагає кодування ] Дослідження Blumenstock і його колеги (2015) бере участь побудова моделі машинного навчання , які могли б використовувати цифрові дані трасування для прогнозування відповіді на опитування. Тепер, ви збираєтеся спробувати те ж саме з іншим набором даних. Kosinski, Stillwell, and Graepel (2013) виявили , що Facebook любить може передбачити індивідуальні риси і атрибути. Дивно, але ці прогнози можуть бути ще більш точним , ніж у друзів і колег (Youyou, Kosinski, and Stillwell 2015) .

    1. Прочитайте Kosinski, Stillwell, and Graepel (2013) рік Kosinski, Stillwell, and Graepel (2013) , і реплікації Малюнок 2. Їх дані доступні тут: http://mypersonality.org/
    2. Тепер, повторити малюнок 3.
    3. І, нарешті, спробувати свої моделі на власних даних Facebook: http://applymagicsauce.com/. Наскільки добре це працює для вас?
  11. [ середа ] Toole et al. (2015) і Toole et al. (2015) докладно використання записів викликів (CDR) з мобільних телефонів для прогнозування загальних тенденцій безробіття.

    1. Порівняйте і дизайн Toole et al. (2015) і Toole et al. (2015) з Blumenstock, Cadamuro, and On (2015) .
    2. Як ви думаєте, повинні CDRs замінити традиційні опитування, доповнити їх або не використовувати взагалі для урядових директивних органів для відстеження безробіття? Чому?
    3. Які докази би переконати вас, що CDRs може повністю замінити традиційні заходи рівня безробіття?