Діяльності

  • ступінь складності: легкий легко , середній середній , важко важко , дуже важкий дуже важкий
  • вимагає математики ( вимагає математики )
  • вимагає кодування ( вимагає кодування )
  • збір даних ( збір даних )
  • мої улюблені ( мій улюблений )
  1. [ важко , вимагає математики ] У розділі я був дуже позитивним щодо пост-стратифікації. Проте це не завжди покращує якість оцінок. Побудуйте ситуацію, коли пост-стратифікація може погіршити якість оцінок. (Для підказки див. Thomsen (1973) .)

  2. [ важко , збір даних , вимагає кодування ] Розробити та провести невизначений огляд на Amazon Mechanical Turk, щоб запитати про право власності на зброю та ставлення до контролю над рухом. Щоб ви могли порівняти свої оцінки з результатами з вірогідної вибірки, скопіюйте текст запитань та варіанти відповідей безпосередньо з високоякісного опитування, наприклад, дослідницького центру Pew.

    1. Як довго триває ваше опитування? Скільки це коштує? Як демографічні показники вашої вибірки порівнюються з демографічними показниками населення США?
    2. Яка необоротна оцінка власності на зброю за допомогою вашої вибірки?
    3. Правильно для нерепрезентативності вашої вибірки, використовуючи пост-стратифікацію чи іншу техніку. Зараз яка оцінка власності на зброю?
    4. Як ваші оцінки порівнюють з останньою оцінкою з вибірки на основі імовірності? Що, на вашу думку, пояснює розбіжності, якщо такі є?
    5. Повторіть питання (б) - (г) щодо ставлення до контролю над зброєю. Як ваші відмінності відрізняються?
  3. [ дуже важкий , збір даних , вимагає кодування ] Гоель та його колеги (2016) Керували 49 загальних соціальних опитувань, що стосувались різного вибору, та провели вибіркові опитування Центру досліджень Pew для невідповідної вибірки респондентів, витягнутого з Amazon Mechanical Turk. Потім вони скориговані на невідчутність даних, використовуючи модельну пост-стратифікацію, та порівнювали їх скориговані оцінки з результатами досліджень GSS та Pew, що базуються на вірогідності. Проведіть таке ж дослідження на Amazon Mechanical Turk і спробуйте відтворити малюнки 2а та 2б, порівнюючи скориговані оцінки з оцінками з останніх раундів опитування GSS та Pew. (Див. Таблицю А2 додатка для переліку 49 питань.)

    1. Порівняйте та порівнюйте результати з результатами з Pew і GSS.
    2. Порівняйте і порівнюйте свої результати з результатами опитування Механічного Турка в Goel, Obeng, and Rothschild (2016) .
  4. [ середній , збір даних , вимагає кодування ] Багато досліджень використовують самовизначені заходи щодо використання мобільних телефонів. Це цікава ситуація, в якій дослідники можуть порівнювати самореалізовану поведінку із вхідною поведінкою (див., Наприклад, Boase and Ling (2013) ). Дві поширені способи поведінки, які потрібно запитати, - це дзвінки та текстові повідомлення, а два загальних часопира є "вчора" та "минулого тижня".

    1. Перед тим, як збирати будь-які дані, який із заходи з самореалізації ви вважаєте більш точним? Чому?
    2. Наберемо п'ять своїх друзів, щоб вони опинилися у вашому опитуванні. Будь ласка, коротко підсумуйте, як вибрали ці п'ять друзів. Чи може ця процедура вибірки викликати певні упередження у ваших оцінках?
    3. Задайте їм наступні запитання щодо мікрообстеження:
    • "Скільки разів ви використовували свій мобільний телефон, щоб зателефонувати іншим учора?"
    • "Скільки текстових повідомлень ви надіслали вчора?"
    • "Скільки разів ви використовували свій мобільний телефон, щоб зателефонувати іншим за останні сім днів?"
    • "Скільки разів ви використовували ваш мобільний телефон для надсилання або отримання текстових повідомлень / SMS протягом останніх семи днів?"
    1. Після того, як цей мікропроцесор буде завершено, попросіть перевірити дані про їх використання як зареєстровані їх телефоном або постачальником послуг. Як порівняти використання власного звіту з даними журналу? Що є найбільш точним, що є найменш точним?
    2. Тепер об'єднайте дані, які ви зібрали з даними інших людей у ​​вашому класі (якщо ви виконуєте цю діяльність для класу). З цим великим набором даних повторіть частину (d).
  5. [ середній , збір даних ] Шуман і Прессер (1996) стверджують, що розпорядження питанням матиме значення для двох типів питань: частина запитань, коли два питання мають однаковий рівень специфіки (наприклад, рейтинги двох кандидатів у президенти); і загальні питання, де загальне питання слідує більш конкретному питанню (наприклад, запитуючи: "Наскільки ви задоволені вашою роботою?", після якого випливає "Як ви задоволені своїм життям?").

    Вони далі характеризують два типи ефекту порядку замовлення: ефекти послідовності виникають, коли відповіді на пізніші запитання наближаються (чим інакше) до тих, що наводяться на попереднє запитання; контрастні ефекти виникають, коли існують більші відмінності між відповідями на два запитання.

    1. Створіть пару питань із частиною, які, на вашу думку, матимуть великий ефект порядку замовлення. пара загальних питань, які, на вашу думку, матимуть ефект великого порядку; і пару питань, замовлення яких ви думаєте, не має значення. Проведіть експеримент на Amazon Mechanical Turk, щоб перевірити свої питання.
    2. Наскільки великий ефект часткової частини Ви могли створити? Чи це було послідовність чи контрастність?
    3. Наскільки великим був частковий ефект, який ви могли створити? Чи це було послідовність чи контрастність?
    4. Чи існував ефект замовлення запиту у вашій парі, де ви не думали, що замовлення матиме значення?
  6. [ середній , збір даних ] На основі роботи Шумана та Прессера, Moore (2002) описує окремий вимір ефекту порядку замовлення: додаткові та субтрактивні ефекти. Незважаючи на те, що ефекти контрастності та послідовності виробляються внаслідок оцінювання респондентів щодо цих двох предметів один до одного, додаткові та субтрактивні ефекти створюються, коли респонденти стають більш чутливими до більшої структури, в якій задаються питання. Читайте Moore (2002) , потім розробляйте та запустіть дослідницький експеримент на MTurk, щоб продемонструвати додаткові чи субтрактивні ефекти.

  7. [ важко , збір даних ] Крістофер Антюн та його колеги (2015) Провели дослідження, яке порівнювало зразки зручності, отримані з чотирьох різних онлайнових вербувальних джерел: MTurk, Craigslist, Google AdWords та Facebook. Створіть просте опитування та набирайте учасників за допомогою принаймні двох різних джерел онлайн-підбору (ці джерела можуть відрізнятись від чотирьох джерел, що використовуються в Antoun et al. (2015) ).

    1. Порівняйте вартість одного і того ж рекрутного грошового кошту та часу між різними джерелами.
    2. Порівняйте склад зразків, отриманих з різних джерел.
    3. Порівняйте якість даних між зразками. Для уявлень про те, як виміряти якість даних від респондентів, див. Schober et al. (2015) . Schober et al. (2015) .
    4. Яке ваше бажане джерело? Чому?
  8. [ середній ] Щоб спрогнозувати результати референдуму ЄС на 2016 рік (наприклад, Brexit), YouGov, Інтернет-компанія з дослідження ринку, проводила он-лайн опитування групи близько 800 000 респондентів у Сполученому Королівстві.

    Детальний опис статистичної моделі YouGov можна знайти на https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Грубо кажучи, YouGov розділив виборців на типи, засновані на виборах загальних виборів до 2015 року, вік, кваліфікацію, стать і дату співбесіди, а також виборчий округ, в якому вони жили. По-перше, вони використовували дані, зібрані учасниками групи YouGov, щоб оцінити серед тих, хто голосував, частку людей кожного типу виборців, які мали намір залишити голос. Вони оцінили явку кожного типу виборців за допомогою британського виборчого дослідження 2015 року (BES), що проводилось після виборів, огляд особистого листа, який підтвердив наявність явки у виборчих дільницях. Нарешті, вони оцінювали, скільки людей в електораті складалося з кожного типу виборців, на основі останнього перепису населення та щорічного опитування населення (з деякими додатковими відомостями з інших джерел даних).

    За три дні до голосування, YouGov показав двоточкове керівництво для відставки. Напередодні голосування опитування показало, що результат був занадто близький до дзвінка (49/51 Remain). Остання на сьогоднішній день дослідження передбачає 48/52 на користь Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Фактично, ця оцінка втратила кінцевий результат (52/48 залишення) на чотири відсоткові пункти.

    1. Використовуйте загальну схему помилок опитування, описану в цьому розділі, щоб оцінити, що могло статися не так.
    2. Відповідь YouGov після виборів (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) пояснила: "Це здається значною мірою через явку - те, що ми всі сказали, що буде мати вирішальне значення для результатів такої тонко збалансованої раси. Наша модель голосування була заснована, частково, на тому, чи відповідали респонденти на останніх загальних виборах, а рівень явки вище загальної виборів, перекинув модель, особливо на півночі. Чи змінює ваша відповідь на частину (а)?
  9. [ середній , вимагає кодування ] Напишіть симуляцію для ілюстрації кожної з помилок представлення на рисунку 3.2.

    1. Створіть ситуацію, коли ці помилки фактично скасовуються.
    2. Створіть ситуацію, коли помилки складають один одного.
  10. [ дуже важкий , вимагає кодування ] Дослідження Blumenstock та його колег (2015) передбачають побудову моделі машинного навчання, яка може використовувати дані цифрового трасування для прогнозування відповідей на опитування. Тепер ви збираєтеся спробувати те ж саме з іншим набором даних. Kosinski, Stillwell, and Graepel (2013) виявили, що Facebook любить може передбачати індивідуальні риси та атрибути. Дивно, що ці прогнози можуть бути ще більш точними, ніж друзі та колеги (Youyou, Kosinski, and Stillwell 2015) .

    1. Прочитайте Kosinski, Stillwell, and Graepel (2013) і повторіть рисунок 2. Їхні дані доступні на http://mypersonality.org/
    2. Тепер повторіть фігуру 3.
    3. Нарешті, спробуйте свою модель на власних даних Facebook: http://applymagicsauce.com/. Наскільки добре вона працює для вас?
  11. [ середній ] Toole et al. (2015) Використовували детальні записи про дзвінки (CDRs) з мобільних телефонів, щоб передбачити сукупні тенденції безробіття.

    1. Порівняйте та порівняйте дизайн дослідження Toole et al. (2015) з Blumenstock, Cadamuro, and On (2015) . Blumenstock, Cadamuro, and On (2015) .
    2. Як ви вважаєте, CDR повинні замінити традиційні опитування, доповнювати їх чи взагалі не використовувати для розробки політики уряду для відстеження безробіття? Чому?
    3. Які докази переконають вас, що CDR можуть повністю замінити традиційні показники рівня безробіття?