Умовні позначення:
[ , ] В цьому розділі, я був дуже позитивно після стратифікації. Тим не менш, це не завжди покращує якість оцінок. Побудувати таку ситуацію, коли може постстратіфікація може знизити якість оцінок. (Для отримання підказки див Thomsen (1973) ).
[ , , ] Проектування і провести обстеження без ймовірності на Amazon MTurk запитати про володіння зброєю ( "Чи є у вас, або хто-небудь у вашій родині, власний пістолет, гвинтівку або пістолет? Хіба що ви або хтось у вашій родині?") І ставлення до контролю над вогнепальною зброєю ( "Що ви вважаєте більш важливим, щоб захистити право американців володіти зброєю, або контролювати володіння зброєю?").
[ , , ] Гоел і його колеги (2016) вводять без ймовірності на основі опитування , що складається з 49 множинного вибору отношенческой питань , взятих із загального соціального обстеження (GSS) і виберіть обстежень Науково - дослідним центром Pew Research Center на Amazon MTurk. Потім вони регулюватися не-репрезентативності даних з використанням моделі на основі постстратіфікація (г-Р), і порівняти скориговані оцінки з тими, оцінюються з використанням ймовірності на основі ГСС / П'ю обстежень. Провести один і той же опитування на MTurk і спробувати повторити малюнок 2a і 2b Малюнок, порівнюючи свої уточнені оцінки з оцінками з найостанніших раундів GSS / Pew (див Додаток Таблиця А2 для списку з 49 питань).
[ , , ] Багато досліджень використовують заходи самозвіту даних мобільних телефонів діяльності. Це цікавий параметр , де дослідники можуть порівняти самостійно повідомляли поведінку з реєстрованої поведінки (дивись , наприклад, Boase and Ling (2013) ). Два найбільш часто зустрічаються моделі поведінки, щоб запитати про викликаєте і текстових повідомлень, а також два загальних часових рамок є "вчора" і "минулого тижня."
[ , ] Шуман і Притискна (1996) стверджують , що цей питання накази будуть мати значення для двох типів відносин між питаннями: неповний частина питань , де два питання знаходяться на тому ж рівні специфічності (наприклад , рейтинги двох кандидатів в президенти); і частково цілі питання, де загальне питання слід більш конкретне питання (наприклад, питання: "Наскільки ви задоволені своєю роботою?", а потім "Наскільки ви задоволені своїм життям?").
Крім того, вони характеризують два типи ефекту порядку питання: консистенція ефекти виникають, коли відповіді на більш пізній питання наближені (чим вони могли б бути), наведеними на раніше поставлене запитання; контрастні ефекти виникають, коли існують великі відмінності між відповідями на два питання.
[ , ] Грунтуючись на роботі Шуманом і притискна, Moore (2002) описує окремий аспект ефекту порядку питання: адитивний і віднімає. У той час як контраст і послідовність ефектів виробляються як наслідок оцінок респондентів двох предметів по відношенню один до одного, добавки і віднімаються ефекти виходять, коли респонденти стають більш чутливими до більшої структури, в рамках якої ставляться питання. Читайте Moore (2002) , а потім розробити і запустити оглядову експеримент по MTurk , щоб продемонструвати аддитивное або вичітательние ефекти.
[ , ] Крістофер Antoun і його колеги (2015) провели дослідження , порівнюючи зразки зручності , отримані з чотирьох різних джерел в Інтернеті рекрутинг: MTurk, Craigslist, Google AdWords і Facebook. Дизайн простий опитування і залучення учасників принаймні двох різних джерел в Інтернеті рекрутингу (вони можуть бути різні джерела з чотирьох джерел , використовуваних в Antoun et al. (2015) і Antoun et al. (2015) ).
[ ] YouGov, інтернет на основі дослідження ринку фірма, провела онлайн-опитування про панелі близько 800 000 респондентів у Великобританії і використовував пан П., щоб передбачити результат референдуму ЄС (тобто Brexit), де виборці Великобританії голосувати або залишитися або залишити Європейський Союз.
Детальний опис статистичної моделі YouGov знаходиться тут (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Грубо кажучи, YouGov розділяє виборців на типи, засновані на 2015 загальних виборів вибору голосів, віку, кваліфікації, стать, дата інтерв'ю, а також виборчому округу вони живуть. По-перше, вони використовували дані, зібрані з членів комісії YouGov для оцінки, в тому числі тих, хто голосує, частка людей кожного типу виборців, які мають намір голосувати піти. Вони оцінюють явку виборців кожного типу за допомогою 2015 британської виборчої дослідження (BES) після виборів лицем до лиця обстеження, яке підтверджено явку зі списків виборців. І, нарешті, вони оцінюють, скільки людей є кожного типу виборців в виборців на підставі останнього перепису населення та щорічного обстеження населення (з деякими крапельну інформації з BES, дані опитування YouGov з усього загальних виборів, а також інформацію про те, як голосували багато людей для кожна зі сторін у кожному виборчому окрузі).
За три дні до голосування, YouGov показав два очки для відпустки. Напередодні голосування, опитування показало, занадто близько до телефону (49-51 Залишаються). Остаточне дослідження-день передбачав 48/52 на користь Залишаються (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Насправді, ця оцінка пропустила кінцевий результат (52-48 Leave) на чотири процентних пункти.
[ , ] Напишіть моделювання, щоб проілюструвати кожну з помилок уявлення на малюнку 3.1.
[ , ] Дослідження Blumenstock і його колеги (2015) бере участь побудова моделі машинного навчання , які могли б використовувати цифрові дані трасування для прогнозування відповіді на опитування. Тепер, ви збираєтеся спробувати те ж саме з іншим набором даних. Kosinski, Stillwell, and Graepel (2013) виявили , що Facebook любить може передбачити індивідуальні риси і атрибути. Дивно, але ці прогнози можуть бути ще більш точним , ніж у друзів і колег (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) і Toole et al. (2015) докладно використання записів викликів (CDR) з мобільних телефонів для прогнозування загальних тенденцій безробіття.