[ , ] В главата бях много позитивна пост-стратификация. Това обаче не винаги подобрява качеството на оценките. Изградете ситуация, при която след стратификацията може да се намали качеството на оценките. (За намек, вижте Thomsen (1973) .)
[ , , ] Проектиране и провеждане на проучване за невъзможност на Amazon Mechanical Turk да попита за собствеността на оръжието и отношението към оръжейния контрол. За да можете да сравните оценките си с тези, получени от вероятностна проба, копирайте текста на въпроса и опциите за отговор директно от висококачествено проучване, като тези, проведени от Pew Research Center.
[ , , ] Гоел и колегите (2016) администрират 49 въпроса за нагласите, изведени от Общото социално изследване (GSS) и избират проучвания от Изследователския център на Pew за проба от респондентите, извлечени от Amazon Mechanical Turk. След това те се приспособяват към непредставимостта на данните, използвайки модел, основан на пост-стратификацията, и сравняват своите коригирани прогнози с тези от проучванията GSS и Pew, базирани на вероятностите. Проведете същото проучване на Amazon Mechanical Turk и опитайте да копирате фигури 2а и 2б, като сравнявате коригираните си прогнози с оценките от последните кръгове на проучванията на GSS и Pew. (Вж. Таблицата за приложение А2 за списъка с 49 въпроса.)
[ , , ] Много проучвания използват самостоятелно съобщени мерки за използване на мобилни телефони. Това е интересна обстановка, в която изследователите могат да сравняват самооправдано поведение със записано поведение (вж. Напр. Boase and Ling (2013) ). Две обичайни поведения, за които се питате, се обаждат и изпращат текстови съобщения, а две общи времеви рамки са "вчера" и "през изминалата седмица".
[ , ] Schuman и Presser (1996) твърдят, че въпросните заповеди биха имали значение за два вида въпроси: частични въпроси, при които два въпроса са на същото ниво на специфичност (напр. Рейтинг на двама кандидати за президент); и частични въпроси, където общият въпрос е вследствие на по-конкретен въпрос (напр. питане "Колко сте доволни от работата си", последвано от "Колко сте доволни от живота си?").
Те освен това характеризират два вида ефекти от реда на въпроси: последователните ефекти се появяват, когато отговорите на по-късен въпрос се доближават (в противен случай биха били) до тези, дадени на предишен въпрос; контрастните ефекти се появяват, когато има по-големи различия между отговорите на два въпроса.
[ , ] Въз основа на работата на Schuman и Presser, Moore (2002) описва отделно измерение на ефекта на реда за въпроси: добавки и субтрактивни ефекти. Докато резултатите от контраста и консистенцията се получават вследствие на оценката на респондентите за двата елемента във връзка един с друг, добавките и субтрактивните ефекти се получават, когато респондентите стават по-чувствителни към по-голямата рамка, в която се поставят въпросите. Прочетете Moore (2002) , след което проектирайте и проведете експеримент с изследване върху MTurk, за да покажете добавъчни или субтрактивни ефекти.
[ , ] Кристофър Антон и колеги (2015) направиха проучване, сравняващо удобните проби, получени от четири различни онлайн източници за набиране на персонал: MTurk, Craigslist, Google AdWords и Facebook. Проектирайте просто проучване и набирайте участници чрез най-малко два различни онлайн източници за набиране на персонал (тези източници могат да бъдат различни от четирите източника, използвани в Antoun et al. (2015) ).
[ ] В опит да се прогнозират резултатите от референдума за 2016 г. на ЕС (т.е. "Брексит"), YouGov - интернет базирана фирма за проучване на пазара, проведе онлайн анкети на група от около 800 000 респонденти в Обединеното кралство.
Подробно описание на статистическия модел на YouGov можете да намерите на адрес https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Приблизително казано, YouGov разделя гласоподавателите на типове, основани на избора на гласоподаватели, възрастта, квалификациите, пола и датата на интервюто, както и избирателния район, в който са живели. Първо, те използваха данните, събрани от журналистите от YouGov, за да преценят сред гласувалите процента на хората от всеки тип избирател, който възнамеряваше да гласува. Те оценяват избирателната активност на всеки тип гласоподаватели, като използват Британското избирателно проучване (BES) от 2015 г., изгодно след анкетно проучване, което потвърждава избирателната активност от избирателните списъци. И накрая, те оценяват колко хора са имали от всеки тип избиратели в електората, въз основа на последното преброяване на населението и годишното проучване на населението (с някои допълнителни данни от други източници на данни).
Три дни преди гласуването YouGov показа двубой за Leave. В навечерието на гласуването анкетата посочи, че резултатът е твърде близо до повикване (49/51 остава). Последното проучване на деня предвижда 48/52 в полза на Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Всъщност тази прогноза пропусна крайния резултат (52/48 Отпуск) с четири процентни пункта.
[ , ] Напишете симулация, за да илюстрирате всяка от представените грешки на фигура 3.2.
[ , ] Изследванията на Blumenstock и колеги (2015) включват изграждане на модел за машинно обучение, който може да използва цифровите данни за проследяване, за да предскаже отговорите от проучването. Сега ще опитате едно и също нещо с различен набор от данни. Kosinski, Stillwell, and Graepel (2013) установиха, че Facebook харесва, може да предскаже индивидуални черти и атрибути. Изненадващо, тези прогнози могат да бъдат дори по-точни от тези на приятели и колеги (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) използват записи с подробни данни за обажданията (CDRs) от мобилни телефони, за да предвидят общите тенденции в безработицата.