[ , ] V této kapitole jsem měl velmi pozitivní post stratifikace. To však ne vždy zlepšuje kvalitu odhadů. Vytvořte situaci, kdy post-stratifikace může snížit kvalitu odhadů. (Za náznak viz Thomsen (1973) .)
[ , , ] Vytvořte a provádějte průzkum nepravděpodobné na Amazon Mechanical Turk a zeptejte se na vlastnictví zbraní a postoje k řízení zbraní. Abyste mohli porovnat své odhady s odhady odvozenými z pravděpodobnostní vzorky, zkopírujte text dotazu a možnosti odpovědi přímo z vysoce kvalitního průzkumu, jako jsou průzkumy Pew Research Center.
[ , , ] Goel a kolegové (2016) spravovali 49 dotazů s možností výběru z obecného sociálního průzkumu (GSS) a vybrali průzkumy Pew Research Center k nepravděpodobnosti vzorku respondentů z Amazon Mechanical Turk. Poté se upravili o nereprezentativnost údajů pomocí post-stratifikace založené na modelu a porovnali své upravené odhady s údaji z průzkumů GSS a Pew založených na pravděpodobnosti. Proveďte stejný průzkum na Amazon Mechanical Turk a pokuste se replikovat obrázek 2a a obrázek 2b porovnáním vašich upravených odhadů s odhady z posledních kol v průzkumech GSS a Pew. (Viz příloha tabulka A2 pro seznam 49 otázek.)
[ , , ] Mnohé studie používají samohodnocená měření používání mobilních telefonů. Toto je zajímavé prostředí, v němž výzkumníci mohou srovnávat chování hlášené se zaznamenávaným chováním (viz např. Boase and Ling (2013) ). Dvě běžné chování, které se ptají, jsou volání a textování a dva společné časové rámce jsou "včera" a "v minulém týdnu".
[ , ] Schuman a Presser (1996) domnívají, že otázky týkající se otázek by se mohly týkat dvou typů otázek: dílčí otázky, kde jsou dvě otázky na stejné úrovni specifičnosti (např. Hodnocení dvou kandidátů na prezidentský proces); a částečně otázky, kde se obecná otázka řídí konkrétnější otázkou (např. otázka "Jak jste spokojeni s vaší prací?" a následně "Jak jste spokojený se svým životem?").
Dále charakterizují dva typy efektu pořadí otázek: důsledky konzistence se objevují, když reakce na pozdější otázku jsou přiblížena (než by jinak byly) těm, které byly dány předchozí otázce; kontrastní efekty nastávají, když existují větší rozdíly mezi odpověďmi na dvě otázky.
[ , ] Na základě práce Schumana a Pressera, Moore (2002) popisuje samostatný rozměr efektu pořadí otázek: aditivní a subtraktivní účinky. Zatímco účinky kontrastu a konzistence jsou výsledkem hodnocení respondentů obou položek ve vztahu k sobě navzájem, aditive a subtraktivní efekty jsou produkovány, když jsou respondenti citlivější na větší rámec, ve kterém jsou kladeny otázky. Přečtěte si Moore (2002) a pak navrhneme a spusťte průzkumný experiment na MTurk, abychom demonstrovali aditivní nebo subtraktivní účinky.
[ , ] Christopher Antoun a jeho kolegové (2015) provedli studii, ve které porovnávají vzorky získané ze čtyř různých on-line zdrojů: MTurk, Craigslist, Google AdWords a Facebook. Navrhněte jednoduchý průzkum a získávejte účastníky prostřednictvím nejméně dvou různých zdrojů online náboru (tyto zdroje se mohou lišit od čtyř zdrojů používaných v Antoun et al. (2015) ).
[ ] Ve snaze předpovědět výsledky referenda o EU v roce 2016 (tj. Společnost Brexit), společnost YouGov - internetová společnost zabývající se výzkumem trhu - provedla online ankety panelu přibližně 800 000 respondentů ve Spojeném království.
Podrobný popis statistického modelu společnosti YouGov naleznete na adrese https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Zhruba řečeno, YouGov rozdělil voliče na typy založené na volbě hlasování o volbách do roku 2015, věku, kvalifikaci, pohlaví a termínu rozhovoru, stejně jako na volebním obvodu, ve kterém žili. Za prvé, používali údaje shromážděné od panelistů společnosti YouGov, aby mezi těmi, kteří hlasovali, odhadli podíl lidí každého typu voliče, kteří měli v úmyslu hlasovat. Odhadovaly účast každého volebního typu pomocí britské volební studie (BES) z roku 2015, po volbách průzkumu tváří v tvář, který potvrdil účasti na volebních plánech. Nakonec odhadli, kolik lidí bylo v každém volebním druhu, podle nejnovějších údajů o sčítání lidu a roční populaci (s některými doplňujícími informacemi z jiných zdrojů údajů).
Tři dny před hlasováním ukázal YouGov dvoubodový náskok pro Leave. V předvečer hlasování hlasování ukázalo, že výsledek byl příliš blízko volání (49/51 Remain). Poslední denní studie předpovídala 48/52 ve prospěch společnosti Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Ve skutečnosti tento odhad zmeškal konečný výsledek (52/48 Odchod) o čtyři procentní body.
[ , ] Napište simulaci, která ilustruje všechny chyby reprezentace na obrázku 3.2.
[ , ] Výzkum Blumenstocka a kolegů (2015) zahrnoval budování modelu strojového učení, který by mohl využívat digitální stopové údaje pro předpovědi reakcí průzkumu. Nyní zkuste stejnou věc s jinou sadou dat. Kosinski, Stillwell, and Graepel (2013) zjistili, že Facebook má rád předpověď jednotlivých vlastností a atributů. Překvapivě mohou být tyto předpovědi ještě přesnější než předpovědi přátel a kolegů (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) použil záznamy z telefonních čísel (CDR) z mobilních telefonů, aby předpověděl souhrnné trendy nezaměstnanosti.