[ , ] A fejezetben nagyon pozitív volt a poszt-rétegződés. Ez azonban nem mindig javítja a becslések minőségét. Olyan helyzetet kell kialakítanunk, ahol a poszt-rétegződés csökkentheti a becslések minőségét. (Lásd a Thomsen (1973) .)
[ , , ] Tervezzen és hajtson végre egy nem valószínűségi felmérést az Amazon Mechanical Turk-ről, hogy kérdezze meg a pisztoly tulajdonjogát és a fegyverellenőrzéshez való hozzáállást. Annak érdekében, hogy összehasonlíthassa becsléseit a valószínűségi mintából származókkal, kérjük, másolja át a kérdezőszövegeket és válaszbeállításokat közvetlenül egy magas minőségű felmérésből, például a Pew Research Center által működtetett felmérésből.
[ , , ] Goel és munkatársai (2016) 49 általános választási kérdést választottak ki az általános szociális felmérésből (GSS), és a Pew Research Center által készített felméréseket választották ki az Amazon Mechanical Turk-től szerzett válaszadók nem valószínűségi mintájára. Ezután az adatok nem reprezentativitására igazították a modell alapú utólagos rétegződést, és összehasonlították a becsült becsléseket a valószínűségi alapú GSS és Pew felmérésekkel. Végezd el ugyanazt a felmérést az Amazon Mechanical Turk-ről, és próbálj meg másolni a 2a. És 2b. Ábrát, összehasonlítva a becsült becsléseket a GSS és a Pew felmérések legfrissebb fordulóinak becsléseivel. (Lásd az A2 függelék táblázatot a 49 kérdés listájához.)
[ , , ] Számos tanulmány a mobiltelefon használatáról szóló önként bejelentett intézkedéseket használja. Ez egy érdekes környezet, amelyben a kutatók összehasonlíthatják az önmagukban jelentett viselkedést a naplózott viselkedéssel (lásd pl. Boase and Ling (2013) ). Két gyakori magatartás a hívás és a szövegezés, a két közös idő "tegnap" és "az elmúlt héten".
[ , ] Schuman és Presser (1996) azt állítják, hogy a kérdőívek két kérdéstípusra vonatkoznak: olyan rész-részkérdések, amelyekben két kérdés azonos szintű szinten van (pl. Két elnöki jelölt minősítése); és részkomponensű kérdésekre, ahol egy általános kérdés egy konkrétabb kérdést követ (pl. megkérdezi: "mennyire elégedett a munkájával?", majd ezt követte: "mennyire elégedett az életével?").
Továbbá a kérdésrendi hatás két típusát jellemzik: a konzisztencia hatása akkor következik be, amikor a későbbi kérdésre adott válaszok közelebb kerülnek (mint egyébként) a korábbi kérdéshez adott válaszokhoz; a kontraszthatások akkor fordulnak elő, ha nagyobb különbségek vannak a két kérdésre adott válaszok között.
[ , ] Schuman és Presser munkájára építve Moore (2002) a kérdésrendi hatás különálló dimenzióját írja le: additív és kivonó hatások. A kontraszt és a konzisztencia hatása a válaszadók két egymáshoz viszonyított elemzésének következtében keletkezik, additív és kivonó hatások keletkeznek, amikor a válaszadók érzékenyebbek a nagyobb keretre, amelyen belül a kérdések merülnek fel. Olvassa el Moore (2002) , majd tervezzen és futtasson egy felmérési kísérletet a MTurk-ra, hogy bemutassa az additív vagy kivonó hatásokat.
[ , ] Christopher Antoun és munkatársai (2015) tanulmányt készítettek, amelyben összehasonlították a négy különböző online toborzási forrásból szerzett előnyöket: a MTurk, a Craigslist, a Google AdWords és a Facebook. Készíts egy egyszerű felmérést, és vegyen fel résztvevőket legalább két különböző online toborzó forráson keresztül (ezek a források eltérhetnek az Antoun et al. (2015) használt négy forrásból).
[ ] A 2016-os EU-népszavazás (azaz a Brexit) eredményeinek előrejelzésére a YouGov internetes piackutató cég végzett online felméréseket az Egyesült Királyságban mintegy 800 000 válaszadóból.
A YouGov statisztikai modelljének részletes leírása megtalálható a https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/ címen. Összességében elmondható, hogy a YouGov a választópolgárokat a 2015-ös általános választójogi választáson, az életkoron, a képesítésen, a nemen és a meghallgatás időpontján, valamint az adott választókerületen alapuló típusokra osztotta. Először a YouGov panelistáktól gyűjtött adatokat használták fel arra, hogy a szavazók körében becsülje meg az egyes választópolgárok népességének azon arányát, akik szavazásra szánták. Becslések szerint az egyes választópolgárok részvételét a 2015-ös brit választási tanulmány (BES) segítségével választották ki a választások utáni szemináriumon, amely érvényesítette a választói névjegyzékből való részvételt. Végül becsülték meg, hogy hány ember van a szavazók típusában a választók között a legújabb népszámlálási és éves népességi felmérés alapján (néhány további információból származó további információ).
Három nappal a szavazást megelőzően YouGov kétpontos vezetést mutatott a Szabadságra. A szavazás előestéjén a szavazás azt mutatta, hogy az eredmény túlságosan közel volt a híváshoz (49/51 Remain). Az utolsó napi tanulmány 48/52-et jelzett a Remain javára (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Valójában ez a becslés négy százalékponttal elmaradt a végeredménytől (52/48 szabadság).
[ , ] Írjon be egy szimulációt a 3.2 ábrán látható reprezentációs hibák bemutatására.
[ , ] A Blumenstock és munkatársai (2015) kutatásai során olyan gépi tanulási modellt építettek, amely digitális nyomkövetési adatokat használhat a felmérési válaszok előrejelzésére. Most ugyanazt fogod kipróbálni egy másik adathalmazgal. Kosinski, Stillwell, and Graepel (2013) találta, hogy a Facebook szeret is megjósolni az egyéni tulajdonságokat és attribútumokat. Meglepő módon ezek a becslések még pontosabbak lehetnek, mint a barátok és kollégák (Youyou, Kosinski, and Stillwell 2015) .
[ Toole et al. (2015) a mobiltelefonoktól származó hívásadat-nyilvántartásokat (CDR-eket) használta az aggregált munkanélküliség alakulásának előrejelzésére.