[ , ] In het hoofdstuk was ik zeer positief over poststratificatie. Dit verbetert echter niet altijd de kwaliteit van schattingen. Construeer een situatie waarin post-stratificatie de kwaliteit van schattingen kan verminderen. (Voor een hint, zie Thomsen (1973) .)
[ , , ] Ontwerp en voer een niet-waarschijnlijkheidsonderzoek uit bij Amazon Mechanical Turk om te vragen naar het bezit van wapens en de houding ten opzichte van wapenbeheersing. Zodat u uw schattingen kunt vergelijken met de resultaten die zijn afgeleid van een kanssteekproef, kopieert u de vraagtekst en de antwoordopties rechtstreeks van een hoogwaardige enquête, zoals die van het Pew Research Center.
[ , , ] Goel en collega's (2016) 49 meerkeuze attitudevragen van de General Social Survey (GSS) en geselecteerde enquêtes van het Pew Research Center tot niet-waarschijnlijkheidstaal van respondenten van Amazon Mechanical Turk. Vervolgens corrigeerden ze de niet-representativiteit van gegevens met behulp van modelgebaseerde poststratificatie en vergeleken ze hun aangepaste schattingen met die van de op waarschijnlijkheid gebaseerde GSS- en Pew-onderzoeken. Voer dezelfde enquête uit bij Amazon Mechanical Turk en probeer figuur 2a en figuur 2b te repliceren door uw aangepaste schattingen te vergelijken met de schattingen uit de meest recente ronden van de GSS- en Pew-onderzoeken. (Zie bijlagetabel A2 voor de lijst met 49 vragen.)
[ , , ] Veel studies gebruiken zelfgerapporteerde metingen van het gebruik van mobiele telefoons. Dit is een interessante omgeving waarin onderzoekers zelfgerapporteerd gedrag kunnen vergelijken met geregistreerd gedrag (zie bijvoorbeeld Boase and Ling (2013) ). Twee veel voorkomende gedragingen om te vragen zijn bellen en sms'en, en twee veelgebruikte tijdspaden zijn 'gisteren' en 'in de afgelopen week'.
[ , ] Schuman en Presser (1996) stellen dat vraagorders van belang zijn voor twee soorten vragen: deelvragen, waarbij twee vragen op hetzelfde niveau van specificiteit zijn (bijv. Beoordelingen van twee presidentskandidaten); en deel-gehele vragen waarbij een algemene vraag een meer specifieke vraag volgt (bijv. vragen "Hoe tevreden bent u met uw werk?", gevolgd door "Hoe tevreden bent u met uw leven?").
Ze kenmerken verder twee soorten vraagordereffecten: consistentie-effecten treden op wanneer reacties op een latere vraag dichter bij elkaar worden gebracht (dan ze anders zouden zijn) naar antwoorden op een eerdere vraag; contrasteffecten treden op wanneer er meer verschillen zijn tussen de antwoorden op twee vragen.
[ , ] Voortbouwend op het werk van Schuman en Presser, beschrijft Moore (2002) een afzonderlijke dimensie van het vraagordereffect: additieve en subtractieve effecten. Hoewel contrast- en consistentie-effecten worden geproduceerd als gevolg van de evaluaties door respondenten van de twee items ten opzichte van elkaar, worden additieve en subtractieve effecten geproduceerd wanneer respondenten gevoeliger worden gemaakt voor het grotere raamwerk waarbinnen de vragen worden gesteld. Lees Moore (2002) , ontwerp en voer een enquête-experiment uit op MTurk om additieve of subtractieve effecten te demonstreren.
[ , ] Christopher Antoun en collega's (2015) voerden een studie uit waarin de gemakssteekproeven werden vergeleken die werden verkregen uit vier verschillende online wervingsbronnen: MTurk, Craigslist, Google AdWords en Facebook. Ontwerp een eenvoudige enquête en rekruteer deelnemers via ten minste twee verschillende bronnen voor online recrutering (deze bronnen kunnen verschillen van de vier bronnen die worden gebruikt in Antoun et al. (2015) ).
[ ] In een poging om de resultaten van het 2016 EU Referendum (dat wil zeggen, Brexit) te voorspellen, voerde YouGov - een op internet gebaseerd marktonderzoeksbureau - online opiniepeilingen uit bij een panel van ongeveer 800.000 respondenten in het Verenigd Koninkrijk.
Een gedetailleerde beschrijving van het statistische model van YouGov is te vinden op https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Grof gezegd, YouGov verdeelde de kiezers in typen op basis van de algemene verkiezing stemkeuze in 2015, leeftijd, kwalificaties, geslacht en datum van het interview, evenals het kiesdistrict waarin ze woonden. Ten eerste gebruikten ze gegevens die waren verzameld door de YouGov-panelleden om, onder degenen die hadden gestemd, een schatting te maken van het aantal mensen van elk type kiezer die van plan waren om te vertrekken. Ze schatten de opkomst van elk type kiezer met behulp van de 2015 British Election Study (BES), een persoonlijke enquête na de verkiezingen, waarbij de opkomst van de verkiezingsrollen gevalideerd werd. Ten slotte schatten ze hoeveel mensen er waren van elk type kiezer in het electoraat, op basis van de laatste volkstelling en jaarlijkse bevolkingsenquête (met enige aanvullende informatie uit andere gegevensbronnen).
Drie dagen voor de stemming vertoonde YouGov een voorsprong van twee punten op verlof. Aan de vooravond van het stemmen gaf de peiling aan dat het resultaat te dichtbij was om te bellen (49/51 Resterend). De laatste studie op de dag voorspelde 48/52 in het voordeel van Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). In feite miste deze schatting het eindresultaat (52/48 Verlof) met vier procentpunten.
[ , ] Schrijf een simulatie om elk van de representatiefouten in figuur 3.2 te illustreren.
[ , ] Het onderzoek van Blumenstock en collega's (2015) betrof het bouwen van een machine-leermodel dat digitale traceergegevens zou kunnen gebruiken om enquêtereacties te voorspellen. Nu ga je hetzelfde proberen met een andere dataset. Kosinski, Stillwell, and Graepel (2013) ontdekten dat likes van Facebook individuele eigenschappen en attributen kunnen voorspellen. Verrassend genoeg kunnen deze voorspellingen zelfs nauwkeuriger zijn dan die van vrienden en collega's (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) gebruikte call detail records (CDR's) van mobiele telefoons om geaggregeerde werkloosheidstrends te voorspellen.