Key:
[ , ] In het hoofdstuk, was ik erg positief over de post-stratificatie. Dit betekent echter niet altijd het verbeteren van de kwaliteit van de schattingen. De bouw van een situatie waar kan poststratificatie kan de kwaliteit van de ramingen te verminderen. (Voor een hint, zie Thomsen (1973) ).
[ , , ] Design en voeren een niet-waarschijnlijkheid onderzoek op Amazon MTurk te vragen over wapenbezit ( "Weet je, of heeft iemand in uw huishouden, het bezit van een pistool, geweer of pistool? Is dat u of iemand anders in uw huishouden? ') En houding ten opzichte van gun control ( "Wat denk je dat is belangrijker-rechts van de Amerikanen te bezitten geweren, of wapenbezit onder controle te beschermen?").
[ , , ] Goel en collega's (2016) toegediend, een niet-waarschijnlijkheid-gebaseerde enquête bestaat uit 49 multiple-choice vragen attitude getrokken uit de General Social Survey (GSS) en selecteer onderzoek van het Pew Research Center op Amazon MTurk. Ze passen dan voor de niet-representativiteit van de gegevens met behulp van modelgebaseerde poststratificatie (Mr. P), en vergelijk de aangepaste ramingen met die geschat met behulp van waarschijnlijkheid op basis van GSS / Pew enquêtes. Voeren dezelfde enquête over MTurk en proberen te figuur 2a en figuur 2b te repliceren door het vergelijken van uw aangepaste ramingen met de ramingen van de meest recente rondes van GSS / Pew (zie bijlage tabel A2 voor de lijst van 49 vragen).
[ , , ] Veel studies gebruiken self-verslag maatregelen van de mobiele telefoon activiteit data. Dit is een interessante omgeving waar onderzoekers zelf-gerapporteerde gedrag gelogde gedrag te vergelijken (zie bijvoorbeeld, Boase and Ling (2013) ). Twee veel voorkomende gedrag te vragen over zijn bellen en sms'en, en twee gemeenschappelijke termijnen zijn "gisteren" en "in de afgelopen week."
[ , ] Schuman en Presser (1996) betogen dat vraag orders van belang zou zijn voor twee typen van de betrekkingen tussen de vragen: part-part vragen waar twee vragen zijn op hetzelfde niveau van specificiteit (bijvoorbeeld ratings van twee presidentskandidaten); en part-geheel vragen, waar een algemene vraag volgt een meer specifieke vraag (bijvoorbeeld de vraag "Hoe tevreden bent u met uw werk?", gevolgd door "Hoe tevreden bent u met uw leven? ').
Ze karakteriseren nog twee soorten vragen orde effect: consistentie effecten optreden wanneer antwoorden op een latere vraag dichterbij (dan ze anders zouden zijn) aan die op een eerdere vraag worden gebracht; contrast effecten optreden wanneer er grotere verschillen tussen de antwoorden op twee vragen.
[ , ] Voortbouwend op het werk van Schuman en Presser, Moore (2002) beschrijft een aparte dimensie van de vraag orde effect: additieve en subtractieve. Terwijl contrast en consistentie effecten veroorzaakt als gevolg van evaluaties van de twee posten respondenten ten opzichte van elkaar, additieve en subtractieve effecten veroorzaakt wanneer respondenten gevoeliger voor het grotere raamwerk waarbinnen de vragen gesteld worden. Lees Moore (2002) , dan is het ontwerpen en uitvoeren van een onderzoek experiment op MTurk tot additieve of subtractieve effecten aan te tonen.
[ , ] Christopher Antoun en collega's (2015) voerden een studie waarbij het gemak monsters verkregen uit vier verschillende online werven bronnen: MTurk, Craigslist, Google AdWords en Facebook. Een vet survey aantrekken van deelnemers door ten minste twee verschillende bronnen online werven (ze kunnen verschillende bronnen uit de vier bronnen gebruikt Antoun et al. (2015) ).
[ ] YouGov, een internet-based marktonderzoeksbureau, uitgevoerd online polls van een panel van ongeveer 800.000 respondenten in het Verenigd Koninkrijk en gebruikt de heer P. om het resultaat van de EU-Referendum (dat wil zeggen, Brexit) waarbij de Britse kiezers ofwel te blijven voorspellen in of laat de Europese Unie.
Een gedetailleerde beschrijving van statistisch model YouGov is hier (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Grofweg YouGov verdeelt kiezers in typen op basis van 2015 algemene verkiezingen stem keuze, leeftijd, kwalificaties, geslacht, datum van het interview, evenals het kiesdistrict waarin zij leven. Ten eerste, ze gebruikt de gegevens verzameld uit de YouGov panelleden in te schatten, onder degenen die stemmen, het percentage mensen van elk type kiezer die van plan zijn te vertrekken stemmen. Zij schatten de opkomst van elk type kiezer met behulp van de Britse Election Study (BES) na de verkiezingen face-to-face enquête, die opkomst gevalideerde uit de kiezerslijsten 2015. Tot slot, ze schatten hoeveel mensen zijn er van elk type kiezer in het electoraat gebaseerd op de laatste volkstelling en de jaarlijkse Population Survey (met enkele Naast informatie van de BES, YouGov enquêtegegevens van rond de algemene verkiezingen, en informatie over hoe veel mensen gestemd elke partij in elke kieskring).
Drie dagen voor de stemming, YouGov toonde een twee punten voorsprong voor Leave. Aan de vooravond van de stemming, de poll bleek te dicht om te bellen (49-51 Remain). De finale op-de-dag studie voorspelde 48/52 in het voordeel van Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). In feite is deze schatting miste het uiteindelijke resultaat (52-48 Leave) met vier procentpunten.
[ , ] Voeg een simulatie aan elk van de vertegenwoordiging fouten illustreren Figuur 3.1.
[ , ] Het onderzoek van Blumenstock en collega's (2015) betrokken de bouw van een machine learning model dat digitale trace gegevens kunnen gebruiken om antwoorden op de enquête te voorspellen. Nu, ga je hetzelfde proberen met een andere dataset. Kosinski, Stillwell, and Graepel (2013) bleek dat Facebook wil kunnen individuele eigenschappen en kenmerken te voorspellen. Verrassend, kan deze voorspellingen nog nauwkeuriger dan die van vrienden en collega's (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) gebruik van Call Detail Records (CDR's) van mobiele telefoons tot de totale werkloosheid trends te voorspellen.