[ , ] I kapitlet var jeg meget positiv om post-stratification. Dette forbedrer dog ikke altid kvaliteten af estimaterne. Konstruer en situation, hvor efterlagring kan reducere estimaternes kvalitet. (For et tip, se Thomsen (1973) .)
[ , , ] Design og gennemfør en undersøgelse uden sandsynlighed på Amazon Mechanical Turk for at spørge om pistol ejerskab og holdninger til pistol kontrol. For at du kan sammenligne dine estimater med dem, der stammer fra en sandsynlighedsprøve, skal du kopiere spørgsmålstegn og svarmuligheder direkte fra en undersøgelse af høj kvalitet, som dem, der drives af Pew Research Center.
[ , , ] Goel og kolleger (2016) administrerede 49 multiple choice attitude spørgsmål trukket fra General Social Survey (GSS) og vælge undersøgelser fra Pew Research Center til ikke-sandsynlige stikprøve af respondenter trukket fra Amazon Mechanical Turk. De justerede derefter for ikke-repræsentativitet af data ved hjælp af modelbaseret postlagring og sammenlignede deres justerede estimater med dem fra de sandsynlighedsbaserede GSS- og Pew-undersøgelser. Gennemfør samme undersøgelse på Amazon Mechanical Turk og prøv at replikere figur 2a og figur 2b ved at sammenligne dine justerede estimater med estimaterne fra de seneste runder af GSS og Pew-undersøgelserne. (Se bilag Tabel A2 for listen over 49 spørgsmål.)
[ , , ] Mange undersøgelser bruger selvrapporterede foranstaltninger til mobiltelefonbrug. Dette er en interessant indstilling, hvor forskere kan sammenligne selvrapporteret adfærd med logget opførsel (se f.eks. Boase and Ling (2013) ). To almindelige adfærdspunkter om at spørge om, ringer og sms'er, og to fælles tidsrammer er "i går" og "i den sidste uge."
[ , ] Schuman og Presser (1996) hævder, at spørgsmålskommentarer ville have betydning for to typer af spørgsmål: delvist spørgsmål, hvor to spørgsmål er på samme niveau af specificitet (f.eks. Vurderinger af to præsidentkandidater); og delvist spørgsmål, hvor et generelt spørgsmål følger et mere specifikt spørgsmål (f.eks. spørgende "Hvor tilfreds er du med dit arbejde?" efterfulgt af "Hvor tilfreds er du med dit liv?").
De karakteriserer yderligere to typer af spørgsmålstegnseffekt: Konsekvenseffekter opstår, når svar på et senere spørgsmål bringes nærmere (end de ellers ville være) til dem, der er givet til et tidligere spørgsmål; Kontrasteffekter opstår, når der er større forskelle mellem svar på to spørgsmål.
[ , ] På baggrund af Schuman og Pressers arbejde beskriver Moore (2002) en separat dimension af spørgsmålstegnseffekt: additiv og subtraktive effekter. Mens der opstår kontraster og konsekvensvirkninger som følge af respondenternes evalueringer af de to punkter i forhold til hinanden, produceres additiv og subtraktive effekter, når respondenterne gøres mere følsomme overfor de større rammer inden for hvilke spørgsmålene stilles. Læs Moore (2002) , og lav en undersøgelseseksperiment på MTurk for at demonstrere additiv eller subtraktive effekter.
[ , ] Christopher Antoun og kolleger (2015) gennemførte en undersøgelse, der sammenlignede bekvemmelighedsprøverne fra fire forskellige online rekrutteringskilder: MTurk, Craigslist, Google AdWords og Facebook. Design en simpel undersøgelse og rekruttere deltagere gennem mindst to forskellige online rekrutteringskilder (disse kilder kan være forskellige fra de fire kilder, der anvendes i Antoun et al. (2015) ).
[ ] I et forsøg på at forudsige resultaterne af 2016 EU-folkeafstemningen (dvs. Brexit), YouGov-en internetbaseret markedsundersøgelse foretaget online-undersøgelser af et panel på omkring 800.000 respondenter i Det Forenede Kongerige.
En detaljeret beskrivelse af YouGovs statistiske model findes på https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Groft sagt delte YouGov vælgere i typer baseret på 2015 valg valg valg, alder, kvalifikationer, køn og dato for interview samt valgkredsen, hvor de levede. For det første brugte de data indsamlet fra YouGov-panelisterne til at estimere blandt de, der stemte, andelen af mennesker af hver vælgertype, der havde til hensigt at stemme forladt. De vurderede valgdeltagelsen for hver vælgertype ved hjælp af den britiske valgstudie (BES) fra 2015, en efter-valg-ansigt-til-ansigt undersøgelse, som validerede valgdeltagelse fra valgrullerne. Endelig estimerede de, hvor mange der var af hver vælgertype i vælgerne, baseret på den seneste folketælling og årlige befolkningsundersøgelse (med nogle tilføjelsesoplysninger fra andre datakilder).
Tre dage før afstemningen viste YouGov en to-punkts ledelse for Leave. På aftenen for afstemningen viste afstemningen, at resultatet var for tæt på at ringe (49/51 Remain). Den endelige on-the-day undersøgelse forudsagde 48/52 til fordel for Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Faktisk savnede dette skøn det endelige resultat (52/48 Forlad) med fire procentpoint.
[ , ] Skriv en simulering for at illustrere hver af repræsentationsfejlene i figur 3.2.
[ , ] Forskningen fra Blumenstock og kolleger (2015) involverede opbygning af en maskinindlæringsmodel, der kunne bruge digitale spordata til at forudsige undersøgelsesresponser. Nu skal du prøve det samme med et andet datasæt. Kosinski, Stillwell, and Graepel (2013) fandt, at Facebook kan lide at forudsige individuelle træk og attributter. Overraskende nok kan disse forudsigelser være endnu mere præcise end venner og kolleger (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) brugte call detail records (CDR'er) fra mobiltelefoner til at forudsige samlede arbejdsløshedstendenser.