Nøgle:
[ , ] I kapitlet, var jeg meget positiv over post-lagdeling. Det gør dog ikke altid forbedre kvaliteten af estimater. Konstruer en situation, hvor kan bogføre-lagdeling kan nedsætte kvaliteten af estimater. (For et tip, se Thomsen (1973) ).
[ , , ] Design og gennemføre en ikke-sandsynlighed undersøgelse om Amazon MTurk at spørge om pistol ejerskab ( "Har du, eller er der nogen i din husstand, ejer en pistol, riffel eller pistol? Er det dig eller en anden i din husstand?") Og holdninger til våbenkontrol ( "Hvad tror du er mere vigtigt, at beskytte retten af amerikanerne til at eje våben, eller til at kontrollere pistol ejerskab?").
[ , , ] Goel og kolleger (2016) administreret en ikke-sandsynlighed-baserede undersøgelse, der består af 49 multiple choice-holdningsmæssige spørgsmål, trukket fra General Social Survey (GSS) og vælg undersøgelser af Pew Research Center på Amazon MTurk. De derefter justere for den ikke-repræsentativitet data ved hjælp af modelbaseret post-stratificering (Mr. P), og sammenligne de justerede estimater med dem, estimeres ved hjælp sandsynlighed-baserede GSS / Pew undersøgelser. Gennemfør samme undersøgelse på MTurk og forsøge at replikere figur 2a og figur 2b ved at sammenligne dine tilpassede estimater med skønnene fra de seneste runder af GSS / Pew (Se tillæg Tabel A2 for listen med 49 spørgsmål).
[ , , ] Mange undersøgelser bruger selvrapportering foranstaltninger af mobiltelefon aktivitetsdata. Dette er en interessant indstilling, hvor forskerne kan sammenligne selvrapporteret adfærd med Logget adfærd (se fx Boase and Ling (2013) ). To almindelige adfærd for at spørge om ringer og sms'er, og to fælles tidsrammer er "i går" og "i den forløbne uge."
[ , ] Schuman og Presser (1996) argumenterer, at spørgsmål ordrer ville betyde noget for to typer af relationer mellem spørgsmål: del-del spørgsmål, hvor to spørgsmål er på det samme niveau af specificitet (f.eks ratings af to præsidentkandidater); og en del-hele spørgsmål, hvor et generelt spørgsmål følger en mere specifikt spørgsmål (f.eks spørge "Hvor tilfreds er du med dit arbejde?" efterfulgt af "Hvor tilfreds er du med dit liv?").
De yderligere at karakterisere to typer af spørgsmål ordre effekt: konsistens effekter opstår, når svar på et senere spørgsmål bringes tættere (end de ellers ville være) til dem, gives til et tidligere spørgsmål; kontrast effekter opstår, når der er større forskelle mellem svar på to spørgsmål.
[ , ] Med udgangspunkt i det arbejde, Schuman og Presser, Moore (2002) beskriver en separat dimension af spørgsmål orden effekt: additiv og subtraktiv. Mens kontrast og konsistens effekter produceres som en konsekvens af de adspurgtes evalueringer af de to elementer i forhold til hinanden, additive og subtraktive effekter produceres når respondenterne bliver mere følsomme over for større ramme, som spørgsmålene er stillet. Læs Moore (2002) , derefter designe og køre en undersøgelse eksperiment på MTurk at demonstrere additive eller subtraktive effekter.
[ , ] Christopher Antoun og kolleger (2015) har foretaget en undersøgelse, der sammenligner de convenience prøver fra fire forskellige online rekruttering kilder: MTurk, Craigslist, Google AdWords og Facebook. Design en simpel undersøgelse og rekruttere deltagere gennem mindst to forskellige online rekruttering kilder (de kan være forskellige kilder fra de fire kilder, der anvendes i Antoun et al. (2015) ).
[ ] YouGov, en internet-baseret analysefirmaet, gennemført online meningsmålinger af et panel af omkring 800.000 respondenter i Storbritannien og brugte Mr. P. til at forudsige resultatet af EU Referendum (dvs. Brexit) hvor de britiske vælgere stemme enten at forblive i eller forlader den Europæiske Union.
En detaljeret beskrivelse af YouGov statistiske model er her (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Groft sagt YouGov partitioner vælgerne i typer baseret på 2015 valget stemme valg, alder, kvalifikationer, køn, dato for interviewet, samt valgkreds, de bor i. Først, de brugte data indsamlet fra YouGov Zaperas paneldeltagerne at estimere, blandt dem der stemmer, er andelen af befolkningen i hver vælger typen, der har til hensigt at stemme orlov. De anslår valgdeltagelse på hver vælger typen ved hjælp af 2015 British Election Study (BES) efter valget ansigt-til-ansigt-undersøgelse, som valideret valgdeltagelse fra valglisterne. Endelig har de vurdere, hvor mange mennesker der er i hver vælger type i vælgerkorpset baseret på nyeste Census og årlige Population Survey (med nogle tillæg oplysninger fra BES, YouGov Zaperas undersøgelse af data fra omkring folketingsvalget, og information om, hvor mange mennesker stemte for hver part i hvert valgkreds).
Tre dage før afstemningen viste YouGov en to point forspring til orlov. På tærsklen til afstemningen, afstemningen viste for tæt til at ringe (49-51 Remain). Den endelige on-the-dages undersøgelse forudsagt 48/52 til fordel for Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Faktisk dette skøn savnede det endelige resultat (52-48 Orlov) med fire procentpoint.
[ , ] Skriv en simulering til at illustrere de enkelte repræsentation fejl i figur 3.1.
[ , ] Forskningen af Blumenstock og kolleger (2015) involveret bygge en maskine learning model, der kunne bruge digitale spor til at forudsige besvarelserne. Nu, vil du prøve det samme med en anden datasæt. Kosinski, Stillwell, and Graepel (2013) fandt, at Facebook kan lide kan forudsige individuelle karaktertræk og egenskaber. Overraskende, kan disse forudsigelser være endnu mere præcis end venner og kolleger (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) brug opkald detaljer optegnelser (CDR'er) fra mobiltelefoner til at forudsige samlende tendenser arbejdsløshed.