Nyckel:
[ , ] I kapitlet, var jag mycket positivt om poststratifiering. Men det inte alltid förbättra kvaliteten på uppskattningar. Konstruera en situation där kan poststratifiering kan minska kvaliteten på uppskattningar. (För en ledtråd, se Thomsen (1973) ).
[ , , ] Design och genomföra en icke-sannolikhets undersökning om Amazon MTurk att fråga om vapeninnehav ( "Har du, eller har någon i ditt hushåll, äger en pistol, gevär eller pistol? Är det du eller någon annan i ditt hushåll?") Och attityder till vapenkontroll ( "Vad tycker du är viktigare, att skydda rätten av amerikaner att äga vapen, eller att kontrollera vapeninnehav?").
[ , , ] Goel och kollegor (2016) ges en icke-sannolikhetsbaserad undersökning består av 49 flervalsattitydfrågor från general Social Survey (GSS) och välj undersökningar av Pew Research Center på Amazon MTurk. De anpassar sedan för icke-representativa uppgifter med hjälp av modellbaserad poststratifiering (Mr P), och jämföra de justerade beräkningar med de uppskattas med hjälp av sannolikhetsbaserade GSS / Pew undersökningar. Genomför samma undersökning på MTurk och försöka replikera figur 2a och figur 2b genom att jämföra dina justerade beräkningar med uppskattningarna från de senaste omgångarna av GSS / Pew (se bilaga tabell A2 för listan över 49 frågor).
[ , , ] Många studier använder självrapportåtgärder mobil data telefon aktivitet. Detta är en intressant miljö där forskare kan jämföra självrapporterade beteende med loggade beteende (se t.ex. Boase and Ling (2013) ). Två vanliga beteenden för att ställa om ringer och sms, och två vanliga tidsramar är "igår" och "den senaste veckan."
[ , ] Schuman och Pressar (1996) hävdar att frågan order skulle fråga för två typer av relationer mellan frågor: deltids del frågor där två frågor är på samma nivå av specificitet (t.ex. betyg av två presidentkandidaterna); och deltids hela frågor där en allmän fråga följer en mer specifik fråga (t.ex. frågar "Hur nöjd är du med ditt arbete?" följt av "Hur nöjd är du med ditt liv?").
De karakterisera ytterligare två typer av frågor för effekt: konsistens uppstår när svar på en senare fråga förs närmare (än de annars skulle vara) till de som ges till en tidigare fråga; kontrast effekter uppstår när det finns större skillnader mellan svaren på två frågor.
[ , ] Bygga på det arbete som Schuman och Pressar, Moore (2002) beskriver en särskild dimension av fråga för effekt: additiv och subtraktiv. Medan kontrast och konsistens effekter produceras som en följd av deltagarnas utvärderingar av de två artiklar i förhållande till varandra, additiva och subtraktiva effekter produceras när svarande görs mer känsliga för större ram inom vilken frågorna ställs. Läs Moore (2002) , sedan utforma och köra en undersökning experiment på MTurk att visa additiva eller subtraktiva effekter.
[ , ] Christopher Antoun och kollegor (2015) genomförde en studie som jämförde de bekvämlighet prover från fyra olika online rekrytera källor: MTurk, Craigslist, Google AdWords och Facebook. Utforma en enkel undersökning och rekrytera deltagare genom åtminstone två olika online-rekryteringskällor (de kan vara olika källor från fyra källor som används i Antoun et al. (2015) ).
[ ] YouGov, en internetbaserad marknadsundersökningsföretaget, som genomfördes på nätet opinionsundersökningar av en panel av cirka 800.000 respondenter i Storbritannien och används Mr P. att förutsäga resultatet av EU-folkomröstningen (dvs Brexit) där de brittiska väljarna rösta antingen förbli i eller lämna EU.
En detaljerad beskrivning av YouGovs statistisk modell är här (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Grovt sett YouGov partitioner väljare i typer baserat på 2015 riksdagsval rösta val, ålder, utbildning, kön, födelse intervju liksom valkretsen de lever i. Först använde de uppgifter som samlats in från YouGovs paneldeltagarna att uppskatta, bland dem som röstar, andelen personer i varje väljare typ som har för avsikt att rösta Lämna. De uppskattar slutit varje väljare typ med hjälp av 2015 brittiska valundersökning (BES) efter valet ansikte mot ansikte undersökning som validerade valdeltagandet från röstlängderna. Slutligen, de uppskatta hur många människor det finns i varje väljare typ av väljarkåren baseras på senaste folkräkningen och årliga Population Survey (med vissa tillägg information från BES, YouGovs enkätdata från hela det allmänna valet, och information om hur många människor röstade för varje parti i varje valkrets).
Tre dagar före omröstningen visade YouGov två poäng ledningen Lämna. Dagen före omröstningen, visade undersökningen för nära att ringa (49-51 Remain). Den slutliga on-the-dagars studie förutspådde 48/52 till förmån för Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Faktum är att denna uppskattning missade slutresultatet (52-48 Lämna) med fyra procentenheter.
[ , ] Skriv en simulering för att illustrera var och en av representations fel i Figur 3.1.
[ , ] Forskningen om Blumen och kollegor (2015) involverade att bygga en maskin inlärningsmodell som kunde använda digitala spårdata för att förutsäga enkätsvar. Nu kommer ni att prova samma sak med en annan datauppsättning. Kosinski, Stillwell, and Graepel (2013) fann att Facebook gillar kan förutsäga individuella egenskaper och attribut. Överraskande, kan dessa förutsägelser bli ännu mer exakt än de vänner och kollegor (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) använder samtalsdetaljposter (CDR) från mobiltelefoner för att förutsäga aggregerade arbetslöshetens utveckling.