[ , ] I kapittelet var jeg veldig positiv om post-stratifisering. Dette forbedrer imidlertid ikke alltid kvaliteten på estimatene. Konstruer en situasjon der etterlagring kan redusere kvaliteten på estimatene. (For et snev, se Thomsen (1973) .)
[ , , ] Utform og utfør en ikke-sannsynlighet undersøkelse på Amazon Mechanical Turk å spørre om pistol eierskap og holdninger til pistol kontroll. Slik at du kan sammenligne dine estimater med de som er avledet av en sannsynlighetseksempel, kan du kopiere spørsmålsteksten og svaralternativene direkte fra en kvalitetsundersøkelse som de som drives av Pew Research Center.
[ , , ] Goel og kollegaer (2016) administrerte 49 flervalgs holdningsspørsmål hentet fra General Social Survey (GSS) og velg undersøkelser fra Pew Research Center til ikke-sannsynlig utvalg av respondenter trukket fra Amazon Mechanical Turk. De justerte deretter for ikke-representativitet av data ved hjelp av modellbasert postlagring og sammenlignet deres justerte estimater med de fra sannsynlighetsbaserte GSS- og Pew-undersøkelsene. Gjør den samme undersøkelsen på Amazon Mechanical Turk, og prøv å replikere figur 2a og figur 2b ved å sammenligne dine justerte estimater med estimatene fra de siste rundene i GSS- og Pew-undersøkelsene. (Se vedlegg tabell A2 for listen over 49 spørsmål.)
[ , , ] Mange studier bruker selvrapporterte tiltak for mobiltelefonbruk. Dette er en interessant setting der forskere kan sammenligne selvrapportert atferd med loggad oppførsel (se f.eks. Boase and Ling (2013) ). To vanlige atferd å spørre om, ringer og teksting, og to vanlige tidsrammer er "i går" og "i den siste uken."
[ , ] Schuman og Presser (1996) hevder at spørreskjemaer vil være av betydning for to typer spørsmål: Delvis spørsmål hvor to spørsmål er på samme nivå av spesifisitet (f.eks. Karakterer av to presidentkandidater); og et helt spørsmål hvor et generelt spørsmål følger et mer spesifikt spørsmål (for eksempel spør du "Hvor fornøyd er du med arbeidet ditt?" etterfulgt av "Hvor fornøyd er du med livet ditt?").
De karakteriserer ytterligere to typer spørsmålseffekt: Konsekvenseffekter oppstår når svar på et senere spørsmål bringes nærmere (enn de ellers ville være) til de som er gitt til et tidligere spørsmål; Kontrasteffekter oppstår når det er større forskjeller mellom svar på to spørsmål.
[ , ] Bygger på arbeidet til Schuman og Presser, beskriver Moore (2002) en separat dimensjon av spørsmålseffekten: additiv og subtraktive effekter. Mens kontraster og konsistenseffekter blir produsert som følge av respondenters evalueringer av de to elementene i forhold til hverandre, blir tilsetnings- og subtraktive effekter produsert når respondentene blir mer følsomme overfor det større rammeverket der spørsmålene stilles. Les Moore (2002) , og utform og utfør et undersøkelseseksperiment på MTurk for å demonstrere additiv eller subtraktive effekter.
[ , ] Christopher Antoun og kollegaer (2015) gjennomførte en studie som sammenlignet bekvemmelighetsprøver hentet fra fire forskjellige online rekrutteringskilder: MTurk, Craigslist, Google AdWords og Facebook. Utform en enkel undersøkelse og rekruttere deltakere gjennom minst to forskjellige online rekrutteringskilder (disse kildene kan være forskjellige fra de fire kildene som brukes i Antoun et al. (2015) ).
[ ] I et forsøk på å forutsi resultatene fra 2016 EU-folkeavstemningen (dvs. Brexit), YouGov-en Internettbasert markedsundersøkelsesvirksomhet gjennomført online-undersøkelser av et panel på rundt 800 000 respondenter i Storbritannia.
En detaljert beskrivelse av YouGovs statistiske modell finner du på https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Grovt sagt delte YouGov velgere til typer basert på valgvalg, alder, kvalifikasjoner, kjønn og dato for intervju i 2015, samt valgkretsen de bodde i. Først brukte de data hentet fra YouGov-panelistene til å estimere, blant de som stemte, andelen mennesker av hver velgertype som hadde til hensikt å stemme. De anslått oppsigelsen til hver velgertype ved å bruke den britiske valgstudien (BES) fra 2015, en etter-valg-ansikt-til-ansikt-undersøkelse, som validerte valgdeltakelse fra valgrullene. Til slutt estimerte de hvor mange personer det var av hver velgertype i velgerne, basert på siste folketelling og årlig befolkningsundersøkelse (med tilleggsinformasjon fra andre datakilder).
Tre dager før avstemningen viste YouGov en to-punkts ledelse for Leave. På kvelden før avstemningen indikerte undersøkelsen at resultatet var for nært å ringe (49/51 Remain). Den endelige studien på dagtid spådde 48/52 til fordel for Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Faktisk savnet dette estimatet det endelige resultatet (52/48 permisjon) med fire prosentpoeng.
[ , ] Skriv en simulering for å illustrere hver av representasjonsfeilene i figur 3.2.
[ , ] Forskningen fra Blumenstock og kolleger (2015) innebar å bygge en maskinlæringsmodell som kunne bruke digitale spordata for å forutsi undersøkelsesresponser. Nå skal du prøve det samme med et annet datasett. Kosinski, Stillwell, and Graepel (2013) fant at Facebook liker å forutsi individuelle egenskaper og attributter. Overraskende nok kan disse spådommene være enda mer nøyaktige enn venner og kolleger (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) brukte samtaleopplysninger (CDR) fra mobiltelefoner for å forutsi samlet arbeidsledighetstrender.