aktiviteter

  • vanskelighetsgrad: lett lett , medium medium , hardt hard , veldig vanskelig veldig vanskelig
  • krever matte ( krever matte )
  • krever koding ( krever koding )
  • datainnsamling ( datainnsamling )
  • mine favoritter ( favoritten min )
  1. [ hard , krever matte ] I kapittelet var jeg veldig positiv om post-stratifisering. Dette forbedrer imidlertid ikke alltid kvaliteten på estimatene. Konstruer en situasjon der etterlagring kan redusere kvaliteten på estimatene. (For et snev, se Thomsen (1973) .)

  2. [ hard , datainnsamling , krever koding ] Utform og utfør en ikke-sannsynlighet undersøkelse på Amazon Mechanical Turk å spørre om pistol eierskap og holdninger til pistol kontroll. Slik at du kan sammenligne dine estimater med de som er avledet av en sannsynlighetseksempel, kan du kopiere spørsmålsteksten og svaralternativene direkte fra en kvalitetsundersøkelse som de som drives av Pew Research Center.

    1. Hvor lang tid tar undersøkelsen din? Hvor mye koster det? Hvordan sammenligner demografien til prøven din med befolkningen i den amerikanske befolkningen?
    2. Hva er det raske estimatet av pistol eierskap bruker prøven din?
    3. Korrigere for upresentativiteten av prøven din ved hjelp av stratifisering eller annen teknikk. Nå hva er estimatet av pistol eierskap?
    4. Hvordan sammenligner dine estimater med det siste estimatet fra en sannsynlighetsbasert prøve? Hva tror du forklarer uoverensstemmelsene, hvis det er noen?
    5. Gjenta spørsmål (b) - (d) for holdninger til pistolkontroll. Hvordan er dine funn forskjellig?
  3. [ veldig vanskelig , datainnsamling , krever koding ] Goel og kollegaer (2016) administrerte 49 flervalgs holdningsspørsmål hentet fra General Social Survey (GSS) og velg undersøkelser fra Pew Research Center til ikke-sannsynlig utvalg av respondenter trukket fra Amazon Mechanical Turk. De justerte deretter for ikke-representativitet av data ved hjelp av modellbasert postlagring og sammenlignet deres justerte estimater med de fra sannsynlighetsbaserte GSS- og Pew-undersøkelsene. Gjør den samme undersøkelsen på Amazon Mechanical Turk, og prøv å replikere figur 2a og figur 2b ved å sammenligne dine justerte estimater med estimatene fra de siste rundene i GSS- og Pew-undersøkelsene. (Se vedlegg tabell A2 for listen over 49 spørsmål.)

    1. Sammenlign og kontrast dine resultater med de fra Pew og GSS.
    2. Sammenlign og kontrast dine resultater med dem fra Mekanisk Turk-undersøkelsen i Goel, Obeng, and Rothschild (2016) .
  4. [ medium , datainnsamling , krever koding ] Mange studier bruker selvrapporterte tiltak for mobiltelefonbruk. Dette er en interessant setting der forskere kan sammenligne selvrapportert atferd med loggad oppførsel (se f.eks. Boase and Ling (2013) ). To vanlige atferd å spørre om, ringer og teksting, og to vanlige tidsrammer er "i går" og "i den siste uken."

    1. Før du samler inn noen data, hvilke av de selvrapporterte tiltakene tror du er mer nøyaktig? Hvorfor?
    2. Rekruttere fem av vennene dine for å være i undersøkelsen din. Vennligst oppsummer kort hvordan disse fem vennene ble samplet. Kan denne prøvetakingsprosedyren medføre spesielle forstyrrelser i dine estimater?
    3. Spør dem følgende microsurvey spørsmål:
    • "Hvor mange ganger brukte du mobiltelefonen til å ringe andre i går?"
    • "Hvor mange tekstmeldinger har du sendt i går?"
    • "Hvor mange ganger brukte du mobiltelefonen din til å ringe andre i de siste syv dagene?"
    • "Hvor mange ganger brukte du mobiltelefonen din til å sende eller motta tekstmeldinger / SMS de siste syv dagene?"
    1. Når denne microsurvey er fullført, be om å sjekke deres bruksdata som logget av deres telefon eller tjenesteleverandør. Hvordan sammenligner selvrapporteringsbruk med loggdata? Hvilken er mest nøyaktig, som er minst nøyaktig?
    2. Kombiner nå dataene du har samlet sammen med data fra andre i klassen din (hvis du gjør denne aktiviteten for en klasse). Gjenta del (d) med dette større datasettet.
  5. [ medium , datainnsamling ] Schuman og Presser (1996) hevder at spørreskjemaer vil være av betydning for to typer spørsmål: Delvis spørsmål hvor to spørsmål er på samme nivå av spesifisitet (f.eks. Karakterer av to presidentkandidater); og et helt spørsmål hvor et generelt spørsmål følger et mer spesifikt spørsmål (for eksempel spør du "Hvor fornøyd er du med arbeidet ditt?" etterfulgt av "Hvor fornøyd er du med livet ditt?").

    De karakteriserer ytterligere to typer spørsmålseffekt: Konsekvenseffekter oppstår når svar på et senere spørsmål bringes nærmere (enn de ellers ville være) til de som er gitt til et tidligere spørsmål; Kontrasteffekter oppstår når det er større forskjeller mellom svar på to spørsmål.

    1. Opprett et par del-delspørsmål som du tror vil ha en stor spørreordreffekt; et par delprofiler som du tror vil ha stor ordreffekt; og et par spørsmål hvis ordre du tror ikke ville ha betydning. Kjør et undersøkelseseksperiment på Amazon Mechanical Turk for å teste dine spørsmål.
    2. Hvor stor en del-del-effekt var du i stand til å skape? Var det en konsistens eller kontrast effekt?
    3. Hvor stor en helhetlig effekt var du i stand til å skape? Var det en konsistens eller kontrast effekt?
    4. Var det en spørringsordreffekt i paret ditt der du ikke trodde at bestillingen ville ha betydning?
  6. [ medium , datainnsamling ] Bygger på arbeidet til Schuman og Presser, beskriver Moore (2002) en separat dimensjon av spørsmålseffekten: additiv og subtraktive effekter. Mens kontraster og konsistenseffekter blir produsert som følge av respondenters evalueringer av de to elementene i forhold til hverandre, blir tilsetnings- og subtraktive effekter produsert når respondentene blir mer følsomme overfor det større rammeverket der spørsmålene stilles. Les Moore (2002) , og utform og utfør et undersøkelseseksperiment på MTurk for å demonstrere additiv eller subtraktive effekter.

  7. [ hard , datainnsamling ] Christopher Antoun og kollegaer (2015) gjennomførte en studie som sammenlignet bekvemmelighetsprøver hentet fra fire forskjellige online rekrutteringskilder: MTurk, Craigslist, Google AdWords og Facebook. Utform en enkel undersøkelse og rekruttere deltakere gjennom minst to forskjellige online rekrutteringskilder (disse kildene kan være forskjellige fra de fire kildene som brukes i Antoun et al. (2015) ).

    1. Sammenlign kostnadene per rekruttering - i form av penger og tid - mellom ulike kilder.
    2. Sammenlign sammensetningen av prøvene hentet fra forskjellige kilder.
    3. Sammenlign kvaliteten på dataene mellom prøvene. For ideer om hvordan du måler datakvaliteten fra respondenter, se Schober et al. (2015) .
    4. Hva er din foretrukne kilde? Hvorfor?
  8. [ medium ] I et forsøk på å forutsi resultatene fra 2016 EU-folkeavstemningen (dvs. Brexit), YouGov-en Internettbasert markedsundersøkelsesvirksomhet gjennomført online-undersøkelser av et panel på rundt 800 000 respondenter i Storbritannia.

    En detaljert beskrivelse av YouGovs statistiske modell finner du på https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Grovt sagt delte YouGov velgere til typer basert på valgvalg, alder, kvalifikasjoner, kjønn og dato for intervju i 2015, samt valgkretsen de bodde i. Først brukte de data hentet fra YouGov-panelistene til å estimere, blant de som stemte, andelen mennesker av hver velgertype som hadde til hensikt å stemme. De anslått oppsigelsen til hver velgertype ved å bruke den britiske valgstudien (BES) fra 2015, en etter-valg-ansikt-til-ansikt-undersøkelse, som validerte valgdeltakelse fra valgrullene. Til slutt estimerte de hvor mange personer det var av hver velgertype i velgerne, basert på siste folketelling og årlig befolkningsundersøkelse (med tilleggsinformasjon fra andre datakilder).

    Tre dager før avstemningen viste YouGov en to-punkts ledelse for Leave. På kvelden før avstemningen indikerte undersøkelsen at resultatet var for nært å ringe (49/51 Remain). Den endelige studien på dagtid spådde 48/52 til fordel for Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Faktisk savnet dette estimatet det endelige resultatet (52/48 permisjon) med fire prosentpoeng.

    1. Bruk den totale undersøkelsesfeilrammen som diskuteres i dette kapittelet for å vurdere hva som kunne ha gått galt.
    2. YouGovs reaksjon etter valget (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) forklarte: "Dette virker i stor grad på grunn av oppsigelse-noe som vi har sagt hele tiden, ville være avgjørende for utfallet av et slikt finbalansert løp. Vårt oppsjonsmodell var delvis basert på om respondentene hadde stemt ved det siste generalvalg og et oppsigelsesnivå over det som ble avholdt i valgvalget, opprørte modellen, spesielt i Nord. "Skifter dette svaret ditt til del a)?
  9. [ medium , krever koding ] Skriv en simulering for å illustrere hver av representasjonsfeilene i figur 3.2.

    1. Lag en situasjon der disse feilene faktisk avbryter.
    2. Lag en situasjon der feilene forstyrrer hverandre.
  10. [ veldig vanskelig , krever koding ] Forskningen fra Blumenstock og kolleger (2015) innebar å bygge en maskinlæringsmodell som kunne bruke digitale spordata for å forutsi undersøkelsesresponser. Nå skal du prøve det samme med et annet datasett. Kosinski, Stillwell, and Graepel (2013) fant at Facebook liker å forutsi individuelle egenskaper og attributter. Overraskende nok kan disse spådommene være enda mer nøyaktige enn venner og kolleger (Youyou, Kosinski, and Stillwell 2015) .

    1. Les Kosinski, Stillwell, and Graepel (2013) figur 2. Deres data er tilgjengelig på http://mypersonality.org/
    2. Nå, gjenta figur 3.
    3. Til slutt, prøv modellen på din egen Facebook-data: http://applymagicsauce.com/. Hvor bra virker det for deg?
  11. [ medium ] Toole et al. (2015) brukte samtaleopplysninger (CDR) fra mobiltelefoner for å forutsi samlet arbeidsledighetstrender.

    1. Sammenlign og kontrast studieutformingen til Toole et al. (2015) med Blumenstock, Cadamuro, and On (2015) .
    2. Tror du at CDR skal erstatte tradisjonelle spørreundersøkelser, utfylle dem eller ikke bli brukt i det hele tatt til at regjeringens politimenn sporer arbeidsledighet? Hvorfor?
    3. Hvilke bevis vil overbevise deg om at CDRer helt kan erstatte tradisjonelle tiltak av arbeidsledigheten?