aktiviteter

Nøkkel:

  • Vanskelighetsgrad: lett lett , medium medium , hard hard , veldig vanskelig veldig vanskelig
  • krever matematikk ( krever matte )
  • krever koding ( krever koding )
  • datainnsamling ( datainnsamling )
  • mine favoritter ( favoritten min )
  1. [ hard , krever matte ] I kapittelet, var jeg veldig positivt om post-stratifisering. Men det betyr ikke alltid forbedre kvaliteten på estimater. Konstruer en situasjon hvor kan poste-stratifisering kan redusere kvaliteten på estimater. (For et hint, se Thomsen (1973) ).

  2. [ hard , datainnsamling , krever koding ] Design og gjennomføre en ikke-sannsynlighets undersøkelse om Amazon MTurk å spørre om pistol eierskap ( "Har du, eller er det noen i din husstand, eier en pistol, rifle eller pistol? Er det du eller noen andre i din husstand?") Og holdninger til våpenkontroll ( "Hva tror du er mer viktig å beskytte retten av amerikanerne til å eie våpen, eller for å kontrollere pistol eierskap?").

    1. Hvor lang tid tar undersøkelsen ta? Hvor mye koster det? Hvordan demografien for prøven i forhold til demografi av den amerikanske befolkningen?
    2. Hva er den rå estimat av pistol eierskap ved hjelp av prøven?
    3. Riktig for den ikke-representativitet av prøven ved hjelp av post-stratifisering eller en annen teknikk. Nå hva er estimatet av pistol eierskap?
    4. Hvordan anslagene i forhold til siste anslaget fra Pew Research Center har? Hva tror du forklare avvik, hvis det er noen?
    5. Gjenta øvelsen 2-5 for holdninger til våpenkontroll. Hvordan skiller funnene gjør?
  3. [ veldig vanskelig , datainnsamling , krever koding ] Goel og kolleger (2016) gis et ikke-sannsynlighetsbasert undersøkelse som består av 49 flervalgsholdnings spørsmål fra General Social Survey (GSS) og velg undersøkelser av Pew Research Center på Amazon MTurk. De deretter justere for den ikke-representativitet data ved hjelp av modellbasert post-stratifisering (Mr. P), og sammenligne de justerte estimatene med de som beregnes ved hjelp av sannsynlighetsbasert GSS / Pew undersøkelser. Gjennomføre den samme undersøkelsen på MTurk og prøve å gjenskape figur 2a og 2b ved å sammenligne de justerte estimater med anslagene fra de siste rundene av GSS / Pew (se vedlegg tabell A2 for en liste over 49 spørsmål).

    1. Sammenligne og kontrast resultatene med resultatene fra Pew og GSS.
    2. Sammenligne og kontrast resultatene med resultatene fra MTurk undersøkelsen i Goel, Obeng, and Rothschild (2016) .
  4. [ medium , datainnsamling , krever koding ] Mange studier bruker selvrapporterings tiltak av mobiltelefonen aktivitetsdata. Dette er en interessant setting der forskerne kan sammenligne selvrapportert atferd med loggede atferd (se f.eks Boase and Ling (2013) ). To vanlige atferd for å spørre om ringer og texting, og to vanlige tidsrammer er "i går" og "i den siste uken."

    1. Før innsamling av data, som for selvrapportering tiltak tror du er mer nøyaktig? Hvorfor?
    2. Rekruttere fem av dine venner til å være i undersøkelsen. Vennligst kort oppsummere hvordan disse 5 venner var samplet. Kan dette prøvetaking indusere spesifikke skjevheter i anslagene?
    3. Spør dem følgende mikro-undersøkelse:
    • "Hvor mange ganger har du brukt mobiltelefonen til å ringe andre i går?"
    • "Hvor mange tekstmeldinger sendte du i går?"
    • "Hvor mange ganger har du bruke mobiltelefonen til å ringe andre i de siste sju dagene?"
    • "Hvor mange ganger gjorde du bruke mobiltelefonen til å sende eller motta tekstmeldinger / SMS i løpet av de siste sju dagene?» Når undersøkelsen er ferdig, be om å sjekke sine brukerdata som logget av deres telefon eller tjenesteleverandøren.
    1. Hvordan selvrapportering bruk sammenligne logge data? Hvilken er mest nøyaktig, som er minst nøyaktige?
    2. Nå kombinerer dataene du har samlet med data fra andre i klassen din (hvis du gjør denne aktiviteten for en klasse). Med denne større datasett, gjentar del (d).
  5. [ medium , datainnsamling ] Schuman og Presser (1996) hevder det spørsmålet ordre ville saken for to typer relasjoner mellom spørsmål: del-del spørsmål hvor to spørsmål er på samme nivå av spesifisitet (f.eks rangeringer av to presidentkandidatene); og del-hel spørsmål hvor et generelt spørsmål følger et mer spesifikt spørsmål (f.eks spør "Hvor fornøyd er du med jobben din?" etterfulgt av "Hvor fornøyd er du med livet ditt?").

    De videre karakterisere to typer spørsmål for effekt: konsistens effekter oppstår når svar på et senere spørsmål bringes nærmere (enn de ellers ville være) til de som er gitt til en tidligere spørsmålet; kontrast effekter oppstår når det er større forskjeller mellom svar på to spørsmål.

    1. Lag et par deltids del spørsmål som du tror vil ha et stort spørsmål for effekt, et par av del-hel spørsmål som du tror vil ha en stor ordre effekt, og et annet par av spørsmålene som rekkefølgen du tror vil ikke saken. Kjør en undersøkelse eksperiment på MTurk å teste dine spørsmål.
    2. Hvor stor var den delen-delen effekt var du i stand til å skape? Var det en konsistens eller kontrasteffekt?
    3. Hvor stor var den del-hele effekten var du i stand til å skape? Var det en konsistens eller kontrasteffekt?
    4. Var det et spørsmål for effekt i par der du ikke tror rekkefølgen ville saken?
  6. [ medium , datainnsamling ] Bygge på arbeidet til Schuman og Presser, Moore (2002) beskriver en egen dimensjon på spørsmålet for effekt: additiv og subtraktiv. Mens kontrast og konsistens effekter er produsert som en konsekvens av respondentenes vurdering av de to elementene i forhold til hverandre, additive og subtraktive effekter produseres når respondentene blir mer følsom for større ramme som spørsmålene er stilt. Les Moore (2002) , deretter utforme og kjøre en undersøkelse eksperiment på MTurk å demonstrere additive eller subtraktive effekter.

  7. [ hard , datainnsamling ] Christopher Antoun og kolleger (2015) gjennomførte en studie som sammenlignet convenience eksempler hentet fra fire ulike online rekruttere kilder: MTurk, Craigslist, Google AdWords og Facebook. Design en enkel undersøkelse og rekruttere deltakere gjennom minst to ulike online rekrutteringskilder (de kan være forskjellige kilder fra de fire kildene som brukes i Antoun et al. (2015) ).

    1. Sammenligne kostnadene per rekrutt, i form av penger og tid, mellom ulike kilder.
    2. Sammenligne sammensetningen av prøvene oppnådd fra forskjellige kilder.
    3. Sammenligne kvaliteten av data mellom prøvene. For ideer om hvordan man kan måle datakvalitet fra respondentene, se Schober et al. (2015) .
    4. Hva er din foretrukne kilde? Hvorfor?
  8. [ medium ] YouGov, en internettbasert markedsundersøkelser firmaet, gjennomført online meningsmålinger av et panel av ca 800 000 respondenter i Storbritannia og brukes Mr. P. å forutsi resultatet av EU Referendum (dvs. Brexit) hvor de britiske velgerne stemme enten å forbli i eller forlate EU.

    En detaljert beskrivelse av YouGov har statistisk modell er her (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Grovt sett skillevegger YouGov velgerne i typer basert på 2015 stortingsvalget stemme valg, alder, kvalifikasjoner, kjønn, dato for intervju, samt valgkretsen de lever i. Først, de brukte data samlet inn fra YouGovs panel å anslå, blant dem som stemmer, andelen av befolkningen i hver velger typen som har tenkt å stemme Leave. De anslår benket seg for hver velger type ved hjelp av 2015 britiske Valgundersøkelsen (BES) etter valget ansikt-til-ansikt undersøkelsen, som validert oppmøtet fra manntallet. Til slutt, de anslå hvor mange mennesker det er av hver velger type i velgermassen basert på nyeste Census og årlig befolkningsundersøkelse (med noen tillegg informasjon fra BES, YouGovs undersøkelsesdata fra hele valget, og informasjon om hvor mange som stemte på hver av partene i hver valgkrets).

    Tre dager før valget, viste YouGov en to poengs ledelse for La. På slutten av stemme, avstemningen viste for nær til å ringe (49-51 Remain). Den endelige on-the-dagers studie spådd 48/52 i favør av Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Faktisk, dette estimatet savnet det endelige resultatet (52-48 La) med fire prosentpoeng.

    1. Bruk den totale undersøkelsen feilen rammer drøftet i dette kapittelet for å vurdere hva som kan ha gått galt.
    2. YouGov respons etter valget (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) forklarte: "Dette virker i en stor del på grunn av oppmøtet - noe som vi har sagt hele tiden vil være avgjørende for utfallet av en slik fint balansert rase. Vår oppmøtet modellen var basert delvis på om respondentene hadde stemt ved siste stortingsvalg og en valgdeltakelse nivå over at av stortingsvalg opprørt modellen, særlig i nord. "Betyr dette endre ditt svar til del (a)?
  9. [ medium , krever koding ] Skriv en simulering for å illustrere hver av de representasjonsfeil i figur 3.1.

    1. Lag en situasjon hvor disse feilene faktisk utligne.
    2. Lag en situasjon hvor feilene sammensatte hverandre.
  10. [ veldig vanskelig , krever koding ] Forskningen av Blumenstok og kolleger (2015) involvert bygge en maskin læringsmodell som kunne bruke digitale spor data til å forutsi undersøkelsen svar. Nå skal du prøve det samme med en annen datasettet. Kosinski, Stillwell, and Graepel (2013) fant at Facebook liker kan forutsi individuelle egenskaper og attributter. Overraskende, kan disse spådommene bli enda mer nøyaktig enn de av venner og kolleger (Youyou, Kosinski, and Stillwell 2015) .

    1. Les Kosinski, Stillwell, and Graepel (2013) , og replikere Figur 2. Deres data er tilgjengelig her: http://mypersonality.org/
    2. Nå gjenskape Figur 3.
    3. Til slutt, prøv deres modell på din egen Facebook-data: http://applymagicsauce.com/. Hvor godt fungerer det for deg?
  11. [ medium ] Toole et al. (2015) bruk samtale detalj poster (CDR) fra mobiltelefoner til å forutsi samlede ledighetsutviklingen.

    1. Sammenligne og kontrast utformingen av Toole et al. (2015) med Blumenstock, Cadamuro, and On (2015) .
    2. Tror du CDR bør erstatte tradisjonelle undersøkelser, utfylle dem eller ikke brukes i det hele tatt for offentlige beslutningstakere for å spore arbeidsledighet? Hvorfor?
    3. Hvilke bevis vil overbevise deg om at CDR kan helt erstatte tradisjonelle mål på ledigheten?