Aktiviteter

  • sværhedsgrad: let let , medium medium , hårdt hårdt , meget hård meget hård
  • kræver matematik ( kræver matematik )
  • kræver kodning ( kræver kodning )
  • dataindsamling ( dataindsamling )
  • Mine favoritter ( min favorit )
  1. [ hårdt , kræver matematik ] I kapitlet var jeg meget positiv om post-stratification. Dette forbedrer dog ikke altid kvaliteten af ​​estimaterne. Konstruer en situation, hvor efterlagring kan reducere estimaternes kvalitet. (For et tip, se Thomsen (1973) .)

  2. [ hårdt , dataindsamling , kræver kodning ] Design og gennemfør en undersøgelse uden sandsynlighed på Amazon Mechanical Turk for at spørge om pistol ejerskab og holdninger til pistol kontrol. For at du kan sammenligne dine estimater med dem, der stammer fra en sandsynlighedsprøve, skal du kopiere spørgsmålstegn og svarmuligheder direkte fra en undersøgelse af høj kvalitet, som dem, der drives af Pew Research Center.

    1. Hvor lang tid tager din undersøgelse? Hvor meget koster det? Hvordan sammenligner din stikprøve demografi med den amerikanske befolknings demografi?
    2. Hvad er det rå skøn over pistol ejerskab ved hjælp af din prøve?
    3. Korrigere for ikke-repræsentativiteten af ​​din prøve ved brug af post-stratification eller en anden teknik. Nu hvad er skønnet om pistol ejerskab?
    4. Hvordan sammenligner dine estimater med det seneste estimat fra en sandsynlighedsbaseret prøve? Hvad mener du forklarer uoverensstemmelserne, hvis der er nogen?
    5. Gentag spørgsmål (b) - (d) for holdninger til pistol kontrol. Hvordan er dine resultater forskellige?
  3. [ meget hård , dataindsamling , kræver kodning ] Goel og kolleger (2016) administrerede 49 multiple choice attitude spørgsmål trukket fra General Social Survey (GSS) og vælge undersøgelser fra Pew Research Center til ikke-sandsynlige stikprøve af respondenter trukket fra Amazon Mechanical Turk. De justerede derefter for ikke-repræsentativitet af data ved hjælp af modelbaseret postlagring og sammenlignede deres justerede estimater med dem fra de sandsynlighedsbaserede GSS- og Pew-undersøgelser. Gennemfør samme undersøgelse på Amazon Mechanical Turk og prøv at replikere figur 2a og figur 2b ved at sammenligne dine justerede estimater med estimaterne fra de seneste runder af GSS og Pew-undersøgelserne. (Se bilag Tabel A2 for listen over 49 spørgsmål.)

    1. Sammenlign og kontrast dine resultater med dem fra Pew og GSS.
    2. Sammenlign og kontrast dine resultater med dem fra den Mekaniske Turk-undersøgelse i Goel, Obeng, and Rothschild (2016) .
  4. [ medium , dataindsamling , kræver kodning ] Mange undersøgelser bruger selvrapporterede foranstaltninger til mobiltelefonbrug. Dette er en interessant indstilling, hvor forskere kan sammenligne selvrapporteret adfærd med logget opførsel (se f.eks. Boase and Ling (2013) ). To almindelige adfærdspunkter om at spørge om, ringer og sms'er, og to fælles tidsrammer er "i går" og "i den sidste uge."

    1. Før du indsamler data, hvilke af selvrapporteringsforanstaltningerne mener du, at det er mere præcist? Hvorfor?
    2. Rekruttere fem af dine venner for at være i din undersøgelse. Opsummer kort hvordan disse fem venner blev samplet. Kan denne prøveudtagningsprocedure medføre specifikke forstyrrelser i dine estimater?
    3. Spørg dem følgende microsurvey spørgsmål:
    • "Hvor mange gange har du brugt din mobiltelefon til at ringe til andre i går?"
    • "Hvor mange sms sendte du i går?"
    • "Hvor mange gange har du brugt din mobiltelefon til at ringe til andre i de sidste syv dage?"
    • "Hvor mange gange har du brugt din mobiltelefon til at sende eller modtage tekstbeskeder / SMS i de sidste syv dage?"
    1. Når denne mikrosurvey er gennemført, bedes du kontrollere deres brugsdata som logget af deres telefon eller tjenesteudbyder. Hvordan sammenligner selvrapporteringsbrug med logdata? Hvilket er mest præcist, hvilket er mindst nøjagtigt?
    2. Kombiner nu de data, du har indsamlet med data fra andre personer i din klasse (hvis du laver denne aktivitet til en klasse). Med dette større datasæt gentages del (d).
  5. [ medium , dataindsamling ] Schuman og Presser (1996) hævder, at spørgsmålskommentarer ville have betydning for to typer af spørgsmål: delvist spørgsmål, hvor to spørgsmål er på samme niveau af specificitet (f.eks. Vurderinger af to præsidentkandidater); og delvist spørgsmål, hvor et generelt spørgsmål følger et mere specifikt spørgsmål (f.eks. spørgende "Hvor tilfreds er du med dit arbejde?" efterfulgt af "Hvor tilfreds er du med dit liv?").

    De karakteriserer yderligere to typer af spørgsmålstegnseffekt: Konsekvenseffekter opstår, når svar på et senere spørgsmål bringes nærmere (end de ellers ville være) til dem, der er givet til et tidligere spørgsmål; Kontrasteffekter opstår, når der er større forskelle mellem svar på to spørgsmål.

    1. Opret et par del-del spørgsmål, som du mener vil have en stor spørgsmålstegn effekt; et par del-hele spørgsmål, som du mener vil have en stor ordreffekt og et par spørgsmål, hvis rækkefølge du synes ikke ville have betydning. Kør et undersøgelseseksperiment på Amazon Mechanical Turk for at teste dine spørgsmål.
    2. Hvor stor en del-del-effekt kunne du oprette? Var det en konsistens eller kontrast effekt?
    3. Hvor stor en del-hel effekt kunne du oprette? Var det en konsistens eller kontrast effekt?
    4. Var der et spørgsmål om ordreffekt i dit par, hvor du ikke troede, at ordren ville betyde noget?
  6. [ medium , dataindsamling ] På baggrund af Schuman og Pressers arbejde beskriver Moore (2002) en separat dimension af spørgsmålstegnseffekt: additiv og subtraktive effekter. Mens der opstår kontraster og konsekvensvirkninger som følge af respondenternes evalueringer af de to punkter i forhold til hinanden, produceres additiv og subtraktive effekter, når respondenterne gøres mere følsomme overfor de større rammer inden for hvilke spørgsmålene stilles. Læs Moore (2002) , og lav en undersøgelseseksperiment på MTurk for at demonstrere additiv eller subtraktive effekter.

  7. [ hårdt , dataindsamling ] Christopher Antoun og kolleger (2015) gennemførte en undersøgelse, der sammenlignede bekvemmelighedsprøverne fra fire forskellige online rekrutteringskilder: MTurk, Craigslist, Google AdWords og Facebook. Design en simpel undersøgelse og rekruttere deltagere gennem mindst to forskellige online rekrutteringskilder (disse kilder kan være forskellige fra de fire kilder, der anvendes i Antoun et al. (2015) ).

    1. Sammenlign omkostningerne pr. Rekruttering - hvad angår penge og tid mellem forskellige kilder.
    2. Sammenlign sammensætningen af ​​prøverne opnået fra forskellige kilder.
    3. Sammenlign kvaliteten af ​​data mellem prøverne. For ideer om, hvordan man måler datakvaliteten hos respondenterne, se Schober et al. (2015) .
    4. Hvad er din foretrukne kilde? Hvorfor?
  8. [ medium ] I et forsøg på at forudsige resultaterne af 2016 EU-folkeafstemningen (dvs. Brexit), YouGov-en internetbaseret markedsundersøgelse foretaget online-undersøgelser af et panel på omkring 800.000 respondenter i Det Forenede Kongerige.

    En detaljeret beskrivelse af YouGovs statistiske model findes på https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Groft sagt delte YouGov vælgere i typer baseret på 2015 valg valg valg, alder, kvalifikationer, køn og dato for interview samt valgkredsen, hvor de levede. For det første brugte de data indsamlet fra YouGov-panelisterne til at estimere blandt de, der stemte, andelen af ​​mennesker af hver vælgertype, der havde til hensigt at stemme forladt. De vurderede valgdeltagelsen for hver vælgertype ved hjælp af den britiske valgstudie (BES) fra 2015, en efter-valg-ansigt-til-ansigt undersøgelse, som validerede valgdeltagelse fra valgrullerne. Endelig estimerede de, hvor mange der var af hver vælgertype i vælgerne, baseret på den seneste folketælling og årlige befolkningsundersøgelse (med nogle tilføjelsesoplysninger fra andre datakilder).

    Tre dage før afstemningen viste YouGov en to-punkts ledelse for Leave. På aftenen for afstemningen viste afstemningen, at resultatet var for tæt på at ringe (49/51 Remain). Den endelige on-the-day undersøgelse forudsagde 48/52 til fordel for Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Faktisk savnede dette skøn det endelige resultat (52/48 Forlad) med fire procentpoint.

    1. Brug den samlede undersøgelsesfejlramme, der diskuteres i dette kapitel for at vurdere, hvad der kunne være gået galt.
    2. YouGovs reaktion efter valget (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) forklarede: "Dette forekommer i vid udstrækning på grund af opstart - noget der vi har sagt hele tiden ville være afgørende for udfaldet af en sådan finbalanceret race. Vores valgdeltagelse var delvis baseret på, hvorvidt respondenterne havde stemt ved det sidste valgvalg og et valgniveau højere end det for valg til generalforfalskede modellen, især i nord. "Ændrer dette dit svar på del a)?
  9. [ medium , kræver kodning ] Skriv en simulering for at illustrere hver af repræsentationsfejlene i figur 3.2.

    1. Opret en situation, hvor disse fejl rent faktisk annullerer.
    2. Opret en situation, hvor fejlene forveksler hinanden.
  10. [ meget hård , kræver kodning ] Forskningen fra Blumenstock og kolleger (2015) involverede opbygning af en maskinindlæringsmodel, der kunne bruge digitale spordata til at forudsige undersøgelsesresponser. Nu skal du prøve det samme med et andet datasæt. Kosinski, Stillwell, and Graepel (2013) fandt, at Facebook kan lide at forudsige individuelle træk og attributter. Overraskende nok kan disse forudsigelser være endnu mere præcise end venner og kolleger (Youyou, Kosinski, and Stillwell 2015) .

    1. Læs Kosinski, Stillwell, and Graepel (2013) , og gentag figur 2. Deres data er tilgængelige på http://mypersonality.org/
    2. Nu gentag figur 3.
    3. Endelig, prøv deres model på dine egne Facebook-data: http://applymagicsauce.com/. Hvor godt virker det for dig?
  11. [ medium ] Toole et al. (2015) brugte call detail records (CDR'er) fra mobiltelefoner til at forudsige samlede arbejdsløshedstendenser.

    1. Sammenlign og kontrast Toole et al. (2015) af Toole et al. (2015) med Blumenstock, Cadamuro, and On (2015) .
    2. Tror du, at CDR'er skal erstatte traditionelle undersøgelser, supplere dem eller slet ikke bruges til at politiske beslutningstagere sporer arbejdsløshed? Hvorfor?
    3. Hvilke beviser vil overbevise dig om, at CDR'er helt kan erstatte traditionelle foranstaltninger af ledigheden?