Aktiviteter

Nøgle:

  • sværhedsgrad: let let , medium medium , hårdt hårdt , meget hård meget hård
  • kræver matematik ( kræver matematik )
  • kræver kodning ( kræver kodning )
  • dataindsamling ( dataindsamling )
  • Mine favoritter ( min favorit )
  1. [ hårdt , kræver matematik ] I kapitlet, var jeg meget positiv over post-lagdeling. Det gør dog ikke altid forbedre kvaliteten af ​​estimater. Konstruer en situation, hvor kan bogføre-lagdeling kan nedsætte kvaliteten af ​​estimater. (For et tip, se Thomsen (1973) ).

  2. [ hårdt , dataindsamling , kræver kodning ] Design og gennemføre en ikke-sandsynlighed undersøgelse om Amazon MTurk at spørge om pistol ejerskab ( "Har du, eller er der nogen i din husstand, ejer en pistol, riffel eller pistol? Er det dig eller en anden i din husstand?") Og holdninger til våbenkontrol ( "Hvad tror du er mere vigtigt, at beskytte retten af ​​amerikanerne til at eje våben, eller til at kontrollere pistol ejerskab?").

    1. Hvor lang tid tager din undersøgelse tage? Hvor meget koster det? Hvordan demografi af din prøve sammenligne med demografien af ​​den amerikanske befolkning?
    2. Hvad er den rå estimat af pistol ejerskab ved hjælp af din prøve?
    3. Korrekt for ikke-repræsentativitet din prøve ved hjælp af post-lagdeling eller en anden teknik. Hvad er nu det estimat af pistol ejerskab?
    4. Hvordan dine estimater sammenligne med det seneste skøn fra Pew Research Center? Hvad tror du forklare uoverensstemmelserne, hvis der er nogen?
    5. Gentag øvelsen 2-5 for holdninger til våbenkontrol. Hvordan dine resultater afviger?
  3. [ meget hård , dataindsamling , kræver kodning ] Goel og kolleger (2016) administreret en ikke-sandsynlighed-baserede undersøgelse, der består af 49 multiple choice-holdningsmæssige spørgsmål, trukket fra General Social Survey (GSS) og vælg undersøgelser af Pew Research Center på Amazon MTurk. De derefter justere for den ikke-repræsentativitet data ved hjælp af modelbaseret post-stratificering (Mr. P), og sammenligne de justerede estimater med dem, estimeres ved hjælp sandsynlighed-baserede GSS / Pew undersøgelser. Gennemfør samme undersøgelse på MTurk og forsøge at replikere figur 2a og figur 2b ved at sammenligne dine tilpassede estimater med skønnene fra de seneste runder af GSS / Pew (Se tillæg Tabel A2 for listen med 49 spørgsmål).

    1. Sammenligne og kontrast dine resultater til resultaterne fra Pew og GSS.
    2. Sammenligne og kontrast dine resultater til resultaterne fra MTurk undersøgelse i Goel, Obeng, and Rothschild (2016) .
  4. [ medium , dataindsamling , kræver kodning ] Mange undersøgelser bruger selvrapportering foranstaltninger af mobiltelefon aktivitetsdata. Dette er en interessant indstilling, hvor forskerne kan sammenligne selvrapporteret adfærd med Logget adfærd (se fx Boase and Ling (2013) ). To almindelige adfærd for at spørge om ringer og sms'er, og to fælles tidsrammer er "i går" og "i den forløbne uge."

    1. Før indsamle data, som af selvrapportering foranstaltninger tror du er mere præcis? Hvorfor?
    2. Rekrutter 5 af dine venner til at være i din undersøgelse. Venligst kort opsummere, hvordan disse 5 venner var udtaget. Kan denne prøveudtagningsprocedure fremkalde specifikke skævheder i vurderingerne?
    3. Spørg dem følgende mikro-undersøgelsen:
    • "Hvor mange gange har du bruger mobiltelefon til at ringe til andre i går?"
    • "Hvor mange tekst-beskeder sendte du går?"
    • "Hvor mange gange har du bruger din mobiltelefon til at ringe til andre i de sidste syv dage?"
    • "Hvor mange gange har du bruger din mobiltelefon til at sende eller modtage sms'er / SMS i de sidste syv dage?" Når undersøgelsen er færdig, bede om at tjekke deres forbrugsdata som logget ved deres telefon eller tjenesteudbyder.
    1. Hvordan brugen selvrapportering sammenligne at logge data? Hvilket er mest præcise, hvilket er mindst korrekte?
    2. Nu kombinerer de data, du har samlet med data fra andre mennesker i din klasse (hvis du gør denne aktivitet for en klasse). Med denne større datasæt, gentage en del (d).
  5. [ medium , dataindsamling ] Schuman og Presser (1996) argumenterer, at spørgsmål ordrer ville betyde noget for to typer af relationer mellem spørgsmål: del-del spørgsmål, hvor to spørgsmål er på det samme niveau af specificitet (f.eks ratings af to præsidentkandidater); og en del-hele spørgsmål, hvor et generelt spørgsmål følger en mere specifikt spørgsmål (f.eks spørge "Hvor tilfreds er du med dit arbejde?" efterfulgt af "Hvor tilfreds er du med dit liv?").

    De yderligere at karakterisere to typer af spørgsmål ordre effekt: konsistens effekter opstår, når svar på et senere spørgsmål bringes tættere (end de ellers ville være) til dem, gives til et tidligere spørgsmål; kontrast effekter opstår, når der er større forskelle mellem svar på to spørgsmål.

    1. Opret et par del-del spørgsmål, som du mener vil have et stort spørgsmål ordre effekt, et par del-helhed spørgsmål, som du tror vil have en stor ordre effekt, og et andet par spørgsmål, hvis rækkefølge du tror ville ikke noget. Kør en undersøgelse eksperiment på MTurk at teste dine spørgsmål.
    2. Hvor stor var den del-del effekt var du i stand til at skabe? Var det en konsistens eller kontrast effekt?
    3. Hvor stor var den del-helhed effekt var du i stand til at skabe? Var det en konsistens eller kontrast effekt?
    4. Var der et spørgsmål orden effekt i dit par, hvor du ikke tror ordren ville noget?
  6. [ medium , dataindsamling ] Med udgangspunkt i det arbejde, Schuman og Presser, Moore (2002) beskriver en separat dimension af spørgsmål orden effekt: additiv og subtraktiv. Mens kontrast og konsistens effekter produceres som en konsekvens af de adspurgtes evalueringer af de to elementer i forhold til hinanden, additive og subtraktive effekter produceres når respondenterne bliver mere følsomme over for større ramme, som spørgsmålene er stillet. Læs Moore (2002) , derefter designe og køre en undersøgelse eksperiment på MTurk at demonstrere additive eller subtraktive effekter.

  7. [ hårdt , dataindsamling ] Christopher Antoun og kolleger (2015) har foretaget en undersøgelse, der sammenligner de convenience prøver fra fire forskellige online rekruttering kilder: MTurk, Craigslist, Google AdWords og Facebook. Design en simpel undersøgelse og rekruttere deltagere gennem mindst to forskellige online rekruttering kilder (de kan være forskellige kilder fra de fire kilder, der anvendes i Antoun et al. (2015) ).

    1. Sammenlign pris pr rekrut, i form af penge og tid, mellem forskellige kilder.
    2. Sammenlign sammensætning af prøverne opnået fra forskellige kilder.
    3. Sammenligne kvaliteten af ​​data mellem prøverne. For ideer om, hvordan man måler datakvaliteten fra respondenter, se Schober et al. (2015) .
    4. Hvad er din foretrukne kilde? Hvorfor?
  8. [ medium ] YouGov, en internet-baseret analysefirmaet, gennemført online meningsmålinger af et panel af omkring 800.000 respondenter i Storbritannien og brugte Mr. P. til at forudsige resultatet af EU Referendum (dvs. Brexit) hvor de britiske vælgere stemme enten at forblive i eller forlader den Europæiske Union.

    En detaljeret beskrivelse af YouGov statistiske model er her (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Groft sagt YouGov partitioner vælgerne i typer baseret på 2015 valget stemme valg, alder, kvalifikationer, køn, dato for interviewet, samt valgkreds, de bor i. Først, de brugte data indsamlet fra YouGov Zaperas paneldeltagerne at estimere, blandt dem der stemmer, er andelen af ​​befolkningen i hver vælger typen, der har til hensigt at stemme orlov. De anslår valgdeltagelse på hver vælger typen ved hjælp af 2015 British Election Study (BES) efter valget ansigt-til-ansigt-undersøgelse, som valideret valgdeltagelse fra valglisterne. Endelig har de vurdere, hvor mange mennesker der er i hver vælger type i vælgerkorpset baseret på nyeste Census og årlige Population Survey (med nogle tillæg oplysninger fra BES, YouGov Zaperas undersøgelse af data fra omkring folketingsvalget, og information om, hvor mange mennesker stemte for hver part i hvert valgkreds).

    Tre dage før afstemningen viste YouGov en to point forspring til orlov. På tærsklen til afstemningen, afstemningen viste for tæt til at ringe (49-51 Remain). Den endelige on-the-dages undersøgelse forudsagt 48/52 til fordel for Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Faktisk dette skøn savnede det endelige resultat (52-48 Orlov) med fire procentpoint.

    1. Brug den samlede undersøgelse fejl rammer diskuteres i dette kapitel for at vurdere, hvad der kunne være gået galt.
    2. YouGov svar efter valget (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) forklarede: "Det ser ud i en stor del på grund af valgdeltagelse - noget, som vi har sagt hele tiden ville være afgørende for udfaldet af en sådan fint balanceret løb. Vores valgdeltagelse model var baseret dels på, om respondenterne havde stemt ved sidste folketingsvalg og en valgdeltagelse niveau over den for almindelige valg forstyrre modellen, især i nord. "Betyder det ændre dit svar på en del (a)?
  9. [ medium , kræver kodning ] Skriv en simulering til at illustrere de enkelte repræsentation fejl i figur 3.1.

    1. Opret en situation, hvor disse fejl faktisk udligne.
    2. Opret en situation, hvor fejlene sammensatte hinanden.
  10. [ meget hård , kræver kodning ] Forskningen af Blumenstock og kolleger (2015) involveret bygge en maskine learning model, der kunne bruge digitale spor til at forudsige besvarelserne. Nu, vil du prøve det samme med en anden datasæt. Kosinski, Stillwell, and Graepel (2013) fandt, at Facebook kan lide kan forudsige individuelle karaktertræk og egenskaber. Overraskende, kan disse forudsigelser være endnu mere præcis end venner og kolleger (Youyou, Kosinski, and Stillwell 2015) .

    1. Læs Kosinski, Stillwell, and Graepel (2013) , og kopiere figur 2. er tilgængelige Deres data her: http://mypersonality.org/
    2. Nu replikere figur 3.
    3. Endelig kan du prøve deres model på din egen Facebook-data: http://applymagicsauce.com/. Hvor godt virker det for dig?
  11. [ medium ] Toole et al. (2015) brug opkald detaljer optegnelser (CDR'er) fra mobiltelefoner til at forudsige samlende tendenser arbejdsløshed.

    1. Sammenligne udformningen af Toole et al. (2015) med Blumenstock, Cadamuro, and On (2015) .
    2. Tror du CDR skal erstatte de traditionelle undersøgelser, supplere dem eller ikke anvendes på alle for regeringens politikere at spore arbejdsløshed? Hvorfor?
    3. Hvilke beviser vil overbevise dig om, at CDR helt kan erstatte traditionelle mål for arbejdsløsheden?