aktiviteter

Nyckel:

  • Svårighetsgrad: lätt lätt , medium medium , hård hård , väldigt hårt väldigt hårt
  • kräver math ( kräver math )
  • kräver kodning ( kräver kodning )
  • datainsamling ( datainsamling )
  • mina favoriter ( min favorit )
  1. [ hård , kräver math ] I kapitlet, var jag mycket positivt om poststratifiering. Men det inte alltid förbättra kvaliteten på uppskattningar. Konstruera en situation där kan poststratifiering kan minska kvaliteten på uppskattningar. (För en ledtråd, se Thomsen (1973) ).

  2. [ hård , datainsamling , kräver kodning ] Design och genomföra en icke-sannolikhets undersökning om Amazon MTurk att fråga om vapeninnehav ( "Har du, eller har någon i ditt hushåll, äger en pistol, gevär eller pistol? Är det du eller någon annan i ditt hushåll?") ​​Och attityder till vapenkontroll ( "Vad tycker du är viktigare, att skydda rätten av amerikaner att äga vapen, eller att kontrollera vapeninnehav?").

    1. Hur lång tid tar din undersökning tar? Hur mycket kostar det? Hur gör demografin i ditt prov jämföra med demografin i den amerikanska befolkningen?
    2. Vad är obearbetad skattning av vapeninnehav med ditt prov?
    3. Korrekt för icke-representativitet ditt prov med hjälp av post-skiktning eller någon annan teknik. Nu vad är uppskattningen av vapeninnehav?
    4. Hur ser dina beräkningar i jämförelse med den senaste uppskattningen från Pew Research Center? Vad tror du förklara skillnaderna, om det finns någon?
    5. Upprepa övningen 2-5 för attityder till vapenkontroll. Hur ser dina resultat skiljer sig?
  3. [ väldigt hårt , datainsamling , kräver kodning ] Goel och kollegor (2016) ges en icke-sannolikhetsbaserad undersökning består av 49 flervalsattitydfrågor från general Social Survey (GSS) och välj undersökningar av Pew Research Center på Amazon MTurk. De anpassar sedan för icke-representativa uppgifter med hjälp av modellbaserad poststratifiering (Mr P), och jämföra de justerade beräkningar med de uppskattas med hjälp av sannolikhetsbaserade GSS / Pew undersökningar. Genomför samma undersökning på MTurk och försöka replikera figur 2a och figur 2b genom att jämföra dina justerade beräkningar med uppskattningarna från de senaste omgångarna av GSS / Pew (se bilaga tabell A2 för listan över 49 frågor).

    1. Jämför och kontrast dina resultat med resultaten från Pew och GSS.
    2. Jämför och kontrast dina resultat med resultaten från MTurk undersökning i Goel, Obeng, and Rothschild (2016) .
  4. [ medium , datainsamling , kräver kodning ] Många studier använder självrapportåtgärder mobil data telefon aktivitet. Detta är en intressant miljö där forskare kan jämföra självrapporterade beteende med loggade beteende (se t.ex. Boase and Ling (2013) ). Två vanliga beteenden för att ställa om ringer och sms, och två vanliga tidsramar är "igår" och "den senaste veckan."

    1. Innan samla alla uppgifter, som av själv rapport åtgärder tycker du är mer korrekt? Varför?
    2. Rekrytera fem av dina vänner för att vara i din undersökning. Sammanfatta kortfattat hur dessa 5 vänner samlades in. Kan detta provtagningsförfarande framkalla specifika fördomar i dina beräkningar?
    3. Fråga dem följande mikro undersökning:
    • "Hur många gånger har du använder mobiltelefonen för att ringa andra går?"
    • "Hur många textmeddelanden skickade du går?"
    • "Hur många gånger har du använder mobiltelefonen för att ringa andra i de senaste sju dagarna?"
    • "Hur många gånger har du använder din mobiltelefon för att skicka eller ta emot textmeddelanden / sms under de senaste sju dagarna?" När undersökningen är klar, be att kontrollera sina användningsdata som loggas av sin telefon eller tjänsteleverantören.
    1. Hur självanvändningsrapporten jämföra logga data? Vilket är mest exakt, vilket är minst korrekt?
    2. Nu kombinerar data som du har samlat in med data från andra människor i din klass (om du gör den här aktiviteten för en klass). Med detta större dataset, upprepa en del (d).
  5. [ medium , datainsamling ] Schuman och Pressar (1996) hävdar att frågan order skulle fråga för två typer av relationer mellan frågor: deltids del frågor där två frågor är på samma nivå av specificitet (t.ex. betyg av två presidentkandidaterna); och deltids hela frågor där en allmän fråga följer en mer specifik fråga (t.ex. frågar "Hur nöjd är du med ditt arbete?" följt av "Hur nöjd är du med ditt liv?").

    De karakterisera ytterligare två typer av frågor för effekt: konsistens uppstår när svar på en senare fråga förs närmare (än de annars skulle vara) till de som ges till en tidigare fråga; kontrast effekter uppstår när det finns större skillnader mellan svaren på två frågor.

    1. Skapa ett par deltids del frågor som du tror kommer att ha en stor fråga för effekt, ett par av deltids hela frågor som du tror kommer att ha en stor order effekt, och ett annat par av frågor vars ordning du tror skulle ingen roll. Kör en undersökning experiment på MTurk att testa dina frågor.
    2. Hur stor var den del delar effekt kunde du skapa? Var det en konsistens eller kontrasteffekt?
    3. Hur stor var den delvis hela effekten kunde du skapa? Var det en konsistens eller kontrasteffekt?
    4. Fanns det en fråga för effekt i par där du inte tror att ordning skulle någon roll?
  6. [ medium , datainsamling ] Bygga på det arbete som Schuman och Pressar, Moore (2002) beskriver en särskild dimension av fråga för effekt: additiv och subtraktiv. Medan kontrast och konsistens effekter produceras som en följd av deltagarnas utvärderingar av de två artiklar i förhållande till varandra, additiva och subtraktiva effekter produceras när svarande görs mer känsliga för större ram inom vilken frågorna ställs. Läs Moore (2002) , sedan utforma och köra en undersökning experiment på MTurk att visa additiva eller subtraktiva effekter.

  7. [ hård , datainsamling ] Christopher Antoun och kollegor (2015) genomförde en studie som jämförde de bekvämlighet prover från fyra olika online rekrytera källor: MTurk, Craigslist, Google AdWords och Facebook. Utforma en enkel undersökning och rekrytera deltagare genom åtminstone två olika online-rekryteringskällor (de kan vara olika källor från fyra källor som används i Antoun et al. (2015) ).

    1. Jämföra kostnaden per rekrytera, i form av pengar och tid, mellan olika källor.
    2. Jämföra sammansättningen av de prov som erhålls från olika källor.
    3. Jämföra kvaliteten på data mellan proverna. För idéer om hur man mäter kvaliteten på uppgifterna från de tillfrågade, se Schober et al. (2015) .
    4. Vad är din favorit källa? Varför?
  8. [ medium ] YouGov, en internetbaserad marknadsundersökningsföretaget, som genomfördes på nätet opinionsundersökningar av en panel av cirka 800.000 respondenter i Storbritannien och används Mr P. att förutsäga resultatet av EU-folkomröstningen (dvs Brexit) där de brittiska väljarna rösta antingen förbli i eller lämna EU.

    En detaljerad beskrivning av YouGovs statistisk modell är här (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Grovt sett YouGov partitioner väljare i typer baserat på 2015 riksdagsval rösta val, ålder, utbildning, kön, födelse intervju liksom valkretsen de lever i. Först använde de uppgifter som samlats in från YouGovs paneldeltagarna att uppskatta, bland dem som röstar, andelen personer i varje väljare typ som har för avsikt att rösta Lämna. De uppskattar slutit varje väljare typ med hjälp av 2015 brittiska valundersökning (BES) efter valet ansikte mot ansikte undersökning som validerade valdeltagandet från röstlängderna. Slutligen, de uppskatta hur många människor det finns i varje väljare typ av väljarkåren baseras på senaste folkräkningen och årliga Population Survey (med vissa tillägg information från BES, YouGovs enkätdata från hela det allmänna valet, och information om hur många människor röstade för varje parti i varje valkrets).

    Tre dagar före omröstningen visade YouGov två poäng ledningen Lämna. Dagen före omröstningen, visade undersökningen för nära att ringa (49-51 Remain). Den slutliga on-the-dagars studie förutspådde 48/52 till förmån för Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Faktum är att denna uppskattning missade slutresultatet (52-48 Lämna) med fyra procentenheter.

    1. Använd den totala ramen undersökning fel diskuteras i detta kapitel för att bedöma vad som kan ha gått fel.
    2. YouGov svar efter valet (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) förklarade: "Det verkar i en stor del på grund av att valdeltagandet - något som vi har sagt hela tiden skulle vara avgörande för resultatet av en sådan välbalanserade lopp. Vår valdeltagandet modell, baserad delvis på huruvida de tillfrågade hade röstat vid det senaste allmänna valet och ett valdeltagande nivå högre än de allmänna valen upprörd modellen, särskilt i norr. "Är detta ändra ditt svar på en del (a)?
  9. [ medium , kräver kodning ] Skriv en simulering för att illustrera var och en av representations fel i Figur 3.1.

    1. Skapa en situation där dessa fel faktiskt tar ut.
    2. Skapa en situation där felen sammansatta varandra.
  10. [ väldigt hårt , kräver kodning ] Forskningen om Blumen och kollegor (2015) involverade att bygga en maskin inlärningsmodell som kunde använda digitala spårdata för att förutsäga enkätsvar. Nu kommer ni att prova samma sak med en annan datauppsättning. Kosinski, Stillwell, and Graepel (2013) fann att Facebook gillar kan förutsäga individuella egenskaper och attribut. Överraskande, kan dessa förutsägelser bli ännu mer exakt än de vänner och kollegor (Youyou, Kosinski, and Stillwell 2015) .

    1. Läs Kosinski, Stillwell, and Graepel (2013) , och replikera figur 2. Deras uppgifter finns här: http://mypersonality.org/
    2. Nu, replikerar Figur 3.
    3. Slutligen, prova deras modell på din egen Facebook data: http://applymagicsauce.com/. Hur väl fungerar det för dig?
  11. [ medium ] Toole et al. (2015) använder samtalsdetaljposter (CDR) från mobiltelefoner för att förutsäga aggregerade arbetslöshetens utveckling.

    1. Jämför och kontrastera utformningen av Toole et al. (2015) med Blumenstock, Cadamuro, and On (2015) .
    2. Tycker du att CDR bör ersätta traditionella undersökningar, komplettera dem eller inte användas alls för statliga beslutsfattarna att spåra arbetslöshet? Varför?
    3. Vilka bevis skulle övertyga dig om att CDR helt kan ersätta traditionella mått på arbetslösheten?