aktiviteter

  • svårighetsgrad: lätt lätt , medium medium , hård hård , väldigt hårt väldigt hårt
  • kräver matte ( kräver matte )
  • kräver kodning ( kräver kodning )
  • datainsamling ( datainsamling )
  • mina favoriter ( min favorit )
  1. [ hård , kräver matte ] I kapitlet var jag väldigt positiv om efterlagring. Detta förbättrar dock inte alltid kvaliteten på uppskattningarna. Konstruera en situation där efterlagring kan minska kvaliteten på uppskattningarna. (För en ledtråd, se Thomsen (1973) .)

  2. [ hård , datainsamling , kräver kodning ] Utforma och utföra en undersökning utan sannolikhet på Amazon Mechanical Turk att fråga om gun ownership och attityder mot pistol kontroll. Så att du kan jämföra dina uppskattningar med de som härrör från ett sannolikhetsprov, kopiera frågeformuläret och svaralternativen direkt från en högkvalitativ undersökning, som de som drivs av Pew Research Center.

    1. Hur lång tid tar din undersökning? Hur mycket kostar det? Hur jämför din demografiska demografi med den amerikanska befolkningens demografi?
    2. Vad är den råa uppskattningen av gun ownership med ditt prov?
    3. Korrigera för att ditt prov är orepresentativ med hjälp av efterlagring eller någon annan teknik. Nu vad är uppskattningen av gun ownership?
    4. Hur jämför dina uppskattningar med den senaste uppskattningen från ett sannolikhetsbaserat prov? Vad tror du förklarar skillnaderna, om det finns några?
    5. Upprepa frågor (b) - (d) för attityder mot pistolstyrning. Hur skiljer dina fynd?
  3. [ väldigt hårt , datainsamling , kräver kodning ] Goel och kollegor (2016) administrerade 49 flervalsfrågor från den allmänna sociala undersökningen (GSS) och väljer undersökningar från Pew Research Center till icke-sannolikhetsprov av respondenter som dras från Amazon Mechanical Turk. De justerade sedan för icke-representativitet av data med hjälp av modellbaserad efterlagring och jämförde sina justerade uppskattningar med de från sannolikhetsbaserade GSS- och Pew-undersökningarna. Utför samma undersökning om Amazon Mechanical Turk och försök att replikera figur 2a och figur 2b genom att jämföra dina justerade uppskattningar med uppskattningarna från de senaste rundorna i GSS och Pew-undersökningarna. (Se bilaga tabell A2 för listan med 49 frågor.)

    1. Jämför och kontrast dina resultat med de från Pew och GSS.
    2. Jämför och kontrast dina resultat med dem från Mekaniska Turk-undersökningen i Goel, Obeng, and Rothschild (2016) .
  4. [ medium , datainsamling , kräver kodning ] Många studier använder självrapporterade åtgärder för mobiltelefonanvändning. Det här är en intressant inställning där forskare kan jämföra självrapporterat beteende med loggat beteende (se t.ex. Boase and Ling (2013) ). Två vanliga beteenden att fråga om ringer och textar, och två vanliga tidsramar är "igår" och "under den senaste veckan".

    1. Innan du samlar in några data, vilken av de självrapporterade åtgärderna tycker du är mer exakt? Varför?
    2. Rekrytera fem av dina vänner för att vara i din undersökning. Snälla sammanfatta hur dessa fem vänner samlades. Kan detta provtagningsförfarande inducera specifika förspänningar i dina uppskattningar?
    3. Fråga dem följande mikrosurvey frågor:
    • "Hur många gånger har du använt din mobiltelefon för att ringa andra i går?"
    • "Hur många textmeddelanden har du skickat igår?"
    • "Hur många gånger har du använt din mobiltelefon för att ringa andra under de senaste sju dagarna?"
    • "Hur många gånger har du använt din mobiltelefon för att skicka eller ta emot textmeddelanden / SMS under de senaste sju dagarna?"
    1. När denna microsurvey har slutförts, be att kontrollera deras användningsdata som loggad av deras telefon eller tjänsteleverantör. Hur jämför sig självrapportering med loggdata? Vilket är mest korrekt, vilket är minst noggrant?
    2. Kombinera nu de data som du har samlat med data från andra personer i din klass (om du gör den här aktiviteten för en klass). Repetera del (d) med denna större dataset.
  5. [ medium , datainsamling ] Schuman och Presser (1996) hävdar att frågeställningar skulle ha betydelse för två typer av frågor: delfrågor där två frågor är i samma grad av specificitet (t.ex. betyg av två presidentkandidater); och heltäckande frågor där en allmän fråga följer en mer specifik fråga (t.ex. fråga "Hur nöjd är du med ditt arbete?" följt av "Hur nöjd är du med ditt liv?").

    De karaktäriserar vidare två typer av frågan om ordningseffekt: konsistenseffekter uppstår när svar på en senare fråga bringas närmare (än vad de annars skulle vara) för dem som ges till en tidigare fråga. Kontrast effekter uppträder när det finns större skillnader mellan svar på två frågor.

    1. Skapa ett par delfelsfrågor som du tror kommer att ha en stor frågaorderpåverkan; ett par helhetsfrågor som du tror kommer att ha stor ordereffekt och ett par frågor vars ordning du tycker inte skulle betyda. Kör ett undersökningsexperiment på Amazon Mechanical Turk för att testa dina frågor.
    2. Hur stor deldel-effekt kunde du skapa? Var det en konsistens eller kontrast effekt?
    3. Hur stor en helhetseffekt kunde du skapa? Var det en konsistens eller kontrast effekt?
    4. Var det en fråga om ordereffekt i ditt par där du inte trodde att ordern skulle betyda?
  6. [ medium , datainsamling ] På grund av Schumans och Pressers arbete beskriver Moore (2002) en separat dimension av frågan om ordereffekt: additiv och subtraktiva effekter. Medan kontrast och konsekvens effekter produceras som en följd av respondenternas utvärderingar av de två objekten i förhållande till varandra, produceras additiv och subtraktiva effekter när respondenterna görs mer känsliga för den större ramen inom vilken frågorna ställs. Läs Moore (2002) och konstruera och kör sedan ett undersökningsexperiment på MTurk för att visa additiv eller subtraktiva effekter.

  7. [ hård , datainsamling ] Christopher Antoun och kollegor (2015) genomförde en studie som jämförde bekvämlighetsproverna från fyra olika online rekryteringskällor: MTurk, Craigslist, Google AdWords och Facebook. Utforma en enkel undersökning och rekrytera deltagare genom minst två olika online rekryteringskällor (dessa källor kan skilja sig från de fyra källor som används i Antoun et al. (2015) ).

    1. Jämför kostnaden per rekrytering i form av pengar och tid mellan olika källor.
    2. Jämför sammansättningen av de prov som erhållits från olika källor.
    3. Jämför kvaliteten på data mellan proven. För idéer om hur man mäter datakvaliteten från respondenter, se Schober et al. (2015) .
    4. Vad är din föredragna källa? Varför?
  8. [ medium ] I ett försök att förutse resultaten från 2016 EU-folkomröstning (dvs. Brexit), YouGov-en Internetbaserad marknadsundersökningsfirma genomförde online-undersökningar av en panel på cirka 800 000 respondenter i Förenade kungariket.

    En detaljerad beskrivning av YouGovs statistiska modell finns på https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. I stort sett delade YouGov väljare i typer baserat på 2015 val val val, ålder, kvalifikationer, kön och datum för intervjun, samt valkretsen där de bodde. För det första använde de data som samlades in från YouGov-paneldeltagarna för att uppskatta, bland de som röstade, andelen personer av varje väljare typ som avsåg att rösta Lämna. De uppskattade valdeltagandet för varje väljarkategori med hjälp av den brittiska valstudien 2015 (BES), en efterhandsval av ansikte mot ansikte, vilket validerat valdeltagandet från valrullarna. Slutligen uppskattade de hur många personer det fanns av varje väljartyp i väljaren, baserat på senaste folkräkning och årliga befolkningsundersökningen (med viss tilläggsinformation från andra datakällor).

    Tre dagar före omröstningen visade YouGov en tvåpunktsled för Leave. På kvällen av omröstningen indikerades att resultatet var för nära att ringa (49/51 Remain). Den slutliga studien på dagen förutspådde 48/52 till förmån för Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). I själva verket missade denna uppskattning slutresultatet (52/48 Leave) med fyra procentenheter.

    1. Använd det totala undersökningsfelramverket som diskuteras i det här kapitlet för att bedöma vad som kunde ha gått fel.
    2. YouGovs svar efter valet (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) förklarade: "Detta verkar i stor utsträckning på grund av uppkomst - något som vi har sagt hela tiden skulle vara avgörande för resultatet av en finbalanserad ras. Vårt tilldelningsmodell baserades delvis på huruvida respondenterna hade röstat vid det senaste riksdagsvalet och en utlösningsnivå över det allmänna valet störde modellen, särskilt i norr. "Ändras detta till ditt svar på del a)?
  9. [ medium , kräver kodning ] Skriv en simulering för att illustrera var och en av representationsfelen i figur 3.2.

    1. Skapa en situation där dessa fel faktiskt avbryter.
    2. Skapa en situation där felen förbinder varandra.
  10. [ väldigt hårt , kräver kodning ] Forskningen från Blumenstock och kollegor (2015) innebar att man byggde en maskininlärningsmodell som kunde använda digitala spårdata för att förutse undersökningssvar. Nu ska du försöka samma sak med en annan dataset. Kosinski, Stillwell, and Graepel (2013) fann att Facebook gillar kan förutsäga enskilda egenskaper och attribut. Förvånansvärt kan dessa förutsägelser vara ännu mer exakta än vänner och kollegor (Youyou, Kosinski, and Stillwell 2015) .

    1. Läs Kosinski, Stillwell, and Graepel (2013) och replikera figur 2. Deras data finns på http://mypersonality.org/
    2. Nu, replikera figur 3.
    3. Slutligen, försök deras modell på din egen Facebook-data: http://applymagicsauce.com/. Hur bra fungerar det för dig?
  11. [ medium ] Toole et al. (2015) använde call detail records (CDR) från mobiltelefoner för att förutsäga sammanlagda arbetslöshetstrender.

    1. Jämför och kontrast studieutformningen av Toole et al. (2015) med Blumenstock, Cadamuro, and On (2015) .
    2. Tror du att CDR ska ersätta traditionella undersökningar, komplettera dem eller inte alls användas för att regeringens politiker ska följa arbetslösheten? Varför?
    3. Vilka bevis skulle övertyga dig om att CDR kan helt ersätta traditionella åtgärder av arbetslösheten?