activiteiten

  • moeilijkheidsgraad: eenvoudig gemakkelijk , medium medium , moeilijk hard , heel moeilijk heel moeilijk
  • vereist wiskunde ( vereist wiskunde )
  • vereist codering ( vereist codering )
  • gegevensverzameling ( gegevensverzameling )
  • mijn favorieten ( mijn favoriet )
  1. [ hard , vereist wiskunde ] In het hoofdstuk was ik zeer positief over poststratificatie. Dit verbetert echter niet altijd de kwaliteit van schattingen. Construeer een situatie waarin post-stratificatie de kwaliteit van schattingen kan verminderen. (Voor een hint, zie Thomsen (1973) .)

  2. [ hard , gegevensverzameling , vereist codering ] Ontwerp en voer een niet-waarschijnlijkheidsonderzoek uit bij Amazon Mechanical Turk om te vragen naar het bezit van wapens en de houding ten opzichte van wapenbeheersing. Zodat u uw schattingen kunt vergelijken met de resultaten die zijn afgeleid van een kanssteekproef, kopieert u de vraagtekst en de antwoordopties rechtstreeks van een hoogwaardige enquête, zoals die van het Pew Research Center.

    1. Hoe lang duurt uw enquête? Hoeveel kost het? Hoe verhouden de demografische gegevens van uw steekproef zich tot de demografie van de Amerikaanse bevolking?
    2. Wat is de ruwe schatting van het bezit van wapens met behulp van uw steekproef?
    3. Corrigeer de niet-representativiteit van uw steekproef met behulp van poststratificatie of een andere techniek. Wat is de schatting van het wapenbezit?
    4. Hoe verhouden uw schattingen zich tot de meest recente schatting van een kansberekening? Wat denk je verklaart de verschillen, als die er zijn?
    5. Herhaal vragen (b) - (d) voor attitudes tegenover wapenbeheersing. Hoe verschillen uw bevindingen?
  3. [ heel moeilijk , gegevensverzameling , vereist codering ] Goel en collega's (2016) 49 meerkeuze attitudevragen van de General Social Survey (GSS) en geselecteerde enquêtes van het Pew Research Center tot niet-waarschijnlijkheidstaal van respondenten van Amazon Mechanical Turk. Vervolgens corrigeerden ze de niet-representativiteit van gegevens met behulp van modelgebaseerde poststratificatie en vergeleken ze hun aangepaste schattingen met die van de op waarschijnlijkheid gebaseerde GSS- en Pew-onderzoeken. Voer dezelfde enquête uit bij Amazon Mechanical Turk en probeer figuur 2a en figuur 2b te repliceren door uw aangepaste schattingen te vergelijken met de schattingen uit de meest recente ronden van de GSS- en Pew-onderzoeken. (Zie bijlagetabel A2 voor de lijst met 49 vragen.)

    1. Vergelijk en contrasteer uw resultaten met die van Pew en GSS.
    2. Vergelijk en vergelijk uw resultaten met die van de Mechanical Turk-enquête in Goel, Obeng, and Rothschild (2016) .
  4. [ medium , gegevensverzameling , vereist codering ] Veel studies gebruiken zelfgerapporteerde metingen van het gebruik van mobiele telefoons. Dit is een interessante omgeving waarin onderzoekers zelfgerapporteerd gedrag kunnen vergelijken met geregistreerd gedrag (zie bijvoorbeeld Boase and Ling (2013) ). Twee veel voorkomende gedragingen om te vragen zijn bellen en sms'en, en twee veelgebruikte tijdspaden zijn 'gisteren' en 'in de afgelopen week'.

    1. Voordat u gegevens verzamelt, welke van de zelfrapportagemetingen zijn volgens u nauwkeuriger? Waarom?
    2. Rekruteer vijf van uw vrienden om deel te nemen aan uw enquête. Gelieve kort samen te vatten hoe deze vijf vrienden werden bemonsterd. Zou deze bemonsteringsprocedure specifieke vertekeningen in uw schattingen kunnen veroorzaken?
    3. Stel hen de volgende vragen over microsurvey:
    • "Hoe vaak heb je je mobiele telefoon gebruikt om anderen gisteren te bellen?"
    • "Hoeveel sms-berichten heb je gisteren verstuurd?"
    • "Hoe vaak hebt u uw mobiele telefoon gebruikt om anderen te bellen in de afgelopen zeven dagen?"
    • "Hoe vaak hebt u uw mobiele telefoon gebruikt om in de afgelopen zeven dagen tekstberichten / sms-berichten te verzenden of te ontvangen?"
    1. Nadat deze microsurvey is voltooid, vraag je om hun gebruiksgegevens te controleren zoals ze zijn vastgelegd door hun telefoon of serviceprovider. Hoe verhoudt het gebruik van zelfrapportage zich tot loggegevens? Welke is het meest nauwkeurig, wat is het minst nauwkeurig?
    2. Combineer nu de gegevens die u hebt verzameld met de gegevens van andere mensen in uw klas (als u deze activiteit voor een klas doet). Herhaal met deze grotere dataset deel (d).
  5. [ medium , gegevensverzameling ] Schuman en Presser (1996) stellen dat vraagorders van belang zijn voor twee soorten vragen: deelvragen, waarbij twee vragen op hetzelfde niveau van specificiteit zijn (bijv. Beoordelingen van twee presidentskandidaten); en deel-gehele vragen waarbij een algemene vraag een meer specifieke vraag volgt (bijv. vragen "Hoe tevreden bent u met uw werk?", gevolgd door "Hoe tevreden bent u met uw leven?").

    Ze kenmerken verder twee soorten vraagordereffecten: consistentie-effecten treden op wanneer reacties op een latere vraag dichter bij elkaar worden gebracht (dan ze anders zouden zijn) naar antwoorden op een eerdere vraag; contrasteffecten treden op wanneer er meer verschillen zijn tussen de antwoorden op twee vragen.

    1. Maak een paar deelonderwerpen waarvan je denkt dat ze een groot vraagordereffect hebben; een paar deel-gehele vragen waarvan u denkt dat ze een groot ordereffect zullen hebben; en een paar vragen waarvan je denkt dat het er niet toe doet. Voer een enquête-experiment uit bij Amazon Mechanical Turk om uw vragen te testen.
    2. Hoe groot was een deeleffect dat je kon creëren? Was het een consistentie of contrasteffect?
    3. Hoe groot was een deeleffect dat je kon creëren? Was het een consistentie of contrasteffect?
    4. Was er een vraagordereffect in uw paar waarvan u dacht dat de volgorde er niet toe zou doen?
  6. [ medium , gegevensverzameling ] Voortbouwend op het werk van Schuman en Presser, beschrijft Moore (2002) een afzonderlijke dimensie van het vraagordereffect: additieve en subtractieve effecten. Hoewel contrast- en consistentie-effecten worden geproduceerd als gevolg van de evaluaties door respondenten van de twee items ten opzichte van elkaar, worden additieve en subtractieve effecten geproduceerd wanneer respondenten gevoeliger worden gemaakt voor het grotere raamwerk waarbinnen de vragen worden gesteld. Lees Moore (2002) , ontwerp en voer een enquête-experiment uit op MTurk om additieve of subtractieve effecten te demonstreren.

  7. [ hard , gegevensverzameling ] Christopher Antoun en collega's (2015) voerden een studie uit waarin de gemakssteekproeven werden vergeleken die werden verkregen uit vier verschillende online wervingsbronnen: MTurk, Craigslist, Google AdWords en Facebook. Ontwerp een eenvoudige enquête en rekruteer deelnemers via ten minste twee verschillende bronnen voor online recrutering (deze bronnen kunnen verschillen van de vier bronnen die worden gebruikt in Antoun et al. (2015) ).

    1. Vergelijk de kosten per rekruut - in termen van geld en tijd - tussen verschillende bronnen.
    2. Vergelijk de samenstelling van de monsters verkregen uit verschillende bronnen.
    3. Vergelijk de kwaliteit van de gegevens tussen de monsters. Zie Schober et al. (2015) Voor ideeën over het meten van de gegevenskwaliteit van respondenten Schober et al. (2015) .
    4. Wat is je favoriete bron? Waarom?
  8. [ medium ] In een poging om de resultaten van het 2016 EU Referendum (dat wil zeggen, Brexit) te voorspellen, voerde YouGov - een op internet gebaseerd marktonderzoeksbureau - online opiniepeilingen uit bij een panel van ongeveer 800.000 respondenten in het Verenigd Koninkrijk.

    Een gedetailleerde beschrijving van het statistische model van YouGov is te vinden op https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Grof gezegd, YouGov verdeelde de kiezers in typen op basis van de algemene verkiezing stemkeuze in 2015, leeftijd, kwalificaties, geslacht en datum van het interview, evenals het kiesdistrict waarin ze woonden. Ten eerste gebruikten ze gegevens die waren verzameld door de YouGov-panelleden om, onder degenen die hadden gestemd, een schatting te maken van het aantal mensen van elk type kiezer die van plan waren om te vertrekken. Ze schatten de opkomst van elk type kiezer met behulp van de 2015 British Election Study (BES), een persoonlijke enquête na de verkiezingen, waarbij de opkomst van de verkiezingsrollen gevalideerd werd. Ten slotte schatten ze hoeveel mensen er waren van elk type kiezer in het electoraat, op basis van de laatste volkstelling en jaarlijkse bevolkingsenquête (met enige aanvullende informatie uit andere gegevensbronnen).

    Drie dagen voor de stemming vertoonde YouGov een voorsprong van twee punten op verlof. Aan de vooravond van het stemmen gaf de peiling aan dat het resultaat te dichtbij was om te bellen (49/51 Resterend). De laatste studie op de dag voorspelde 48/52 in het voordeel van Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). In feite miste deze schatting het eindresultaat (52/48 Verlof) met vier procentpunten.

    1. Gebruik het totale enquêtefoutkader dat in dit hoofdstuk wordt besproken om te beoordelen wat er mis zou kunnen zijn gegaan.
    2. YouGov's reactie na de verkiezingen (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) legde uit: "Dit lijkt voor een groot deel te wijten aan de opkomst, iets dat we hebben altijd gezegd dat het cruciaal zou zijn voor de uitkomst van zo'n fijn uitgebalanceerde race. Ons wisselmodel was gedeeltelijk gebaseerd op de vraag of de respondenten bij de laatste algemene verkiezingen hadden gestemd en een opkomstniveau boven dat van algemene verkiezingen verstoorde het model, met name in het noorden. "Is dit uw antwoord op deel (a)?
  9. [ medium , vereist codering ] Schrijf een simulatie om elk van de representatiefouten in figuur 3.2 te illustreren.

    1. Maak een situatie waarin deze fouten daadwerkelijk worden geannuleerd.
    2. Creëer een situatie waarin de fouten elkaar aanvullen.
  10. [ heel moeilijk , vereist codering ] Het onderzoek van Blumenstock en collega's (2015) betrof het bouwen van een machine-leermodel dat digitale traceergegevens zou kunnen gebruiken om enquêtereacties te voorspellen. Nu ga je hetzelfde proberen met een andere dataset. Kosinski, Stillwell, and Graepel (2013) ontdekten dat likes van Facebook individuele eigenschappen en attributen kunnen voorspellen. Verrassend genoeg kunnen deze voorspellingen zelfs nauwkeuriger zijn dan die van vrienden en collega's (Youyou, Kosinski, and Stillwell 2015) .

    1. Lees Kosinski, Stillwell, and Graepel (2013) en repliceer figuur 2. Hun gegevens zijn beschikbaar op http://mypersonality.org/
    2. Herhaal nu figuur 3.
    3. Probeer ten slotte hun model op uw eigen Facebook-gegevens: http://applymagicsauce.com/. Hoe goed werkt het voor u?
  11. [ medium ] Toole et al. (2015) gebruikte call detail records (CDR's) van mobiele telefoons om geaggregeerde werkloosheidstrends te voorspellen.

    1. Vergelijk en contrasteer het studieontwerp van Toole et al. (2015) met die van Blumenstock, Cadamuro, and On (2015) .
    2. Denkt u dat CDR's traditionele enquêtes moeten vervangen, ze moeten aanvullen of helemaal niet moeten worden gebruikt voor beleidsmakers van de overheid om de werkloosheid te volgen? Waarom?
    3. Welk bewijs zou u overtuigen dat CDR's de traditionele maatregelen van de werkloosheidsgraad volledig kunnen vervangen?