activiteiten

Key:

  • moeilijkheidsgraad: easy gemakkelijk , medium medium , harde hard , heel moeilijk heel moeilijk
  • vereist wiskunde ( vereist wiskunde )
  • vereist codering ( vereist codering )
  • het verzamelen van gegevens ( het verzamelen van gegevens )
  • mijn favorieten ( mijn favoriet )
  1. [ hard , vereist wiskunde ] In het hoofdstuk, was ik erg positief over de post-stratificatie. Dit betekent echter niet altijd het verbeteren van de kwaliteit van de schattingen. De bouw van een situatie waar kan poststratificatie kan de kwaliteit van de ramingen te verminderen. (Voor een hint, zie Thomsen (1973) ).

  2. [ hard , het verzamelen van gegevens , vereist codering ] Design en voeren een niet-waarschijnlijkheid onderzoek op Amazon MTurk te vragen over wapenbezit ( "Weet je, of heeft iemand in uw huishouden, het bezit van een pistool, geweer of pistool? Is dat u of iemand anders in uw huishouden? ') En houding ten opzichte van gun control ( "Wat denk je dat is belangrijker-rechts van de Amerikanen te bezitten geweren, of wapenbezit onder controle te beschermen?").

    1. Hoe lang duurt uw enquête te nemen? Hoeveel kost het? Hoe kan de demografie van uw steekproef te vergelijken met de demografie van de Amerikaanse bevolking?
    2. Wat is de ruwe schatting van wapenbezit met behulp van uw monster?
    3. Correct voor de niet-representativiteit van het monster met behulp van post-stratificatie of een andere techniek. Wat is nu de schatting van wapenbezit?
    4. Hoe kan uw schattingen te vergelijken met de meest recente schatting van het Pew Research Center? Wat denk je dat verklaren de verschillen, als er een?
    5. Herhaal de oefening 2-5 voor de houding ten opzichte van wapenbezit. Hoe weet je bevindingen verschillen?
  3. [ heel moeilijk , het verzamelen van gegevens , vereist codering ] Goel en collega's (2016) toegediend, een niet-waarschijnlijkheid-gebaseerde enquête bestaat uit 49 multiple-choice vragen attitude getrokken uit de General Social Survey (GSS) en selecteer onderzoek van het Pew Research Center op Amazon MTurk. Ze passen dan voor de niet-representativiteit van de gegevens met behulp van modelgebaseerde poststratificatie (Mr. P), en vergelijk de aangepaste ramingen met die geschat met behulp van waarschijnlijkheid op basis van GSS / Pew enquêtes. Voeren dezelfde enquête over MTurk en proberen te figuur 2a en figuur 2b te repliceren door het vergelijken van uw aangepaste ramingen met de ramingen van de meest recente rondes van GSS / Pew (zie bijlage tabel A2 voor de lijst van 49 vragen).

    1. Vergelijken en het contrast van uw resultaten aan de resultaten van Pew en GSS.
    2. Vergelijken en het contrast van uw resultaten aan de resultaten van het onderzoek in MTurk Goel, Obeng, and Rothschild (2016) .
  4. [ medium , het verzamelen van gegevens , vereist codering ] Veel studies gebruiken self-verslag maatregelen van de mobiele telefoon activiteit data. Dit is een interessante omgeving waar onderzoekers zelf-gerapporteerde gedrag gelogde gedrag te vergelijken (zie bijvoorbeeld, Boase and Ling (2013) ). Twee veel voorkomende gedrag te vragen over zijn bellen en sms'en, en twee gemeenschappelijke termijnen zijn "gisteren" en "in de afgelopen week."

    1. Voor het verzamelen van gegevens, welke van de self-verslag maatregelen denkt u dat is nauwkeuriger? Waarom?
    2. Recruit 5 van je vrienden in je onderzoek. Gelieve kort samenvatten hoe deze 5 vrienden werden bemonsterd. Kan dit sampling procedure te induceren specifieke vooroordelen in uw schattingen?
    3. Vraag hen de volgende micro-enquête:
    • "Hoe vaak heb je gebruikt de mobiele telefoon om anderen gisteren gebeld? '
    • "Hoeveel sms'jes heb je gisteren sturen? '
    • "Hoe vaak heb je gebruik maken van uw mobiele telefoon om anderen noemen in de laatste zeven dagen? '
    • "Hoe vaak heb je je mobiele telefoon gebruiken voor het verzenden of tekstberichten / SMS ontvangen in de laatste zeven dagen?" Zodra het onderzoek is afgerond, vragen om hun gebruik van gegevens te controleren zoals aangemeld door hun telefoon of service provider.
    1. Hoe werkt zelfrapportage gebruik te vergelijken met de gegevens in te loggen? Welke is het meest nauwkeurig, dat het minst accuraat?
    2. Nu combineert de gegevens die je hebt verzameld met de gegevens van andere mensen in je klas (als je doet deze activiteit voor een klasse). Met deze grotere dataset, herhaal deel (d).
  5. [ medium , het verzamelen van gegevens ] Schuman en Presser (1996) betogen dat vraag orders van belang zou zijn voor twee typen van de betrekkingen tussen de vragen: part-part vragen waar twee vragen zijn op hetzelfde niveau van specificiteit (bijvoorbeeld ratings van twee presidentskandidaten); en part-geheel vragen, waar een algemene vraag volgt een meer specifieke vraag (bijvoorbeeld de vraag "Hoe tevreden bent u met uw werk?", gevolgd door "Hoe tevreden bent u met uw leven? ').

    Ze karakteriseren nog twee soorten vragen orde effect: consistentie effecten optreden wanneer antwoorden op een latere vraag dichterbij (dan ze anders zouden zijn) aan die op een eerdere vraag worden gebracht; contrast effecten optreden wanneer er grotere verschillen tussen de antwoorden op twee vragen.

    1. Maak een paar part-part vragen waarvan u denkt dat een grote vraag orde effect, een paar part-geheel vragen waarvan u denkt dat een grote order effect te hebben, en nog een paar van de vragen waarvan u de volgorde dat zou er niet toe hebben. Voer een enquête experiment op MTurk om uw vragen te testen.
    2. Hoe groot was de part-part effect was je in staat om te creëren? Was het een consistentie of contrast-effect?
    3. Hoe groot was de part-hele effect was je in staat om te creëren? Was het een consistentie of contrast-effect?
    4. Was er een vraag orde effect in je paar waar je dacht niet dat de orde zou ertoe?
  6. [ medium , het verzamelen van gegevens ] Voortbouwend op het werk van Schuman en Presser, Moore (2002) beschrijft een aparte dimensie van de vraag orde effect: additieve en subtractieve. Terwijl contrast en consistentie effecten veroorzaakt als gevolg van evaluaties van de twee posten respondenten ten opzichte van elkaar, additieve en subtractieve effecten veroorzaakt wanneer respondenten gevoeliger voor het grotere raamwerk waarbinnen de vragen gesteld worden. Lees Moore (2002) , dan is het ontwerpen en uitvoeren van een onderzoek experiment op MTurk tot additieve of subtractieve effecten aan te tonen.

  7. [ hard , het verzamelen van gegevens ] Christopher Antoun en collega's (2015) voerden een studie waarbij het ​​gemak monsters verkregen uit vier verschillende online werven bronnen: MTurk, Craigslist, Google AdWords en Facebook. Een vet survey aantrekken van deelnemers door ten minste twee verschillende bronnen online werven (ze kunnen verschillende bronnen uit de vier bronnen gebruikt Antoun et al. (2015) ).

    1. Vergelijk de kosten per werven, in termen van geld en tijd, tussen verschillende bronnen.
    2. Vergelijk de samenstelling van de verkregen monsters uit verschillende bronnen.
    3. Vergelijk de kwaliteit van de gegevens tussen de monsters. Voor ideeën over hoe de kwaliteit van de gegevens van de respondenten te meten, zie Schober et al. (2015) .
    4. Wat is uw favoriete bron? Waarom?
  8. [ medium ] YouGov, een internet-based marktonderzoeksbureau, uitgevoerd online polls van een panel van ongeveer 800.000 respondenten in het Verenigd Koninkrijk en gebruikt de heer P. om het resultaat van de EU-Referendum (dat wil zeggen, Brexit) waarbij de Britse kiezers ofwel te blijven voorspellen in of laat de Europese Unie.

    Een gedetailleerde beschrijving van statistisch model YouGov is hier (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Grofweg YouGov verdeelt kiezers in typen op basis van 2015 algemene verkiezingen stem keuze, leeftijd, kwalificaties, geslacht, datum van het interview, evenals het kiesdistrict waarin zij leven. Ten eerste, ze gebruikt de gegevens verzameld uit de YouGov panelleden in te schatten, onder degenen die stemmen, het percentage mensen van elk type kiezer die van plan zijn te vertrekken stemmen. Zij schatten de opkomst van elk type kiezer met behulp van de Britse Election Study (BES) na de verkiezingen face-to-face enquête, die opkomst gevalideerde uit de kiezerslijsten 2015. Tot slot, ze schatten hoeveel mensen zijn er van elk type kiezer in het electoraat gebaseerd op de laatste volkstelling en de jaarlijkse Population Survey (met enkele Naast informatie van de BES, YouGov enquêtegegevens van rond de algemene verkiezingen, en informatie over hoe veel mensen gestemd elke partij in elke kieskring).

    Drie dagen voor de stemming, YouGov toonde een twee punten voorsprong voor Leave. Aan de vooravond van de stemming, de poll bleek te dicht om te bellen (49-51 Remain). De finale op-de-dag studie voorspelde 48/52 in het voordeel van Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). In feite is deze schatting miste het uiteindelijke resultaat (52-48 Leave) met vier procentpunten.

    1. Gebruik de totale enquête fout kader in dit hoofdstuk besproken om te beoordelen wat er mis had kunnen gaan.
    2. respons YouGov's na de verkiezingen (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) legde uit: "Dit lijkt in een groot deel te wijten aan de opkomst - iets dat we hebben allemaal langs die cruciaal zijn voor de uitkomst van een dergelijke uitgebalanceerde ras zou zijn. Onze opkomst model was gebaseerd, gedeeltelijk, op de vraag of de respondenten bij de laatste algemene verkiezingen hadden gestemd en een opkomst niveau boven dat van de algemene verkiezingen verstoren van het model, met name in het noorden. "Betekent dit verander je antwoord op een deel (a)?
  9. [ medium , vereist codering ] Voeg een simulatie aan elk van de vertegenwoordiging fouten illustreren Figuur 3.1.

    1. Creëer een situatie waarin deze fouten daadwerkelijk opheffen.
    2. Een situatie waarin de fouten samengestelde elkaar.
  10. [ heel moeilijk , vereist codering ] Het onderzoek van Blumenstock en collega's (2015) betrokken de bouw van een machine learning model dat digitale trace gegevens kunnen gebruiken om antwoorden op de enquête te voorspellen. Nu, ga je hetzelfde proberen met een andere dataset. Kosinski, Stillwell, and Graepel (2013) bleek dat Facebook wil kunnen individuele eigenschappen en kenmerken te voorspellen. Verrassend, kan deze voorspellingen nog nauwkeuriger dan die van vrienden en collega's (Youyou, Kosinski, and Stillwell 2015) .

    1. Lees Kosinski, Stillwell, and Graepel (2013) , en repliceren Figuur 2. Hun gegevens zijn hier beschikbaar: http://mypersonality.org/
    2. Nu, repliceren figuur 3.
    3. Tot slot, probeer hun model op uw eigen Facebook-gegevens: http://applymagicsauce.com/. Hoe goed werkt het voor u?
  11. [ medium ] Toole et al. (2015) gebruik van Call Detail Records (CDR's) van mobiele telefoons tot de totale werkloosheid trends te voorspellen.

    1. Vergelijken en het contrast van het ontwerp van Toole et al. (2015) met Blumenstock, Cadamuro, and On (2015) .
    2. Denk je dat CDR moet de traditionele enquêtes te vervangen, aanvullen of niet worden gebruikt op alle voor de overheid beleidsmakers om de werkloosheid te houden? Waarom?
    3. Welk bewijs zou u ervan overtuigen dat CDR's volledig traditionele maatregelen van de werkloosheid kan vervangen?