aktiwiteite

sleutel:

  • moeilikheidsgraad: maklik maklik , medium medium , hard hard , baie hard baie hard
  • vereis wiskunde ( vereis wiskunde )
  • vereis kodering ( vereis kodering )
  • data-insameling ( data-insameling )
  • my Gunstelinge ( my gunsteling )
  1. [ hard , vereis wiskunde ] In die hoofstuk, was ek baie positief oor post-stratifikasie. Dit beteken egter nie altyd die verbetering van die gehalte van skattings. Stel 'n situasie waar kan plaas-stratifikasie kan die gehalte van skattings te verminder. (Vir 'n wenk, sien Thomsen (1973) ).

  2. [ hard , data-insameling , vereis kodering ] Ontwerp en voer 'n nie-waarskynlikheid opname op Amazon MTurk te vra oor wapen besit ( "Het jy, of nie iemand in jou huishouding, eienaar van 'n geweer, geweer of pistool? Is dit jy of iemand anders in jou huishouding?") En houdings teenoor geweer beheer ( "Wat dink jy is belangriker-aan die regterkant van die Amerikaners te besit gewere, of om geweer eienaarskap beheer te beskerm?").

    1. Hoe lank neem jou opname te neem? Hoeveel kos dit? Hoe kan die demografie van jou monster te vergelyk met die demografie van die Amerikaanse bevolking?
    2. Wat is die rou skatting van die geweer eienaarskap met jou monster?
    3. Korrek vir die nie-verteenwoordiging van jou monster met behulp van post-stratifikasie of 'n ander tegniek. Nou wat is die skatting van die geweer eienaarskap?
    4. Hoe kan jou skat te vergelyk met die nuutste raming van Pew Research Center? Wat dink jy verduidelik die verskille, indien daar enige?
    5. Herhaal die oefening 2-5 vir houdings teenoor geweer beheer. Hoe kan jou bevindinge verskil?
  3. [ baie hard , data-insameling , vereis kodering ] Goel en kollegas (2016) geadministreer 'n nie-waarskynlikheid-gebaseerde opname bestaan ​​uit 49 meervoudigekeuse-houding vrae uit die algemene sosiale Survey (GSS) en kies opnames deur die Pew Research Center op Amazon MTurk. Hulle pas dan vir die nie-verteenwoordiging van data met behulp van modelgebaseerde post-stratifikasie (mnr P), en vergelyk die Aansuiweringsbegroting met dié beraam met behulp van waarskynlikheid gegrond GSS / Pew opnames. Doen dieselfde opname oor MTurk en probeer om uit te 2a en 2b figuur herhaal deur vergelyk Aansuiweringsbegroting met die skattings van die mees onlangse rondes van GSS / Pew (Sien Aanhangsel Tabel A2 vir die lys van 49 vrae).

    1. Vergelyk en kontrasteer jou resultate om die resultate van Pew en GSS.
    2. Vergelyk en kontrasteer jou resultate om die resultate van die MTurk opname in Goel, Obeng, and Rothschild (2016) .
  4. [ medium , data-insameling , vereis kodering ] Baie studies gebruik self-verslag maatreëls van die selfoon aktiwiteit data. Dit is 'n interessante omgewing waar navorsers self-gerapporteerde gedrag met Aangeteken gedrag kan vergelyk (sien bv Boase and Ling (2013) ). Twee algemene gedrag te vra oor 'n beroep en SMS, en twee algemene tydraamwerke is "gister" en "in die afgelope week."

    1. Voordat die invordering van enige data, wat van die self-verslag maatreëls dink jy is meer akkuraat? Hoekom?
    2. Werf 5 van jou vriende te wees in jou opname. Asseblief kortliks hoe hierdie 5 vriende is getoets. Mag hierdie voorbeeld prosedure veroorsaak spesifieke vooroordele in jou skat?
    3. Vra asseblief vir hulle die volgende mikro-opname:
    • "Hoeveel keer het jy gebruik selfoon aan ander gister noem?"
    • "Hoeveel teksboodskappe het jy gister stuur?"
    • "Hoeveel keer het jy gebruik jou selfoon om ander te roep in die laaste sewe dae?"
    • "Hoeveel keer het jy jou selfoon gebruik om te stuur of teks boodskappe / SMS ontvang in die laaste sewe dae?" Sodra die opname voltooi is, te vra om hul gebruik van data te kontroleer as aangemeld deur hul selfoon of diensverskaffer.
    1. Hoe self-verslag gebruik vergelyk met data te meld? Wat is die mees akkurate, wat die kleinste akkuraat?
    2. Nou kombineer die data wat jy ingesamel het met die data van ander mense in jou klas (as jy doen hierdie aktiwiteit vir 'n klas). Met hierdie groter dataset, herhaal deel (d).
  5. [ medium , data-insameling ] Schuman en naai (1996) argumenteer dat die vraag bestellings sal saak vir twee tipes verhoudings tussen vrae: deel-deel vrae waar twee vrae is op dieselfde vlak van spesifisiteit (bv gradering van twee presidensiële kandidate); en 'n deel-geheel vrae waar 'n algemene vraag volg op 'n meer spesifieke vraag (bv vra "Hoe tevrede is jy met jou werk?" gevolg deur "Hoe tevrede is jy met jou lewe?").

    Hulle kenmerk verdere twee tipes vraag einde effek: konsekwentheid effekte voorkom wanneer antwoorde op 'n latere vraag nader (as wat hulle andersins sou wees) aan diegene gegee word aan 'n vroeëre vraag gebring; kontras-effekte voorkom wanneer daar groter verskille tussen antwoorde op twee vrae.

    1. Skep 'n paar van die deel-gedeelte vrae wat jy dink sal 'n groot vraag einde effek, 'n paar van 'n deel-geheel vrae wat jy dink sal 'n groot bestelling effek, en nog 'n paar vrae waarvan die volgorde wat jy dink sou nie saak nie. Begin 'n opname eksperiment op MTurk om jou vrae te toets.
    2. Hoe groot was die deel-gedeelte van krag was jy in staat om te skep? Was dit 'n konsekwentheid of kontras effek?
    3. Hoe groot was die deel-geheel effek was jy in staat om te skep? Was dit 'n konsekwentheid of kontras effek?
    4. Was daar 'n vraag einde effek in jou paar waar jy nie gedink het aan die orde sou saak?
  6. [ medium , data-insameling ] Die bou op die werk van Schuman en pers, Moore (2002) beskryf 'n aparte dimensie van die vraag einde effek: toevoeging en subtraktiewe. Terwyl kontras en konsekwentheid effekte geproduseer as gevolg van evaluering van die twee items respondente se in verhouding tot mekaar, toevoeging en subtraktiewe effekte geproduseer wanneer respondente meer sensitief vir die groter raamwerk waarbinne die vrae gestel word. Lees Moore (2002) , dan ontwerp en uit te voer 'n opname eksperiment op MTurk om toevoeging of subtraktiewe effekte demonstreer.

  7. [ hard , data-insameling ] Christopher Antoun en kollegas (2015) het 'n studie vergelyk die gerief monsters verkry uit vier verskillende aanlyn werwing bronne: MTurk, Craigslist, Google AdWords en Facebook. Ontwerp 'n eenvoudige opname en werf deelnemers deur middel van ten minste twee verskillende aanlyn werwing bronne (wat hulle kan wees verskillende bronne van die vier bronne wat in Antoun et al. (2015) ).

    1. Vergelyk die koste per werf, in terme van geld en tyd, tussen verskillende bronne.
    2. Vergelyk die samestelling van die inligting wat uit verskillende bronne monsters.
    3. Vergelyk die kwaliteit van data tussen die monsters. Vir idees oor hoe om kwaliteit data van die respondente te meet, sien Schober et al. (2015) .
    4. Wat is jou gunsteling bron? Hoekom?
  8. [ medium ] YouGov, 'n internet-gebaseerde mark navorsing firma, wat aanlyn stembusse van 'n paneel van ongeveer 800,000 respondente in die Verenigde Koninkryk en gebruik mnr P. aan die uitslag van die EU-Referendum (dit wil sê, Brexit) waar die Britse kiesers stem óf te bly voorspel in of los die Europese Unie.

    'N gedetailleerde beskrywing van statistiese model YouGov is hier (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Rofweg gesproke, YouGov mure kiesers in tipes gebaseer op 2015 algemene verkiesing stem keuse, ouderdom, kwalifikasies, geslag, datum van onderhoud, asook die kiesafdeling waarin hulle woon. In die eerste plek het hulle gebruik data wat versamel is van die YouGov paneel om te skat, onder diegene wat stem, die verhouding van mense van elke tipe kieser wat van voorneme is om te vertrek stem. Hulle skat opkoms van elke tipe kieser deur gebruik te maak van die Britse Verkiesing Studie (BES) post-verkiesing van aangesig tot aangesig opname, wat opkoms bekragtig van die verkiesings rolle 2015. Uiteindelik het hulle skat hoeveel mense daar van elke tipe kieser in die kiesers wat gebaseer is op die nuutste sensus en Jaarlikse bevolking Survey (met 'n paar bykomende inligting van die BES, YouGov opname data van regoor die algemene verkiesing, en inligting oor hoe baie mense het vir elke party in elke kiesafdeling).

    Drie dae voor die stemming, YouGov het 'n twee punte voor om verlof. Op die vooraand van die stemming, die meningspeiling het getoon te naby om te bel (49-51 Bly). Die finale on-the-dag studie voorspel 48/52 ten gunste van Bly (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Trouens, hierdie beraming gemis die finale uitslag (52-48 Laat) deur vier persentasiepunte.

    1. Gebruik die totale opname fout raamwerk in hierdie hoofstuk bespreek om vas te stel wat verkeerd kon gegaan het.
    2. reaksie YouGov se na die verkiesing (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) verduidelik: "Dit lyk in 'n groot deel te danke aan die opkoms - iets wat ons het al langs sê noodsaaklik vir die uitslag van so 'n fyn balans ras sou wees. Ons opkoms model is gebaseer, gedeeltelik, op of respondente by die laaste algemene verkiesing gestem het en 'n opkoms vlak hoër as dié van die algemene verkiesings ontstel die model, veral in die Noorde. "Is dit verander jou antwoord om deel (a)?
  9. [ medium , vereis kodering ] Skryf 'n simulasie aan elk van die verteenwoordiging foute te illustreer in Figuur 3.1.

    1. Skep 'n situasie waar die foute eintlik kanselleer.
    2. Skep 'n situasie waar die foute vererger mekaar.
  10. [ baie hard , vereis kodering ] Die navorsing van Blumenstock en kollegas (2015) wat betrokke is die bou van 'n masjien leermodel wat digitale spoor data kan gebruik om opname antwoorde voorspel. Nou, gaan jy dieselfde ding probeer met 'n ander dataset. Kosinski, Stillwell, and Graepel (2013) het bevind dat Facebook hou kan individuele eienskappe en eienskappe te voorspel. Verbasend, kan hierdie voorspellings selfs meer akkuraat as dié van vriende en kollegas wees (Youyou, Kosinski, and Stillwell 2015) .

    1. Lees Kosinski, Stillwell, and Graepel (2013) , en herhaal Figuur 2. Hul data is hier beskikbaar: http://mypersonality.org/
    2. Nou, herhaal Figuur 3.
    3. Ten slotte, probeer om hul model op jou eie Facebook data: http://applymagicsauce.com/. Hoe goed werk dit vir jou?
  11. [ medium ] Toole et al. (2015) gebruik oproep detail rekords (CDRs) van selfone tot totale werkloosheid tendense te voorspel.

    1. Vergelyk en kontrasteer die ontwerp van Toole et al. (2015) met Blumenstock, Cadamuro, and On (2015) .
    2. Dink jy CDRs moet tradisionele opnames vervang, vul hulle of nie gebruik word glad nie vir die regering beleidmakers om werkloosheid te spoor? Hoekom?
    3. Watter bewyse sou jy oortuig dat CDRs heeltemal tradisionele maatstawwe van die werkloosheidsyfer kan vervang?