aktiwiteite

  • moeilikheidsgraad: maklik maklik , medium medium , hard hard , baie hard baie hard
  • vereis wiskunde ( vereis wiskunde )
  • vereis kodering ( vereis kodering )
  • data-insameling ( data-insameling )
  • my Gunstelinge ( my gunsteling )
  1. [ hard , vereis wiskunde ] In die hoofstuk was ek baie positief oor post-stratifikasie. Dit verbeter egter nie altyd die kwaliteit van die ramings nie. Konstrueer 'n situasie waar post-stratifikasie die gehalte van ramings kan verlaag. (Vir 'n wenk, sien Thomsen (1973) .)

  2. [ hard , data-insameling , vereis kodering ] Ontwerp en voer 'n nie-waarskynlikheid opname op Amazon Mechanical Turk om te vra oor geweer eienaarskap en houdings teenoor geweer beheer. Sodat jy jou ramings kan vergelyk met dié wat uit 'n waarskynlikheids monster verkry word, kopieer asseblief die vraestel en reaksie opsies direk uit 'n hoë gehalte opname, soos dié wat deur die Pew Research Centre bestuur word.

    1. Hoe lank duur jou opname? Hoeveel kos dit? Hoe vergelyk die demografie van jou steekproef met die demografie van die Amerikaanse bevolking?
    2. Wat is die rou skatting van geweer eienaarskap met behulp van jou monster?
    3. Korrekte vir die nie-verteenwoordigendheid van jou monster met behulp van post-stratifikasie of 'n ander tegniek. Nou, wat is die skatting van geweerbesit?
    4. Hoe vergelyk u ramings met die jongste skatting van 'n waarskynlikheidsgebaseerde steekproef? Wat dink jy verduidelik die verskille, as daar enige is?
    5. Herhaal vrae (b) - (d) vir houdings teenoor geweerbeheer. Hoe verskil jou bevindings?
  3. [ baie hard , data-insameling , vereis kodering ] Goel en kollegas (2016) 49 meervoudige keuse houdingsvrae uit die Algemene Sosiale Opname (GSS (2016) geadministreer en kies opnames deur die Pew Research Centre na nie-waarskynlikheidseksample van respondente wat uit Amazon Mechanical Turk getrek is. Hulle het dan aangepas vir die nie-verteenwoordigendheid van data met behulp van modelgebaseerde post-stratifikasie en vergelyk hul aangepaste ramings met dié van die waarskynlikheidsgebaseerde GSS- en Pew-opnames. Doen dieselfde opname op Amazon Mechanical Turk en probeer figuur 2a en figuur 2b te herhaal deur jou aangepaste ramings te vergelyk met die ramings van die mees onlangse rondes van die GSS- en Pew-opnames. (Sien bylae tabel A2 vir die lys van 49 vrae.)

    1. Vergelyk en kontrasteer jou resultate met dié van Pew en GSS.
    2. Vergelyk en kontrasteer jou resultate met dié van die Meganiese Turk-opname in Goel, Obeng, and Rothschild (2016) .
  4. [ medium , data-insameling , vereis kodering ] Baie studies gebruik selfgemelde maatreëls van selfoongebruik. Dit is 'n interessante omgewing waarin navorsers Boase and Ling (2013) gedrag met aangetekende gedrag kan vergelyk (sien bv. Boase and Ling (2013) ). Twee algemene gedrag om te vra is om te bel en te SMS, en twee algemene tydraamwerke is "gister" en "in die afgelope week."

    1. Voordat jy enige data insamel, watter van die selfverslagmaatreëls dink jy is meer akkuraat? Hoekom?
    2. Werf vyf van jou vriende om in jou opname te wees. Som kortliks op hoe hierdie vyf vriende gesampliseer is. Mag hierdie steekproefprosedure spesifieke vooroordeel in jou ramings veroorsaak?
    3. Vra hulle die volgende mikrovraagstukke:
    • "Hoeveel keer het jy jou selfoon gister gebruik om ander te bel?"
    • "Hoeveel sms-boodskappe het jy gister gestuur?"
    • "Hoeveel keer het jy jou selfoon gebruik om ander mense in die laaste sewe dae te bel?"
    • "Hoeveel keer het jy jou selfoon gebruik om SMS-boodskappe / SMS in die laaste sewe dae te stuur of te ontvang?"
    1. Sodra hierdie mikroopname voltooi is, vra om hul gebruiksdata na te gaan soos aangeteken deur hul foon of diensverskaffer. Hoe vergelyk selfverslagverbruik met logg data? Wat is die mees akkurate, wat is die minste akkuraat?
    2. Kombineer nou die data wat jy ingesamel het met die data van ander mense in jou klas (as jy hierdie aktiwiteit vir 'n klas doen). Met hierdie groter datastel, herhaal deel (d).
  5. [ medium , data-insameling ] Schuman en Presser (1996) beweer dat vraagbevele vir twee soorte vrae sal uitwerk: gedeeltesvrae waar twee vrae op dieselfde vlak van spesifisiteit is (bv. Graderings van twee presidensiële kandidate); en gedeeltelike vrae waar 'n algemene vraag 'n meer spesifieke vraag volg (bv. vra: "Hoe tevrede is jy met jou werk?" gevolg deur "Hoe tevrede is jy met jou lewe?").

    Hulle karakteriseer verder twee tipes vraagvolg effek: konsekwentheidseffekte kom voor wanneer die antwoorde op 'n latere vraag nader gebring word (as wat hulle andersins sou wees) aan dié wat aan 'n vorige vraag gegee is; kontras effekte kom voor wanneer daar groter verskille is tussen antwoorde op twee vrae.

    1. Skep 'n paar gedeeltesvrae wat jy dink 'n groot vraagvolgorde sal hê; 'n paar gedeeltelike vrae wat jy dink sal 'n groot orde-effek hê; en 'n paar vrae wie se bestelling jy dink nie saak maak nie. Doen 'n opname-eksperiment op Amazon Mechanical Turk om jou vrae te toets.
    2. Hoe groot 'n deelgedeelte-effek was jy in staat om te skep? Was dit 'n konsekwentheid of kontras effek?
    3. Hoe groot 'n deel-geheel-effek was jy in staat om te skep? Was dit 'n konsekwentheid of kontras effek?
    4. Was daar 'n vraagvolgorde-effek in jou paar waar jy nie gedink het die bestelling sou saak maak nie?
  6. [ medium , data-insameling ] Op grond van die werk van Schuman en Presser beskryf Moore (2002) 'n afsonderlike dimensie van vraagvolg effek: additief en subtraktiewe effekte. Terwyl kontras en konsekwentheidseffekte geproduseer word as gevolg van respondente se evaluering van die twee items in verhouding tot mekaar, word addisionele en subtraktiewe effekte geproduseer wanneer respondente meer sensitief gemaak word vir die groter raamwerk waarbinne die vrae gestel word. Lees Moore (2002) en ontwerp en voer 'n opname-eksperiment op MTurk om additiewe of subtraktiewe effekte aan te toon.

  7. [ hard , data-insameling ] Christopher Antoun en kollegas (2015) het 'n studie gedoen wat die geriefmonsters van vier verskillende aanlyn werwingsbronne vergelyk: MTurk, Craigslist, Google AdWords en Facebook. Ontwerp 'n eenvoudige opname en werf deelnemers deur minstens twee verskillende aanlyn werwingsbronne. Hierdie bronne kan verskil van die vier bronne wat in Antoun et al. (2015) ).

    1. Vergelyk die koste per werf-in terme van geld en tyd tussen verskillende bronne.
    2. Vergelyk die samestelling van die monsters verkry uit verskillende bronne.
    3. Vergelyk die kwaliteit van data tussen die monsters. Vir idees oor hoe om data kwaliteit van respondente te meet, sien Schober et al. (2015) .
    4. Wat is jou voorkeurbron? Hoekom?
  8. [ medium ] In 'n poging om die resultate van die 2016 EU-referendum (bv. Brexit) te voorspel, het YouGov-'n internet-gebaseerde marknavorsingsfirma-aanlyn-peiling van 'n paneel van ongeveer 800,000 respondente in die Verenigde Koninkryk.

    'N Gedetailleerde beskrywing van YouGov se statistiese model kan gevind word by https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Oor die algemeen het YouGov partye gekies in tipes gebaseer op die algemene verkiesingsstem keuse van die verkiesings, ouderdom, kwalifikasies, geslag en datum van die onderhoud in 2015, asook die kiesafdeling waarin hulle geleef het. Eerstens gebruik hulle data wat deur die YouGov-paneellede versamel is om onder diegene wat gestem het, die persentasie mense van elke kiesers tipe te beoordeel wat van plan was om te stem. Hulle het die opkoms van elke kiesertipe geraam deur gebruik te maak van die Britse verkiesingsstudie (BES) in 2015, 'n na-verkose aangesig-tot-aangesig-opname, wat bevestigde opkoms uit die kiesrolle was. Ten slotte het hulle beraam hoeveel mense daar van elke kiesertipe in die kiesers was, gebaseer op die jongste Sensus en Jaarlikse Bevolkingsopname (met bykomende inligting uit ander databronne).

    Drie dae voor die stemming het YouGov 'n twee-punt-voorsprong vir Verlof gewys. Op die vooraand van stemming het die stemming aangedui dat die uitslag te naby was (49/51 Remain). Die finale op-die-dag-studie het 48/52 voorspel ten gunste van Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Trouens, hierdie skatting het die finale uitslag (52/48 Verlof) met vier persentasiepunte gemis.

    1. Gebruik die totale oorsig fout raamwerk bespreek in hierdie hoofstuk om te bepaal wat verkeerd kon gegaan het.
    2. YouGov se reaksie na die verkiesing (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) verduidelik: "Dit lyk grootliks as gevolg van opkoms-iets wat wat ons al gesê het, sal noodsaaklik wees vir die uitkoms van so 'n fyn gebalanseerde wedloop. Ons opkomsmodel was gedeeltelik gebaseer op die vraag of respondente tydens die laaste algemene verkiesing gestem het en 'n opkomsvlak bo dié van algemene verkiesings die model, veral in die Noorde, ontstel het. "Verander dit jou antwoord op deel (a)?
  9. [ medium , vereis kodering ] Skryf 'n simulasie om elk van die voorstelling foute in figuur 3.2 te illustreer.

    1. Skep 'n situasie waar hierdie foute eintlik kanselleer.
    2. Skep 'n situasie waar die foute mekaar met mekaar verbind.
  10. [ baie hard , vereis kodering ] Die navorsing van Blumenstock en kollegas (2015) betrekking op die bou van 'n masjienleermodel wat digitale spoordata kan gebruik om antwoorde te voorspel. Nou gaan jy dieselfde ding met 'n ander datastel probeer. Kosinski, Stillwell, and Graepel (2013) bevind dat Facebook graag individuele eienskappe en eienskappe kan voorspel. Verrassend genoeg kan hierdie voorspellings selfs meer akkuraat wees as dié van vriende en kollegas (Youyou, Kosinski, and Stillwell 2015) .

    1. Lees Kosinski, Stillwell, and Graepel (2013) en herhaal figuur 2. Hul data is beskikbaar by http://mypersonality.org/
    2. Herhaal nou figuur 3.
    3. Uiteindelik, probeer hul model op u eie Facebook-data: http://applymagicsauce.com/. Hoe goed werk dit vir jou?
  11. [ medium ] Toole et al. (2015) gebruik oproep detail rekords (CDRs) van selfone om die totale werkloosheidstendense te voorspel.

    1. Vergelyk en kontrasteer die studieontwerp van Toole et al. (2015) met dié van Blumenstock, Cadamuro, and On (2015) .
    2. Dink jy CDR's moet tradisionele opnames vervang, hulle aanvul of nie gebruik word vir die regering se beleidmakers om werkloosheid op te spoor nie? Hoekom?
    3. Watter bewyse sal jou oortuig dat CDR's die tradisionele maatreëls van die werkloosheidsyfer heeltemal kan vervang?