Tegevused

  • raskusaste: lihtne lihtne , keskmine keskmine , kõvasti raske , väga raske väga raske
  • nõuab matemaatika ( nõuab matemaatikat )
  • nõuab kodeerimist ( vajab kodeerimist )
  • andmete kogumine ( andmete kogumine )
  • minu lemmikud ( minu lemmik )
  1. [ raske , nõuab matemaatikat ] Peatükis olin väga kiindunud pärast kihistumist. Kuid see ei pruugi alati hinnangute kvaliteeti parandada. Luua olukord, kus stratifitseerimine võib vähendada hinnangute kvaliteeti. (Vihje kohta vt Thomsen (1973) .)

  2. [ raske , andmete kogumine , vajab kodeerimist ] Disainige ja viige läbi Amazon Mehaanilise Türkkonna mitte-tõenäolise uuringu, kus küsitakse relvade omandiõiguse ja hoiakuid relvade kontrolli kohta. Selleks, et saaksite võrrelda oma prognoose tõenäosustestiga tuletatud tulemustega, palun kopeerige küsimuste teksti ja vastuste valikud otse kvaliteetsest uuringust, näiteks Pewi uurimiskeskuse juhitud küsitlustest.

    1. Kui kaua teie küsitlus võtab aega? Kui palju see maksab? Kuidas teie proovi demograafilised andmed võrreldavad USA rahvastiku demograafiaga?
    2. Milline on teie valimis sisalduv relva omandi hinnang?
    3. Korrigeerige oma proovi mitte esindavust, kasutades stratifitseerimisjärgset meetodit või mõnda muud tehnikat. Milline on relvavalduse hinnang?
    4. Kuidas teie hinnangud võrreldavad tõenäosuspõhise valimi värskeima hinnanguga? Mis mõjutavad lahkarvamusi, kui neid on?
    5. Korda küsimusi (b) - (d) relvade kontrolli suhtes. Kuidas erinevad teie leiud?
  3. [ väga raske , andmete kogumine , vajab kodeerimist ] Goel ja tema kolleegid (2016) viisid läbi 49 üldise sotsiaaluuringu (GSS) valikuvõimalust ja seletasid Pewi uurimiskeskuse uuringuid mitteametliku valimisse kuuluvate Amazon Mehaaniliste Türkide vastajate seast. Seejärel korrigeeriti neid andmete mitteametreerivust, kasutades mudelipõhist stratifitseerumist ja võrreldi nende kohandatud hinnanguid tõenäosusel põhinevate GSS ja Pew-uuringute andmetega. Tehke samasugune Amazon Mechanical Turki uuring ja proovige korrigeerida jooniseid 2a ja 2b, võrreldes teie kohandatud hinnanguid GSS ja Pewi uuringute viimaste voorude hinnangutega. (Vt lisa tabelit A2 49 küsimuse loendi kohta.)

    1. Võrdle ja kontrasteerige oma tulemusi Pewi ja GSSi tulemustega.
    2. Võrdle ja vastandage oma tulemused Goel, Obeng, and Rothschild (2016) Mehhiko Türgi uuringu tulemustega.
  4. [ keskmine , andmete kogumine , vajab kodeerimist ] Paljudes uuringutes kasutatakse eneses teatatud mobiiltelefonide kasutamise meetodeid. See on huvitav seade, kus teadlased saavad võrrelda enesest teatatud käitumist logitud käitumisega (vt nt Boase and Ling (2013) ). Kaks ühist käitumist, mida küsida, on helistamine ja tekstisõnumite saatmine ning kaks ühist ajakaadrit on "eile" ja "eelmisel nädalal".

    1. Enne mis tahes andmete kogumist, milliseid eneseanalüüsi meetmeid peate täpsemaks pidama? Miks?
    2. Viis oma sõpratest värvige oma uuringusse. Lühidalt lühidalt, kuidas nende viie sõbra valimisse kaasati. Kas see prooviprotseduur võib teie prognoosis esile kutsuda erilisi kõrvalekaldumisi?
    3. Küsige neilt järgmised mikrosurve küsimused:
    • "Mitu korda kasutasite mobiiltelefoni, et helistada teistele eile?"
    • "Mitu tekstisõnumi saatsite eile?"
    • "Mitu korda te mobiiltelefoni kasutate, et helistada teistele viimase seitsme päeva jooksul?"
    • "Mitu korda kasutasite mobiiltelefoni SMS-sõnumite saatmiseks / vastuvõtmiseks viimase seitsme päeva jooksul?"
    1. Kui see mikrosurve on lõpule viidud, paluge kontrollida nende kasutusandmeid oma telefoni või teenusepakkuja sisselogimisel. Kuidas ennastarvestusi võrrelda logite andmetega? Mis on kõige täpsem, mis on kõige täpsem?
    2. Nüüd ühendage andmed, mille olete kogunud oma klassi teiste inimeste andmetega (kui teete seda tegevust klassi jaoks). Selle suurema andmestikuga korrake osa (d).
  5. [ keskmine , andmete kogumine ] Schuman ja Presser (1996) väidavad, et küsimuste korraldused mõjutaksid kaht tüüpi küsimusi: osalistes küsimustes, kus kaks küsimust on sama eripära tasemel (nt kahe presidendikandidaadi reitingud); ja osalise terviku küsimused, kus üldine küsimus järgib konkreetsemat küsimust (nt küsib: "Kui rahul olete oma tööga?", millele järgneb "kui rahul olete oma eluga?").

    Nad iseloomustavad ka kahte tüüpi küsimustellimuse efekti: järjepidevuse tagajärjed tekivad siis, kui hilisemas küsimuses antakse vastused varasemale küsimusele lähemale (kui muidu oleks); kontrastiga seotud efektid ilmnevad, kui vastused kahe küsimuse vahel on suuremad.

    1. Loo paar osalist küsimust, mis teie arvates sisaldab suurt tellimuste efekti; paari terviklikke küsimusi, mis teie arvates on suuremahulise tellimusefektiga; ja paari küsimusi, mille järgi sa arvad, et see pole oluline. Käivita Amazon Mehaanilise Türgi uuringukatse, et testida oma küsimusi.
    2. Kui suur oli osalise osalise efekti loomine? Kas see oli järjepidevus või kontrastsus?
    3. Kui suur oli osaline tervikmõju, mida sa suutsid luua? Kas see oli järjepidevus või kontrastsus?
    4. Kas teie paaril oli küsimuste tellimise efekt, kus sa ei arva, et tellimus oleks oluline?
  6. [ keskmine , andmete kogumine ] Schumani ja presseri tööle tuginedes kirjeldab Moore (2002) teemakäsitlust mõjutavat eraldi mõõdet: lisa- ja substratiivseid mõjusid. Ehkki kontrastsuse ja järjepidevuse tagajärjed tekivad vastajate kahe komponendi hinnangute tagajärjel, lisanduvad ja lahutavad mõjud tekivad, kui vastajad on muutunud tundlikumaks suuremale raamistikule, milles küsimused esitatakse. Loe Moore (2002) , siis projekteerige ja käitage MTurki uurimiskatse, et näidata lisandite või substratiivseid mõjusid.

  7. [ raske , andmete kogumine ] Christopher Antoun ja tema kolleegid (2015) viisid läbi uuringu, milles võrreldi nelja erinevat online-värbamisallikat: MTurk, Craigslisti, Google AdWordsi ja Facebooki pakutud mugavusproovid. Disainige lihtne ülevaade ja värbage osalejaid vähemalt kahe erineva online värbamisallika kaudu (need allikad võivad olla erinevad Antoun et al. (2015) neljast allikast).

    1. Võrrelge kulusid ühe töötaja värbamise ja kulude vahel erinevate allikate vahel.
    2. Võrrelge erinevatest allikatest saadud proovide koostist.
    3. Proovide andmete kvaliteedi võrdlemine. Ideede kohta, kuidas mõõta andmete kvaliteeti vastanutest, vt Schober et al. (2015) .
    4. Mis on teie eelistatud allikas? Miks?
  8. [ keskmine ] Et 2016. Aasta ELi rahvahääletuse tulemusi (st Brexit) ennustada, tegi YouGov - Interneti-põhise turu-uuringute firma-Ühendkuningriigis umbes 800 000 vastajat käsitleva veebipõhise küsitluse.

    YouGovi statistilise mudeli üksikasjalik kirjeldus on saadaval aadressil https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Peale selle jagasite YouGov valijad tüüpidesse, mis põhinevad 2015. aasta üldvalimiskomisjoni hääletamise valikul, vanusel, kvalifikatsioonil, sugul ja intervjuu kuupäeval, samuti nende valimisringkonnas, kus nad elasid. Esiteks kasutasid YouGov-i päevakoostujad kogutud andmeid, et hinnata hääletajate seas iga valija tüübi inimeste osakaalu, kes kavatsesid hääletamisest loobuda. Nad hindasid iga valija tüübi valimist, kasutades valimisjärgset küsitlust valimisjärgse küsitluse alusel, mis võeti valimisrullide valimisest kinni, kasutades 2015. aasta Briti valimiste uuringut (BES). Lõpuks hindasid nad, kui palju inimesi valijate hulgas on iga valijatüübi kohta, lähtudes viimasest loendusest ja iga-aastasest rahvastikuprognoosist (koos mõne lisateabega muudest andmeallikatest).

    Kolm päeva enne hääletust näitas YouGov kaheastmelist juhist väljumiseks. Hääletuse eelõhtul näitas küsitlus, et tulemus oli liiga kõnele lähedane (49/51 Remain). Viimane päevane uuring ennustas 48/52 Remaini kasuks (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Tegelikult jäi see hinnang kehtima lõpliku tulemuse (52/48 Jäta) nelja protsendipunkti võrra.

    1. Kasutage käesolevas peatükis käsitletud uuringute vea raamistikku, et hinnata, mis oleks valesti läinud.
    2. YouGovi vastus pärast valimisi (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) selgitas: "See tundub suurt osa valimisaktiivsuse pärast - midagi me kõik oleme öelnud, oleks sellise peenelt tasakaalustatud rassi tulemuste seisukohast väga oluline. Meie osalusmudel põhines osaliselt sellepärast, kas vastanutest olid viimastel üldvalimistel hääletanud, ja üldvalimiste valimisaktiivsus ületas mudelit, eriti põhjaosas. "Kas see muudab teie vastust osa (a)?
  9. [ keskmine , vajab kodeerimist ] Kirjutage simulatsioon, et illustreerida kõiki joonisel 3.2 toodud representatsiooni vigu.

    1. Loo olukord, kus need vead tegelikult tühistuvad.
    2. Loo olukord, kus vead ühendavad üksteist.
  10. [ väga raske , vajab kodeerimist ] Blumenstocki ja kolleegide uurimine (2015) hõlmas masinõppe mudeli loomist, mis võiks kasutada uuringute vastuseid ennustamiseks digitaalsete jälitusteabe abil. Nüüd proovite sama asju teistsuguse andmestikuga. Kosinski, Stillwell, and Graepel (2013) leidis, et Facebooki Kosinski, Stillwell, and Graepel (2013) saab ennustada individuaalseid jooni ja atribuute. Üllatuslikult võivad need prognoosid olla isegi täpsemad kui sõprade ja kolleegide (Youyou, Kosinski, and Stillwell 2015) omad.

    1. Loe Kosinski, Stillwell, and Graepel (2013) joonis 2. Nende andmed on saadaval aadressil http://mypersonality.org/
    2. Nüüd kopeerige joonis 3.
    3. Lõpuks proovige oma mudelit oma Facebooki andmetega: http://applymagicsauce.com/. Kui hästi see töötab teie jaoks?
  11. [ keskmine ] Toole et al. (2015) kasutas mobiiltelefonidelt kõne üksikasjalikke andmeid (CDR), et ennustada koondatud tööpuuduse suundumusi.

    1. Võrrelda ja vastandada Toole et al. (2015) ja Blumenstock, Cadamuro, and On (2015) .
    2. Kas te arvate, et CDRd peaksid asendama traditsioonilisi uuringuid, täiendama neid või mitte kasutama üldse valitsuse poliitikakujundajate jaoks tööpuuduse jälgimiseks? Miks?
    3. Milliseid tõendeid teid veendate, et CDR-id võivad täiesti välja vahetada traditsioonilised töötuse määrad?