aktivitetet

  • shkalla e vështirësisë: e lehtë i lehtë , të mesme medium , e vështirë i vështirë , shume e veshtire shume e veshtire
  • kërkon matematikë ( kërkon matematikë )
  • kërkon kodim ( kërkon kodim )
  • Mbledhja e të dhënave ( Mbledhja e të dhënave )
  • te Preferuarat e mia ( my favorite )
  1. [ i vështirë , kërkon matematikë ] Në kapitull, isha shumë pozitive për post-stratifikimin. Megjithatë, kjo nuk përmirëson gjithmonë cilësinë e vlerësimeve. Ndërtimi i një situate ku pas-stratifikimi mund të zvogëlojë cilësinë e vlerësimeve. (Për një aluzion, shih Thomsen (1973) .)

  2. [ i vështirë , Mbledhja e të dhënave , kërkon kodim ] Hartimi dhe kryerja e një studimi jo-probabiliteti në Amazon Mechanical Turk për të pyetur për pronësinë e armëve dhe qëndrimet ndaj kontrollit të armëve. Kështu që ju mund të krahasoni vlerësimet tuaja me ato që rrjedhin nga një mostër probabiliteti, ju lutemi kopjoni tekstin e pyetjeve dhe opsionet e përgjigjes direkt nga një studim i cilësisë së lartë, siç janë ato të drejtuara nga Qendra Kërkimore Pew.

    1. Sa kohë merr studimi juaj? Sa kushton? Si e krahasojnë demografia e mostrës tuaj me demografinë e popullsisë amerikane?
    2. Cila është vlerësimi i papërpunuar i pronësisë së armëve duke përdorur shembullin tuaj?
    3. Korrekt për mosrepresentativeness e mostrës tuaj duke përdorur post-stratifikim ose ndonjë teknikë tjetër. Tani cili është vlerësimi i pronësisë së armëve?
    4. Si vlerësohen vlerësimet tuaja me vlerësimin më të fundit nga një mostër e bazuar në probabilitet? Çfarë mendoni ju shpjegon mospërputhjet, nëse ka ndonjë?
    5. Pyetje të përsëritura (b) - (d) për qëndrimet ndaj kontrollit të armëve. Si ndryshojnë gjetjet tuaja?
  3. [ shume e veshtire , Mbledhja e të dhënave , kërkon kodim ] Goel dhe kolegët (2016) administruan 49 pyetje të zgjedhjeve me zgjedhje të shumëfishta të nxjerra nga Sondazhi i Përgjithshëm Social (GSS) dhe zgjedhja e anketave nga Qendra Kërkimore Pew për mostrën e jo-probabilitetit të të anketuarve të nxjerra nga Amazon Mechanical Turk. Ato pastaj përshtatën për mos-përfaqësimin e të dhënave duke përdorur modelin e pas-stratifikimit dhe krahasuan vlerësimet e tyre të rregulluara me ato nga anketat e GSS dhe Pew të bazuar në probabilitet. Kryeni të njëjtin studim në Amazon Mechanical Turk dhe përpiquni të përsërisni figurën 2a dhe figurën 2b duke krahasuar vlerësimet tuaja të rregulluara me vlerësimet nga raundet më të fundit të vrojtimeve të GSS dhe Pew. (Shih shtojcën tabelën A2 për listën e 49 pyetjeve.)

    1. Krahasoni dhe kontrast rezultatet tuaja me ato nga Pew dhe GSS.
    2. Krahasoni dhe kontrast rezultatet tuaja me ato nga hulumtimi i Turk Turk në Goel, Obeng, and Rothschild (2016) .
  4. [ medium , Mbledhja e të dhënave , kërkon kodim ] Shumë studime përdorin vetë-raportuar masat e përdorimit të telefonit celular. Kjo është një mjedis interesant në të cilin kërkuesit mund të krahasojnë sjelljet e vetë-raportuar me sjelljet e regjistruara (shih p.sh. Boase and Ling (2013) ). Dy sjellje të zakonshme për të pyetur janë thirrja dhe tekstimi, dhe dy korniza kohore të zakonshme janë "dje" dhe "javën e kaluar".

    1. Para se të grumbulloni ndonjë të dhënë, cilat prej masave të vetë-raportit mendoni se janë më të sakta? Pse?
    2. Rekrutoni pesë nga miqtë tuaj për të qenë në studimin tuaj. Ju lutemi përmbledhni shkurtimisht se si u përzgjodhën këto pesë shokë. A mundet kjo procedurë e mostrimit të sjellë paragjykime specifike në vlerësimet tuaja?
    3. Kërkojuni atyre pyetjet e mëposhtme të microsurvey:
    • "Sa herë keni përdorur telefonin tuaj celular për t'i telefonuar të tjerët dje?"
    • "Sa mesazhe me tekst keni dërguar dje?"
    • "Sa herë keni përdorur telefonin tuaj celular për të thirrur të tjerët në shtatë ditët e fundit?"
    • "Sa herë keni përdorur telefonin tuaj celular për të dërguar ose marrë mesazhe me tekst / SMS gjatë shtatë ditëve të fundit?"
    1. Sapo të përfundojë kjo mikro-regjistrim, kërkoni të kontrolloni të dhënat e përdorimit të tyre si të regjistruara nga telefoni ose ofruesi i shërbimit. Si krahasohet përdorimi i vetë-raportit me të dhënat e regjistrit? Cila është më e sakta, e cila është më pak e saktë?
    2. Tani kombinoni të dhënat që keni mbledhur me të dhënat nga njerëzit e tjerë në klasën tuaj (nëse jeni duke bërë këtë aktivitet për një klasë). Me këtë grup të dhënash më të madh, përsëritni pjesë (d).
  5. [ medium , Mbledhja e të dhënave ] Schuman dhe Presser (1996) argumentojnë se urdhrat e pyetjeve do të kishin rëndësi për dy lloje të pyetjeve: pyetjet pjesore ku dy pyetje janë në të njëjtin nivel të specifikës (p.sh. vlerësimet e dy kandidatëve presidencialë); dhe pyetjet e pjesës së tërësishme ku një pyetje e përgjithshme ndjek një pyetje më specifike (p.sh., duke pyetur "Sa jeni të kënaqur me punën tuaj?" e ndjekur nga "Sa jeni të kënaqur me jetën tuaj?").

    Ato karakterizojnë më tej dy lloje të efektit të rendit të pyetjeve: efektet e qëndrueshmërisë ndodhin kur përgjigjet ndaj një pyetjeje të mëvonshme afrohen më shumë (sesa do të ishin ndryshe) atyre që i janë dhënë një pyetjeje më të hershme; efektet e kontrastit ndodhin kur ka dallime më të mëdha midis përgjigjeve ndaj dy pyetjeve.

    1. Krijo një çift të pjesës pjesë të pyetjeve që mendoni se do të kenë një efekt të madh të rendit të pyetjeve; një palë pyetjesh të pjesëshme që mendoni se do të kenë një efekt të madh rendi; dhe një palë pyetjesh, rendi i të cilit mendoni se nuk do të kishte rëndësi. Drejtoni një eksperiment studimi në Amazon Mechanical Turk për të testuar pyetjet tuaja.
    2. Sa i madh ishte një efekt i një pjese të pjesëshme për të krijuar? A ishte një efekt konsistensi apo kontrasti?
    3. Sa i madh ishte efekti i plotë dhe i plotë për të krijuar? A ishte një efekt konsistensi apo kontrasti?
    4. A ka pasur një efekt të renditjes së pyetjes në palën tuaj ku nuk menduat se rendi do të kishte rëndësi?
  6. [ medium , Mbledhja e të dhënave ] Duke u bazuar në punën e Schuman dhe Presser, Moore (2002) përshkruan një dimension të veçantë të efektit të rendit të pyetjeve: efektet shtesë dhe zbritëse. Përderisa efektet e kontrastit dhe konsistencës janë prodhuar si pasojë e vlerësimeve të të anketuarve për të dyja artikujt në lidhje me njëri tjetrin, prodhohen efekte shtesë dhe zbritëse kur të anketuarit bëhen më të ndjeshëm ndaj kuadrit më të madh brenda të cilit paraqiten pyetjet. Lexoni Moore (2002) , pastaj dizajnoni dhe zhvilloni një eksperiment të anketës në MTurk për të demonstruar efekte shtesë ose subtraktive.

  7. [ i vështirë , Mbledhja e të dhënave ] Christopher Antoun dhe kolegët (2015) kryen një studim që krahason modelet e komoditetit të përfituara nga katër burime të rekrutimit online: MTurk, Craigslist, Google AdWords dhe Facebook. Hartimi i një studimi të thjeshtë dhe rekrutimi i pjesëmarrësve përmes të paktën dy burimeve të ndryshme të rekrutimit online (këto burime mund të jenë të ndryshme nga katër burimet e përdorura në Antoun et al. (2015) ).

    1. Krahasoni koston për rekrutë - në aspektin e parave dhe kohës - midis burimeve të ndryshme.
    2. Krahasoni përbërjen e mostrave të marra nga burime të ndryshme.
    3. Krahasoni cilësinë e të dhënave në mes mostrave. Për ide se si të matet cilësia e të dhënave nga të anketuarit, shih Schober et al. (2015) .
    4. Cili është burimi juaj i preferuar? Pse?
  8. [ medium ] Në një përpjekje për të parashikuar rezultatet e referendumit 2016 të BE-së (dmth., Brexit), një kompani e hulumtimit të tregut të bazuar në internet, YouGov, drejtoi sondazhet online të një paneli prej rreth 800,000 të anketuarish në Mbretërinë e Bashkuar.

    Një përshkrim i hollësishëm i modelit statistikor të YouGov mund të gjendet në https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Thjesht folur, YouGov ndarë votuesit në lloje të bazuar në zgjedhjen e përgjithshme të votimit të zgjedhjeve të vitit 2015, moshën, kualifikimet, gjininë dhe datën e intervistës, si dhe zonën zgjedhore në të cilën ata jetonin. Së pari, ata përdorën të dhënat e mbledhura nga panelistët e YouGov për të vlerësuar, në mesin e atyre që votuan, përqindjen e njerëzve të çdo tipi të zgjedhësve që synonin të votonin Largohu. Ata vlerësuan pjesëmarrjen e secilës lloj votuesi duke përdorur Studimin Britanik të Zgjedhjeve të vitit 2015 (BES), një studim ballë për ballë pas zgjedhjeve, i cili vërtetonte daljen nga rrotullat zgjedhore. Përfundimisht, ata vlerësuan se sa njerëz ishin në çdo lloj votuesi në elektoratin, bazuar në regjistrimin e fundit të popullsisë dhe anketën vjetore të popullsisë (me disa informata shtesë nga burime të tjera të të dhënave).

    Tre ditë para votimit, JuGov tregoi një pikë dy pikë për Lirë. Në prag të votimit, sondazhi tregoi se rezultati ishte shumë afër thirrjes (49/51 Remain). Studimi përfundimtar në ditë parashikoi 48/52 në favor të Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Në fakt, ky vlerësim humbi rezultatin përfundimtar (52/48 Lini) me katër pikë përqindjeje.

    1. Përdorni kornizën e përgjithshme të gabimeve të anketimit të diskutuara në këtë kapitull për të vlerësuar se çfarë mund të ketë shkuar keq.
    2. Përgjigja e YouGov pas zgjedhjeve (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) shpjegoi: "Kjo duket në një pjesë të madhe për shkak të daljes në votim-diçka që ne kemi thënë të gjithë së bashku do të ishte vendimtare për rezultatin e një race të tillë të balancuar. Modeli ynë i daljes në votim u bazua, pjesërisht, nëse të anketuarit kishin votuar në zgjedhjet e fundit të përgjithshme dhe një nivel pjesëmarrjeje mbi atë të zgjedhjeve të përgjithshme u mërzit modelin, veçanërisht në Veri. "A e ndryshon kjo përgjigja në pjesën (a)?
  9. [ medium , kërkon kodim ] Shkruani një simulim për të ilustruar secilën prej gabimeve të përfaqësimit në figurën 3.2.

    1. Krijo një situatë ku këto gabime anulohen.
    2. Krijo një situatë ku gabimet përbëjnë njëra-tjetrën.
  10. [ shume e veshtire , kërkon kodim ] Hulumtimi i Blumenstock dhe kolegët (2015) përfshinte ndërtimin e një modeli të mësimit të makinës që mund të përdorte të dhënat digjitale të gjurmëve për të parashikuar përgjigjet e studimit. Tani, do të provoni të njëjtën gjë me një grup të dhënash të ndryshëm. Kosinski, Stillwell, and Graepel (2013) zbuluan se Facebook pëlqen mund të parashikojë veçoritë dhe atributet individuale. Çuditërisht, këto parashikime mund të jenë edhe më të sakta se ato të miqve dhe kolegëve (Youyou, Kosinski, and Stillwell 2015) .

    1. Lexoni Kosinski, Stillwell, and Graepel (2013) figurën 2. Të dhënat e tyre janë në dispozicion në http://mypersonality.org/
    2. Tani, riprodhoni figurën 3.
    3. Së fundi, provoni modelin tuaj në të dhënat tuaja në Facebook: http://applymagicsauce.com/. Sa mirë funksionon për ju?
  11. [ medium ] Toole et al. (2015) përdorën të dhënat e detajimit të telefonatave (CDR) nga telefonat celularë për të parashikuar trendet agregate të papunësisë.

    1. Krahaso dhe kontrast projektin e studimit të Toole et al. (2015) me atë të Blumenstock, Cadamuro, and On (2015) .
    2. A mendoni se CDR-të duhet të zëvendësojnë sondazhet tradicionale, t'i plotësojnë ato ose të mos përdoren fare për politikëbërësit e qeverisë për të gjetur papunësinë? Pse?
    3. Cilat dëshmi do t'ju bindin se CDR-të mund të zëvendësojnë tërësisht masat tradicionale të shkallës së papunësisë?