dejavnosti

  • stopnja težavnosti: enostavno enostavno , srednja srednje , težko težko , zelo težko zelo težko
  • zahteva matematiko ( zahteva matematiko )
  • zahteva kodiranje ( zahteva kodiranje )
  • Zbiranje podatkov ( Zbiranje podatkov )
  • moji najljubši ( moj najljubši )
  1. [ težko , zahteva matematiko ] V poglavju sem bil zelo pozitiven glede post-stratifikacije. Vendar to vedno ne izboljša kakovosti ocen. Konstruirajte situacijo, kjer post-stratifikacija lahko zmanjša kakovost ocen. (Za namig glej Thomsen (1973) .)

  2. [ težko , Zbiranje podatkov , zahteva kodiranje ] Oblikujte in izvedite raziskavo brez verjetnosti, na Amazon Mechanical Turk, da vprašate o lastništvu orožja in odnosih do nadzora orožja. Tako lahko svoje ocene primerjate s tistimi, ki izhajajo iz vzorca verjetnosti, zato kopirajte besedilo vprašanja in odgovore na vprašanja neposredno iz visokokakovostne raziskave, kot so tiste, ki jih vodi raziskovalni center Pew.

    1. Kako dolgo traja vaša raziskava? Koliko stane? Kako se demografija vašega vzorca primerja z demografskimi podatki prebivalstva ZDA?
    2. Kakšna je groba ocena lastnine orožja z vašim vzorcem?
    3. Popravite za nepreprezentativnost vašega vzorca z uporabo post-stratifikacije ali druge tehnike. Kakšna je ocena lastnine orožja?
    4. Kako se vaše ocene primerjajo z najnovejšo oceno iz vzorca na podlagi verjetnosti? Kaj menite, kako razlaga razlike, če jih sploh obstaja?
    5. Ponovite vprašanja (b) - (d) za odnos do nadzora pištole. Kako se ugotovitve razlikujejo?
  3. [ zelo težko , Zbiranje podatkov , zahteva kodiranje ] Goel in sodelavci (2016) upravljali 49 vprašanj, povezanih z več vprašanji, sestavljenimi iz Splošne družbene ankete (GSS) in izbirnih raziskovanj Pew Research Centra za vzorčenje anketirancev brez verjetnosti iz Amazon Mechanical Turk. Nato so se prilagajale za ne-reprezentativnost podatkov z uporabo post-stratifikacije, ki temelji na modelu, in primerjala njihove prilagojene ocene s tistimi iz raziskav GSS in Pew, ki temeljijo na verjetnosti. Izvedite isto raziskavo o Amazon Mechanical Turk in poskusite ponoviti slike 2a in sliko 2b s primerjanjem prilagojenih ocen z ocenami iz najnovejših krogov GSS in Pewovih raziskav. (Glej prilogo tabel A2 za seznam 49 vprašanj.)

    1. Primerjajte in primerjate rezultate s Pew in GSS.
    2. Primerjajte in primerjate svoje rezultate s tistimi iz ankete Mechanical Turk v Goel, Obeng, and Rothschild (2016) .
  4. [ srednje , Zbiranje podatkov , zahteva kodiranje ] Številne študije uporabljajo ukrepe, ki se sami prijavijo za uporabo mobilnih telefonov. To je zanimiva okoliščina, v kateri lahko raziskovalci primerjajo vedenje samega sebe z logiranim vedenjem (glej npr. Boase and Ling (2013) ). Dva skupna vedenja, ki jih je treba vprašati, so klicanje in pošiljanje besedil, dva skupna časovna okvira sta »včeraj« in »v zadnjem tednu«.

    1. Preden zbirate katere koli podatke, kateri od ukrepov samoprijav je po vašem mnenju bolj natančen? Zakaj?
    2. Zapišite pet prijateljev, da bi bili v anketi. Na kratko povzemite, kako so bili vzorci teh petih prijateljev. Ali lahko ta postopek vzorčenja povzroči posebne pristranskosti v svojih ocenah?
    3. Vprašajte jih za naslednja mikroprocesorska vprašanja:
    • "Kolikokrat ste z mobilnim telefonom včeraj poklicali druge?"
    • "Koliko besedilnih sporočil ste poslali včeraj?"
    • »Kolikokrat ste uporabili mobilni telefon, da pokličete druge v zadnjih sedmih dneh?«
    • "Kolikokrat ste svoj mobilni telefon uporabljali za pošiljanje ali prejemanje SMS / SMS v zadnjih sedmih dneh?"
    1. Ko je ta mikroururcija končana, prosite, naj preveri svoje podatke o uporabi, ki jih je prijavil njihov telefon ali ponudnik storitev. Kako se samo-prijavljanje uporablja v primerjavi z dnevniki? Kateri je najbolj natančen, kar je najmanj točno?
    2. Zdaj združite podatke, ki ste jih zbrali s podatki drugih oseb v vašem razredu (če to počnete za razred). S tem večjim naborom podatkov ponovite del (d).
  5. [ srednje , Zbiranje podatkov Schuman in Presser (1996) trdita, da bi bila naročila vprašanj pomembna za dve vrsti vprašanj: delna vprašanja, kjer sta dve vprašanji enaka stopnji specifičnosti (npr. Ocene dveh predsedniških kandidatov); in delno celih vprašanj, kjer splošno vprašanje sledi bolj specifičnemu vprašanju (npr. sprašuje se: "Kako ste zadovoljni s svojim delom?", čemur sledi "Kako ste zadovoljni s svojim življenjem?").

    Nadalje opredeljujejo dve vrsti učinkom reda vprašanj: učinki doslednosti se pojavijo, ko se odgovori na kasnejše vprašanje približajo tistim, ki so bili dani prejšnjemu vprašanju (kot bi sicer bili); Učinki kontrasta se pojavijo, ko obstajajo večje razlike med odgovori na dve vprašanji.

    1. Ustvarite par delnih vprašanj, za katere menite, da bodo imeli velik učinek na vprašanje; par delnih vprašanj, za katera menite, da bodo imeli velik učinek naročilo; in par vprašanj, za katere misliš, da ne bi bilo pomembno. Izvedite raziskovalni poskus na Amazon Mechanical Turk, da preizkusite svoja vprašanja.
    2. Koliko velikega učinka ste lahko ustvarili? Je bil učinek doslednosti ali kontrasta?
    3. Kako velik je bil delovni učinek, ki ste ga ustvarili? Je bil učinek doslednosti ali kontrasta?
    4. Ali ste imeli v vašem paru učinek na vprašanje, v katerem niste mislili, da bi bil nalog pomemben?
  6. [ srednje , Zbiranje podatkov ] Na podlagi dela Schuman in Presser, Moore (2002) opisuje ločeno dimenzijo učinka reda vprašanj: dodatni in odštevni učinki. Medtem ko učinki kontrasta in doslednosti nastanejo kot rezultat ocenjevanja anketirancev obeh postavk v povezavi med seboj, se ustvarjajo dodatni in odštevni učinki, ko so anketiranci bolj občutljivi na širši okvir, znotraj katerega se postavljajo vprašanja. Preberite Moore (2002) , nato pa načrtujte in izvedite raziskovalni poskus na MTurk, da bi pokazali aditive ali odštevanje.

  7. [ težko , Zbiranje podatkov ] Christopher Antoun in sodelavci (2015) izvedli študijo, v kateri so primerjali vzorce primernosti, pridobljene iz štirih različnih spletnih virov za zaposlovanje: MTurk, Craigslist, Google AdWords in Facebook. Oblikujte preprosto anketo in zaposlite udeležence prek vsaj dveh različnih spletnih virov za zaposlovanje (ti viri se lahko razlikujejo od štirih virov, uporabljenih v Antoun et al. (2015) ).

    1. Primerjajte stroške na zaposlovanje - v smislu denarja in časa - med različnimi viri.
    2. Primerjajte sestavo vzorcev, pridobljenih iz različnih virov.
    3. Primerjajte kakovost podatkov med vzorci. Za ideje o merjenju kakovosti podatkov od anketirancev glej Schober et al. (2015) .
    4. Kateri je vaš najprimernejši vir? Zakaj?
  8. [ srednje ] V prizadevanju, da bi napovedali rezultate referenduma EU leta 2016 (tj. Brexit), spletno anketo podjetja YouGov, ki temelji na tržnih raziskavah na spletu, je izvedla spletno anketo s približno 800.000 anketiranci v Združenem kraljestvu.

    Podroben opis YouGovega statističnega modela je na voljo na https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Grobo rečeno, YouGov je razdelil volivce v vrste, ki so temeljile na volilni volilni glasovi leta 2015, starosti, kvalifikacijah, spolu in datumu razgovora ter volilni enoti, v kateri so živeli. Prvič, uporabili so podatke, zbrane od YouGov-ovih panelistov, da bi med tistimi, ki so glasovali, ocenili delež ljudi iz posamezne vrste volivcev, ki so nameravali glasovati na dopustu. Ocenili so volilno udeležbo vsake vrste volivcev z uporabo britanske volilne študije leta 2015 (BES), post-election ankete iz oči v oči, ki je potrjevala volilno udeležbo volivcev. Na koncu so ocenili, koliko ljudi je bilo v volilnem telesu vsake vrste volivcev na podlagi najnovejšega popisa in letnega popisa prebivalstva (z dodatnimi informacijami iz drugih virov podatkov).

    Tri dni pred glasovanjem, YouGov je pokazal dvotočkovno prednost pri Leave. Na predvečer glasovanja je anketa pokazala, da je bil rezultat preblizu klica (49/51 Remain). Končna tekoča študija je predvidela 48/52 v korist Remaina (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Dejansko je ta ocena zamudila končni rezultat (52/48 Leave) za štiri odstotne točke.

    1. Uporabite celoten okvir napake v anketi, ki je opisan v tem poglavju, da bi ocenili, kaj bi se lahko zgodilo narobe.
    2. Odgovor YouGov po volitvah (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) je pojasnil: "To se zdi v veliki meri zaradi udeležbe - nekaj, kar je smo rekli, da bo vse skupaj ključnega pomena za izid takšne drobno uravnotežene dirke. Naš volilni model je delno temeljil na tem, ali so anketiranci glasovali na zadnjih splošnih volitvah in je volilna udeležba nad splošnimi volitvami vznemirila model, zlasti na severu. «Ali to spreminja vaš odgovor na del (a)?
  9. [ srednje , zahteva kodiranje ] Napišite simulacijo, ki ponazarja vsako napako reprezentacije na sliki 3.2.

    1. Ustvari situacijo, v kateri se te napake dejansko izničijo.
    2. Ustvarite razmere, v katerih se napake združujejo.
  10. [ zelo težko , zahteva kodiranje ] Raziskave Blumenstocka in sodelavcev (2015) vključevale izdelavo strojnega učnega modela, ki bi lahko uporabil digitalne podatke o sledovih za predvidevanje odzivov anket. Sedaj boste poskusili isto stvar z drugačnim naborom podatkov. Kosinski, Stillwell, and Graepel (2013) ugotovili, da je všeč Facebooku napovedati posamezne lastnosti in lastnosti. Presenetljivo je, da so te napovedi lahko še bolj točne od tistih od prijateljev in kolegov (Youyou, Kosinski, and Stillwell 2015) .

    1. Preberite Kosinski, Stillwell, and Graepel (2013) in ponovite sliko 2. Njihovi podatki so na voljo na http://mypersonality.org/
    2. Zdaj ponovite sliko 3.
    3. Končno, poskusite svoj model na lastne podatke Facebook: http://applymagicsauce.com/. Kako dobro deluje za vas?
  11. [ srednje ] Toole et al. (2015) uporablja podatke o klicnih podrobnostih (CDR) iz mobilnih telefonov in napoveduje skupne trende brezposelnosti.

    1. Primerjajte in kontrastite študijskemu oblikovanju orodja Toole et al. (2015) s programom Blumenstock, Cadamuro, and On (2015) .
    2. Ali menite, da bi morali CDR nadomestiti tradicionalne raziskave, jih dopolniti ali jih sploh ne bi uporabili za oblikovanje vladnih politik za sledenje brezposelnosti? Zakaj?
    3. Kateri dokazi vas bodo prepričali, da lahko CDR popolnoma nadomestijo tradicionalne ukrepe stopnje brezposelnosti?