djelatnost

  • stupanj težine: jednostavno lako , srednji srednji , teško teško , vrlo teško vrlo teško
  • zahtijeva matematiku ( zahtijeva matematiku )
  • zahtijeva kodiranje ( zahtijeva kodiranje )
  • prikupljanje podataka ( prikupljanje podataka )
  • moji omiljeni ( moj favorit )
  1. [ teško , zahtijeva matematiku ] U ovom poglavlju bio sam vrlo pozitivan u post-stratifikaciji. Međutim, to ne poboljšava uvijek kvalitetu procjena. Izgraditi situaciju u kojoj post-stratifikacija može smanjiti kvalitetu procjena. (Za savjet, pogledajte Thomsen (1973) .)

  2. [ teško , prikupljanje podataka , zahtijeva kodiranje ] Izraditi i provesti istraživanje o ne-vjerojatnosti na američkoj mehaničkoj Turku kako bi se pitala o vlasništvu oružja i stavovima prema kontroli oružja. Da biste usporedili procjene s rezultatima uzorka vjerojatnosti, kopirajte tekst pitanja i opcije odgovora izravno iz ankete visoke kakvoće, poput onih koje vodi Pew Research Center.

    1. Koliko dugo traje anketa? Koliko to kosta? Kako se demografski podaci vašeg uzorka uspoređuju s demografijom stanovništva SAD-a?
    2. Koja je neobrađena procjena vlasništva oružja pomoću uzorka?
    3. Ispravite za nereprezentativnost vašeg uzorka pomoću poststratifikacije ili neke druge tehnike. Sada što je procjena vlasništva oružja?
    4. Kako se vaše procjene uspoređuju s najnovijom procjenom s uzorka temeljenog na vjerojatnosti? Što mislite kako objašnjava odstupanja, ako ih ima?
    5. Ponovite pitanja (b) - (d) za stavove prema kontroli oružja. Kako se vaši nalazi razlikuju?
  3. [ vrlo teško , prikupljanje podataka , zahtijeva kodiranje ] Goel i njegovi kolege (2016) primjenjuju 49 pitanja s višestrukim odabirom iznesenih iz Generalnog socijalnog istraživanja (GSS) i odabiru ankete od strane Pew Research Centera na uzorku ne-vjerojatnosti ispitanika iz Amazon Mechanical Turk. Zatim su prilagodili ne-reprezentativnost podataka koristeći poststratifikaciju na temelju modela i uspoređivale svoje prilagođene procjene s onima iz ispitivanja temeljenih na vjerojatnosti GSS i Pew. Provedite istu anketu na Amazon Mechanical Turk i pokušajte replicirati sliku 2a i sliku 2b uspoređujući svoje prilagođene procjene s procjenama iz najnovijih krugova GSS i Pew anketa. (Vidi dodatak tablici A2 za popis od 49 pitanja.)

    1. Usporedite i usporedite rezultate s onima iz tvrtke Pew i GSS.
    2. Usporedite i usporedite rezultate s onima iz ankete Mechanical Turk u Goel, Obeng, and Rothschild (2016) .
  4. [ srednji , prikupljanje podataka , zahtijeva kodiranje ] Mnoge studije koriste samoobjavljene mjere korištenja mobilnog telefona. Ovo je zanimljivo okruženje u kojem istraživači mogu usporediti ponašanje sa samostalnim prijavljenim ponašanjem (vidi npr. Boase and Ling (2013) ). Dva uobičajena ponašanja koja se traže su pozivanje i slanje poruka, a dva uobičajena vremenska okvira su "jučer" i "proteklog tjedna".

    1. Mislite li da je prije nego što prikupite podatke, koja je od mjera za izvješćivanje točnija? Zašto?
    2. Zaposlite pet svojih prijatelja da budu u vašem istraživanju. Ukratko sažmite kako su ovi pet prijatelja uzorkovani. Može li ovaj postupak uzorkovanja izazvati specifične pristranosti u vašim procjenama?
    3. Upitajte ih na sljedeća pitanja:
    • "Koliko ste puta koristili svoj mobilni telefon da jučer pozovete druge?"
    • "Koliko ste SMS poruka poslali jučer?"
    • "Koliko ste puta koristili svoj mobilni telefon da pozovete druge u posljednjih sedam dana?"
    • "Koliko ste puta koristili svoj mobilni telefon za slanje ili primanje tekstualnih poruka / SMS poruka u zadnjih sedam dana?"
    1. Nakon završetka ovog microsurvey-a, molimo da provjerite njihove podatke o korištenju kako ih prijavljuje njihov telefon ili davatelj usluga. Kako se upotreba izvješća o sebi usporeduje s podacima zapisivanja podataka? Što je najpreciznije, što je najmanje točno?
    2. Sada kombinirate podatke koje ste prikupili s podacima drugih osoba u vašem razredu (ako radite ovu aktivnost za klase). S ovim većim skupom podataka ponovite dio (d).
  5. [ srednji , prikupljanje podataka Schuman i Presser (1996) tvrde da bi pitanja za pitanja bila važna za dva tipa pitanja: pitanja na dijelu gdje su dva pitanja na istoj razini specifičnosti (npr. Ocjena dva predsjednička kandidata); i cjelovito pitanja gdje opće pitanje slijedi specifičnija pitanja (npr. pitajući "koliko ste zadovoljni svojim radom?", a slijedili su "Koliko ste zadovoljni svojim životom?").

    Oni nadalje karakteriziraju dvije vrste učinka pitanja: učinci dosljednosti nastaju kada se reakcije na kasnije pitanje približe (nego što bi inače bile) na one koje su dane ranijem pitanju; Kontrastni efekti nastaju kada postoje veće razlike između odgovora na dva pitanja.

    1. Napravite par dijelova pitanja za koje smatrate da će imati velik utjecaj na pitanje redoslijeda; par cjelokupnih pitanja za koja mislite da će imati veliki učinak reda; i par pitanja čiji nalog mislite da ne bi bilo važno. Pokrenite eksperiment anketiranja na Amazon Mechanical Turku kako biste testirali svoja pitanja.
    2. Koliko je velik utjecaj na djelu mogao stvoriti? Je li to bila konzistencija ili kontrastni učinak?
    3. Koliko je velik dio cijelog učinka mogao stvoriti? Je li to bila konzistencija ili kontrastni učinak?
    4. Je li u vašem paru postojao pitanje naloga za poredak, gdje niste mislili da bi red bi bio važan?
  6. [ srednji , prikupljanje podataka ] Oslanjajući se na rad Schumana i Pressera, Moore (2002) opisuje zasebnu dimenziju učinka pitanja reda: aditivnih i oduzimajućih učinaka. Dok se učinci kontrasta i dosljednosti proizlaze kao posljedica procjene dvaju predmeta ispitanika u odnosu jedni na druge, nastaju aditivni i subtrakcijski učinci kada ispitanici budu osjetljiviji na veći okvir unutar kojeg se postavljaju pitanja. Pročitajte Moore (2002) , zatim osmislite i pokrenite eksperiment anketiranja na MTurku kako biste pokazali aditivne ili oduzimljive učinke.

  7. [ teško , prikupljanje podataka Christopher Antoun i njegovi kolege (2015) proveli su studiju koja uspoređuje uzorke pogodnosti dobivene iz četiri različita izvora za zapošljavanje na mreži: MTurk, Craigslist, Google AdWords i Facebook. Izradite jednostavan pregled i regrutirajte sudionike kroz najmanje dva različita izvora za zapošljavanje na mreži (ti se izvori mogu razlikovati od četiri izvora koji se koriste u Antoun et al. (2015) ).

    1. Usporedite troškove po regrutiranju - u smislu novca i vremena - između različitih izvora.
    2. Usporedite sastav uzoraka dobivenih iz različitih izvora.
    3. Usporedite kvalitetu podataka između uzoraka. Za ideje o tome kako mjeriti kvalitetu podataka od ispitanika, pogledajte Schober et al. (2015) .
    4. Koji je vaš željeni izvor? Zašto?
  8. [ srednji ] U pokušaju da predviđaju rezultate referenduma EU 2016. (tj. Brexit), YouGov - internetska tvrtka za istraživanje tržišta - provela je online ankete panela od oko 800.000 ispitanika u Velikoj Britaniji.

    Detaljan opis YouGov statističkog modela možete pronaći na https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Grubo govoreći, YouGov podijelio birače u vrste prema izboru općih izbora za izbor, dob, kvalifikacije, spol i datum intervjua, kao i izbornu jedinicu u kojoj su živjeli. Prvo, koristili su podatke prikupljene od članova ViGov-a kako bi procijenili, među onima koji su glasali, udio ljudi svake vrste birača koji su namjeravali glasovati. Procjenjuju se odaziv svakog tipa birača pomoću britanske izborne studije iz 2015. godine (BES), poslijeizborne ankete licem u lice, koje su potvrdile odaziv na izborima. Naposljetku, procijenili su koliko je ljudi bilo svake vrste birača u biračkom tijelu, temeljeno na najnovijem popisu stanovništva i Godišnjem popisu stanovništva (s dodatnim informacijama iz drugih izvora podataka).

    Tri dana prije glasovanja, YouGov je pokazao vodstvo u dvije točke za odlazak. Uoči glasovanja, anketa je pokazala da je rezultat previše blizu pozivu (49/51 Remain). Konačna studija predvidjela je 48/52 u korist Remaina (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Zapravo, ova procjena propustila je konačni rezultat (52/48 odsustvo) za četiri postotna boda.

    1. Upotrijebite okvir za pogreške ukupne ankete opisane u ovom poglavlju kako biste procijenili što bi moglo biti pogrešno.
    2. YouGovov odgovor nakon izbora (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) objasnio je: "Ovo se u velikoj mjeri čini zbog odaziva - nešto što sve što smo rekli bilo bi od ključne važnosti za ishod takve fino uravnotežene utrke. Naš model odaziva temelji se dijelom o tome jesu li ispitanici glasovali na posljednjim općim izborima, a razina odaziva iznad onih općih izbora uznemirila je model, osobito na sjeveru. "Je li to promijenilo vaš odgovor na dio (a)?
  9. [ srednji , zahtijeva kodiranje Napišite simulaciju kako biste ilustrirali svaku od pogrešaka prikazivanja na slici 3.2.

    1. Stvorite situaciju u kojoj se ove pogreške zapravo otkazuju.
    2. Stvorite situaciju u kojoj su pogreške spojene jedna s drugom.
  10. [ vrlo teško , zahtijeva kodiranje ] Istraživanje Blumenstocka i suradnika (2015) uključivalo je izgradnju modela strojnog učenja koji bi mogao upotrijebiti podatke digitalnog traga za predviđanje odgovora na ankete. Sada ćete pokušati ista stvar s drugim skupom podataka. Kosinski, Stillwell, and Graepel (2013) utvrdili su da Facebook voli predvidjeti pojedinačne osobine i atribute. Iznenađujuće, ova predviđanja mogu biti još preciznija od onih prijatelja i kolega (Youyou, Kosinski, and Stillwell 2015) .

    1. Pročitajte Kosinski, Stillwell, and Graepel (2013) , te ponovite sliku 2. Njihovi su podaci dostupni na http://mypersonality.org/
    2. Sada, ponovite sliku 3.
    3. Na kraju, isprobajte svoj model na svojim Facebook podacima: http://applymagicsauce.com/. Koliko dobro radi za vas?
  11. [ srednji Toole et al. (2015) koristili su detalje o detaljima poziva (CDR-ova) s mobilnih telefona kako bi predvidjeli kretanje agregatnih nezaposlenosti.

    1. Usporedite i suprotstavite dizajnu studije Toole et al. (2015) s onima Blumenstock, Cadamuro, and On (2015) .
    2. Mislite li da bi CDR-ovi trebali zamijeniti tradicionalna istraživanja, nadopuniti ih ili uopće ne iskoristiti za vladine poli- tike da prate nezaposlenost? Zašto?
    3. Koji bi vas dokazi mogli uvjeriti da CDR-ovi u potpunosti mogu zamijeniti tradicionalne mjere stope nezaposlenosti?