djelatnost

  • Stepen teškoće: lako lako , srednja srednje , teško teško , vrlo teško vrlo teško
  • zahteva matematiku ( zahteva matematiku )
  • zahteva kodiranje ( zahteva kodiranje )
  • prikupljanje podataka ( prikupljanje podataka )
  • moji omiljeni ( moj najdraži )
  1. [ teško , zahteva matematiku ] U poglavlju sam bio vrlo pozitivan u pogledu post-stratifikacije. Međutim, to ne uvijek poboljšava kvalitet procjena. Konstruišite situaciju u kojoj post-stratifikacija može smanjiti kvalitet procjena. (Za nagoveštaj pogledajte Thomsen (1973) .)

  2. [ teško , prikupljanje podataka , zahteva kodiranje ] Dizajnirajte i sprovedite istraživanje o verovatnoći Amazon Mechanical Turk da biste pitali o vlasništvu pištolja i stavovima o kontroli oružja. Da biste mogli upoređivati ​​procjene sa onima dobijenim iz uzorka vjerovatnoće, molimo vas da kopirate tekst pitanja i odgovore direktno iz visoko kvalitetnog istraživanja, kao što su one koje vodi Pew Research Center.

    1. Koliko dugo traje vaše istraživanje? Koliko to košta? Kako se demografija vašeg uzorka upoređuje sa demografijom stanovništva SAD-a?
    2. Koja je sirova procjena vlasništva oružja koristeći vaš uzorak?
    3. Pravite za neprepoznatljivost vašeg uzorka koristeći post-stratifikaciju ili neku drugu tehniku. Kakva je procena vlasništva nad oružjem?
    4. Kako se vaše procjene upoređuju sa najnovijom procenom iz uzorka zasnovanog na vjerojatnosti? Šta misliš da objašnjava neslaganja, ako ih ima?
    5. Ponovite pitanja (b) - (d) za stavove prema kontroli oružja. Kako se vaši nalazi razlikuju?
  3. [ vrlo teško , prikupljanje podataka , zahteva kodiranje ] Goel i kolege (2016) administrirali su 49 pitanja višestrukog izbora koji su izvučeni iz Opšte društvene ankete (GSS) i odabrali istraživanja od strane istraživačkog centra Pewa uzorku ispitanika koji nisu verovatno izvučeni iz Amazon Mechanical Turk. Zatim su se prilagodili za ne-reprezentativnost podataka koristeći post-stratifikaciju zasnovanu na modelu i upoređivali su njihove prilagođene procjene sa onima iz GSS i Pew studija zasnovanih na vjerovatnoći. Vodite istu anketu na Amazon Mechanical Turk i pokušajte da ponovite sliku 2a i Slika 2b upoređivanjem vaših prilagođenih procjena sa procjenama iz najnovijih krugova GSS i Pew istraživanja. (Vidi dodatak tabela A2 za listu 49 pitanja.)

    1. Uporedite i upoređujte rezultate sa onima iz Pew i GSS.
    2. Uporedite i uporedite rezultate sa onima iz istraživanja Mechanical Turk u Goel, Obeng, and Rothschild (2016) .
  4. [ srednje , prikupljanje podataka , zahteva kodiranje ] Mnoge studije koriste samo-prijavljene mjere korištenja mobilnih telefona. Ovo je zanimljivo okruženje u kojem istraživači mogu upoređivati ​​samopovređeno ponašanje sa prijavljenim ponašanjem (vidi npr. Boase and Ling (2013) ). Dva uobičajena ponašanja o kojima se pitate su poziv i slanje tekstova, a dva uobičajena vremenska okvira su "jučer" i "prošle nedelje".

    1. Pre nego što ste prikupili bilo koji podatak, koja od mjera samoregulacije mislite da je tačnija? Zašto?
    2. Recite pet prijatelja da budu u vašoj anketi. Molimo da ukratko saznamo kako su ove pet prijatelja uzorkovane. Može li ova procedura uzorkovanja izazvati određene pristrasnosti u vašim procjenama?
    3. Pitajte im sledeća pitanja mikroprocesora:
    • "Koliko puta ste koristili svoj mobilni telefon da pozovete druge juče?"
    • "Koliko ste tekstualnih poruka poslali juče?"
    • "Koliko puta ste koristili svoj mobilni telefon da pozovete druge u zadnjih sedam dana?"
    • "Koliko puta ste koristili svoj mobilni telefon za slanje ili primanje SMS poruka / SMS-a u poslednjih sedam dana?"
    1. Kada se ova mikrosrbija završi, zatražite da proverite njihove podatke o korišćenju koje prijavljuje njihov telefon ili provajder usluga. Kako se samo-prijavljivanje koristi upoređuje sa evidencijama? Koja je najtačnija, koja je najmanje tačna?
    2. Sada kombinujte podatke koje ste prikupili sa podacima drugih ljudi u vašoj klasi (ako radite ovu aktivnost za klasu). Uz ovaj veći skup podataka, ponovite deo (d).
  5. [ srednje , prikupljanje podataka ] Schuman i Presser (1996) tvrde da bi narudžbina pitanja bila važna za dva tipa pitanja: delimična pitanja u kojima su dva pitanja u istom nivou specifičnosti (npr. Ocjene dva predsednička kandidata); i delimična pitanja u kojima opšte pitanje prati konkretnije pitanje (npr. pitajući "Koliko ste zadovoljni sa svojim poslom?", a zatim "Koliko ste zadovoljni sa svojim životom?").

    Oni dalje karakterišu dva tipa efekta poretka pitanja: efekti konzistencije se javljaju kada se odgovori na kasnije pitanje dovode bliže (nego što bi inače bili) na one date na ranije pitanje; efekti kontrasta nastaju kada postoje veće razlike između odgovora na dva pitanja.

    1. Napravite par pitanja u dijelu za koji mislite da će imati veliki efekat poretka pitanja; par delimičnih pitanja za koje mislite da će imati veliki efekat naredbe; i par pitanja čiji poredak mislite da nije važno. Pokrenite anketni eksperiment na Amazon Mechanical Turk da biste testirali svoja pitanja.
    2. Koliki je efekat dijelova bio moguć u stvaranju? Da li je to bio konzistentnost ili kontrastni efekat?
    3. Koliki je bio veliki efekat u celini? Da li je to bio konzistentnost ili kontrastni efekat?
    4. Da li je u vašem paru postojao efekat naloga za pitanja, kada niste mislili da bi to bilo važno?
  6. [ srednje , prikupljanje podataka ] Nadovezujući se na rad Schuman i Presser, Moore (2002) opisuje posebnu dimenziju efekta poretka pitanja: aditivne i subtraktivne efekte. Iako su efekti kontrasta i konzistentnosti proizvedeni kao posljedica ocjenjivanja ispitanika od dvije stavke u odnosu jedna na drugu, aditivni i subtraktivni efekti se proizvode kada ispitanici postanu osjetljiviji na veći okvir unutar kojeg se postavljaju pitanja. Pročitajte Moore (2002) , zatim dizajnirajte i pokrenite istraživački eksperiment na MTurk-u da biste prikazali aditivne ili subtraktivne efekte.

  7. [ teško , prikupljanje podataka ] Christopher Antoun i kolege (2015) sproveli studiju upoređujući uzorke pogodnosti dobijene iz četiri različita izvora za zapošljavanje: MTurk, Craigslist, Google AdWords i Facebook. Dizajnirajte jednostavnu anketu i regrutirajte učesnike kroz najmanje dva različita online izvore za zapošljavanje (ti izvori se mogu razlikovati od četiri izvora koji se koriste u Antoun et al. (2015) ).

    1. Uporedite troškove po zaposlenima - u smislu novca i vremena - između različitih izvora.
    2. Uporedite sastav uzoraka dobijenih iz različitih izvora.
    3. Uporedite kvalitet podataka između uzoraka. Za ideje o tome kako mjeriti kvalitet podataka od ispitanika, pogledajte Schober et al. (2015) .
    4. Koji je vaš omiljeni izvor? Zašto?
  8. [ srednje ] U nastojanju da predvidi rezultate referenduma EU u 2016. godini (tj. Brexit), YouGov-ov firma za istraživanje tržišta zasnovana na internetu, sprovela je online ankete panela od oko 800.000 ispitanika u Ujedinjenom Kraljevstvu.

    Detaljan opis YouGovog statističkog modela možete naći na https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Grubo govoreći, YouGov je podelio birače na tipove zasnovane na izboru opšteg izbornog izbora u 2015. godini, uzrastu, kvalifikacijama, polu i datumu intervjua, kao i izbornoj jedinici u kojoj žive. Prvo su koristili podatke prikupljene od YouGov panelista kako bi procenili, među onima koji su glasali, procenat ljudi iz svakog biračkog tipa koji su namjeravali da glasaju za Odlazak. Procenili su izlaznost svakog tipa birača korišćenjem britanske izborne studije (BES) za 2015. godinu, postizbornom licem u lice, koji je potvrdio izlaznost iz izbornih listića. Konačno, procijenili su koliko je ljudi bilo koje vrste birača u biračkom telu, na osnovu najnovije popisa i godišnjeg popisa stanovništva (uz neke dodatne informacije iz drugih izvora podataka).

    Tri dana pre glasanja, YouGov je pokazao vođstvo od dve tačke za Leave. Uoči glasanja, anketa je pokazala da je rezultat bio previše blizu poziva (49/51 Remain). Konačna današnja studija predviđala je 48/52 u korist Remaina (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). U stvari, ova procjena je propustila konačni rezultat (52/48 Odlazak) za četiri procentna poena.

    1. Koristite okvir ukupne greške u istraživanju koji je opisan u ovom poglavlju kako biste procijenili šta je moglo pogriješiti.
    2. Odgovor YouGov-a nakon izbora (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) objasnio je: "Ovo se čini u velikom dijelu zbog odziva - nešto što rekli smo da će sve vreme biti ključno za ishod takve fino izbalansirane trke. Naš model odziva bio je delimično zasnovan na tome da li su ispitanici glasali na posljednjim opštim izborima, a nivo izlaznosti iznad općih izbora uznemirio je model, posebno na sjeveru. "Da li ovo mijenja vaš odgovor na dio (a)?
  9. [ srednje , zahteva kodiranje ] Napišite simulaciju koja ilustruje svaku grešku reprezentacije na slici 3.2.

    1. Stvorite situaciju u kojoj se ove greške zapravo poništavaju.
    2. Stvorite situaciju u kojoj se greške slažu jedni druge.
  10. [ vrlo teško , zahteva kodiranje ] Istraživanje Blumenstock-a i kolega (2015) uključivalo je izgradnju modela za učenje mašina koji bi mogao koristiti digitalne podatke o tragovima kako bi predvidio odgovore na ankete. Sada ćete pokušati istu stvar sa drugim podacima. Kosinski, Stillwell, and Graepel (2013) otkrili da Facebook voli da predvide individualne osobine i atribute. Iznenađujuće, ove predviđanja mogu biti još preciznije od onih prijatelja i kolega (Youyou, Kosinski, and Stillwell 2015) .

    1. Pročitajte Kosinski, Stillwell, and Graepel (2013) sliku 2. Njihovi podaci su dostupni na http://mypersonality.org/
    2. Sada, ponovite sliku 3.
    3. Konačno, probajte svoj model na sopstvenim Facebook podacima: http://applymagicsauce.com/. Koliko dobro to radi za vas?
  11. [ srednje ] Toole et al. (2015) koristio podatke o detaljima poziva (CDR-a) sa mobilnih telefona kako bi predvidio agregatne trendove nezaposlenosti.

    1. Uporedite i kontrastirajte dizajn studije Toole et al. (2015) sa Blumenstock, Cadamuro, and On (2015) iz Blumenstock, Cadamuro, and On (2015) .
    2. Da li mislite da CDR treba da zamene tradicionalna istraživanja, da ih dopunjuju ili da se uopšte ne koriste za vladine donosioce politike da prate nezaposlenost? Zašto?
    3. Koji dokazi će vas uveriti da CDR mogu u potpunosti zameniti tradicionalne mere stope nezaposlenosti?