Activitati

Cheie:

  • grad de dificultate: ușor uşor , mediu mediu , greu greu , foarte greu foarte greu
  • necesită matematică ( necesită matematică )
  • necesită codificare ( necesită codificare )
  • colectare de date ( colectare de date )
  • preferatele mele ( preferatul meu )
  1. [ greu . necesită matematică ] În capitolul, am fost foarte pozitiv despre post-stratificare. Cu toate acestea, nu se îmbunătățește întotdeauna calitatea estimărilor. Construi o situație în care poate post-stratificare poate scădea calitatea estimărilor. (Pentru un indiciu, vezi Thomsen (1973) ).

  2. [ greu . colectare de date . necesită codificare ] Proiectarea și să efectueze un studiu non-probabilitate de pe Amazon MTurk să întreb despre arma de proprietate ( "ai face, sau nu cineva din casa ta, dețin o armă, pușcă sau pistol? Este că tu sau altcineva din casa ta?") Și atitudinea fata de controlul armelor de foc ( "Ce crezi că este mai important, pentru a proteja dreptul americanilor de a deține arme, sau pentru a controla arma de proprietate?").

    1. Cât timp durează sondajul dumneavoastră? Cat costa? Cum se demografice ale eșantionului dumneavoastră de a compara datele demografice ale populației din SUA?
    2. Care este estimarea prime de arma de proprietate folosind proba ta?
    3. Corectă pentru non-reprezentativitatea eșantionului folosind post-stratificare sau o altă tehnică. Acum, ceea ce este estimarea de arma de proprietate?
    4. Cum se estimările compara cu cele mai recente estimări de la Pew Research Center? Ce crezi că explica discrepanțele, în cazul în care există?
    5. Se repetă exercițiul 2-5 pentru atitudinea față de controlul armelor. Cum se descoperirile difera?
  3. [ foarte greu . colectare de date . necesită codificare ] Goel și colegii (2016) administrat un studiu bazat pe non-probabilitate care constă din 49 de întrebări atitudinale multiple variante extrase din Ancheta sociale generale (GSS) și selectați anchetele de Centrul de Cercetare Pew pe Amazon MTurk. Apoi își ajustează pentru non-reprezentativitatea datelor prin utilizarea pe bază de model post-stratificare (d-P) și se compară estimările ajustate cu cele estimate folosind anchete GSS / Pew bazate pe probabilitate. Efectuează același sondaj privind MTurk și să încerce să reproducă Figura 2a și Figura 2b, prin compararea estimările ajustate cu estimările din cele mai recente runde de GSS / Pew (A se vedea apendicele tabelul A2 pentru lista de 49 de întrebări).

    1. Compară și rezultatele la rezultatele de la Pew și GSS.
    2. Compară și rezultatele la rezultatele sondajului MTurk în Goel, Obeng, and Rothschild (2016) .
  4. [ mediu . colectare de date . necesită codificare ] Multe studii folosesc măsuri de auto-raport de date privind activitatea de telefon mobil. Acesta este un cadru interesant în cazul în care cercetătorii pot compara comportamentul autoraportat cu comportament înregistrate în jurnal ( a se vedea de exemplu, Boase and Ling (2013) ). Două comportamente comune pentru a cere cu privire la cer și mesaje text, și două cadre de timp sunt comune "ieri" și "în ultima săptămână."

    1. Înainte de a colecta date, care a auto-raport măsuri credeți că este mai precisă? De ce?
    2. 5 dintre prietenii recruta dvs. să fie în sondajul tău. Vă rugăm să explicați pe scurt modul în care au fost incluși în eșantion aceste 5 prieteni. Este posibil ca această procedură de eșantionare induce distorsiuni specifice în estimările dumneavoastră?
    3. Vă rugăm să-i următoarele micro-sondaj întreba:
    • "De câte ori ai folosit telefonul mobil pentru a apela alții ieri?"
    • "Cât de multe mesaje de text ai trimis ieri?"
    • "De câte ori ați folosit telefonul mobil pentru a apela alte persoane în ultimele șapte zile?"
    • "De câte ori ai folosit telefonul mobil pentru a trimite sau primi mesaje text / SMS-uri în ultimele șapte zile?" Odată ce sondajul este completă, solicitați să verifice datele lor de utilizare ca și autentificat de către furnizorul lor de telefon sau de serviciu.
    1. Cum se compară utilizarea de auto-raport jurnal de date? Ceea ce este cel mai precis, care este cel mai puțin precisă?
    2. Acum combină datele pe care le-ați colectat cu datele de la alte persoane din clasa ta (dacă faci această activitate pentru o clasă). Cu acest set de date mai mare, repetați partea (d).
  5. [ mediu . colectare de date ] Schuman și Presser (1996) susțin că ordinele de întrebare ar conta pentru două tipuri de relații între întrebări: întrebări cu partea partea în care cele două întrebări sunt la același nivel de specificitate ( de exemplu , evaluări a doi candidați la președinție); și întrebări cu partea întregi în cazul în care o întrebare generală urmează o întrebare mai specifică (de exemplu, întrebarea "Cât de mulțumit sunteți cu munca ta?", urmat de "Cât de mulțumit sunteți cu viața ta?").

    Ele caracterizează în continuare două tipuri de efect al ordinii întrebare: efecte de consistență apar atunci când răspunsurile la o întrebare mai târziu sunt aduse mai aproape (decât ar fi altfel) la cele date la o întrebare anterioară; contrast efecte apar atunci când există diferențe mai mari între răspunsurile la două întrebări.

    1. Creați o pereche de întrebări part-partea pe care credeți că vor avea un efect mare ordine întrebare, o pereche de întrebări întreaga parte care credeți că va avea un efect de ordine mare, și o altă pereche de întrebări a căror ordine crezi că nu ar conta. Un experiment rula studiu privind MTurk pentru a testa întrebările dumneavoastră.
    2. Cât de mare a fost efectul part-o parte ai fost capabil de a crea? A fost un efect de consistență sau de contrast?
    3. Cât de mare a fost efectul de o parte întreg ai fost capabil de a crea? A fost un efect de consistență sau de contrast?
    4. A existat o întrebare efect de ordine în perechea ta în cazul în care nu ai crezut ordinea ar conta?
  6. [ mediu . colectare de date ] Bazându -se pe lucrările lui Schuman și Presser, Moore (2002) descrie o dimensiune separată a intrării în vigoare ordine întrebare: aditiv și substractiv. În timp ce efectele de contrast și consistență sunt produse ca urmare a evaluărilor respondenților ale celor două elemente în legătură unul cu altul, aditiv și efectele substractive sunt produse atunci când respondenții sunt mai sensibile la cadrul mai larg în care se pun întrebări. Citește mai Moore (2002) , apoi de design și rula un experiment de studiu privind MTurk pentru a demonstra aditiv sau substractive efecte.

  7. [ greu . colectare de date ] Christopher Antoun și colegii (2015) a realizat un studiu care a comparat probele obținute din patru semipreparate diferite surse de recrutare on - line: MTurk, Craigslist, Google AdWords și Facebook. Proiecta un simplu sondaj și recrutarea participanților prin intermediul a cel puțin două surse diferite de recrutare on - line (acestea pot fi surse diferite de cele patru surse utilizate în Antoun et al. (2015) , Antoun et al. (2015) ).

    1. Compara costul per recrut, în termeni de bani și de timp, între diferite surse.
    2. Compară compoziția probelor obținute din diferite surse.
    3. Compara calitatea datelor între probe. Pentru idei cu privire la modul de măsurare a calității datelor din respondenți, vezi Schober et al. (2015) .
    4. Care este sursa ta preferată? De ce?
  8. [ mediu ] YouGov, o firma de cercetare de piață pe internet, efectuat sondaje online a unui grup de aproximativ 800.000 de respondenți din Marea Britanie si folosit domnul P. pentru a prezice rezultatul referendumului UE (de exemplu, Brexit), în cazul în care alegătorii din Regatul Unit alege fie să rămână în sau de a părăsi Uniunea Europeană.

    O descriere detaliată a modelului statistic YouGov este aici (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Aproximativ vorbind, YouGov partitioneaza alegători în tipuri bazate pe 2015 alegeri generale vot alegere, vârstă, calificări, sexul, data interviului, precum și circumscripția în care trăiesc. Mai întâi, au folosit datele colectate de la vorbitori YouGov pentru a estima, printre cei care votează, proporția de persoane din fiecare tip de alegător care intenționează să voteze concediul. Ei estimează prezența la vot a fiecărui tip de alegător utilizând britanic Studiul din 2015 a alegerilor (SIC) post-electorală față-în-față sondaj, care a validat, prezența la vot din listele electorale. În cele din urmă, ei estimează cât de mulți oameni sunt de fiecare tip de alegător din electorat pe baza ultimului recensământ și Analiza anuală a populației (cu unele informații plus de BES, datele sondajului YouGov din jurul valorii de alegerile generale, precum și informații cu privire la cât de mulți oameni au votat pentru fiecare parte, în fiecare circumscripție).

    Cu trei zile înainte de vot, YouGov a arătat două puncte de plumb pentru concediul. În ajunul votului, sondajul a arătat prea aproape de apel (49-51 remain). Studiul final pe-zi a prezis 48/52 în favoarea să rămână (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). De fapt, această estimare a ratat rezultatul final (52-48 concediul) cu patru puncte procentuale.

    1. Utilizeze cadrul total de eroare la sondajul discutat în acest capitol, pentru a evalua ceea ce ar fi mers prost.
    2. răspunsul YouGov după alegeri (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) a explicat: "Acest lucru pare într-o mare parte din cauza participării - ceva ce am spus tot timpul ar fi crucială pentru rezultatul unei astfel de cursă fin echilibrat. Modelul nostru de prezența la urne a fost bazată, în parte, dacă respondenții au votat la ultimele alegeri generale și un nivel de prezență mai mare decât cel al alegerilor generale supărat modelul, mai ales în Nord. "Asta schimbă răspunsul la partea (a)?
  9. [ mediu . necesită codificare ] Scrieți o simulare pentru a ilustra fiecare dintre erorile de reprezentare în figura 3.1.

    1. Creați o situație în care aceste erori anulează efectiv.
    2. Crearea unei situații în care erorile compus reciproc.
  10. [ foarte greu . necesită codificare ] Cercetarea Blumenstock si colegii (2015) a implicat construirea unui model de învățare mașină care ar putea folosi date digitale urme pentru a prezice raspunsuri studiu. Acum, aveți de gând să încercați același lucru cu un alt set de date. Kosinski, Stillwell, and Graepel (2013) a constatat că Facebook îi place pot prezice trasaturi individuale si atribute. În mod surprinzător, aceste predicții pot fi chiar și mai precise decât cele de prieteni si colegi (Youyou, Kosinski, and Stillwell 2015) .

    1. Citește mai Kosinski, Stillwell, and Graepel (2013) , și să reproducă figura 2. sunt disponibile date lor aici: http://mypersonality.org/
    2. Acum, replica Figura 3.
    3. În cele din urmă, încercați modelul lor pe cont propriu de date Facebook: http://applymagicsauce.com/. Cât de bine funcționează pentru tine?
  11. [ mediu ] Toole et al. (2015) evidențele detaliate privind utilizarea apelului (CDR - uri) de la telefoanele mobile pentru a anticipa tendințele de șomaj agregate.

    1. Compară și proiectarea de Toole et al. (2015) cu Blumenstock, Cadamuro, and On (2015) .
    2. Crezi că ar trebui să înlocuiască CDR-uri sondaje tradiționale, le completează sau nu pot fi utilizate la toate pentru factorii de decizie politica guvernului de a urmări șomajul? De ce?
    3. Ce dovezi v-ar convinge că CDR-urile pot înlocui complet măsurile tradiționale ale ratei șomajului?