aktivity

  • stupeň obtiažnosti: ľahké jednoduchý , stredná stredná , ťažké usilovne , veľmi ťažké veľmi ťažké
  • vyžaduje matematiku ( vyžaduje matematiku )
  • vyžaduje kódovanie ( vyžaduje kódovanie )
  • zber dát ( zber dát )
  • moje obľúbené ( môj obľúbený )
  1. [ usilovne , vyžaduje matematiku ] V kapitole som bol veľmi pozitívny na post stratifikácie. To však nie vždy zlepšuje kvalitu odhadov. Vytvorte situáciu, keď post-stratifikácia môže znížiť kvalitu odhadov. (Pokyn nájdete v Thomsen (1973) .)

  2. [ usilovne , zber dát , vyžaduje kódovanie ] Navrhnite a vykonajte prieskum s nepravdepodobnosťou na Amazon Mechanical Turk, aby ste sa spýtali na vlastníctvo zbraní a postoje voči kontrole zbrane. Aby ste mohli porovnať svoje odhady s údajmi odvodenými z pravdepodobnostnej vzorky, skopírujte text otázky a možnosti odpovede priamo z vysoko kvalitného prieskumu, ako sú tie, ktoré spravuje Pew Research Center.

    1. Ako dlho trvá váš prieskum? Koľko to stojí? Ako sa demografické údaje vašej vzorky porovnávajú s demografickými údajmi populácie USA?
    2. Aký je hrubý odhad vlastníctva zbraní pomocou vašej vzorky?
    3. Opravte svoju nereprezentatívnu vzorku pomocou post stratifikácie alebo nejakej inej techniky. Aký je odhad vlastníctva zbraní?
    4. Ako sa porovnávajú vaše odhady s najnovším odhadom z vzorky založenej na pravdepodobnostiach? Čo si myslíte, že vysvetľuje nezrovnalosti, ak existujú nejaké nezrovnalosti?
    5. Opakujte otázky (b) - (d) o postojoch voči kontrole pištole. Ako sa vaše zistenia líšia?
  3. [ veľmi ťažké , zber dát , vyžaduje kódovanie ] Goel a kolegovia (2016) spravovali 49 otázok týkajúcich sa viacerých odpovedí, ktoré vychádzali z Všeobecného sociálneho prieskumu (GSS) a vybrali prieskumy z Centra výskumu Pew na vzorky respondentov, ktorí nie sú pravdepodobné, od Amazon Mechanical Turk. Potom sa prispôsobili nereprezentatívnosti údajov pomocou modelovej post-stratifikácie a porovnali svoje upravené odhady s odhadmi z prieskumov GSS a Pew založených na pravdepodobnostiach. Vykonajte rovnaký prieskum na Amazon Mechanical Turk a pokúste sa zopakovať obrázok 2a a obrázok 2b porovnaním vašich upravených odhadov s odhadmi z posledných kôl prieskumov GSS a Pew. (Pozri dodatok v tabuľke A2 pre zoznam 49 otázok.)

    1. Porovnajte a kontrastujte svoje výsledky s výsledkami z Pew a GSS.
    2. Porovnajte a kontrastujte svoje výsledky s výsledkami prieskumu Mechanical Turk v Goel, Obeng, and Rothschild (2016) .
  4. [ stredná , zber dát , vyžaduje kódovanie ] V mnohých štúdiách sa používajú meradlá používané v mobilných telefónoch. Toto je zaujímavé prostredie, v ktorom vedci môžu porovnávať vlastné správanie so zaznamenaným správaním (pozri napr. Boase and Ling (2013) ). Dve bežné správanie, ktoré sa pýtajú, sú volanie a odosielanie správ, a dva spoločné časové rámce sú "včera" a "v minulom týždni".

    1. Pred zhromažďovaním akýchkoľvek údajov, ktoré z vlastných správ považujete za presnejšie? Prečo?
    2. Pridajte piatich vašich priateľov, aby ste boli v prieskume. Stručne zhrňte, ako boli odobratí vzorky týchto piatich priateľov. Mohol by tento postup výberu vzorky spôsobiť určité odklonenie vo vašich odhadoch?
    3. Opýtajte sa ich na nasledujúce otázky týkajúce sa mikroúverov:
    • "Koľkokrát ste včera použili mobilný telefón na zavolanie ostatných?"
    • "Koľko textových správ ste poslali včera?"
    • "Koľkokrát ste použili mobilný telefón na zavolanie ostatných za posledných sedem dní?"
    • "Koľkokrát ste použili svoj mobilný telefón na odosielanie alebo prijímanie textových správ / SMS počas posledných siedmich dní?"
    1. Po dokončení tohto mikroúboru požiadajte o kontrolu dát o používaní, ktoré zaznamenal ich telefón alebo poskytovateľ služieb. Ako sa porovnáva používanie vlastnej správy s údajmi denníka? Čo je najpresnejšie, čo je najmenej presné?
    2. Teraz skombinujte údaje, ktoré ste zhromaždili s údajmi od iných ľudí vo vašej triede (ak robíte túto aktivitu pre triedu). Pomocou tejto väčšej množiny údajov opakujte časť (d).
  5. [ stredná , zber dát ] Schuman a Presser (1996) tvrdia, že otázky týkajúce sa otázok by mali mať význam pre dva druhy otázok: časti otázky, kde sú dve otázky na rovnakej úrovni špecifickosti (napr. Hodnotenie dvoch kandidátov na prezidenta); a čiastočne celých otázok, kde sa všeobecná otázka riadi konkrétnejšou otázkou (napr. otázka "Ako ste spokojný / á s vašou prácou?" a nasleduje "Ako ste spokojný so svojím životom?").

    Ďalej charakterizujú dva typy účinkov na otázky: dôsledky konzistencie sa vyskytujú vtedy, keď sa odpovede na neskoršiu otázku približujú (ako by inak boli) k otázkam uvedeným v predchádzajúcej otázke; kontrastné účinky sa vyskytujú, ak existujú väčšie rozdiely medzi odpoveďami na dve otázky.

    1. Vytvorte pár častí otázok, o ktorých si myslíte, že budú mať veľký vplyv na otázky; pár čiastočne celých otázok, o ktorých si myslíte, že budú mať veľký efekt; a pár otázok, ktorých poradie si myslíte, že by nezáležalo. Spustite prieskumný experiment na Amazon Mechanical Turk, aby ste otestovali svoje otázky.
    2. Ako veľký efekt čiastočnej časti ste mohli vytvoriť? Bolo to konštantný alebo kontrastný efekt?
    3. Aký veľký čiastočný efekt ste mohli vytvoriť? Bolo to konštantný alebo kontrastný efekt?
    4. Bola nejaká otázka týkajúca sa poradia vo vašom páre, kde ste si nemysleli, že objednávka bude záležitosť?
  6. [ stredná , zber dát ] Na základe práce Schumana a Pressera, Moore (2002) opisuje samostatný rozmer efektu poradia otázok: aditívne a subtraktívne efekty. Zatiaľ čo účinky kontrastu a konzistencie sa vytvárajú ako dôsledok hodnotenia oboch položiek respondentov vo vzájomných vzťahoch, aditívne a subtraktívne efekty sa vytvárajú, keď sú respondenti citlivejší na väčší rámec, v rámci ktorého sú otázky položené. Prečítajte si Moore (2002) a navrhnite a vykonajte prieskumný experiment na MTurk, aby ste preukázali aditívne alebo subtraktívne účinky.

  7. [ usilovne , zber dát ] Christopher Antoun a kolegovia (2015) uskutočnili štúdiu porovnávajúcu ukážky pohodlia získané zo štyroch rôznych online zdrojov: MTurk, Craigslist, Google AdWords a Facebook. Navrhnite jednoduchý prieskum a získajte účastníkov aspoň dvoma rôznymi zdrojmi online náboru (tieto zdroje sa môžu líšiť od štyroch zdrojov, ktoré používa Antoun et al. (2015) ).

    1. Porovnajte náklady na jedného náboru - z hľadiska peňazí a času - medzi rôznymi zdrojmi.
    2. Porovnajte zloženie vzoriek získaných z rôznych zdrojov.
    3. Porovnajte kvalitu údajov medzi vzorkami. Informácie o tom, ako merať kvalitu údajov od respondentov, nájdete v Schober et al. (2015) .
    4. Aký je váš preferovaný zdroj? Prečo?
  8. [ stredná ] V snahe predpovedať výsledky referenda o EÚ 2016 (tj spoločnosť Brexit) spoločnosť YouGov - internetová spoločnosť na prieskum trhu - uskutočnila online prieskumy panelu približne 800 000 respondentov v Spojenom kráľovstve.

    Podrobný opis štatistického modelu spoločnosti YouGov nájdete na adrese https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Zhruba povedané, YouGov rozdelil voličov na typy založené na voľbe volieb vo všeobecnom volebnom období vo veku 2015, veku, kvalifikácii, pohlaví a termíne rozhovoru, ako aj na volebnom obvode, v ktorom žili. Najprv použili údaje zhromaždené od panelistov YouGov, aby odhadli medzi tými, ktorí hlasovali, podiel ľudí z každého druhu voličov, ktorí mali v úmysle hlasovať. Odhadovali účasť každého druhu voličov pomocou volebnej štúdie (BES) z roku 2015, po voľbách priamych prieskumov, ktoré potvrdili účasť na voľbách z volebných zoznamov. Nakoniec odhadli, koľko ľudí bolo z každého voliča vo voličstve, na základe najnovšieho sčítania ľudu a ročného zisťovania o populácii (s niektorými doplňujúcimi informáciami z iných zdrojov údajov).

    Tri dni pred hlasovaním ukázal YouGov dvojstupňový náskok pre dovolenku. V predvečer hlasovania prieskum uviedol, že výsledok bol príliš blízko volania (49/51 zostáva). Konečná štúdie očakávala 48/52 v prospech spoločnosti Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). V skutočnosti tento odhad zmeškal konečný výsledok (52/48 Leave) o štyri percentuálne body.

    1. Použite celkový rámcový prehľad týkajúci sa chýb, ktorý je popísaný v tejto kapitole, aby ste zhodnotili, čo sa mohlo pokaziť.
    2. YouGovova odpoveď po voľbách (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) vysvetlila: "Zdá sa to vo veľkej miere kvôli volebnej účasti - niečo, čo celkom sme povedali, že bude rozhodujúci pre výsledok takého jemne vyváženého preteku. Náš volebný model bol založený čiastočne na tom, či respondenti hlasovali na posledných všeobecných voľbách a úroveň volebnej účasti nad úrovňou všeobecných volieb narušila model, najmä na severe. "Zmenila to vaša odpoveď na časť (a)?
  9. [ stredná , vyžaduje kódovanie ] Napíšte simuláciu, aby ste ilustrovali každú chybu reprezentácie na obrázku 3.2.

    1. Vytvorte situáciu, v ktorej sa tieto chyby skutočne zrušia.
    2. Vytvorte situáciu, v ktorej sa chyby navzájom zlúčia.
  10. [ veľmi ťažké , vyžaduje kódovanie ] Výskum spoločností Blumenstock a kolegov (2015) zahŕňal vytvorenie modelu strojového učenia, ktorý by mohol využívať digitálne stopové dáta na predpovedanie odpovedí prieskumu. Teraz vyskúšate to isté s iným súborom údajov. Kosinski, Stillwell, and Graepel (2013) zistili, že Facebook má rád možnosť predpovedať jednotlivé črty a atribúty. Je prekvapujúce, že tieto predpovede môžu byť dokonca presnejšie než predpovede priateľov a kolegov (Youyou, Kosinski, and Stillwell 2015) .

    1. Prečítajte si Kosinski, Stillwell, and Graepel (2013) a opakujte obrázok 2. Ich údaje sú k dispozícii na http://mypersonality.org/
    2. Teraz replikujte obrázok 3.
    3. Nakoniec vyskúšajte ich model na svojich vlastných údajoch Facebook: http://applymagicsauce.com/. Ako dobre funguje pre vás?
  11. [ stredná Toole et al. (2015) použili záznamy o detailoch hovoru (CDR) z mobilných telefónov s cieľom predpovedať celkové trendy nezamestnanosti.

    1. Porovnajte a kontrast štúdie štúdie Toole et al. (2015) s Blumenstock, Cadamuro, and On (2015) .
    2. Myslíte si, že CDR by mali nahradiť tradičné prieskumy, dopĺňať ich alebo vôbec sa nesmie použiť na to, aby vládni činitelia v oblasti politiky sledovali nezamestnanosť? Prečo?
    3. Aké dôkazy by vás presvedčili, že CDR môžu úplne nahradiť tradičné miery nezamestnanosti?