aktivity

Klíč:

  • Stupeň obtížnosti: lehká snadný , středně střední tvrdé tvrdý , velmi těžké velmi těžké
  • vyžaduje matematiku ( vyžaduje matematiku )
  • vyžaduje kódování ( vyžaduje kódování )
  • sběr dat ( sběr dat )
  • můj oblíbený ( můj oblíbený )
  1. [ tvrdý , vyžaduje matematiku ] V kapitole, byl jsem velmi pozitivně o post-stratifikace. Nicméně, to není vždy zlepšit kvalitu odhadů. Konstruovat situace, kdy může post-stratifikace může snížit kvalitu odhadů. (Pro nádechem, viz Thomsen (1973) ).

  2. [ tvrdý , sběr dat , vyžaduje kódování ] Design a provést průzkum non-pravděpodobnostní na Amazon MTurk požádat o vlastnictví zbraní ( "Opravdu, nebo má někdo ve vaší domácnosti, vlastnit zbraň, pušku nebo pistole? Je to vy nebo někdo jiný ve vaší domácnosti?") A postoje vůči kontroly zbraně ( "Co myslíte, že je důležitější, chránit právo Američanů vlastnit zbraně, nebo ke kontrole držení zbraní?").

    1. Jak dlouho trvá váš průzkum trvat? Kolik to bude stát? Jak se demografie Vašeho vzorku v porovnání s demografie obyvatel USA?
    2. Co je to syrové odhad vlastnictví zbraní pomocí svého vzorku?
    3. Správné pro non-reprezentativnost svého vzorku za použití post-stratifikaci nebo nějakou jinou techniku. A teď, co je odhad držení střelných zbraní?
    4. Jak se vaše odhady v porovnání s posledním odhadem z Pew Research Center? Co si myslíte vysvětlit nesrovnalosti, pokud existuje?
    5. Opakujte cvičení 2-5 pro postojů k ovládání zbraně. Jak se vaše výsledky liší?
  3. [ velmi těžké , sběr dat , vyžaduje kódování ] Goel a jeho kolegové (2016) podávat non-pravděpodobnosti založenou na průzkum skládající se z 49 multiple-choice postojích otázky čerpaných od General Social Survey (GSS) a vyberte průzkumů Pew Research Center na Amazonu MTurk. Oni pak nastavit pro non-reprezentativnosti dat pomocí založené na modelu post-vrstvení (Mr. P) a srovnat upravené odhady s těmi odhadnout pomocí pravděpodobnostních na bázi průzkumy GSS / lavice. Provést stejný průzkum na MTurk a pokusit se replikovat Obrázek 2a a 2b Porovnáním upravené odhady s odhady z posledních kolech GSS / Pew (viz Příloha tabulka A2 pro seznam 49 otázek).

    1. Srovnejte své výsledky s výsledky z lavice a GSS.
    2. Srovnejte své výsledky s výsledky z průzkumu MTurk v Goel, Obeng, and Rothschild (2016) .
  4. [ střední , sběr dat , vyžaduje kódování ] Mnoho studií používat selfreportových opatření dat mobilní telefon aktivity. Jedná se o zajímavý nastavení, kde mohou vědci srovnávat s vlastním hlášeno chování s přihlášeného chování (viz např Boase and Ling (2013) ). Dva běžné chování zeptat se volání a posílání SMS zpráv, a dva společné časových rámcích jsou "včera" a "v minulém týdnu."

    1. Před odběrem veškeré údaje, které self-report opatření Myslíte si, že je přesnější? Proč?
    2. Zaměstnat 5 svých přátel, aby se ve svém průzkumu. Prosím stručně shrnout, jak byly tyto 5 přátel odebrány vzorky. Může to postup při odběru vzorků vyvolat specifické předsudky ve svých odhadech?
    3. Zeptejte se jim následující micro-průzkum:
    • "Kolikrát jste použili mobilní telefon pro volání ostatní včera?"
    • "Kolik textových zpráv jste poslat včera?"
    • "Kolikrát jste používat svůj mobilní telefon pro volání ostatním v posledních sedmi dnech?"
    • "Kolikrát jste pomocí mobilního telefonu odesílat a přijímat textové zprávy SMS / v posledních sedmi dnech?" Po dokončení průzkumu, zeptejte se kontrolovat jejich data o využití jak je zaznamenána jejich telefonu nebo poskytovatele služeb.
    1. Jak se využití self-zpráva v porovnání s záznam dat? Což je nejpřesnější, což je nejméně přesné?
    2. Nyní kombinovat data, která jste shromážděné s daty od jiných lidí ve své třídě (pokud děláte tuto aktivitu pro třídu). S touto větší datové sady, zopakovat vybranou část (d).
  5. [ střední , sběr dat ] Schuman a Presser (1996) tvrdí, že otázka předběžná opatření by záležet na dva typy vztahů mezi otázky: částečný část otázek, kde dvě otázky jsou na stejné úrovni specifičnosti (např hodnocení dvou prezidentských kandidátů); i částečný celé otázky, kde obecná otázka následuje konkrétnější otázku (např otázkou: "Jak jste spokojen s vaší prací?" následuje "Jak jste spokojen se svým životem?").

    Dále charakterizují dva typy otázka objednávky efektu: efekty konzistence nastat při odpovědi na otázku, později se přiblíží (než by jinak bylo) s ustanoveními uvedenými na předchozí otázku; kontrastní efekty nastat, když existují větší rozdíly mezi odpovědí na dvě otázky.

    1. Vytvoření páru částečný dílčích otázek, které si myslíte, že bude mít velký vliv otázka pořadí, pár otázek na částečný celek, který si myslíte, že bude mít velký vliv objednávky a další pár otázek, jejichž pořadí si myslíte, že by nevadilo. Spustit průzkumu experiment na MTurk otestovat vaše dotazy.
    2. Jak velký byl částečně součástí efekt jste byli schopni vytvořit? Byl to konzistence nebo kontrastní účinek?
    3. Jak velký byl vliv na částečný celá jste byli schopni vytvořit? Byl to konzistence nebo kontrastní účinek?
    4. Byla tam otázka pořadí efekt v páru, kde jste si nemyslel, že objednávka by na tom?
  6. [ střední , sběr dat ] V návaznosti na práci Schumana a Presser, Moore (2002) popisuje samostatný rozměr otázka objednávky efektu: aditivní a subtraktivní. Zatímco kontrastu a konzistence účinky jsou produkovány jako důsledek hodnocení respondentů obou položek v souvislosti s každým jiným, přídatné látky a subtraktivní účinky jsou produkovány, když jsou respondenti více citlivý na širšího rámce, ve kterém jsou otázky položené. Přečtěte Moore (2002) , poté navrhnout a provozovat průzkumu experiment na MTurk demonstrovat aditivní nebo subtraktivní účinky.

  7. [ tvrdý , sběr dat ] Christopher Antoun a jeho kolegové (2015) provedli studii porovnávající vzorky se smíšeným získaných ze čtyř různých zdrojů online náboru: MTurk, Craigslist, Google AdWords a Facebook. Navrhnout jednoduchý průzkum a počtu účastníků prostřednictvím nejméně dvou různých zdrojů, on-line náboru (mohou být z různých zdrojů ze čtyř zdrojů používaných v Antoun et al. (2015) ).

    1. Porovnání nákladů za rekruta, z hlediska času a peněz mezi různými zdroji.
    2. Porovnávají složení vzorků získaných z různých zdrojů.
    3. Porovnat kvalitu dat mezi jednotlivými vzorky. Pro představy o tom, jak měřit kvalitu dat od respondentů, viz Schober et al. (2015) .
    4. Jaký je váš preferovaný zdroj? Proč?
  8. [ střední ] YouGov, založený na internetu, průzkum trhu firma, provedli online hlasování panelem asi 800 tisíc respondentů ve Velké Británii a použitý P. předpovědět výsledek referenda EU (tj Brexit), kde voliči UK volit buď zůstat nebo opustit evropskou unii.

    Podrobný popis YouGov je statistického modelu je zde (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Zjednodušeně řečeno, YouGov příčky voliče do typů založených na 2015 všeobecných voleb hlasování volby, věku, vzdělání, pohlaví, datum pohovoru, stejně jako volební obvod žijí v. Za prvé, oni používali údaje shromážděné z panelistů YouGov odhadnout, mezi těmi, kteří volí, podíl lidí každého druhu voličů, kteří mají v úmyslu volit odejít. Oni odhadují účast každého typu voličů pomocí britské studie z roku 2015 volební (BES) povolební face-to-face průzkumu, který potvrzeny účast od voličů. Nakonec se odhadnout, kolik lidí existuje pro každý typ voličů v voličů na základě nejnovějšího sčítání lidu a roční analýze populace (s nějakým přidávání informací od BES, údaje průzkumu YouGov z celého všeobecných voleb, a informace o tom, kolik lidí hlasovalo pro každá strana v každém volebním obvodě).

    Tři dny před hlasováním YouGov ukázal dvě bodový náskok na vstoupení. V předvečer hlasování, hlasování ukázal příliš blízko k volání (49 až 51 Zbývá). Konečný on-the-denní studie předpovídá 48/52 ve prospěch Zůstávají (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Ve skutečnosti je tento odhad minul konečný výsledek (52 - 48 dovolené) o čtyři procentní body.

    1. Použijte celkový rámec chyb průzkum popisované v této kapitole posoudit, co se mohlo pokazit.
    2. YouGov odpověď po volbách (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/~~HEAD=pobj) vysvětlil: "To se zdá být ve velké části kvůli volební účast - něco, řekli jsme po celou dobu bude rozhodující pro výsledek takového jemně vyvážené rasy. Naše účast model byl zčásti založen na tom, zda respondentů hlasovali v posledních všeobecných volbách a úroveň účast vyšší než všeobecných voleb narušit modelu, zejména na severu. "Znamená to změnit svou odpověď na části (a)?
  9. [ střední , vyžaduje kódování ] Napsat simulace pro ilustraci každý z chyb zastoupení na obrázku 3.1.

    1. Vytváří situaci, kdy tyto chyby ve skutečnosti vyruší.
    2. Vytváří situaci, kdy k chybám sloučenina navzájem.
  10. [ velmi těžké , vyžaduje kódování ] Výzkum Blumenstock a kolegové (2015) účastní budování učení modelu stroj, který mohl používat digitální data trasování předpovědět odpovědí v průzkumu. Nyní se pokusíme to samé s jiným datové sady. Kosinski, Stillwell, and Graepel (2013) zjistili, že Facebook má rád může předvídat individuální vlastnosti a atributy. Překvapivě, tyto předpovědi mohou být ještě přesnější než u přátel a kolegů (Youyou, Kosinski, and Stillwell 2015) .

    1. Přečtěte si Kosinski, Stillwell, and Graepel (2013) , a replikovat Obrázek 2. jsou zde k dispozici Jejich údaje: http://mypersonality.org/
    2. Nyní replikovat Obrázek 3.
    3. Konečně, zkuste svůj model na svém vlastním údajům na Facebooku: http://applymagicsauce.com/. Jak dobře to funguje pro vás?
  11. [ střední ] Toole et al. (2015) detail použití záznamy Call (CDR) z mobilních telefonů předvídat souhrnné trendy v nezaměstnanosti.

    1. Srovnat a odlišit design Toole et al. (2015) s Blumenstock, Cadamuro, and On (2015) .
    2. Myslíte si, že CDR by měla nahradit tradiční průzkumy, doplňovat je či není možné použít vůbec pro vládní politiky, aby sledovat nezaměstnanost? Proč?
    3. Jaké důkazy by vás přesvědčit, že CDR mohou zcela nahradit tradiční opatření míry nezaměstnanosti?