Tevékenységek

  • nehézségi fok: könnyű könnyen , közepes közepes , kemény kemény , nagyon nehéz nagyon nehéz
  • matematikai követelményt igényel ( matematikai követelményt igényel )
  • kódolást igényel ( kódolást igényel )
  • adatgyűjtés ( adatgyűjtés )
  • a kedvenceim ( a kedvencem )
  1. [ kemény , matematikai követelményt igényel ] A fejezetben nagyon pozitív volt a poszt-rétegződés. Ez azonban nem mindig javítja a becslések minőségét. Olyan helyzetet kell kialakítanunk, ahol a poszt-rétegződés csökkentheti a becslések minőségét. (Lásd a Thomsen (1973) .)

  2. [ kemény , adatgyűjtés , kódolást igényel ] Tervezzen és hajtson végre egy nem valószínűségi felmérést az Amazon Mechanical Turk-ről, hogy kérdezze meg a pisztoly tulajdonjogát és a fegyverellenőrzéshez való hozzáállást. Annak érdekében, hogy összehasonlíthassa becsléseit a valószínűségi mintából származókkal, kérjük, másolja át a kérdezőszövegeket és válaszbeállításokat közvetlenül egy magas minőségű felmérésből, például a Pew Research Center által működtetett felmérésből.

    1. Meddig tart a felmérése? Mennyibe kerül? Hogyan hasonlít össze a minta demográfiai adatai az amerikai népesség demográfiai jellemzőivel?
    2. Mi a nyers becslés a fegyverhasználatról a minta felhasználásával?
    3. Helyes a minta nem reprezentativitására, utólagos rétegzés vagy más technika alkalmazásával. Most mi a becslés a pisztoly tulajdonlásáról?
    4. Hogyan becsülik meg becsléseid a valószínűségi alapú minta legfrissebb becslését? Mit gondolsz, miért magyarázza az eltéréseket, ha vannak?
    5. Ismételje meg a (b) - (d) kérdést a pisztoly-irányításhoz való hozzáállás tekintetében. Hogyan különböznek a megállapításai?
  3. [ nagyon nehéz , adatgyűjtés , kódolást igényel ] Goel és munkatársai (2016) 49 általános választási kérdést választottak ki az általános szociális felmérésből (GSS), és a Pew Research Center által készített felméréseket választották ki az Amazon Mechanical Turk-től szerzett válaszadók nem valószínűségi mintájára. Ezután az adatok nem reprezentativitására igazították a modell alapú utólagos rétegződést, és összehasonlították a becsült becsléseket a valószínűségi alapú GSS és Pew felmérésekkel. Végezd el ugyanazt a felmérést az Amazon Mechanical Turk-ről, és próbálj meg másolni a 2a. És 2b. Ábrát, összehasonlítva a becsült becsléseket a GSS és a Pew felmérések legfrissebb fordulóinak becsléseivel. (Lásd az A2 függelék táblázatot a 49 kérdés listájához.)

    1. Összehasonlíthatja és összehasonlíthatja az eredményeket a Pew és a GSS segítségével.
    2. Hasonlítsd össze és hasonlítsd össze az eredményeket a Mechanical Turk felméréséből Goel, Obeng, and Rothschild (2016) .
  4. [ közepes , adatgyűjtés , kódolást igényel ] Számos tanulmány a mobiltelefon használatáról szóló önként bejelentett intézkedéseket használja. Ez egy érdekes környezet, amelyben a kutatók összehasonlíthatják az önmagukban jelentett viselkedést a naplózott viselkedéssel (lásd pl. Boase and Ling (2013) ). Két gyakori magatartás a hívás és a szövegezés, a két közös idő "tegnap" és "az elmúlt héten".

    1. Mielőtt összegyűjtené az adatokat, mely önrejelentési intézkedések közül melyik szerint pontosabb? Miért?
    2. Tegyen fel öt barátait a felméréshez. Röviden összefoglaljuk, hogy miként vettük fel ezeket az öt barátot. Lehet, hogy ez a mintavételi eljárás konkrét előítéleteket idéz elő becslései során?
    3. Kérdezze meg tőlük a következő mikroszöveti kérdéseket:
    • "Hányszor használta mobiltelefonját, hogy tegnap felhívja a többieket?"
    • "Hány szöveges üzenetet küldtél tegnap?"
    • "Hányszor használta mobiltelefonját, hogy másoknak hívja az elmúlt hét napban?"
    • "Hányszor használta mobiltelefonját SMS-ek küldésére és fogadására az elmúlt hét napban?"
    1. Miután elkészült a mikroszkennelés, kérdezze meg, hogy a telefonja vagy a szolgáltatója naplózza-e a használati adatokat. Hogyan hasonlítható össze az önálló jelentés felhasználása a naplóadatokkal? Melyik a legpontosabb, ami a legkevésbé pontos?
    2. Most kombinálja az összegyűjtött adatokat az osztályának más tagjaival (ha egy adott osztályhoz tartozó tevékenységet végez). Ezzel a nagyobb adatsorral ismételje meg a (d) részt.
  5. [ közepes , adatgyűjtés ] Schuman és Presser (1996) azt állítják, hogy a kérdőívek két kérdéstípusra vonatkoznak: olyan rész-részkérdések, amelyekben két kérdés azonos szintű szinten van (pl. Két elnöki jelölt minősítése); és részkomponensű kérdésekre, ahol egy általános kérdés egy konkrétabb kérdést követ (pl. megkérdezi: "mennyire elégedett a munkájával?", majd ezt követte: "mennyire elégedett az életével?").

    Továbbá a kérdésrendi hatás két típusát jellemzik: a konzisztencia hatása akkor következik be, amikor a későbbi kérdésre adott válaszok közelebb kerülnek (mint egyébként) a korábbi kérdéshez adott válaszokhoz; a kontraszthatások akkor fordulnak elő, ha nagyobb különbségek vannak a két kérdésre adott válaszok között.

    1. Hozzon létre egy pár részkérdéses kérdést, amelyekről úgy gondolja, hogy nagy kérdőíves hatása lesz; egy pár rész-egész kérdés, amelyről úgy gondolja, hogy nagy rendű hatása lesz; és olyan kérdésekre, amelyeknek sorrendje szerinted nem számít. Futtasson felmérési kísérletet az Amazon Mechanical Turk-en, hogy tesztelje kérdéseit.
    2. Milyen nagy volt a rész-rész hatása? Ez konzisztencia vagy kontraszthatás volt?
    3. Milyen nagy volt a rész-egész hatása? Ez konzisztencia vagy kontraszthatás volt?
    4. Volt kérdéses rendezési hatás a párban, ahol nem gondolta, hogy a rend számítana?
  6. [ közepes , adatgyűjtés ] Schuman és Presser munkájára építve Moore (2002) a kérdésrendi hatás különálló dimenzióját írja le: additív és kivonó hatások. A kontraszt és a konzisztencia hatása a válaszadók két egymáshoz viszonyított elemzésének következtében keletkezik, additív és kivonó hatások keletkeznek, amikor a válaszadók érzékenyebbek a nagyobb keretre, amelyen belül a kérdések merülnek fel. Olvassa el Moore (2002) , majd tervezzen és futtasson egy felmérési kísérletet a MTurk-ra, hogy bemutassa az additív vagy kivonó hatásokat.

  7. [ kemény , adatgyűjtés ] Christopher Antoun és munkatársai (2015) tanulmányt készítettek, amelyben összehasonlították a négy különböző online toborzási forrásból szerzett előnyöket: a MTurk, a Craigslist, a Google AdWords és a Facebook. Készíts egy egyszerű felmérést, és vegyen fel résztvevőket legalább két különböző online toborzó forráson keresztül (ezek a források eltérhetnek az Antoun et al. (2015) használt négy forrásból).

    1. Hasonlítsa össze a pénzt és az időt - toborzási költségeket - a különböző források között.
    2. Hasonlítsa össze a különböző forrásokból származó minták összetételét.
    3. Hasonlítsa össze az adatok minőségét a minták között. A válaszadók adatminőségének mérésére vonatkozó ötleteket lásd Schober et al. (2015) .
    4. Mi a kedvenc forrásod? Miért?
  8. [ közepes ] A 2016-os EU-népszavazás (azaz a Brexit) eredményeinek előrejelzésére a YouGov internetes piackutató cég végzett online felméréseket az Egyesült Királyságban mintegy 800 000 válaszadóból.

    A YouGov statisztikai modelljének részletes leírása megtalálható a https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/ címen. Összességében elmondható, hogy a YouGov a választópolgárokat a 2015-ös általános választójogi választáson, az életkoron, a képesítésen, a nemen és a meghallgatás időpontján, valamint az adott választókerületen alapuló típusokra osztotta. Először a YouGov panelistáktól gyűjtött adatokat használták fel arra, hogy a szavazók körében becsülje meg az egyes választópolgárok népességének azon arányát, akik szavazásra szánták. Becslések szerint az egyes választópolgárok részvételét a 2015-ös brit választási tanulmány (BES) segítségével választották ki a választások utáni szemináriumon, amely érvényesítette a választói névjegyzékből való részvételt. Végül becsülték meg, hogy hány ember van a szavazók típusában a választók között a legújabb népszámlálási és éves népességi felmérés alapján (néhány további információból származó további információ).

    Három nappal a szavazást megelőzően YouGov kétpontos vezetést mutatott a Szabadságra. A szavazás előestéjén a szavazás azt mutatta, hogy az eredmény túlságosan közel volt a híváshoz (49/51 Remain). Az utolsó napi tanulmány 48/52-et jelzett a Remain javára (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Valójában ez a becslés négy százalékponttal elmaradt a végeredménytől (52/48 szabadság).

    1. Használja az ebben a fejezetben tárgyalt teljes felmérési hiba keretrendszert, hogy felmérje, mi lehetett volna rosszul elmozdulni.
    2. YouGov válasza a válasz után (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) magyarázta: "Ez nagyrészt a részvételi Mindig elmondtuk, hogy döntő fontosságú lenne egy ilyen finoman kiegyensúlyozott verseny kimeneteléhez. A részvételi arányunk részben azon alapult, hogy a válaszadók a legutóbbi általános választásokon szavaztak-e, és az általános választások fölötti részvételi szint felborította-e a modellt, különösen az északon. "Ez megváltoztatja a választ az a) részre?
  9. [ közepes , kódolást igényel ] Írjon be egy szimulációt a 3.2 ábrán látható reprezentációs hibák bemutatására.

    1. Olyan helyzetet hozzon létre, ahol ezek a hibák ténylegesen megszűnnek.
    2. Olyan helyzetet hozzon létre, ahol a hibák összetettek egymással.
  10. [ nagyon nehéz , kódolást igényel ] A Blumenstock és munkatársai (2015) kutatásai során olyan gépi tanulási modellt építettek, amely digitális nyomkövetési adatokat használhat a felmérési válaszok előrejelzésére. Most ugyanazt fogod kipróbálni egy másik adathalmazgal. Kosinski, Stillwell, and Graepel (2013) találta, hogy a Facebook szeret is megjósolni az egyéni tulajdonságokat és attribútumokat. Meglepő módon ezek a becslések még pontosabbak lehetnek, mint a barátok és kollégák (Youyou, Kosinski, and Stillwell 2015) .

    1. Olvassa el Kosinski, Stillwell, and Graepel (2013) , és ismételje meg a 2. ábrát. Adataik a következő címen érhetők el: http://mypersonality.org/
    2. Most, reprodukálja a 3. ábrát.
    3. Végül kipróbáld a modelledet saját Facebookadatain: http://applymagicsauce.com/. Mennyire jól működik az Ön számára?
  11. [ közepes Toole et al. (2015) a mobiltelefonoktól származó hívásadat-nyilvántartásokat (CDR-eket) használta az aggregált munkanélküliség alakulásának előrejelzésére.

    1. Összehasonlítva és ellentétes a Toole et al. (2015) , a Blumenstock, Cadamuro, and On (2015) .
    2. Gondolod, hogy a CDR-k helyettesítenék a hagyományos felméréseket, kiegészítenék őket, vagy egyáltalán nem használnák az állami politikai döntéshozókat a munkanélküliség nyomon követésére? Miért?
    3. Milyen bizonyítékok győztek meg arról, hogy a CDR-k teljesen helyettesíthetik a munkanélküliségi ráta hagyományos mértékét?