дзейнасць

  • Ступень складанасці: лёгкі лёгка , сярэдні серада , жорсткі жорсткі , Вельмі цяжка вельмі цяжка
  • патрабуе матэматыкі ( патрабуе матэматыкі )
  • патрабуе кадавання ( патрабуе кадавання )
  • збор дадзеных ( збор дадзеных )
  • мае любімыя ( мой любімы )
  1. [ жорсткі , патрабуе матэматыкі ] У гэтай чале, я быў вельмі пазітыўна пасля стратыфікацыі. Аднак, гэта не заўсёды паляпшае якасць ацэнак. Пабудаваць такую ​​сітуацыю, калі постстратификация можа знізіць якасць ацэнак. (Для намёкам см Thomsen (1973) .)

  2. [ жорсткі , збор дадзеных , патрабуе кадавання ] Распрацоўка і правядзенне абследавання не імавернасную на Amazon Mechanical Turk, каб спытаць аб уласнасці пісталета і дачыненні да кантролю стрэльбы. Так што вы можаце параўнаць свае ацэнкі на тыя, якія атрыманы з імавернаснай выбаркі, скапіяваўшы тэкст пытання і варыянты адказу непасрэдна з апытання высокай якасці, такія як праграмы даследчага цэнтра Pew.

    1. Як доўга ваш апытанне зойме? Колькі каштуе? Як дэмаграфія вашага ўзору параўнаць з дэмаграфіяй насельніцтва ЗША?
    2. Што такое сыравіну ацэнкі уласнасці зброі, выкарыстоўваючы свой узор?
    3. Правільна для nonrepresentativeness вашага ўзору з дапамогай постстратификация ці якой-небудзь іншай тэхнікі. Цяпер тое, што ацэнка валодання зброяй?
    4. Як вашы ацэнкі параўнаць з апошняй ацэнкай ад верагоднасці на аснове ўзору? Як вы думаеце, тлумачыць разыходжанні, калі такія маюцца?
    5. Паўторныя пытанні (б) - (г) для кантролю адносіны да пісталета. Як вашы вынікі адрозніваюцца?
  3. [ вельмі цяжка , збор дадзеных , патрабуе кадавання ] Гоел і яго калегі (2016) ўводзяць 49 множных выбар пытанняў паводніцкіх намаляваных ад агульнага сацыяльнага абследавання (GSS) і абярыце абследавання даследчага цэнтрам Pew ня-імавернасную выбарку рэспандэнтаў намаляваных ад Amazon Mechanical Turk. Затым яны з папраўкай на не-рэпрэзентатыўнасці дадзеных з выкарыстаннем мадэлі на аснове постстратификация і параўналі іх удакладненыя ацэнкі з тымі, ад верагоднасці на аснове ГСС і Pew абследаванняў. Правядзенне ж апытанне на Amazon Mechanical Turk і паспрабаваць паўтарыць малюнак 2a і малюнак 2b, параўноўваючы свае удакладненыя ацэнкі з ацэнкамі з самых апошніх раўндаў абследаванняў ГСС і Pew. (Глядзі дадатак табліцы А2 ў спіс з 49 пытанняў.)

    1. Параўнайце і супастаўце вашы вынікі з тымі з Pew і ГСС.
    2. Параўнайце і супастаўце вашы вынікі з тымі , ад абследавання Mechanical Turk ў Goel, Obeng, and Rothschild (2016) .
  4. [ серада , збор дадзеных , патрабуе кадавання ] Шматлікія даследаванні выкарыстоўваюць самасправаздачы меры выкарыстання мабільнага тэлефона. Гэта цікавая абстаноўка , у якой даследчыкі могуць параўнаць самастойна паведамілі паводзіны з рэгіструецца паводзінамі (гл , напрыклад, Boase and Ling (2013) ). Два агульнай паводзіны, каб спытаць пра выклікаем і тэкставыя паведамленні, а таксама два агульныя часовых рамак з'яўляюцца «ўчора» і «на мінулым тыдні.»

    1. Перад зборам якіх-небудзь дадзеных, якія ў самасправаздачы меры вы думаеце, з'яўляецца больш дакладным? Чаму?
    2. Набіраем пяць вашых сяброў, каб быць у вашым апытанні. Просьба коратка падсумаваць, як адбіраліся гэтыя пяць сяброў. Можа гэтая працэдура адбору выклікаюць пэўныя перакосы ў сваіх ацэнках?
    3. Задайце ім наступныя пытанні MicroSurvey:
    • «Колькі разоў вы выкарыстоўваеце свой мабільны тэлефон, каб патэлефанаваць іншым ўчора?»
    • «Колькі тэкставых паведамленняў вы адправілі ўчора?»
    • «Колькі разоў вы выкарыстоўваеце свой мабільны тэлефон, каб патэлефанаваць іншым у апошнія сем дзён?"
    • «Колькі разоў вы выкарыстоўваеце свой мабільны тэлефон, каб адпраўляць або атрымліваць тэкставыя паведамленні / SMS на працягу апошніх сямі дзён?"
    1. Пасля гэтага MicroSurvey было завершана, папытаеце, каб праверыць свае дадзеныя аб выкарыстанні ў якасці пратакаліруецца іх тэлефона або пастаўшчыка паслуг. Як выкарыстанне самасправаздачы параўнаць дадзеныя часопіса? Што з'яўляецца найбольш дакладным, што з'яўляецца найменш дакладным?
    2. Цяпер аб'яднаць дадзеныя, якія вы сабралі з дадзенымі іншых людзей у класе (калі вы робіце гэта практыкаванне для класа). З дапамогай гэтага набору дадзеных большага, паўтарыць частка (d).
  5. [ серада , збор дадзеных ] Шуман і прыціскной (1996) сцвярджаюць , што пытанне заказаў будзе мець значэння для двух тыпаў пытанняў: частка-частка пытанняў , дзе два пытанні знаходзяцца на тым жа ўзроўні спецыфічнасці (напрыклад, рэйтынгі двух кандыдатаў у прэзідэнты); і часткова цэлыя пытанні, дзе агульны пытанне варта больш канкрэтнае пытанне (напрыклад, пытанне: «Наколькі вы задаволеныя сваёй працай?», а затым «Наколькі вы задаволеныя сваім жыццём?»).

    Акрамя таго, яны характарызуюць два тыпу эфекту парадку пытанне: кансістэнцыя эфекты ўзнікаюць, калі адказы на больш позні пытанне набліжаны (чым яны маглі б быць), прыведзенымі на раней зададзенае пытанне; кантрасныя эфекты ўзнікаюць, калі існуюць вялікія адрозненні паміж адказамі на два пытанні.

    1. Стварыць пару няпоўнай часткі пытанняў, якія вы думаеце, будзе мець вялікі эфект парадку пытанне; пара няпоўных цэлым пытанні, якія вы думаеце, будзе мець вялікі эфект парадку; і пара пытанняў, парадак вы думаеце, не мае значэння. Выканаць абследаванне эксперымент на Amazon Mechanical Turk, каб праверыць вашыя пытанні.
    2. Як вялікая частка частак эфект, які вы ў стане стварыць былі? Ці было гэта кансістэнцыя ці эфект кантрасту?
    3. Як большая частка-цэлае эфект, які вы ў стане стварыць былі? Ці было гэта кансістэнцыя ці эфект кантрасту?
    4. Ці быў пытанне эфект парадку ў вашай пары, дзе вы не думаеце, што парадак будзе мець значэнне?
  6. [ серада , збор дадзеных ] Грунтуючыся на працы Шумана і прыціскной, Moore (2002) апісвае асобны аспект эфекту парадку пытанне: адытыўная і субтрактивных эфекты. У той час як кантраст і паслядоўнасць эфекты ўтвараюцца ў выніку ацэнак рэспандэнтаў двух элементаў ў адносінах адзін да аднаго, дабаўкі і адымаецца эфекты атрымліваюцца, калі рэспандэнты будуць больш адчувальныя да больш шырокім рамкам, на працягу якога ставяцца пытанні. Чытайце Moore (2002) , а затым распрацаваць і запусціць аглядны эксперымент па MTurk прадэманстраваць адытыўная або субтрактивные эфекты.

  7. [ жорсткі , збор дадзеных ] Крыстафер Antoun і калегі (2015) правялі даследаванне , параўноўваючы ўзоры выгоды , атрыманыя з чатырох розных крыніц у Інтэрнэце рэкрутынгу: MTurk, Craigslist, Google AdWords і Facebook. Дызайн простага апытання і прыцягненне ўдзельнікаў па меншай меры , два розных крыніц у Інтэрнэце рэкрутынгу (гэтыя крыніцы могуць адрознівацца ад чатырох крыніц , якія выкарыстоўваюцца ў Antoun et al. (2015) і Antoun et al. (2015) ).

    1. Параўнайце кошт кожнага прызыўніка ў тэрмінах часу і грошай-паміж рознымі крыніцамі.
    2. Параўнанне складу узораў, атрыманых з розных крыніц.
    3. Параўнайце якасць дадзеных паміж ўзорамі. Для ідэй аб тым , як вымераць якасць дадзеных ад рэспандэнтаў, см Schober et al. (2015) і Schober et al. (2015) .
    4. Што ваш пераважны крыніца? Чаму?
  8. [ серада ] У спробе спрагназаваць вынікі 2016 года ЕС Рэферэндум (г.зн. Brexit), YouGov-Інтэрнэт на аснове маркетынгавых даследаванняў фірмы-правялі онлайн-апытанні панэлі каля 800000 рэспандэнтаў у Злучаным Каралеўстве.

    Падрабязнае апісанне статыстычнай мадэлі YouGov можна знайсці на https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Груба кажучы, YouGov размяркоўвалі выбаршчыкаў на тыпы, заснаваныя на 2015 усеагульных выбараў выбару галасоў, ўзросту, кваліфікацыі, полу і даты сумоўя, а таксама выбарчай акругі, у якім яны жылі. Па-першае, яны выкарысталі дадзеныя, сабраныя з дэгустатараў YouGov ацаніць, сярод тых, хто галасаваў, доля людзей кожнага тыпу выбаршчыкаў, якія мелі намер галасаваць водпуску. Яны ацанілі яўку кожнага тыпу выбаршчыкаў з дапамогай 2015 British Study Выбарчага (BES), пасля выбараў тварам да твару абследаванне, якое правераная яўку з выбарчых спісаў. Нарэшце, яны вызначылі, колькі людзей былі кожным тыпу выбаршчыкаў у электараце, на аснове апошняга перапісу насельніцтва і штогадовае абследаванне насельніцтва (з некаторай адытыўная інфармацыяй з іншых крыніц дадзеных).

    За тры дні да галасавання, YouGov паказаў два ачкі для адпачынку. Напярэдадні галасавання, апытанне паказала, што вынік быў занадта блізка да тэлефона (49/51 Застаюцца). Канчатковае даследаванне-дзень прадказваў 48/52 на карысць Застаюцца (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). На самай справе, гэтая адзнака прапушчаны канчатковы вынік (52/48 Leave) на чатыры працэнтных пункта.

    1. Выкарыстоўвайце агульную структуру памылкі абследавання абмяркоўваюцца ў гэтым раздзеле, каб ацаніць тое, што магло пайсці не так.
    2. Адказ YouGov пасля выбараў (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) растлумачыў: «Гэта, здаецца, у значнай ступені з-за стрелочных-то, што мы ўжо гаварылі ўсе разам будзе мець вырашальнае значэнне для зыходу такой тонка збалансаванай расы. Наша мадэль яўка была заснавана, у прыватнасці, ад таго, рэспандэнтаў прагаласавалі на апошніх усеагульных выбарах і ўзровень яўкі вышэй, чым усеагульных выбараў перакуліць мадэль, асабліва на Поўначы. »Ці змяніўся ваш адказ на часткі (а)?
  9. [ серада , патрабуе кадавання ] Напішыце мадэляванне, каб ілюстраваць кожны з памылак прадстаўлення на малюнку 3.2.

    1. Стварыце сітуацыю, дзе гэтыя памылкі сапраўды скарачаюцца.
    2. Стварыць сітуацыю, у якой памылкі соединенияв адзін аднаго.
  10. [ вельмі цяжка , патрабуе кадавання ] Даследаванне Blumenstock і яго калег (2015) удзельнічае пабудова мадэлі навучання машыны , якія маглі б выкарыстоўваць лічбавыя дадзеныя трасіроўкі для прагназавання адказаў абследавання. Зараз, вы збіраецеся паспрабаваць тое ж самае з іншым наборам дадзеных. Kosinski, Stillwell, and Graepel (2013) выявілі , што Facebook любіць можа прадказаць індывідуальныя рысы і атрыбуты. Дзіўна, але гэтыя прадказанні могуць быць яшчэ больш дакладным , чым у сяброў і калегаў (Youyou, Kosinski, and Stillwell 2015) .

    1. Чытайце Kosinski, Stillwell, and Graepel (2013) , і паўтарыць малюнак 2. Іх дадзеныя даступныя на http://mypersonality.org/
    2. Цяпер, паўтарыць малюнак 3.
    3. І, нарэшце, паспрабаваць свае мадэлі на ўласных дадзеных Facebook: http://applymagicsauce.com/. Наколькі добра гэта працуе для вас?
  11. [ серада ] Toole et al. (2015) і Toole et al. (2015) , якія выкарыстоўваюцца запісаў дэталяў выкліку (CDR) з мабільных тэлефонаў для прагназавання агульных тэндэнцый беспрацоўя.

    1. Параўнайце і супастаўце даследаванні дызайн Toole et al. (2015) і Toole et al. (2015) з тым з Blumenstock, Cadamuro, and On (2015) .
    2. Як вы думаеце, CDR, варта замяніць традыцыйныя апытанні, дапоўніць іх ці не можа быць выкарыстаны на ўсе дзяржаўныя палітык адсочваць ўзровень беспрацоўя? Чаму?
    3. Якія доказы будзе пераканаць вас, што CDRs можа цалкам замяніць традыцыйныя меры ўзроўню беспрацоўя?