дзейнасць

Ўмоўныя абазначэнні:

  • Ступень складанасці: лёгкі лёгка , сярэдні серада , жорсткі жорсткі , Вельмі цяжка вельмі цяжка
  • патрабуе матэматыку ( патрабуе матэматыку )
  • патрабуе кадавання ( патрабуе кадавання )
  • збор дадзеных ( збор дадзеных )
  • мае любімыя ( мой любімы )
  1. [ жорсткі , патрабуе матэматыку ] У гэтым раздзеле, я быў вельмі пазітыўна пасля стратыфікацыі. Тым не менш, гэта не заўсёды паляпшае якасць ацэнак. Пабудаваць такую ​​сітуацыю, калі можа постстратификация можа знізіць якасць ацэнак. (Для атрымання падказкі см Thomsen (1973) ).

  2. [ жорсткі , збор дадзеных , патрабуе кадавання ] Праектаванне і правесці абследаванне без верагоднасці на Amazon MTurk спытаць пра валодання зброяй ( "Ці ёсць у вас, ці хто-небудзь у вашай сям'і, уласны пісталет, вінтоўку або пісталет? Хіба што вы ці хто-то ў вашай сям'і?") І стаўленне да кантролю над агнястрэльнай зброяй ( "Што вы лічыце больш важным, каб абараніць права амерыканцаў валодаць зброяй, ці кантраляваць валоданне зброяй?").

    1. Колькі часу ваш апытанне зойме? Колькі каштуе? Як дэмаграфію вашага ўзору ў параўнанні з дэмаграфіяй насельніцтва ЗША?
    2. Што такое сырая адзнака валодання зброяй, выкарыстоўваючы ваш ўзор?
    3. Правільнае за неправаслаўных рэпрэзентатыўнасці вашага ўзору з выкарыстаннем постстратификация ці якой-небудзь іншай тэхнікі. Цяпер тое, што ацэнка валодання зброяй?
    4. Як вашы ацэнкі ў параўнанні з апошняй ацэнкай з Pew Research Center ,? Як вы думаеце, растлумачыць разыходжанні, калі ёсць якія-небудзь?
    5. Паўтарыце практыкаванне 2-5 для дачынення да кантролю над агнястрэльнай зброяй. Як вашы высновы адрозніваюцца?
  3. [ вельмі цяжка , збор дадзеных , патрабуе кадавання ] Гоел і яго калегі (2016) ўводзяць без верагоднасці на аснове апытання , якая складаецца з 49 множнага выбару отношенческими пытанняў , узятых з агульнага сацыяльнага абследавання (GSS) і абярыце абследаванняў Навукова - даследчым цэнтрам Pew Research Center на Amazon MTurk. Затым яны рэгуляваўся ня-рэпрэзентатыўнасці дадзеных з выкарыстаннем мадэлі на аснове постстратификация (г-Р), і параўнаць скарэкціраваныя ацэнкі з тымі, ацэньваюцца з выкарыстаннем верагоднасці на аснове ГСС / П'ю абследаванняў. Правесці адзін і той жа апытанне на MTurk і паспрабаваць паўтарыць малюнак 2a і 2b Малюнак, параўноўваючы свае удакладненыя ацэнкі з ацэнкамі з самых апошніх раўндаў GSS / Pew (гл Дадатак Табліца А2 для спісу з 49 пытанняў).

    1. Параўнайце і супастаўце вашы вынікі з вынікамі Pew і ГСС.
    2. Параўнайце і супастаўце вашы вынікі з вынікамі апытання MTurk ў Goel, Obeng, and Rothschild (2016) .
  4. [ серада , збор дадзеных , патрабуе кадавання ] Шматлікія даследаванні выкарыстоўваюць меры самасправаздачы дадзеных мабільных тэлефонаў дзейнасці. Гэта цікавы параметр , дзе даследчыкі могуць параўнаць самастойна паведамлялі паводзіны з рэгіструемага паводзін (глядзі , напрыклад, Boase and Ling (2013) ). Два найбольш часта сустракаемыя мадэлі паводзін, каб спытаць пра выклікаеце і тэкставых паведамленняў, а таксама два агульных часовых рамак з'яўляюцца "учора" і "на мінулым тыдні."

    1. Перад зборам якіх-небудзь дадзеных, якія з самасправаздачы меры на вашу думку, больш дакладным? Чаму?
    2. Набіраем 5 з вашых сяброў, каб быць у вашым апытанні. Просьба коратка падсумаваць, як былі адабраны гэтыя 5 сяброў. Можа гэтая працэдура выбаркі выклікаюць пэўныя ўхілы ў вашых ацэнках?
    3. Калі ласка, папытаеце іх наступны мікра-апытанне:
    • "Колькі разоў вы выкарыстоўвалі мабільны тэлефон, каб патэлефанаваць іншым ўчора?"
    • "Колькі тэкставых паведамленняў вы адправілі ўчора?"
    • "Колькі разоў вы выкарыстоўвалі свой мабільны тэлефон, каб патэлефанаваць іншым у апошнія сем дзён?"
    • "Колькі разоў вы выкарыстоўваеце свой мабільны тэлефон, каб адпраўляць або атрымліваць тэкставыя паведамленні / SMS на працягу апошніх сямі дзён?" Пасля таго, як даследаванне завершанае, папытаеце, каб праверыць свае дадзеныя аб выкарыстанні, як рэгіструюцца па іх тэлефоне або пастаўшчыка паслуг.
    1. Як выкарыстанне самасправаздачы параўнайце дадзеныя часопіса? Які з'яўляецца найбольш дакладным, які з'яўляецца найменш дакладным?
    2. Цяпер аб'яднаць дадзеныя, якія вы сабралі з дадзенымі іншых людзей у вашым класе (калі вы робіце гэта практыкаванне для класа). З дапамогай гэтага набору дадзеных большага, паўтарыць частка (d).
  5. [ серада , збор дадзеных ] Шуман і прыціскной (1996) сцвярджаюць , што гэты пытанне загады будуць мець значэнне для двух тыпаў адносін паміж пытаннямі: няпоўны частка пытанняў , дзе два пытанні знаходзяцца на тым жа ўзроўні спецыфічнасці (напрыклад , рэйтынгі двух кандыдатаў у прэзідэнты); і часткова цэлыя пытанні, дзе агульны пытанне варта больш канкрэтнае пытанне (напрыклад, пытанне: "Наколькі вы задаволеныя сваёй працай?", а затым "Наколькі вы задаволеныя сваім жыццём?").

    Акрамя таго, яны характарызуюць два тыпу эфекту парадку пытанне: кансістэнцыя эфекты ўзнікаюць, калі адказы на больш позні пытанне набліжаны (чым яны маглі б быць), прыведзеных на раней зададзенае пытанне; кантрасныя эфекты ўзнікаюць, калі існуюць вялікія адрозненні паміж адказамі на два пытанні.

    1. Стварыць пару няпоўны частка пытанняў, якія вы думаеце, будзе мець вялікі эфект парадку пытанне, пару частка-цэлае пытанні, якія, на вашу думку будзе мець вялікі эфект парадку, а яшчэ пару пытанняў, парадак вы думаеце, не будзе мець значэння. Выканаць абследаванне эксперымент на MTurk, каб праверыць вашыя пытанні.
    2. Наколькі вялікая была частка-частка эфекту вы змаглі стварыць? Ці было гэта кансістэнцыя ці эфект кантрасту?
    3. Наколькі вялікая была тая частка, увесь эфект вы змаглі стварыць? Ці было гэта кансістэнцыя ці эфект кантрасту?
    4. Ці быў пытанне эфект парадак у вашай пары, дзе вы не думалі, парадак будзе мець значэнне?
  6. [ серада , збор дадзеных ] Грунтуючыся на працы Шуманам і прыціскной, Moore (2002) апісвае асобны аспект эфекту парадку пытанне: адытыўная і адымае. У той час як кантраст і паслядоўнасць эфектаў вырабляюцца як следства адзнак рэспандэнтаў двух прадметаў па адносінах адзін да аднаго, дабаўкі і адымаецца эфекты атрымліваюцца, калі рэспандэнты становяцца больш адчувальнымі да больш буйной структуры, у рамках якой ставяцца пытанні. Чытайце Moore (2002) , а затым распрацаваць і запусціць аглядную эксперымент па MTurk , каб прадэманстраваць адытыўная або вычитательные эфекты.

  7. [ жорсткі , збор дадзеных ] Крыстафер Antoun і яго калегі (2015) правялі даследаванне , параўноўваючы ўзоры выгоды , атрыманыя з чатырох розных крыніц у Інтэрнэце рэкрутынгу: MTurk, Craigslist, Google AdWords і Facebook. Дызайн просты апытанне і прыцягненне ўдзельнікаў па меншай меры двух розных крыніц у Інтэрнэце рэкрутынгу (яны могуць быць розныя крыніцы з чатырох крыніц , якія выкарыстоўваюцца ў Antoun et al. (2015) і Antoun et al. (2015) ).

    1. Параўнайце кошт аднаго прызыўніка, з пункту гледжання грошай і часу, паміж рознымі крыніцамі.
    2. Параўнайце склад узораў, атрыманых з розных крыніц.
    3. Параўнайце якасць дадзеных паміж ўзорамі. Для атрымання ўяўленні аб тым , як вымераць якасць дадзеных ад рэспандэнтаў, см Schober et al. (2015) і Schober et al. (2015) .
    4. Які ваш пераважны крыніца? Чаму?
  8. [ серада ] YouGov, інтэрнэт на аснове даследаванні рынку фірма, правяла онлайн-апытанне аб панэлі каля 800 000 рэспандэнтаў у Вялікабрытаніі і выкарыстаў г-н П., каб прадказаць вынік рэферэндуму ЕС (г.зн. Brexit), дзе выбаршчыкі Вялікабрытаніі галасаваць альбо застацца ці пакінуць Еўрапейскі Саюз.

    Падрабязнае апісанне статыстычнай мадэлі YouGov знаходзіцца тут (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Груба кажучы, YouGov падзяляе выбаршчыкаў на тыпы, заснаваныя на 2015 усеагульных выбараў выбару галасоў, ўзросту, кваліфікацыі, пол, дата інтэрв'ю, а таксама выбарчай акрузе яны жывуць. Па-першае, яны выкарысталі дадзеныя, сабраныя з членаў камісіі YouGov для ацэнкі, у тым ліку тых, хто галасуе, доля людзей кожнага тыпу выбаршчыкаў, якія маюць намер галасаваць сысці. Яны ацэньваюць яўку выбаршчыкаў кожнага тыпу з дапамогай 2015 брытанскай выбарчай даследаванні (BES) пасля выбараў твар у твар абследавання, якое пацверджана яўку з спісаў выбаршчыкаў. І, нарэшце, яны ацэньваюць, колькі людзей ёсць кожнага тыпу выбаршчыкаў у выбаршчыкаў на падставе апошняга перапісу насельніцтва і штогадовага абследавання насельніцтва (з некаторымі кропельным інфармацыі з BES, дадзеныя апытання YouGov з усяго усеагульных выбараў, а таксама інфармацыю пра тое, як галасавалі многія людзі для кожны з бакоў у кожнай выбарчай акрузе).

    За тры дні да галасавання, YouGov паказаў два ачкі для адпачынку. Напярэдадні галасавання, апытанне паказала, занадта блізка да тэлефона (49-51 Застаюцца). Канчатковае даследаванне-дзень прадказваў 48/52 на карысць Застаюцца (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). На самай справе, гэтая адзнака прапусціла канчатковы вынік (52-48 Leave) на чатыры працэнтных пункта.

    1. Выкарыстоўвайце агульную структуру памылкі абследавання, апісаную ў гэтай чале, каб ацаніць тое, што магло пайсці не так.
    2. адказ YouGov пасля выбараў (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/~~HEAD=pobj) растлумачыў: "Гэта, здаецца, у значнай ступені з-за яўкі - тое, што мы ўжо гаварылі ўсе разам будуць мець вырашальнае значэнне для зыходу такога ператоку расы. Наша мадэль яўка была заснавана, у прыватнасці, ад таго, рэспандэнтаў прагаласавалі на апошніх усеагульных выбарах і ўзровень яўкі вышэй, што усеагульных выбараў перакуліць мадэль, асабліва на Поўначы. "Ці змяніўся ваш адказ на часткі (а)?
  9. [ серада , патрабуе кадавання ] Напішыце мадэляванне, каб праілюстраваць кожную з памылак прадстаўлення на малюнку 3.1.

    1. Стварыць сітуацыю, калі гэтыя памылкі фактычна зводзяць на нішто.
    2. Стварыць сітуацыю, калі памылкі злучэнне адзін з адным.
  10. [ вельмі цяжка , патрабуе кадавання ] Даследаванне Blumenstock і яго калегі (2015) удзельнічае пабудова мадэлі машыннага навучання , якія маглі б выкарыстоўваць лічбавыя дадзеныя трасіроўкі для прагназавання адказы на апытанне. Зараз, вы збіраецеся паспрабаваць тое ж самае з іншым наборам дадзеных. Kosinski, Stillwell, and Graepel (2013) выявілі , што Facebook любіць можа прадказаць індывідуальныя рысы і атрыбуты. Дзіўна, але гэтыя прагнозы могуць быць яшчэ больш дакладным , чым у сяброў і калегаў (Youyou, Kosinski, and Stillwell 2015) .

    1. Прачытайце Kosinski, Stillwell, and Graepel (2013) год Kosinski, Stillwell, and Graepel (2013) , і рэплікацыі Малюнак 2. Іх дадзеныя даступныя тут: http://mypersonality.org/
    2. Цяпер, паўтарыць малюнак 3.
    3. І, нарэшце, паспрабаваць свае мадэлі на ўласных дадзеных Facebook: http://applymagicsauce.com/. Наколькі добра гэта працуе для вас?
  11. [ серада ] Toole et al. (2015) і Toole et al. (2015) падрабязна выкарыстанне запісаў выклікаў (CDR) з мабільных тэлефонаў для прагназавання агульных тэндэнцый беспрацоўя.

    1. Параўнайце і дызайн Toole et al. (2015) і Toole et al. (2015) з Blumenstock, Cadamuro, and On (2015) .
    2. Як вы думаеце, павінны CDRs замяніць традыцыйныя апытанні, дапоўніць іх ці не выкарыстоўваць наогул для ўрадавых дырэктыўных органаў для адсочвання беспрацоўя? Чаму?
    3. Якія доказы б пераканаць вас, што CDRs можа цалкам замяніць традыцыйныя меры ўзроўню беспрацоўя?