Mga Aktibidad

  • antas ng kahirapan: madali madali , daluyan daluyan , mahirap mahirap , napakahirap napakahirap
  • nangangailangan ng matematika ( nangangailangan ng matematika )
  • nangangailangan ng coding ( nangangailangan ng coding )
  • pagkolekta ng data ( pagkolekta ng data )
  • ang aking mga paborito ( Paborito ko )
  1. [ mahirap , nangangailangan ng matematika ] Sa kabanata, positibo ako tungkol sa post-stratification. Gayunpaman, hindi ito palaging nagpapabuti sa kalidad ng mga estima. Bumuo ng isang sitwasyon kung saan ang post-stratification ay maaaring bumaba sa kalidad ng mga estima. (Para sa isang pahiwatig, tingnan ang Thomsen (1973) .)

  2. [ mahirap , pagkolekta ng data , nangangailangan ng coding ] Magdisenyo at magsagawa ng isang di-posibilidad na survey sa Amazon Mechanical Turk upang magtanong tungkol sa pagmamay-ari ng baril at saloobin patungo sa kontrol ng baril. Upang maihambing mo ang iyong mga pagtatantya sa mga nagmula sa posibilidad na sample, mangyaring kopyahin ang teksto ng tanong at mga sagot ng tugon nang direkta mula sa isang mataas na kalidad na survey tulad ng mga tumatakbo sa Pew Research Center.

    1. Gaano katagal ang iyong survey? Magkano iyan? Paano naiiba ang demograpiko ng iyong sample sa mga demograpiko ng populasyon ng US?
    2. Ano ang raw na pagtatantya ng pagmamay-ari ng baril gamit ang iyong sample?
    3. Tama para sa hindi nagpahayag ng iyong sample gamit ang post-stratification o ilang iba pang pamamaraan. Ngayon ano ang pagtatantya ng pagmamay-ari ng baril?
    4. Paano naiiba ang iyong mga pagtatantya sa pinakahuling tantya mula sa isang probabilidad na nakabatay sa sample? Ano sa palagay mo ang nagpapaliwanag ng mga pagkakaiba, kung mayroon man?
    5. Ulitin ang mga tanong (b) - (d) para sa mga saloobin sa kontrol ng baril. Paano naiiba ang iyong mga natuklasan?
  3. [ napakahirap , pagkolekta ng data , nangangailangan ng coding ] Goel at mga kasamahan (2016) pinangangasiwaan ng 49 multiple-choice attitudinal questions na inilabas mula sa General Social Survey (GSS) at pumili ng mga survey ng Pew Research Center sa di-posibilidad na sample ng mga respondent na inilabas mula sa Amazon Mechanical Turk. Pagkatapos ay inayos nila ang di-representatipikasyon ng data gamit ang modelo na nakabatay sa post-stratification at inihambing ang kanilang nababagay na mga estima sa mga mula sa probabilidad na nakabatay sa GSS at Pew na mga survey. Magsagawa ng parehong survey sa Amazon Mechanical Turk at subukan upang magtiklop ang figure 2a at figure 2b sa pamamagitan ng paghahambing ng iyong mga nababagay na pagtatantya sa mga pagtatantya mula sa pinakabagong mga pag-ikot ng survey ng GSS at Pew. (Tingnan ang appendix table A2 para sa listahan ng 49 na tanong.)

    1. Ihambing at i-contrast ang iyong mga resulta sa mga mula sa bangko at GSS.
    2. Ihambing at i-contrast ang iyong mga resulta sa mga mula sa Mechanical Turk survey sa Goel, Obeng, and Rothschild (2016) .
  4. [ daluyan , pagkolekta ng data , nangangailangan ng coding ] Maraming mga pag-aaral ang gumagamit ng mga naiulat na sukat ng paggamit ng mobile phone. Ito ay isang kagiliw-giliw na setting na kung saan ang mga mananaliksik ay maaaring ihambing ang pag-uugali ng sariling pag-uulat na may naka-log na pag-uugali (tingnan ang hal., Boase and Ling (2013) ). Dalawang karaniwang pag-uugali na magtanong tungkol sa pagtawag at pag-text, at dalawang karaniwang mga frame ng panahon ay "kahapon" at "sa nakaraang linggo."

    1. Bago ang pagkolekta ng anumang data, alin sa mga panukalang-batas sa sarili ang sa tingin mo ay mas tumpak? Bakit?
    2. Mag-recruit limang ng iyong mga kaibigan upang maging sa iyong survey. Mangyaring maikling buod kung paano ang mga limang kaibigan na ito ay na-sample. Maaaring magawa ng sampling pamamaraan na ito ang mga tiyak na biases sa iyong mga pagtatantya?
    3. Itanong sa kanila ang sumusunod na mga tanong sa microsurvey:
    • "Ilang beses na ginamit mo ang iyong mobile phone upang tumawag sa iba kahapon?"
    • "Ilang text message ang ipinadala mo kahapon?"
    • "Ilang beses na ginamit mo ang iyong mobile phone upang tumawag sa iba sa huling pitong araw?"
    • "Ilang beses na ginamit mo ang iyong mobile phone upang magpadala o tumanggap ng mga text message / SMS sa huling pitong araw?"
    1. Sa sandaling nakumpleto na ang microsurvey na ito, hilingin na suriin ang kanilang data sa paggamit bilang naka-log sa pamamagitan ng kanilang telepono o service provider. Paano inihahambing ang paggamit ng self-report sa data ng pag-log? Alin ang pinaka tumpak, na hindi gaanong tumpak?
    2. Ngayon pagsamahin ang data na iyong nakolekta sa data mula sa ibang mga tao sa iyong klase (kung ginagawa mo ang aktibidad na ito para sa isang klase). Gamit ang mas malaking dataset, ulitin ang bahagi (d).
  5. [ daluyan , pagkolekta ng data Ipinahihiwatig ng Schuman at Presser (1996) na ang mga order sa tanong ay mahalaga para sa dalawang uri ng mga katanungan: mga bahagi ng bahagi na tanong kung saan dalawang tanong ay nasa parehong antas ng pagtitiyak (halimbawa, mga rating ng dalawang kandidato ng pampanguluhan); at mga bahagi na buong tanong kung saan sinusunod ng isang pangkalahatang tanong ang isang mas partikular na tanong (halimbawa, nagtanong "Gaano ka nasiyahan sa iyong trabaho?" na sinusundan ng "Gaano ka nasiyahan sa iyong buhay?").

    Higit pang nailalarawan ang dalawang uri ng epekto ng pagkakasunod-sunod ng tanong: ang mga epekto ng pagkakatugma ay nangyayari kapag ang mga sagot sa susunod na tanong ay pinalalapit (kaysa sa kung saan sila ay magiging) sa mga ibinigay sa isang naunang tanong; Ang mga epekto ng kaibahan ay nangyayari kapag may mas malaking pagkakaiba sa pagitan ng mga tugon sa dalawang tanong.

    1. Gumawa ng isang pares ng mga bahagi na bahagi ng mga tanong na sa palagay mo ay magkakaroon ng isang malaking epekto ng pagkakasunod-sunod ng tanong; isang pares ng mga part-buong tanong na sa palagay mo ay magkakaroon ng malaking epekto sa pagkakasunud-sunod; at isang pares ng mga tanong na ang order mo sa tingin ay hindi bagay. Magpatakbo ng eksperimento sa survey sa Amazon Mechanical Turk upang subukan ang iyong mga tanong.
    2. Gaano kalaki ang isang epekto ng bahagi na bahagi na iyong nilikha? Ito ba ay pare-pareho o epekto ng kaibahan?
    3. Gaano kalaki ang isang bahagi-buo na epekto na iyong nilikha? Ito ba ay pare-pareho o epekto ng kaibahan?
    4. Mayroon bang epekto sa pagkakasunod-sunod ng tanong sa iyong pares kung saan hindi mo naisip ang pagkakasunud-sunod ay mahalaga?
  6. [ daluyan , pagkolekta ng data ] Ang gusali sa trabaho ng Schuman at Presser, Moore (2002) naglalarawan ng isang hiwalay na dimensyon ng epekto sa pagkakasunod-sunod ng tanong: mga additive at subtractive effect. Habang tumutukoy ang mga kaibahan at mga epekto ng pagkakapare-pareho bilang resulta ng mga pagsusuri ng mga sumasagot sa dalawang bagay na may kaugnayan sa isa't isa, ang mga additive at subtractive effect ay ginawa kapag ang mga respondent ay mas sensitibo sa mas malaking balangkas kung saan ang mga tanong ay ibinabanta. Basahin ang Moore (2002) , pagkatapos ay mag-disenyo at magpatakbo ng isang eksperimento sa pag-aaral sa MTurk upang ipakita ang mga additive o subtractive effect.

  7. [ mahirap , pagkolekta ng data ] Christopher Antoun at mga kasamahan (2015) nagsagawa ng pag-aaral na naghahambing sa mga sample ng kaginhawahan na nakuha mula sa apat na iba't ibang mga pinagmumulan ng online recruiting: MTurk, Craigslist, Google AdWords at Facebook. Idisenyo ang isang simpleng survey at kumalap ng mga kalahok sa pamamagitan ng hindi bababa sa dalawang magkaibang mga online recruiting sources (ang mga mapagkukunang ito ay maaaring naiiba mula sa apat na pinagkukunan na ginamit sa Antoun et al. (2015) ).

    1. Ihambing ang gastos sa bawat recruit-sa mga tuntunin ng pera at oras-sa pagitan ng iba't ibang mga mapagkukunan.
    2. Ihambing ang komposisyon ng mga sampol na nakuha mula sa iba't ibang mga mapagkukunan.
    3. Ihambing ang kalidad ng data sa pagitan ng mga sample. Para sa mga ideya kung paano sukatin ang kalidad ng data mula sa mga sumasagot, tingnan ang Schober et al. (2015) .
    4. Ano ang iyong ginustong mapagkukunan? Bakit?
  8. [ daluyan ] Sa isang pagsisikap upang mahulaan ang mga resulta ng Referendum ng EU ng 2016 (ibig sabihin, Brexit), YouGov-isang kompanya ng pananaliksik sa merkado na nakabatay sa Internet-na nagdaos ng mga online na botohan sa isang panel ng mga 800,000 na tumutugon sa United Kingdom.

    Ang detalyadong paglalarawan ng statistical model ng YouGov ay matatagpuan sa https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Sa mahigpit na pagsasalita, ang YouGov ay nakabahagi ng mga botante sa mga uri batay sa 2015 na pangkalahatang pagpili ng botohan sa eleksyon, edad, kwalipikasyon, kasarian, at petsa ng pakikipanayam, pati na rin ang konstityuwensya kung saan sila nakatira. Una, ginamit nila ang data na nakolekta mula sa mga panelist ng YouGov upang matantiya, kabilang sa mga bumoto, ang proporsyon ng mga tao ng bawat uri ng botante na nilayon upang bumoto sa Iwanan. Tinatantiya nila ang turnout ng bawat uri ng botante sa pamamagitan ng paggamit ng 2015 British Election Study (BES), isang post-election face-to-face survey, na napatunayan na turnout mula sa mga listahan ng elektoral. Sa wakas, tinatantya nila kung gaano karaming tao ang may bawat uri ng botante sa botante, batay sa pinakabagong Census at Annual Population Survey (na may ilang karagdagang impormasyon mula sa iba pang mga mapagkukunan ng data).

    Tatlong araw bago ang boto, ipinakita ng YouGov ang dalawang punto para sa Pag-iwan. Sa bisperas ng pagboto, ipinakita ng poll na ang resulta ay masyadong malapit sa tawag (49/51 Panatilihin). Ang pangwakas na pag-aaral sa hinaharap ay hinulaan 48/52 pabor sa Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Sa katunayan, ang pagtantya na ito ay hindi nakuha ang huling resulta (52/48 Leave) sa pamamagitan ng apat na porsyento na puntos.

    1. Gamitin ang kabuuang balangkas ng error sa survey na tinalakay sa kabanatang ito upang masuri kung ano ang maaaring magkamali.
    2. Ang tugon ng YouGov pagkatapos ng halalan (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) ay nagpaliwanag: "Tila ito sa isang malaking bahagi dahil sa turnout-isang bagay na Sinabi nating lahat ay mahalaga sa kinalabasan ng gayong isang makinis na balanseng lahi. Ang aming modelo ng turnout ay nakabatay, sa bahagi, kung ang mga respondents ay bumoto sa huling pangkalahatang halalan at isang antas ng turnout sa itaas ng mga pangkalahatang halalan na napinsala ang modelo, lalo na sa Hilaga. "Ito ba ay nagbabago sa iyong sagot sa bahagi (a)?
  9. [ daluyan , nangangailangan ng coding ] Isulat ang isang kapanggapan upang ilarawan ang bawat isa sa mga kamalian sa pagkatawan sa tayahin 3.2.

    1. Lumikha ng isang sitwasyon kung saan ang mga error na ito ay talagang kanselahin.
    2. Lumikha ng isang sitwasyon kung saan ang mga pagkakamali compound sa bawat isa.
  10. [ napakahirap , nangangailangan ng coding ] Ang pananaliksik ng Blumenstock at mga kasamahan (2015) kasangkot sa pagbuo ng isang modelo ng pag-aaral ng makina na maaaring gumamit ng mga digital na data na bakas upang mahulaan ang mga tugon sa survey. Ngayon, susubukan mo ang parehong bagay sa ibang dataset. Kosinski, Stillwell, and Graepel (2013) na gusto ng Facebook na mahulaan ang mga indibidwal na katangian at mga katangian. Nakakagulat, ang mga hula na ito ay maaaring mas tumpak kaysa sa mga kaibigan at kasamahan (Youyou, Kosinski, and Stillwell 2015) .

    1. Basahin ang Kosinski, Stillwell, and Graepel (2013) , at ginagaya ang figure 2. Ang kanilang data ay makukuha sa http://mypersonality.org/
    2. Ngayon, magtiklop ang figure 3.
    3. Sa wakas, subukan ang kanilang modelo sa iyong sariling data sa Facebook: http://applymagicsauce.com/. Gaano kahusay ang ginagawa nito para sa iyo?
  11. [ daluyan ] Toole et al. (2015) ginamit na mga tala ng detalyadong tawag (CDR) mula sa mga mobile phone upang mahulaan ang pinagsama-samang mga trend ng pagkawala ng trabaho.

    1. Ihambing at i-contrast ang disenyo ng pag-aaral ng Toole et al. (2015) may Blumenstock, Cadamuro, and On (2015) .
    2. Sa palagay mo ba ang mga CDR ay dapat palitan ang mga tradisyonal na survey, umakma sa kanila o hindi magagamit sa lahat para sa mga tagabigay ng polisiya ng pamahalaan upang subaybayan ang kawalan ng trabaho? Bakit?
    3. Anong katibayan ang kumbinsihin sa iyo na maaaring ganap na palitan ng mga CDR ang tradisyunal na mga panukala ng rate ng kawalan ng trabaho?