Mga Aktibidad

key:

  • antas ng kahirapan: madali madali , medium medium , mahirap mahirap , napaka-hirap napaka-hirap
  • ay nangangailangan ng matematika ( ay nangangailangan ng math )
  • nangangailangan coding ( ay nangangailangan ng coding )
  • pagkolekta ng data ( pagkolekta ng data )
  • aking mga paborito ( Paborito ko )
  1. [ mahirap , ay nangangailangan ng math ] Sa kabanata, ako ay napaka-positibong tungkol sa post-pagsasapin-sapin. Gayunman, ito ay hindi laging mapabuti ang kalidad ng mga pagtatantya. Makagawa ng isang sitwasyon na kung saan maaaring mag-post-pagsasapin-sapin ay maaaring bumaba ang kalidad ng mga pagtatantya. (Para sa isang pahiwatig, tingnan Thomsen (1973) ).

  2. [ mahirap , pagkolekta ng data , ay nangangailangan ng coding ] Disenyo at magsagawa ng isang non-bagay na maaaring mangyari survey sa Amazon MTurk upang magtanong tungkol sa gun pagmamay-ari ( "Gusto mo ba, o ang sinuman sa iyong sambahayan, pagmamay-ari ng baril, rifle o pistol? Iyan ba sa iyo o sa ibang tao sa inyong sambahayan?") At attitudes patungo gun control ( "Ano sa tingin ninyo ay mas mahalaga-upang protektahan ang karapatan ng mga Amerikano mag-angkin ng baril, o upang makontrol gun pagmamay-ari?").

    1. Gaano katagal ang iyong mga survey tumagal? Magkano iyan? Paano ang mga demograpiko ng iyong sample ihambing sa ang mga demograpiko ng populasyon ng US?
    2. Ano ang raw pagtatantya ng gun pagmamay-ari ng paggamit ng iyong sample?
    3. Tamang para sa mga di-representativeness ng iyong sample gamit post-pagsasapin-sapin o ilang iba pang pamamaraan. Ngayon ano ang pagtatantya ng gun pagmamay-ari?
    4. Paano ang iyong mga pagtatantya ihambing sa pinakabagong pagtatantya mula Pew Research Center? Ano sa tingin ninyo ipaliwanag ang mga pagkakaiba, kung mayroong anumang?
    5. Ulitin ang exercise 2-5 para attitudes papunta gun control. Paano ang iyong mga natuklasan naiiba?
  3. [ napaka-hirap , pagkolekta ng data , ay nangangailangan ng coding ] Goel at kasamahan (2016) pinangangasiwaan ng isang non-bagay na maaaring mangyari-based survey na binubuo ng 49 multiple-choice attitudinal katanungan iginuhit mula sa Pangkalahatang Social Survey (GSS) at piliin ang mga survey sa pamamagitan ng bangko Research Center sa Amazon MTurk. Sila ay pagkatapos ay ayusin para sa mga di-representativeness ng data gamit ang modelo-based post-pagsasapin-sapin (Mr. P), at ihambing ang mga nababagay pagtatantya sa mga tinatayang gamit probabilidad-based GSS / Pew survey. Magsagawa ang parehong survey sa MTurk at subukan upang magtiklop Figure 2a at 2b Figure sa pamamagitan ng paghahambing ng iyong adjusted estima sa mga pagtatantya mula sa pinakahuling round ng GSS / Pew (Tingnan ang Appendix Table A2 para sa listahan ng 49 mga tanong).

    1. Ihambing at kaibahan ang iyong mga resulta sa mga resulta mula sa Pew at GSS.
    2. Ihambing at kaibahan ang iyong mga resulta sa mga resulta mula sa mga survey MTurk sa Goel, Obeng, and Rothschild (2016) .
  4. [ medium , pagkolekta ng data , ay nangangailangan ng coding ] Maraming mga pag-aaral gamitin panukala self-ulat ng mobile data ng telepono na aktibidad. Ito ay isang nakawiwiling setting na kung saan mga mananaliksik ay maaaring ihambing self-iniulat uugali na may naka-log-uugali (tingnan eg, Boase and Ling (2013) ). Dalawang karaniwang pag-uugali upang magtanong tungkol sa ay pagtawag at texting, at dalawang mga karaniwang oras frame ay "kahapon" at "sa nakalipas na linggo."

    1. Bago pagkolekta ng anumang data, kung alin sa mga self-ulat panukala sa tingin ninyo ay mas tumpak? Bakit?
    2. Kumalap 5 ng iyong mga kaibigan upang maging sa iyong survey. Mangyaring ibuod nang maikli kung paano ang mga 5 mga kaibigan ay na-sample. Maaaring ito sampling procedure magbuod tiyak biases sa iyong mga pagtatantya?
    3. Mangyaring hilingin sa kanila ang mga sumusunod na micro-survey:
    • "Ilang beses mo ginamit ang mobile phone upang tawagan ang iba kahapon?"
    • "Kay rami ng mga text na mensahe ay mong ipadala kahapon?"
    • "Ilang beses na gamitin mo ang iyong mobile phone upang tawagan ang iba sa nakaraang pitong araw?"
    • "Ilang beses did gamitin mo ang iyong mobile phone upang magpadala o tumanggap ng mga text message / SMS sa huling pitong araw?" Sa sandaling ang survey ay kumpleto, hilingin na suriin ang kanilang mga data sa paggamit bilang naka-log in sa pamamagitan ng kanilang mga telepono o service provider.
    1. Paano gumagana ang self-ulat paggamit ihambing upang mag-log ng data? Alin ang pinaka-tumpak na, na kung saan ay hindi bababa sa tumpak?
    2. Ngayon pagsamahin ang data na iyong nakolekta sa mga data mula sa iba pang mga tao sa iyong klase (kung ikaw ay paggawa sa aktibidad na ito para sa isang klase). Gamit ang mas malaking dataset, ulitin bahagi (d).
  5. [ medium , pagkolekta ng data ] Schuman at Presser (1996) magtaltalan na tanong order ay bagay para sa dalawang uri ng mga relasyon sa pagitan ng mga tanong: part-part katanungan kung saan ang dalawang mga katanungan ay sa parehong antas ng pagtitiyak (eg ratings ng dalawang kandidato sa pagkapangulo); at part-buong mga katanungan kung saan ang isang pangkalahatang tanong ay sinusundan ng isang mas tiyak na tanong (eg humihingi sa "Gaano ka nasiyahan sa iyong trabaho?" na sinusundan ng "Gaano ka nasiyahan sa iyong buhay?").

    Sila karagdagang magpakilala dalawang uri ng tanong upang epekto: hindi pabago-bago effects mangyari kapag mga tugon sa isang mas huling tanong ay dinadala mas malapit (kaysa sila man ay maging) sa mga binigay sa isang mas maaga tanong; kaibahan epekto mangyari kapag mayroong mga mas higit na pagkakaiba sa pagitan ng mga sagot sa dalawang tanong na ito.

    1. Gumawa ng isang pares ng mga part-bahagi mga katanungan na sa tingin mo ay may isang malaking tanong sunod epekto, ang isang pares ng mga part-buong mga katanungan na sa tingin mo ay magkakaroon ng isang malaking order epekto, at isa pang pares ng mga katanungan na ang pagkakasunod-sunod sa tingin mo ay hindi mahalaga. Magpatakbo ng isang survey eksperimento sa MTurk upang subukan ang iyong mga tanong.
    2. Paano malaki ay ang bahagi-bahagi epekto ay ikaw ay magagawang lumikha? Was ito ng isang hindi pabago-bago o kaibahan epekto?
    3. Paano malaki ay ang part-buong epekto ay ikaw ay magagawang lumikha? Was ito ng isang hindi pabago-bago o kaibahan epekto?
    4. Was may isang katanungan upang epekto sa iyong pares na kung saan hindi mo naisip ang pagkakasunod-sunod ay bagay?
  6. [ medium , pagkolekta ng data ] Building sa ang gawain ng Schuman at Presser, Moore (2002) ay naglalarawan ng isang hiwalay na sukat ng tanong upang epekto: additive at subtractive. Habang contrast at pagkakapare-pareho ng mga epekto ay ginawa bilang isang resulta ng respondents 'pagsusuri ng dalawang mga item na may kaugnayan sa bawat isa, additive at subtractive epekto ay ginawa kapag respondents ay ginawa mas sensitibo sa mga mas malalaking framework sa loob kung saan ang mga tanong ay posed. Basahin Moore (2002) , at pagkatapos ay mag-disenyo at patakbuhin ang isang survey eksperimento sa MTurk upang ipakita additive o subtractive epekto.

  7. [ mahirap , pagkolekta ng data ] Christopher Antoun at kasamahan (2015) na isinasagawa ng isang pag-aaral ng paghahambing ng mga convenience samples na nakuha mula sa apat na iba't ibang mga online na mapagkukunan recruiting: MTurk, Craigslist, Google AdWords at Facebook. Disenyo ng isang simpleng survey at kumalap mga kalahok sa pamamagitan ng hindi bababa sa dalawang iba't ibang mga pinagmulan online recruiting (maaari silang maging sa iba't ibang pinagmumulan mula sa apat na mga pinagkukunan na ginagamit sa Antoun et al. (2015) ).

    1. Ihambing ang mga gastos sa bawat bagong kaanib, sa mga tuntunin ng pera at oras, sa pagitan ng iba't ibang mga pinagmulan.
    2. Ihambing ang mga bahagi ng mga samples na nakuha mula sa iba't ibang pinagmulan.
    3. Ihambing ang kalidad ng data sa pagitan ng mga halimbawa. Para sa mga ideya tungkol sa kung paano upang masukat ang kalidad ng data mula sa respondents, tingnan Schober et al. (2015) .
    4. Ano ang iyong ginustong source? Bakit?
  8. [ medium ] YouGov, isang internet-based na pananaliksik sa merkado firm, na isinasagawa online polls ng isang panel ng mga tungkol sa 800,000 respondents sa UK at ginagamit Mr. P. upang mahulaan ang resulta ng EU reperendum (ie, Brexit) kung saan ang UK botante bumoto alinman upang manatili in o mag-iwan ng European Union.

    Ang isang detalyadong paglalarawan ng statistical modelo YouGov ay dito (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Halos pagsasalita, YouGov partitions botante sa uri batay sa 2015 pangkalahatang halalan boto choice, edad, mga kwalipikasyon, kasarian, petsa ng interview, pati na rin ang konstityuwensya sila nakatira in. Una, ginagamit ang mga ito ng data na nakolekta mula sa YouGov panelists upang matantya, bukod sa mga na bumoto, ang bahagdan ng mga tao ng bawat uri ng botante na nilayon upang bumoto Leave. matantya nila turnout ng bawat uri ng botante sa pamamagitan ng paggamit sa 2015 British Election Study (BES) post-election face-to-face survey, na kung saan patutunayan turnout mula sa elektoral roll. Sa wakas, tinatantiya nila kung ilang mga tao may mga ng bawat uri ng botante sa mga manghahalal batay sa pinakabagong Census at Taunang Populasyon Survey (na may ilang mga karagdagan impormasyon mula sa BES, YouGov survey data mula sa buong pangkalahatang halalan, at impormasyon sa kung ilang mga tao na bumoto para sa ang bawat partido sa bawat konstityuwensya).

    Tatlong araw bago ang boto, YouGov ay nagpakita ng isang dalawang puntos na kalamangan para sa Leave. Sa gabi ng pagboto, ang poll ay nagpakita ng masyadong malapit sa tumawag sa (49-51 Manatili). Ang huling on-the-araw na pag-aaral hinulaang 48/52 pabor sa Manatiling (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Sa katunayan, ito pagtatantya hindi nakuha ang huling resulta (52-48 Leave) sa pamamagitan ng apat na puntos na porsyento.

    1. Gamitin ang kabuuang survey error framework tinalakay sa kabanatang ito upang masuri kung ano ang maaaring dumanas mali.
    2. tugon ni YouGov matapos ang halalan (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) ipinaliwanag: "Ito ay tila sa isang malaking bahagi dahil sa turnout - isang bagay na namin sinabi ang lahat ng kasama ay magiging mahalaga sa kinalabasan ng mga naturang isang pino ang balanseng lahi. Ang aming turnout modelo ay batay, sa bahagi, sa kung respondents ay bumoto sa huling pangkalahatang halalan at isang turnout antas sa itaas na ng pangkalahatang halalan mapataob ang modelo, lalo na sa North. "Mababago ba nito ang iyong sagot sa bahagi (a)?
  9. [ medium , ay nangangailangan ng coding ] Sumulat ng simulation upang ilarawan ang bawat isa sa mga error na representasyon sa Figure 3.1.

    1. Gumawa ng isang sitwasyon na kung saan ang mga error na aktwal na kanselahin out.
    2. Gumawa ng isang sitwasyon na kung saan ang mga error tambalan bawat isa.
  10. [ napaka-hirap , ay nangangailangan ng coding ] Ang pananaliksik ng Blumenstock at kasamahan (2015) na kasangkot sa paggawa ng isang machine modelo sa pag-aaral na maaaring gamitin ng mga digital na data trace upang mahulaan kasagutan survey. Ngayon, ikaw ay pagpunta sa subukan ang parehong bagay sa isang iba't ibang mga dataset. Kosinski, Stillwell, and Graepel (2013) natagpuan na Facebook paggusto mahuhulaan indibidwal na katangian at mga katangian. Nakakagulat na ang mga hulang ito ay maaaring maging mas tumpak na kaysa sa mga ng mga kaibigan at kasamahan (Youyou, Kosinski, and Stillwell 2015) .

    1. Basahin Kosinski, Stillwell, and Graepel (2013) , at magtiklop Figure 2. Ang kanilang data ay magagamit dito: http://mypersonality.org/
    2. Ngayon, ginagaya Figure 3.
    3. Sa wakas, subukan ang kanilang mga modelo sa iyong sariling data Facebook: http://applymagicsauce.com/. Kung gaano kahusay ito gumagana para sa iyo?
  11. [ medium ] Toole et al. (2015) mga tala detalye paggamit call (CDRs) mula sa mga mobile phone upang mahulaan aggregate uso kawalan ng trabaho.

    1. Ihambing at kaibahan ang disenyo ng Toole et al. (2015) na may Blumenstock, Cadamuro, and On (2015) .
    2. Sa tingin ba ninyo CDRs dapat palitan ang tradisyonal na mga survey, umakma ang mga ito o hindi maaaring gamitin sa lahat para sa policymakers pamahalaan upang subaybayan ang kawalan ng trabaho? Bakit?
    3. Ano ang katibayan ay kumbinsihin sa iyo na CDRs maaaring ganap na palitan ang tradisyonal na mga panukala ng ang pagkawala ng trabaho rate?