Mga Aktibidad

  • antas ng kahirapan: madali madali , daluyan daluyan , mahirap mahirap , napakahirap napakahirap
  • nangangailangan ng matematika ( nangangailangan ng matematika )
  • nangangailangan ng coding ( nangangailangan ng coding )
  • pagkolekta ng data ( pagkolekta ng data )
  • ang aking mga paborito ( Paborito ko )
  1. [ napakahirap , nangangailangan ng coding , pagkolekta ng data , Paborito ko ] Isa sa mga pinaka-kapana-panabik na mga claim mula sa Benoit at mga kasamahan ' (2016) pananaliksik sa karamihan ng tao-coding ng pampulitika manifestos ay ang mga resulta ay maaaring kopyahin. Merz, Regel, and Lewandowski (2016) nagbibigay ng access sa Manipesto Corpus. Subukang magparami ng figure 2 mula sa Benoit et al. (2016) gamit ang mga manggagawa mula sa Amazon Mechanical Turk. Gaano kagaya ang iyong mga resulta?

  2. [ daluyan ] Sa proyektong InfluenzaNet isang grupo ng mga boluntaryo ng tao ang nag-uulat ng pagkilos, paglaganap, at pag-uugali sa paghahanap ng kalusugan na may kaugnayan sa influenza-tulad-sakit (Tilston et al. 2010; Noort et al. 2015) .

    1. Ihambing at i-contrast ang disenyo, gastos, at malamang mga pagkakamali sa InfluenzaNet, Mga Trangkaso sa Google Flu, at mga sistema ng pagsubaybay sa tradisyunal na influenza.
    2. Isaalang-alang ang isang hindi pa nasasabik na oras, tulad ng pagsiklab ng isang nobelang anyo ng trangkaso. Ilarawan ang mga posibleng error sa bawat system.
  3. [ mahirap , nangangailangan ng coding , pagkolekta ng data ] Ang Economist ay isang lingguhang magazine ng balita. Gumawa ng isang tao na proyekto ng pagtutuos upang makita kung ang ratio ng mga kababaihan sa kalalakihan sa pabalat ay nagbago sa paglipas ng panahon.

    1. Ang magazine ay maaaring magkaroon ng iba't ibang mga pabalat sa walong iba't ibang mga rehiyon (Africa, Asia Pacific, Europa, European Union, Latin America, Gitnang Silangan, Hilagang Amerika, at United Kingdom) at maaari silang lahat ma-download mula sa website ng magazine. Pumili ng isa sa mga rehiyong ito at isagawa ang pagtatasa. Siguraduhin na ilarawan ang iyong mga pamamaraan na may sapat na detalye na maaari silang kopyahin ng ibang tao.

    Ang tanong na ito ay inspirasyon ng isang katulad na proyekto ni Justin Tenuto, isang data na siyentipiko sa crowdsourcing company CrowdFlower: tingnan ang "Time Magazine Really Likes Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ napakahirap , nangangailangan ng coding , pagkolekta ng data ] Paggawa sa nakaraang tanong, isagawa ngayon ang pagtatasa para sa lahat ng walong rehiyon.

    1. Anong mga pagkakaiba ang nakita mo sa mga rehiyon?
    2. Gaano karaming dagdag na oras at pera ang kinakailangan upang mapalaki ang iyong pagtatasa sa lahat ng walong ng mga rehiyon?
    3. Isipin na ang Economist ay may 100 iba't ibang mga sumasaklaw sa bawat linggo. Tantyahin kung gaano karaming dagdag na oras at pera ang kinakailangan upang mapalaki ang iyong pagtatasa sa 100 na pabalat sa bawat linggo.
  5. [ mahirap , nangangailangan ng coding ] Maraming mga website na nagho-host ng mga bukas na proyekto ng tawag, tulad ng Kaggle. Makilahok sa isa sa mga proyektong iyon, at ilarawan kung ano ang natututuhan mo tungkol sa partikular na proyektong iyon at tungkol sa mga bukas na tawag sa pangkalahatan.

  6. [ daluyan ] Hanapin sa pamamagitan ng isang kamakailang isyu ng isang journal sa iyong larangan. Mayroon bang anumang mga papeles na maaaring repormahin bilang mga bukas na proyekto sa pagtawag? Bakit o bakit hindi?

  7. [ madali ] Purdam (2014) naglalarawan ng isang ipinamamahagi koleksyon ng data tungkol sa kadukhaan sa London. Ibigay ang buod ng mga lakas at kahinaan ng disenyo ng pananaliksik na ito.

  8. [ daluyan ] Ang kalabisan ay isang mahalagang paraan upang masuri ang kalidad ng ipinamamahagi na koleksyon ng data. Windt and Humphreys (2016) bumuo at sumubok ng isang sistema upang mangolekta ng mga ulat ng mga kaguluhan ng mga kaganapan mula sa mga tao sa Eastern Congo. Basahin ang papel.

    1. Paano tinitiyak ng kanilang disenyo na ang kalabisan?
    2. Nag-alok sila ng ilang mga diskarte upang patunayan ang data na nakolekta mula sa kanilang proyekto. Ibigay ang buod sa kanila. Alin ang pinaka-kapani-paniwala sa iyo?
    3. Magpanukala ng isang bagong paraan upang ma-validate ang data. Ang mga mungkahi ay dapat na subukan upang madagdagan ang pagtitiwala na mayroon ka sa data sa isang paraan na cost-effective at etikal.
  9. [ daluyan ] Karim Lakhani at mga kasamahan (2013) lumikha ng isang bukas na tawag upang manghingi ng mga bagong algorithm upang malutas ang problema sa computational biology. Nakatanggap sila ng higit sa 600 mga pagsusumite na naglalaman ng 89 nobelang computational approach. Sa mga pagsusumite, lumampas sa 30 ang pagganap ng US National Institutes of Health's MegaBLAST, at ang pinakamahusay na pagsusumite ay nakakuha ng parehong mas mataas na katumpakan at bilis (1,000 beses na mas mabilis).

    1. Basahin ang kanilang papel, at pagkatapos ay ipanukala ang isang problemang panlipunan sa pananaliksik na maaaring gumamit ng parehong uri ng bukas na paligsahan. Sa partikular, ang ganitong uri ng bukas na paligsahan ay nakatuon sa pagpapabilis at pagpapabuti ng pagganap ng isang umiiral na algorithm. Kung hindi mo maisip ang problema tulad nito sa iyong larangan, subukan na ipaliwanag kung bakit hindi.
  10. [ daluyan , Paborito ko ] Maraming mga proyekto sa pag-compute ng tao ang umaasa sa mga kalahok mula sa Amazon Mechanical Turk. Mag-sign up upang maging isang manggagawa sa Amazon Mechanical Turk. Gumugol ng isang oras na nagtatrabaho doon. Paano ito nakakaapekto sa iyong mga iniisip tungkol sa disenyo, kalidad, at etika ng mga proyekto ng pag-compute ng tao?