Tegevused

  • raskusaste: lihtne lihtne , keskmine keskmine , kõvasti raske , väga raske väga raske
  • nõuab matemaatika ( nõuab matemaatikat )
  • nõuab kodeerimist ( vajab kodeerimist )
  • andmete kogumine ( andmete kogumine )
  • minu lemmikud ( minu lemmik )
  1. [ väga raske , vajab kodeerimist , andmete kogumine , minu lemmik ] Üks kõige põnevaid Benoiti ja kolleegide (2016) uurimusi poliitiliste manifestide rahvahulkekodeerimise kohta on see, et tulemused on korratavad. Merz, Regel, and Lewandowski (2016) tagavad juurdepääsu Manifesti korpusele. Püüa paljundada joonist 2 Benoit et al. (2016) kasutades Amazon Mehaanilise Türgi töötajaid. Kui sarnased olid teie tulemused?

  2. [ keskmine ] InfluenzaNet'i projektis on vabatahtliku töörühm aru saanud gripitaolise haigusega seotud esinemissageduse, levimuse ja tervisega seotud käitumise kohta (Tilston et al. 2010; Noort et al. 2015) .

    1. Võrrelge InfluenzaNet'i, Google Flu Trendsi ja tavapäraste gripi jälgimissüsteemide kujundust, kulusid ja tõenäolisi vigu.
    2. Mõelge aeglastele ajaga, näiteks gripi uudse vormi puhangule. Kirjeldage võimalikke vigu igas süsteemis.
  3. [ raske , vajab kodeerimist , andmete kogumine ] The Economist on iganädalane ajakiri. Loo välja inimeste arvutusprojekt, et näha, kas naiste ja meeste suhe kaanega on aja jooksul muutunud.

    1. Ajakirjale on erinevad kaaned kaheksas erinevas piirkonnas (Aafrika, Aasia ja Vaikse ookeani piirkond, Euroopa, Euroopa Liit, Ladina-Ameerika, Lähis-Ida, Põhja-Ameerika ja Ühendkuningriik) ning neid saab alla laadida ajakirja veebisaidilt. Valige üks nendest piirkondadest ja viige läbi analüüs. Kindlasti kirjeldage oma protseduure piisavalt üksikasjalikult, et keegi teine ​​saaks neid kopeerida.

    Seda küsimust inspireeris sarnane projekt Justin Tenuto, andmeteadlane rahvarohke ettevõttes CrowdFlower: vt "Time Magazine tõesti meeldib kutt" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ väga raske , vajab kodeerimist , andmete kogumine ] Lähtudes eelmisest küsimusest, viime nüüd läbi kõigi kaheksa piirkonna analüüsi.

    1. Milliseid erinevusi leidsite erinevates piirkondades?
    2. Kui palju aega ja raha kulus analüüsi laiendamiseks kõigile kaheksale piirkonnale?
    3. Kujutlege, et igal aastal on Economist 100 erinevat kaarti. Hinda, kui palju lisaaega ja raha kulub teie analüüsi suurendamiseks 100 nädala jooksul.
  5. [ raske , vajab kodeerimist ] On mitmeid veebisaite, mis võtavad vastu avatud kõneprojekte, näiteks Kaggle. Osale ühes neist projektidest ja kirjeldage seda, mida teate selle konkreetse projekti kohta ja avatud kõnede kohta üldiselt.

  6. [ keskmine ] Vaadake oma valdkonnas uusimat väljaannet. Kas on olemas dokumente, mida oleks võinud ümberkujundada avatud kõneprojektidena? Miks või miks mitte?

  7. [ lihtne ] Purdam (2014) kirjeldab Purdam (2014) andmekogumist Londoni kerjamise kohta. Kokkuvõtteks selle uurimisprojekti tugevused ja nõrkused.

  8. [ keskmine ] Ümberpaigutamine on oluline vahend jagatud andmekogumise kvaliteedi hindamiseks. Windt and Humphreys (2016) töötasid välja ja katsetasid Ida-Kongo elanike konfliktijuhtumite aruannete kogumise süsteemi. Lugege paberit.

    1. Kuidas nende disain tagab koondamise?
    2. Nad pakkusid mitut lähenemisviisi oma projektist kogutud andmete kinnitamiseks. Kokkuvõtteks neid. Mis oli teile kõige veenvam?
    3. Paku välja uue viisi, kuidas andmeid saaks kinnitada. Soovitused peaksid üritama suurendada teie andmete usaldusväärsust viisil, mis on kulutõhus ja eetiline.
  9. [ keskmine ] Karim Lakhani ja tema kolleegid (2013) loonud avaliku konkursi, et leida uusi algoritme probleemi lahendamiseks arvutuslikus bioloogias. Nad said üle 600 avalduse, mis sisaldas 89 uut arvutuslikku lähenemist. Esitustest ületas 30 USA riikliku tervishoiu instituudi MegaBLAST toimivust ning parima tulemuse saavutas nii suurem täpsus kui ka kiirus (1000 korda kiiremini).

    1. Lugege oma paberit ja pakute seejärel sotsiaalse uurimisprobleemi, mis võiks kasutada sama tüüpi avatud konkurssi. Eelkõige on selline avatud konkurss keskendunud olemasoleva algoritmi jõudluse kiirendamisele ja parandamisele. Kui te ei oska oma valdkonnas välja mõelda sellisele probleemile, proovige selgitada, miks mitte.
  10. [ keskmine , minu lemmik ] Paljud inimeste arvutusprojektid tuginevad osalejatele Amazon Mehhaaniline Türk. Registreeruge, et saada Amazon Mehaanilise Türgi töötajaks. Kuluta üks tund seal töötades. Kuidas see mõjutab teie mõtteid inimeste arvutusprojektide disaini, kvaliteedi ja eetika kohta?