djelatnost

  • stupanj težine: jednostavno lako , srednji srednji , teško teško , vrlo teško vrlo teško
  • zahtijeva matematiku ( zahtijeva matematiku )
  • zahtijeva kodiranje ( zahtijeva kodiranje )
  • prikupljanje podataka ( prikupljanje podataka )
  • moji omiljeni ( moj favorit )
  1. [ vrlo teško , zahtijeva kodiranje , prikupljanje podataka , moj favorit Jedna od najuzbudljivijih tvrdnji Benoitovih i kolega (2016) istraživanja o gomilanju kodova političkih manifesta jest da su rezultati reproducibilni. Merz, Regel, and Lewandowski (2016) omogućuju pristup Manifesta Corpusu. Pokušajte reproducirati sliku 2 iz Benoit et al. (2016) koristeći radnike Amazon Mechanical Turk. Koliko su slični bili vaši rezultati?

  2. [ srednji ] U projektu InfluenzaNet volonterski panel ljudi izvještava o incidenciji, prevalenciji i ponašanju koje traži zdravlje vezano za bolest sličnu gripi (Tilston et al. 2010; Noort et al. 2015) .

    1. Usporedite i kontrastite dizajn, troškove i vjerojatne pogreške u InfluenzaNetu, Google Raširenost gripe i tradicionalnim sustavima za praćenje gripe.
    2. Razmislite o neurednom vremenu, kao što je izbijanje novog oblika gripe. Opišite moguće pogreške u svakom sustavu.
  3. [ teško , zahtijeva kodiranje , prikupljanje podataka Ekonomist je tjedni časopis. Napravite računalni projekt za ljudske potencijale da biste vidjeli je li se promjena odnosa žena i muškaraca na naslovnici promijenilo tijekom vremena.

    1. Časopis može imati različite pokrivače u osam različitih regija (Afrika, Azija Pacifik, Europa, Europska unija, Latinska Amerika, Bliski Istok, Sjeverna Amerika i Velika Britanija) i svi se mogu preuzeti s web stranica časopisa. Odaberite jednu od tih regija i izvedite analizu. Obavezno opišite svoje postupke s dovoljno pojedinosti da ih netko drugi može ponavljati.

    Ovo pitanje je inspirirano sličnim projektom Justina Tenuta, znanstvenika iz CrowdFlower tvrtke crowdsourcing: vidi "Time Magazine stvarno voli dude" (http://www.crowdflower.com/blog/time-magazine-cover-data) ,

  4. [ vrlo teško , zahtijeva kodiranje , prikupljanje podataka ] Oslanjajući se na prethodno pitanje, sada obavite analizu svih osam regija.

    1. Koje su razlike pronašle po regijama?
    2. Koliko je vremena i novca bilo potrebno da se analiza svede na sve osam regija?
    3. Zamislite da ekonomist ima 100 različitih pokrivača svaki tjedan. Procjenjujte koliko dodatnog vremena i novca trebate za povećanje analize na 100 pokrivača tjedno.
  5. [ teško , zahtijeva kodiranje Postoji nekoliko web stranica koje ugostiti projekte otvorenih poziva, kao što je Kaggle. Sudjelujte u jednom od tih projekata i opišite što ste saznali o tom projektu i o otvorenim pozivima općenito.

  6. [ srednji Pogledajte kroz nedavni broj časopisa na vašem polju. Postoje li neki radovi koji bi mogli biti preoblikovani kao projekti otvorenih poziva? Zašto ili zašto ne?

  7. [ lako ] Purdam (2014) opisuje distribuiranu zbirku podataka o prosjačenju u Londonu. Sažmite snage i slabosti ovog istraživačkog dizajna.

  8. [ srednji ] Redundancija je važan način procjene kvalitete distribuirane distribucije podataka. Windt and Humphreys (2016) razvili su i testirali sustav prikupljanja izvješća o sukobima događaja ljudi iz Istočnog Konga. Čitaj papir.

    1. Kako njihov dizajn osigurava zalihost?
    2. Ponudili su nekoliko pristupa za provjeru podataka prikupljenih iz njihovog projekta. Sažeti ih. Što vam je najviše uvjerljivo?
    3. Predložiti novi način da se podaci mogu potvrditi. Prijedlozi bi trebali pokušati povećati povjerenje koje biste imali u podacima na način koji je ekonomičan i etičan.
  9. [ srednji ] Karim Lakhani i njegovi kolege (2013) otvorili su otvoreni poziv za traženje novih algoritama za rješavanje problema računalne biologije. Primili su više od 600 podnesaka koji su sadržavali 89 novih računalnih pristupa. Od podnesaka, 30 je prekoračila performanse Nacionalnog instituta za zdravstvo MegaBLAST, a najbolji podnesak postigao je i veću točnost i brzinu (1000 puta brže).

    1. Pročitajte svoj rad, a zatim predložite problem društvenog istraživanja koji bi mogao upotrijebiti istu vrstu otvorenog natječaja. Konkretno, ova vrsta otvorenog natječaja usmjerena je na ubrzanje i poboljšanje performansi postojećeg algoritma. Ako ne možete zamisliti takav problem u svom polju, pokušajte objasniti zašto ne.
  10. [ srednji , moj favorit ] Mnogi se projekti ljudskih računanja oslanjaju na sudionike Amazon Mechanical Turk. Prijavite se da postanete radnik na Amazon Mechanical Turk. Provedite jedan sat radi tamo. Kako to utječe na vaše misli o dizajnu, kvaliteti i etici ljudskih računalnih projekata?