djelatnost

Key:

  • stupanj težine: lako lako , srednji srednji , teško tvrd , vrlo teško vrlo teško
  • zahtijeva matematike ( zahtijeva matematike )
  • zahtijeva kodiranje ( zahtijeva kodiranje )
  • prikupljanje podataka ( prikupljanje podataka )
  1. [ vrlo teško , zahtijeva kodiranje , prikupljanje podataka ] Jedan od najuzbudljivijih potraživanja od Benoit et al. (2015) na gomili-kodiranje političkog manifesta je da su rezultati ponovljive. Merz, Regel, and Lewandowski (2016) omogućava pristup Manifesta Corpus. Pokušajte za reprodukciju Slika 2 od Benoit et al. (2015) koristeći radnika iz Amazon Mechanical Turk. Kako slični su vaši rezultati?

  2. [ srednji ] U projektu InfluenzaNet volonter panel ljudi prijavljuju incidencije, prevalencije i zdravlje tražeći ponašanje vezano za gripu-bolest (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. Usporedite i kontrast dizajn, troškovi, i vjerovatno greške u InfluenzaNet, Google Flu Trends, i tradicionalnih sistema za praćenje gripe.
    2. Razmotrimo neizmirene vremena, kao što je izbijanje svinjskog gripa. Opišite eventualne greške u svakom sistemu.
  3. [ tvrd , zahtijeva kodiranje , prikupljanje podataka ] The Economist je sedmični magazin. Kreirajte projekt ljudskog proračuna da vidi da li je odnos žena i muškaraca na naslovnici je porastao tokom vremena.

    1. Časopis mogu imati različite naslovnice u osam različitih regija (Afrika, Azija i Pacifik, Europa, Europska unija, Latinskoj Americi, Bliskom Istoku, Sjevernoj Americi, i Velika Britanija) i svi oni mogu se preuzeti sa sajta The Economist . Izaberite jedan od tih područja i vrši analizu. Budite sigurni da opiše svoj procedura sa dovoljno detalja koji bi mogli biti ponoviti neko drugi.

    Ovo pitanje je inspiriran sličnim projektom Justin tenuto, naučnik podataka na crowdsourcing kompanija CrowdFlower , pogledajte "Time Magazine se veseli Dudes" .

  4. [ vrlo teško , zahtijeva kodiranje , prikupljanje podataka ] Nadovezujući se na pitanje gore, sada vrše analize za svih osam regija.

    1. Šta razlike si našao po regijama?
    2. Koliko dodatno vrijeme i novac vam je trebalo da smanji-up vaše analize svih osam regija?
    3. Zamislite da Economist ima 100 različitih poklopaca svake sedmice. Procijenite koliko dodatnog vremena i novca je potrebno da se skalira-up vaše analize do 100 poklopaca tjedno.
  5. [ tvrd , zahtijeva kodiranje ] [Kaggle] (https://www.kaggle.com/) je web stranica koja je domaćin projekata otvoren poziv. Sudjelovati u jednoj od tih projekata.

  6. [ srednji ] Pogledajte kroz posljednje izdanje časopisa u polju. Da li postoje radovi koji su se mogli preformulisati kao projekti otvoreni poziv? Zašto ili zašto ne?

  7. [ lako ] Purdam (2014) opisao je distribuiran prikupljanje podataka o prosjačenju u Londonu. Sumirati prednosti i slabosti ovog istraživanja dizajna.

  8. [ srednji ] Redundancy je važan način za procjenu kvalitete distribuiranih prikupljanja podataka. Windt and Humphreys (2016) razviti i testirati sistem za prikupljanje prijava sukoba događaja od ljudi u Istočnom Kongu. Pročitati novine.

    1. Kako njihov dizajn osigurati redundancije?
    2. Oni nude nekoliko pristupa za provjeru podataka prikupljenih od svojih projekata. Sumiraju ih. Koji je bio najuvjerljiviji vas?
    3. Predložiti novi način da se podaci mogu biti potvrđeni. Prijedlozi treba pokušati povećati povjerenje da bi se u podacima na način koji je isplativ i etički.
  9. [ srednji ] Karim Lakhani i kolege (2013) stvorio otvoreni poziv da traže nove algoritme za rješavanje problema u računarske biologije. Oni su dobili više od 600 podnesaka sa 89 romana računarske pristupa. Podnesaka, su dobili 30 koji je premašio učinak američkog Nacionalnog instituta za zdravlje je Megablast, a najbolji podnošenje postići i veću preciznost i brzinu (1000 puta brže).

    1. Pročitajte svom radu, a zatim predložiti problem društvena istraživanja koji bi mogao koristiti istu vrstu otvorenog konkursa. Konkretno, ova vrsta otvorenog konkursa je usmjerena na ubrzavanje i poboljšanje performansi postojećeg algoritma. Ako ne možete misliti o problemu kao što je ovaj u vašem polju, pokušati objasniti zašto ne.
  10. [ srednji ] Mnogi projekti ljudskih proračun oslanjaju na učesnike iz Amazon Mechanical Turk. Prijavi-do postati radnik na Amazonu Mechanical Turk. Provedite jedan sat radi tu. Kako to utjecaj svoja razmišljanja o dizajnu, kvalitetu, i etike projekata ljudskih compuation?