aktivity

  • stupeň obtiažnosti: ľahké jednoduchý , stredná stredná , ťažké usilovne , veľmi ťažké veľmi ťažké
  • vyžaduje matematiku ( vyžaduje matematiku )
  • vyžaduje kódovanie ( vyžaduje kódovanie )
  • zber dát ( zber dát )
  • moje obľúbené ( môj obľúbený )
  1. [ veľmi ťažké , vyžaduje kódovanie , zber dát , môj obľúbený ] Jedným z najpôsobivejších požiadaviek výskumu Benoita a kolegov (2016) o kódovaní davov politických manifestov je to, že výsledky sú reprodukovateľné. Merz, Regel, and Lewandowski (2016) umožňujú vstup do Manifest Corpus. Pokúste sa reprodukovať obrázok 2 od Benoit et al. (2016) pomocou pracovníkov z Amazon Mechanical Turk. Aké sú vaše výsledky podobné?

  2. [ stredná ] V projekte InfluenzaNet uvádza dobrovoľnícka skupina ľudí výskyt, prevalenciu a správanie pri hľadaní zdravia v súvislosti s ochorením podobným chrípke (Tilston et al. 2010; Noort et al. 2015) .

    1. Porovnajte a kontrastujte návrh, náklady a pravdepodobné chyby v aplikáciách InfluenzaNet, Chrípkové trendy Google a tradičných systémov sledovania chrípky.
    2. Zvážte nevyriešený čas, ako napríklad vypuknutie novej formy chrípky. Opíšte možné chyby v každom systéme.
  3. [ usilovne , vyžaduje kódovanie , zber dát ] The Economist je týždenný spravodajský časopis. Vytvorte projekt ľudských výpočtov, aby ste zistili, či pomer žien k mužom na obálke sa časom zmenil.

    1. Časopis môže mať rôzne kryty v ôsmich rôznych regiónoch (Afrika, Ázia, Tichomorie, Európa, Európska únia, Latinská Amerika, Stredný východ, Severná Amerika a Spojené kráľovstvo) a môžu byť stiahnuté z webových stránok časopisu. Vyberte jednu z týchto oblastí a vykonajte analýzu. Nezabudnite popísať svoje postupy s dostatočnými podrobnosťami, aby ich mohol replikovať niekto iný.

    Táto otázka bola inšpirovaná podobným projektom od Justina Tenuta, vedúceho informatiky v crowdsourcingovej spoločnosti CrowdFlower: pozri časopis "Time Magazine Really Likes Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) ,

  4. [ veľmi ťažké , vyžaduje kódovanie , zber dát ] Na základe predchádzajúcej otázky teraz vykonajte analýzu pre všetkých osem regiónov.

    1. Aké rozdiely ste zistili v jednotlivých regiónoch?
    2. Koľko extra času a peňazí ste dostali na to, aby ste zvýšili svoju analýzu na všetkých osem regiónov?
    3. Predstavte si, že Economist má každý týždeň 100 rôznych obalov. Odhadnite, koľko extra času a peňazí by ste potrebovali na zvýšenie vašej analýzy na 100 obálok za týždeň.
  5. [ usilovne , vyžaduje kódovanie ] Existuje niekoľko webových stránok, ktoré hosťujú otvorené projekty telefonovania, napríklad Kaggle. Zapojte sa do jedného z týchto projektov a popíšte, čo sa dozviete o konkrétnom projekte ao otvorených výzvach vo všeobecnosti.

  6. [ stredná ] Pozrite sa na nedávne vydanie denníka vo vašom odbore. Existujú nejaké dokumenty, ktoré by mohli byť preformulované ako projekty otvorených výziev? Prečo áno alebo prečo nie?

  7. [ jednoduchý ] Purdam (2014) opisuje distribuovaný súbor údajov o žobraní v Londýne. Zhrňte silné a slabé stránky tohto návrhu výskumu.

  8. [ stredná ] Redundancia je dôležitý spôsob posúdenia kvality zhromažďovania distribuovaných údajov. Windt and Humphreys (2016) vyvinuli a testovali systém na zhromažďovanie správ o konfliktných udalostiach od ľudí vo východnom Kongu. Prečítajte si papier.

    1. Ako ich návrh zabezpečuje redundanciu?
    2. Ponúkali niekoľko prístupov na overenie údajov zozbieraných z ich projektu. Zhrňte ich. Ktorý bol pre vás najpresvedčivejší?
    3. Navrhnite nový spôsob, ako by mohli byť údaje overené. Návrhy by sa mali snažiť zvýšiť dôveru, ktorú by ste mali v údajoch spôsobom, ktorý je nákladovo efektívny a etický.
  9. [ stredná ] Karim Lakhani a kolegovia (2013) vytvorili otvorenú výzvu na získanie nových algoritmov na riešenie problému v oblasti výpočtovej biológie. Dostali viac ako 600 podaní obsahujúcich 89 nových výpočtových prístupov. Z príspevkov 30 prekročilo výkonnosť MegaBLASTu Spojených štátov národných inštitútov a najlepšie podanie dosiahlo vyššiu presnosť a rýchlosť (1000 krát rýchlejšie).

    1. Prečítajte si ich príspevok a potom navrhnite sociálny výskumný problém, ktorý by mohol použiť rovnaký druh otvorenej súťaže. Konkrétne sa tento druh otvorenej súťaže zameriava na urýchlenie a zlepšenie výkonu existujúceho algoritmu. Ak nemôžete myslieť na takýto problém vo svojom odbore, skúste vysvetliť prečo nie.
  10. [ stredná , môj obľúbený ] Mnoho ľudských výpočtových projektov sa spolieha na účastníkov z Amazon Mechanical Turk. Zaregistrujte sa, aby ste sa stali pracovníkmi na Amazon Mechanical Turk. Strávte jednu hodinu tam. Ako to ovplyvňuje vaše myšlienky na dizajn, kvalitu a etiku ľudských projektov v oblasti výpočtovej techniky?