aktivity

kľúč:

  • Stupeň obtiažnosti: ľahká jednoduchý , stredne stredná tvrdé usilovne , veľmi ťažké veľmi ťažké
  • vyžaduje matematiku ( vyžaduje matematiku )
  • vyžaduje kódovanie ( vyžaduje kódovanie )
  • zber dát ( zber dát )
  1. [ veľmi ťažké , vyžaduje kódovanie , zber dát ] Jeden z najviac vzrušujúcich pohľadávok z Benoit et al. (2015) na dav-kódovanie politických manifestov je, že výsledky sú reprodukovateľné. Merz, Regel, and Lewandowski (2016) poskytuje prístup k manifestu korpusu. Pokúsiť sa reprodukovať obr 2 z Benoit et al. (2015) za použitia pracovníkmi z Amazon Mechanical Turk. Ako podobné boli vaše výsledky?

  2. [ stredná ] V InfluenzaNet projektu dobrovoľník panel ľudí, ktorí hlásia výskyt, rozšírenie a zdravotné hľadá správanie súvisiace s chrípkové-ochoreniach (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. Porovnať a odlíšiť dizajn, náklady a pravdepodobné chyby v InfluenzaNet Chrípkové trendy Google a tradičné sledovacie systémy chrípky.
    2. Zoberme si pohnutú dobu, ako je prasacej chrípky. Popíšte prípadné chyby v každom systéme.
  3. [ usilovne , vyžaduje kódovanie , zber dát ] The Economist je týždenný spravodajský časopis. Vytvorenie ľudskou výpočtovej projekt, aby zistili, či je pomer žien k mužom na obálke zvýšila v priebehu času.

    1. Časopis môže mať rôzne kryty v ôsmich rôznych regiónoch (Afrika, Ázia a Tichomorie, Európa, Európska únia, Latinskej Ameriky, Stredného východu, Severnej Ameriky a Spojené kráľovstvo) a môžu byť všetky stiahnuť z webovej stránky The Economist . Vyberte si jeden z týchto regiónov a vykonať analýzu. Uistite sa, že popisovať svoje postupy s dostatkom detailov, ktoré by mohli byť replikované niekto iný.

    Táto otázka bola inšpirovaná podobným projektu Justin Tenuto, dátové vedec na crowdsourcing spoločnosti CrowdFlower , pozri "Time Magazine má naozaj rád Dudes" .

  4. [ veľmi ťažké , vyžaduje kódovanie , zber dát ] V nadväznosti na vyššie uvedenú otázku, teraz vykonávať analýzu všetkých ôsmich krajoch.

    1. Aké rozdiely ste našiel naprieč regiónmi?
    2. Ako veľmi extra času a peňazí trvalo škálovať-up svoju analýzu na všetkých ôsmich regiónoch?
    3. Predstavme si, že Economist má 100 rôznych krytov každý týždeň. Odhadnúť, ako moc extra času a peňazí to bude trvať škálovať-up vašej analýzy 100 krytov týždenne.
  5. [ usilovne , vyžaduje kódovanie ] [Kaggle] (https://www.kaggle.com/) je webová stránka, ktorá je hostiteľom otvorených projektov volanie. Podieľať sa na jednej z týchto projektov.

  6. [ stredná ] Pozrite sa nedávnom vydaní časopisu vo svojom odbore. Existujú nejaké papiere, ktoré by boli preformulované ako projekty Otvorená výzva? Prečo áno alebo prečo nie?

  7. [ jednoduchý ] Purdam (2014) opísal distribuovaný zber dát o žobranie v Londýne. Zhrnúť silné a slabé stránky tohto výskumného zámeru.

  8. [ stredná ] Redundancia je dôležitý spôsob, ako hodnotiť kvalitu distribuovaného zberu dát. Windt and Humphreys (2016) vyvinúť a otestovať systém pre zber správ o konflikte udalostí od ľudí vo východnom Kongu. Čítať noviny.

    1. Ako sa ich konštrukcia zaistí redundanciu?
    2. Ponúkajú niekoľko prístupov na overenie dát získaných z ich projektu. Zhrnúť je. Čo bolo Najpresvedčivejší pre vás?
    3. Navrhnúť nový spôsob, že údaje by mohli byť potvrdený. Návrhy by sa mali snažiť zvýšiť istotu, že budete musieť v dátach spôsobom, ktorý je nákladovo efektívne a etické.
  9. [ stredná ] Karim Lakhani a jeho kolegovia (2013) vytvoril otvorenú výzvu vyžiadať nové algoritmy vyriešiť problém vo výpočtovej biológii. Dostalo sa im viac ako 600 podaní, ktoré obsahujú 89 nových výpočtových prístupov. Z toho, čo tvrdí, že dostala 30, ktorá prekročila výkonnosť US National Institutes of Health Megablast, a najlepšie podanie dosiahnuté i väčšiu presnosť a rýchlosť (1000 krát rýchlejší).

    1. Čítať ich noviny, a potom navrhnúť nejaký problém sociálneho výskumu, ktoré by mohli používať rovnaký druh otvorenej súťaže. Najmä tento druh otvorenej súťaže je zameraný na urýchlenie a zlepšenie výkonu existujúceho algoritmu. Ak nemôžete myslieť na problém, ako je tento vo svojom odbore, sa snaží vysvetliť, prečo nie.
  10. [ stredná ] Mnoho výpočtovej projekty v oblasti ľudských spoliehajú na účastníkov z Amazon Mechanical Turk. Sign-up, aby sa stal pracovníkom na Amazon Mechanical Turk. Stráviť hodinu tam pracovať. Ako to ovplyvniť vaše myšlienky o dizajn, kvalitu a etika compuation projektov v oblasti ľudských?