Activitati

  • gradul de dificultate: ușor uşor , mediu mediu , greu greu , foarte greu foarte greu
  • necesită matematică ( necesită matematică )
  • necesită codificare ( necesită codificare )
  • colectare de date ( colectare de date )
  • preferatele mele ( preferatul meu )
  1. [ foarte greu . necesită codificare . colectare de date . preferatul meu ] Una dintre cele mai incitante pretentii ale cercetarilor lui Benoit si ale colegilor (2016) privind codificarea aglomerata a manifestarilor politice este ca rezultatele sunt reproductibile. Merz, Regel, and Lewandowski (2016) oferă acces la Manifestul Corpus. Încercați să reproduceți figura 2 de la Benoit et al. (2016) folosind muncitorii de la Amazon Mechanical Turk. Cât de similare au fost rezultatele dvs.?

  2. [ mediu ] În cadrul proiectului InfluenzaNet, un grup de voluntari de populație raportează incidența, prevalența și comportamentul de căutare a sănătății legate de boala asemănătoare gripei (Tilston et al. 2010; Noort et al. 2015) .

    1. Comparați și contrastează designul, costurile și erorile posibile în InfluenzaNet, Google Flu Trends și sistemele tradiționale de urmărire a influenței.
    2. Luați în considerare un timp neregulat, cum ar fi izbucnirea unei noi forme de gripă. Descrieți posibilele erori din fiecare sistem.
  3. [ greu . necesită codificare . colectare de date ] The Economist este o revistă săptămânală de știri. Creați un proiect de calcul uman pentru a vedea dacă raportul dintre femei și bărbați pe copertă sa schimbat în timp.

    1. Revista poate avea diferite coperți în opt regiuni diferite (Africa, Asia Pacific, Europa, Uniunea Europeană, America Latină, Orientul Mijlociu, America de Nord și Regatul Unit) și pot fi descărcate de pe site-ul revistei. Alegeți una dintre aceste regiuni și efectuați analiza. Asigurați-vă că vă descrieți procedurile cu suficientă detaliere pentru a putea fi replicate de altcineva.

    Această întrebare a fost inspirată de un proiect similar realizat de Justin Tenuto, un om de știință la compania CrowdFlower: vezi "Time Magazine Really Likes Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ foarte greu . necesită codificare . colectare de date ] Pe baza întrebării anterioare, efectuați acum analiza pentru toate cele opt regiuni.

    1. Ce diferențe ai găsit în regiuni?
    2. Cât de mult timp și bani ați făcut pentru a vă mări analiza în toate cele opt regiuni?
    3. Imaginați-vă că economistul are 100 de coperți diferite în fiecare săptămână. Estimați cât de mult timp și bani ar fi nevoie pentru a crește analiza dvs. la 100 de acoperă pe săptămână.
  5. [ greu . necesită codificare ] Există mai multe site-uri care găzduiesc proiecte de apel deschise, cum ar fi Kaggle. Participați la unul dintre aceste proiecte și descrieți ce învățați despre proiectul respectiv și despre apelurile deschise în general.

  6. [ mediu ] Uită-te la un număr recent de jurnal din domeniul tău. Există documente care ar fi putut fi reformulate ca proiecte de apel deschis? De ce sau de ce nu?

  7. [ uşor ] Purdam (2014) descrie o colecție de date distribuită despre cerșit în Londra. Rezumați punctele forte și punctele slabe ale acestui proiect de cercetare.

  8. [ mediu ] Redundanța este o modalitate importantă de a evalua calitatea colectării datelor distribuite. Windt and Humphreys (2016) dezvoltat și testat un sistem de colectare a rapoartelor privind evenimentele conflictuale de la persoanele din estul Congo. Citește ziarul.

    1. Cum asigură designul lor redundanță?
    2. Ei au oferit mai multe abordări pentru a valida datele colectate din proiectul lor. Rezumați-le. Care a fost cea mai convingătoare pentru dvs.?
    3. Propuneți un nou mod în care datele ar putea fi validate. Sugestiile ar trebui să încerce să crească încrederea pe care ați avea-o în date într-un mod care să fie rentabil și etic.
  9. [ mediu ] Karim Lakhani și colegii (2013) creat un apel deschis pentru a solicita noi algoritmi pentru a rezolva o problemă în biologia computațională. Au primit mai mult de 600 de depuneri care conțin 89 de noi abordări computaționale. Dintre observații, 30 au depășit performanța MegaBLAST a Statelor Unite ale Națiunilor din Sănătate, iar cea mai bună depunere a atins atât o acuratețe cât și o viteză mai mare (de 1.000 de ori mai rapidă).

    1. Citiți hârtia și apoi propuneți o problemă de cercetare socială care ar putea folosi același tip de concurs deschis. În mod special, acest tip de concurs deschis se concentrează pe accelerarea și îmbunătățirea performanțelor unui algoritm existent. Dacă nu vă puteți gândi la o problemă de genul asta în domeniul dvs., încercați să explicați de ce nu.
  10. [ mediu . preferatul meu ] Multe proiecte de calcul umane se bazează pe participanții de la Amazon Mechanical Turk. Înscrieți-vă pentru a deveni lucrător pe Amazon Mechanical Turk. Petreceți o oră de lucru acolo. Cum influențează acest lucru gândurile tale asupra designului, calității și eticii proiectelor de calcul uman?