activitats

clau:

  • grau de dificultat: fàcil fàcil , mitja mitjà i dur dur , molt dur molt dur
  • requereix matemàtiques ( requereix matemàtiques )
  • requereix codificació ( requereix de codificació )
  • recopilació de dades ( recopilació de dades )
  1. [ molt dur , requereix de codificació , recopilació de dades ] Una de les afirmacions més interessants de Benoit et al. (2015) en multitud de codificació de manifestos polítics és que els resultats són reproduïbles. Merz, Regel, and Lewandowski (2016) proporciona accés al Manifest Corpus. Tractar de reproduir la figura 2 de Benoit et al. (2015) utilitzant treballadors d'Amazon Mechanical Turk. Què tan similars van ser els seus resultats?

  2. [ mitjà ] En el projecte InfluenzaNet un panell de voluntaris de les persones informar de la incidència, la prevalença i la salut del comportament de recerca relacionada amb la grip-com-malaltia (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. Comparar i contrastar el disseny, costos i possibles errors en InfluenzaNet, Google Flu Trends, i sistemes de seguiment de la grip tradicionals.
    2. Penseu un temps sense resoldre, com ara el brot de grip porcina. Descriure els possibles errors en cada sistema.
  3. [ dur , requereix de codificació , recopilació de dades ] The Economist és una revista de notícies setmanal. Crear un projecte de computació humana per veure si la proporció de dones i homes a la portada ha augmentat amb el temps.

    1. La revista pot tenir diferents cobertes en vuit regions diferents (Àfrica, Àsia Pacífic, Europa, la Unió Europea, Amèrica Llatina, Orient Mitjà, Amèrica del Nord, i del Regne Unit) i tots ells poden ser descarregats des del lloc web de The Economist . Tria una d'aquestes regions i realitzar l'anàlisi. Assegureu-vos de descriure els seus procediments amb suficient detall perquè puguin ser replicats per una altra persona.

    Aquesta pregunta es va inspirar en un projecte similar per Justin Tenuto, un científic de dades de l'empresa i Bing per CrowdFlower , veure "la revista Time li agrada molt Dudes" .

  4. [ molt dur , requereix de codificació , recopilació de dades ] Sobre la base de la pregunta anterior, ara realitzar l'anàlisi de les vuit regions.

    1. Quines diferències trobes entre les regions?
    2. Quant més temps i diners es triga a augmentar l'escala de la seva anàlisi per als vuit de les regions?
    3. Imagineu que l'economista té 100 portades diferents cada setmana. Estimar la quantitat de temps i diners extra es necessitaria per augmentar l'escala de la seva anàlisi per a 100 coberts per setmana.
  5. [ dur , requereix de codificació ] [Kaggle] (https://www.kaggle.com/) és un lloc web que allotja els projectes de convocatòria oberta. Participar en un d'aquests projectes.

  6. [ mitjà ] Mira a través d'un número recent d'una revista en el seu camp. Hi ha alguna documents que podrien haver estat reformulats com a projectes de trucades obertes? Per què o per què no?

  7. [ fàcil ] Purdam (2014) descriuen una col·lecció de dades distribuïts sobre la mendicitat a Londres. Resumir els punts forts i febles d'aquest disseny d'investigació.

  8. [ mitjà ] La redundància és una manera important per avaluar la qualitat de la recollida de dades distribuïda. Windt and Humphreys (2016) desenvolupar i provar un sistema de recollida d'informes d'esdeveniments de conflicte de persones a l'est del Congo. Llegir el diari.

    1. Com s'assegura el seu disseny redundància?
    2. Ofereixen diversos enfocaments per validar les dades recollides del seu projecte. Resum dels mateixos. El que era més convincent per a vostè?
    3. Proposar una nova forma de que les dades podrien ser validats. Els suggeriments han de tractar d'augmentar la confiança que tindria en les dades d'una manera que és rendible i ètic.
  9. [ mitjà ] Karim Lakhani i els seus col·legues (2013) van crear una convocatòria oberta per sol·licitar nous algoritmes per resoldre un problema en la biologia computacional. Es van rebre més de 600 presentacions que contenen 89 nous enfocaments computacionals. Dels escrits, i es van rebre 30 que va superar el rendiment dels Instituts Nacionals de Salut dels Estats Units d'Megablast, i la millor presentació arriben tant una major precisió i velocitat (1.000 vegades més ràpid).

    1. Llegir el seu paper, i després proposar un problema d'investigació social que podria utilitzar el mateix tipus de concurs obert. En particular, aquest tipus de concurs obert se centra en accelerar i millorar el rendiment d'un algoritme existent. Si no es pot pensar en un problema com aquest en el seu camp, tractar d'explicar per què no.
  10. [ mitjà ] Molts projectes de càlcul humans depenen dels participants d'Amazon Mechanical Turk. Fes-ho per convertir-se en un treballador en Amazon Mechanical Turk. Passar una hora de treball allà. Com afecta això als seus pensaments sobre el disseny, la qualitat i l'ètica dels projectes compuation humans?