actividades

Key:

  • Grado de dificultade: fácil fácil , medio medio , difícil difícil , moi duro moi duro
  • require matemáticas ( require matemáticas )
  • require codificación ( require codificación )
  • recollida de datos ( recollida de datos )
  1. [ moi duro , require codificación , recollida de datos ] Unha das reivindicacións máis emocionantes de Benoit et al. (2015) na crowd-codificación dos manifestos políticos é que os resultados son reprodutíveis. Merz, Regel, and Lewandowski (2016) ofrece acceso ao Manifesto Corpus. Probe reproducir Fig 2 de Benoit et al. (2015) utilizando os traballadores de Amazon Mechanical Turk. Como semellante foron os seus resultados?

  2. [ medio ] O proxecto InfluenzaNet un panel voluntario de persoas relatan a incidencia, prevalencia e comportamento de busca de saúde relacionada coa gripe do tipo gripal (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. Comparar e contrastar o proxecto, custos e erros probables en InfluenzaNet, Google Flu Trends, e sistemas de seguimento de gripe tradicionais.
    2. Considero un tempo inestable, como a epidemia de gripe porcina. Describir os posibles erros en cada sistema.
  3. [ difícil , require codificación , recollida de datos ] The Economist é unha revista semanal de noticias. Crear un proxecto de computación humana a ver se a proporción de mulleres para homes na capa aumentou co paso do tempo.

    1. A revista pode ter diferentes coberturas en oito rexións distintas (África, Asia-Pacífico, Europa, Unión Europea, América Latina, Oriente Medio, América e Reino Unido) e todos eles poden ser descargados da web do The Economist . Escolla unha destas rexións e realizar a análise. Asegúrese de describir os seus procedementos con detalles suficientes que puidesen ser replicados por outra persoa.

    Esta cuestión foi inspirado nun proxecto similar por Justin Tenuto, un científico de datos na empresa crowdsourcing CrowdFlower , consulte "Equipo Magazine realmente gusta Dudes" .

  4. [ moi duro , require codificación , recollida de datos ] Baseado na pregunta anterior, agora realizar a análise para todos os oito rexións.

    1. Que diferenzas atopou entre as rexións?
    2. Canto máis tempo e diñeiro que tardou para ampliar o seu análise de todos os oito rexións?
    3. Imaxina que a Economist ten 100 capas diferentes cada semana. Estimar canto tempo e diñeiro que sería necesario para dimensionar-se a súa análise de 100 tapas por semana.
  5. [ difícil , require codificación ] [Kaggle] (https://www.kaggle.com/) é un sitio web que aloxa proxectos de chamadas abertas. Participar nun destes proxectos.

  6. [ medio ] Olle a través dunha edición recente dunha revista no seu campo. Hai os documentos que poderían ser reformuladas como proxectos de chamadas abertas? Por que ou por que non?

  7. [ fácil ] Purdam (2014) describiu unha recollida de datos distribuídos sobre mendicidade en Londres. Resumir os puntos fortes e débiles deste proxecto de investigación.

  8. [ medio ] A redundancia é unha forma importante para avaliar a calidade da recollida de datos distribuídos. Windt and Humphreys (2016) desenvolver e probar un sistema para recoller informes de eventos conflito de persoas no leste do Congo. Ler o xornal.

    1. Como é que o seu deseño garantir redundancia?
    2. Eles ofrecen varias propostas para validar os datos recollidos a partir do seu proxecto. Resumín a eles. Que foi máis convincente para ti?
    3. Propoñer unha nova forma que os datos poderían ser validado. As suxestións deben tentar aumentar a confianza de que tería nos datos dun xeito que é rendible e ético.
  9. [ medio ] Karim Lakhani e os seus colegas (2013) creou unha chamada aberta para solicitar novos algoritmos para resolver un problema en bioloxía computacional. Recibiron máis de 600 actuacións que contén 89 novos enfoques computacionais. Das presentacións, recibiron 30 que superou o desempeño dos Institutos Nacionais de Megablast de Sanidade, ea mellor presentación alcanzado tanto maior precisión e velocidade (1.000 veces máis rápido).

    1. Ler o seu papel e, a continuación, propoñer un problema de investigación social que podería usar o mesmo tipo de concurso aberto. En particular, este tipo de concurso aberto está enfocada en acelerar e mellorar o rendemento dun algoritmo existente. Se non pode pensar en problemas como este no seu campo, tentar explicar por que non.
  10. [ medio ] Moitos proxectos de computación humana contar con participantes de Amazon Mechanical Turk. Rexístrese para facer un traballador en Amazon Mechanical Turk. Pasar unha hora de traballo alí. Cal o impacto seus pensamentos sobre o deseño, calidade e ética de proxectos compuation humanos?