atividades

  • grau de dificuldade: fácil fácil médio médio , Difícil Difícil , muito difícil muito difícil
  • requer matemática ( requer matemática )
  • requer codificação ( requer codificação )
  • coleção de dados ( coleção de dados )
  • meus favoritos ( meu favorito )
  1. [ muito difícil , requer codificação , coleção de dados , meu favorito Uma das afirmações mais interessantes da pesquisa de Benoit e colegas (2016) sobre codificação de manifestos políticos é que os resultados são reprodutíveis. Merz, Regel, and Lewandowski (2016) fornecem acesso ao Manifesto Corpus. Tente reproduzir a figura 2 de Benoit et al. (2016) usando trabalhadores da Amazon Mechanical Turk. Quão parecidos foram os seus resultados?

  2. [ médio No projeto InfluenzaNet, um painel de voluntários relatou a incidência, a prevalência e o comportamento de busca de saúde relacionados à doença semelhante à gripe (Tilston et al. 2010; Noort et al. 2015) .

    1. Compare e contraste o design, os custos e os erros prováveis ​​em InfluenzaNet, Google Flu Trends e sistemas tradicionais de rastreamento da gripe.
    2. Considere um período instável, como um surto de uma nova forma de gripe. Descreva os possíveis erros em cada sistema.
  3. [ Difícil , requer codificação , coleção de dados ] The Economist é uma revista de notícias semanal. Crie um projeto de computação humana para ver se a proporção de mulheres para homens na capa mudou ao longo do tempo.

    1. A revista pode ter diferentes capas em oito regiões diferentes (África, Ásia-Pacífico, Europa, União Européia, América Latina, Oriente Médio, América do Norte e Reino Unido) e todas podem ser baixadas do site da revista. Escolha uma dessas regiões e execute a análise. Certifique-se de descrever seus procedimentos com detalhes suficientes para que possam ser replicados por outra pessoa.

    Esta pergunta foi inspirada por um projeto similar de Justin Tenuto, um cientista de dados da CrowdFlower: veja “A revista Time realmente gosta de caras” (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ muito difícil , requer codificação , coleção de dados ] Com base na pergunta anterior, faça agora a análise para todas as oito regiões.

    1. Quais diferenças você encontrou em todas as regiões?
    2. Quanto tempo e dinheiro extra foram necessários para ampliar sua análise para todas as oito regiões?
    3. Imagine que o Economist tenha 100 capas diferentes a cada semana. Estimar quanto tempo e dinheiro extra seria necessário para ampliar sua análise para 100 coberturas por semana.
  5. [ Difícil , requer codificação ] Existem vários sites que hospedam projetos de chamada aberta, como o Kaggle. Participe de um desses projetos e descreva o que você aprendeu sobre esse projeto específico e sobre chamadas abertas em geral.

  6. [ médio ] Examine uma edição recente de um periódico em seu campo. Há algum documento que poderia ter sido reformulado como projetos de chamada aberta? Por que ou por que não?

  7. [ fácil Purdam (2014) descreve uma coleta de dados distribuídos sobre implorando em Londres. Resuma os pontos fortes e fracos deste design de pesquisa.

  8. [ médio A redundância é uma maneira importante de avaliar a qualidade da coleta de dados distribuídos. Windt and Humphreys (2016) desenvolveram e testaram um sistema para coletar relatos de eventos de conflito de pessoas no leste do Congo. Leia o papel.

    1. Como o design deles garante redundância?
    2. Eles ofereceram várias abordagens para validar os dados coletados de seu projeto. Resuma-os. Qual foi o mais convincente para você?
    3. Propor uma nova maneira de validar os dados. Sugestões devem tentar aumentar a confiança que você teria nos dados de uma maneira que seja econômica e ética.
  9. [ médio ] Karim Lakhani e colegas (2013) criaram uma chamada aberta para solicitar novos algoritmos para resolver um problema em biologia computacional. Eles receberam mais de 600 submissões contendo 89 novas abordagens computacionais. Das submissões, 30 superaram o desempenho do MegaBLAST dos Institutos Nacionais de Saúde dos EUA, e a melhor submissão alcançou maior precisão e velocidade (1.000 vezes mais rápido).

    1. Leia seu artigo e, em seguida, proponha um problema de pesquisa social que possa usar o mesmo tipo de concurso aberto. Em particular, este tipo de concurso aberto está focado em acelerar e melhorar o desempenho de um algoritmo existente. Se você não consegue pensar em um problema como esse em seu campo, tente explicar por que não.
  10. [ médio , meu favorito Muitos projetos de computação humana contam com participantes do Amazon Mechanical Turk. Inscreva-se para se tornar um trabalhador no Amazon Mechanical Turk. Passe uma hora trabalhando lá. Como isso afeta seus pensamentos sobre o design, a qualidade e a ética de projetos de computação humanos?