eBird recolhe dados sobre as aves de observadores; voluntários podem fornecer escala geográfica que nenhuma equipe de pesquisa pode igualar.
Aves estão em toda parte, e ornitólogos gostaria de saber onde cada pássaro é a cada momento. Dado um conjunto de dados tão perfeita, ornitólogos poderiam abordar muitas questões fundamentais da sua área. Claro, coletar esses dados está fora do âmbito de qualquer investigador particular. Ao mesmo tempo que os ornitólogos desejo de dados mais ricos e completos, "observadores" -pessoas que ir observação de aves para se divertir-se constantemente observando aves e documentar o que vêem. Estas duas comunidades têm uma longa história de colaboração, mas agora essas colaborações foram transformadas pela era digital. eBird é um projeto de coleta de dados distribuída que solicita informações de observadores de aves em todo o mundo, e já recebeu mais de 260 milhões de avistamentos de aves de 250.000 participantes (Kelling et al. 2015) .
Antes do lançamento de eBird, grande parte dos dados criados por observadores não estava disponível para os pesquisadores:
"Em milhares de armários em todo o mundo hoje se encontram inúmeros notebooks, cartões de índice, listas de verificação anotados, e diários. Aqueles de nós envolvidos com as instituições birding conhece bem a frustração de ouvir uma e outra vez sobre 'registros de aves meu falecido tio' Sabemos o quão valioso que poderia ser. Infelizmente, nós também sabemos que não podemos usá-los. " (Fitzpatrick et al. 2002)
Ao invés de ter esses dados valiosos sentar não utilizado, eBird permite aos observadores para enviá-lo para um banco de dados centralizado, digital. Dados enviados para eBird contém seis campos-chave: quem, onde, quando, o que as espécies, quantas, e esforço. Para os leitores não-observação de pássaros, "esforço" refere-se aos métodos utilizados ao fazer observações. verificações de qualidade de dados começa antes mesmo de os dados são carregados. Birders tentando apresentar relatórios-tão incomum como relatórios de espécie muito rara, muito contagens elevadas, ou fora de temporada relatórios-são sinalizadas, e no site solicita automaticamente informações adicionais, tais como fotografias. Depois de recolher estas informações adicionais, os relatórios marcados são enviados para uma das centenas de peritos regionais voluntários para posterior avaliação. Após investigação pela, incluindo especialista possível correspondência adicional regional com os birder-os relatórios marcados ou são descartados como não confiável ou eles são inseridos no banco de dados eBird (Kelling et al. 2012) . Esta base de dados de observações selecionados é então disponibilizado para qualquer pessoa no mundo com acesso à Internet, e até agora, quase 100 publicações peer-reviewed tê-lo usado (Bonney et al. 2014) . eBird mostra claramente que observadores voluntários são capazes de recolher dados que são úteis para a pesquisa verdadeira ornitologia.
Uma das belezas de eBird é que ele capta "trabalho" que já está a acontecer, neste caso, observação de pássaros. Este recurso permite que o projeto alcance enorme escala. No entanto, o "trabalho" feito por observadores não corresponde exatamente os dados necessários por ornitólogos. Por exemplo, em eBird, a recolha de dados é determinada pela localização da observadores não o local de aves. Isto significa que, por exemplo, a maioria das observações tendem a ocorrer perto das estradas (Kelling et al. 2012; Kelling et al. 2015) . Além desta distribuição desigual de esforço sobre o espaço, as observações realizadas por observadores reais não são sempre ideal. Por exemplo, alguns observadores apenas carregar informações sobre as espécies que eles consideram interessantes em vez de carregar informações sobre todas as espécies que eles observados.
pesquisadores eBird tem duas soluções principais para essas questões de qualidade de dados, questões que surgem em muitos outros projectos de recolha de dados distribuídos. Primeiro, os pesquisadores eBird estão constantemente tentando melhorar a qualidade dos dados apresentados pelos observadores de aves. Por exemplo, eBird oferece educação para os participantes, e criou visualizações de dados de cada participante que, em sua concepção, incentivar observadores para fazer upload de informações sobre todas as espécies que eles observados, e não apenas um subconjunto (Wood et al. 2011; Wiggins 2011) . Em segundo lugar, os pesquisadores eBird utilizar modelos estatísticos que tentam corrigir a natureza barulhento e heterogênea dos dados brutos. Ainda não está claro se esses modelos estatísticos remover completamente preconceitos a partir dos dados, mas ornitólogos estão confiantes o suficiente na qualidade dos dados eBird ajustados que, como havia sido mencionado anteriormente, ele tem sido usado em quase 100 publicações científicas com revisão por pares.
Muitos não-ornitólogos estão inicialmente extremamente céticos quando ouvem sobre eBird pela primeira vez. Na minha opinião, parte desse ceticismo vem de pensar sobre eBird no caminho errado. Muitas pessoas pensam primeiramente "Os dados são eBird perfeito?", Ea resposta é absolutamente não. No entanto, essa não é a pergunta certa. A pergunta certa é: "Para certas questões de pesquisa, são os dados eBird melhor do que os dados ornitologia existentes?" Para essa pergunta a resposta é definitivamente sim, em parte porque, para muitas questões de interesse não há alternativa realista para a coleta de dados distribuída.
O projeto eBird demonstra que é possível envolver voluntários na recolha de dados científicos importantes. No entanto, eBird e relacionados projetos, indicam que os desafios relacionados com a amostragem e a qualidade dos dados são preocupações para os projectos de recolha de dados distribuídos. Como veremos na próxima seção, no entanto, com design inteligente e tecnologia essas preocupações podem ser minimizados em algumas configurações.