O eBird coleta dados sobre aves de observadores de aves; os voluntários podem fornecer uma escala que nenhuma equipe de pesquisa pode igualar.
As aves estão por toda parte, e os ornitólogos gostariam de saber onde cada ave está a cada momento. Dado um conjunto de dados tão perfeito, os ornitólogos poderiam abordar muitas questões fundamentais em seu campo. É claro que coletar esses dados está além do escopo de qualquer pesquisador em particular. Ao mesmo tempo em que os ornitólogos desejam dados mais ricos e completos, os “observadores de pássaros” - pessoas que assistem a observação de aves por diversão - observam constantemente os pássaros e documentam o que vêem. Essas duas comunidades têm uma longa história de colaboração, mas agora essas colaborações foram transformadas pela era digital. O eBird é um projeto de coleta de dados distribuído que solicita informações de observadores de aves ao redor do mundo e já recebeu mais de 260 milhões de avistamentos de aves de 250.000 participantes (Kelling, Fink, et al. 2015) .
Antes do lançamento do eBird, a maioria dos dados criados por observadores de aves não estavam disponíveis para os pesquisadores:
“Em milhares de armários em todo o mundo atualmente existem inúmeros cadernos, fichas de índice, listas de verificação anotadas e diários. Aqueles de nós envolvidos com instituições de observação de aves sabem bem a frustração de ouvir repetidas vezes sobre os registros de pássaros do meu tio-avô. [Sic] Sabemos quão valiosos eles poderiam ser. Infelizmente, também sabemos que não podemos usá-los. ” (Fitzpatrick et al. 2002)
Em vez de deixar esses dados valiosos sem uso, o eBird permite que observadores de aves os enviem para um banco de dados digital centralizado. Os dados enviados para o eBird contêm seis campos-chave: quem, onde, quando, que espécie, quantos e esforço. Para os leitores não-observadores, “esforço” refere-se aos métodos usados ao fazer observações. As verificações de qualidade de dados começam mesmo antes de os dados serem carregados. Os observadores de aves que tentam enviar relatórios incomuns - como relatos de espécies muito raras, contagens muito altas ou relatórios fora de época - são sinalizados e o site solicita automaticamente informações adicionais, como fotografias. Depois de coletar essas informações adicionais, os relatórios sinalizados são enviados a uma das centenas de especialistas regionais voluntários para uma análise mais detalhada. Após investigação pelo especialista regional - incluindo possível correspondência adicional com o observador - os relatórios sinalizados são descartados como não confiáveis ou inseridos no banco de dados do eBird (Kelling et al. 2012) . Este banco de dados de observações rastreadas é então disponibilizado para qualquer pessoa no mundo com uma conexão com a Internet e, até o momento, quase 100 publicações revisadas por pares o utilizaram (Bonney et al. 2014) . O eBird mostra claramente que observadores voluntários são capazes de coletar dados que são úteis para pesquisas reais de ornitologia.
Uma das belezas do eBird é que ele captura o “trabalho” que já está acontecendo - neste caso, a observação de pássaros. Esse recurso permite que o projeto atinja uma tremenda escala. No entanto, o “trabalho” feito pelos observadores não corresponde exatamente aos dados necessários pelos ornitólogos. Por exemplo, no eBird, a coleta de dados é determinada pela localização dos observadores, não pela localização das aves. Isso significa que, por exemplo, a maioria das observações tende a ocorrer perto de estradas (Kelling et al. 2012; Kelling, Fink, et al. 2015) . Além dessa distribuição desigual de esforço no espaço, as observações reais feitas pelos observadores de pássaros nem sempre são ideais. Por exemplo, alguns observadores de aves só enviam informações sobre espécies que consideram interessantes, em vez de informações sobre todas as espécies que observaram.
Os pesquisadores do eBird têm duas soluções principais para esses problemas de qualidade de dados - soluções que também podem ser úteis em outros projetos distribuídos de coleta de dados. Primeiro, os pesquisadores do eBird estão constantemente tentando atualizar a qualidade dos dados enviados pelos observadores. Por exemplo, o eBird oferece educação aos participantes e criou visualizações dos dados de cada participante que, por seu design, incentivam os observadores a enviar informações sobre todas as espécies que observaram, e não apenas as mais interessantes (Wood et al. 2011; Wiggins 2011) . Segundo, os pesquisadores do eBird usam modelos estatísticos que tentam corrigir a natureza ruidosa e heterogênea dos dados brutos (Fink et al. 2010; Hurlbert and Liang 2012) . Ainda não está claro se esses modelos estatísticos eliminam totalmente os vieses dos dados, mas os ornitólogos confiam o suficiente na qualidade dos dados ajustados do eBird que, como mencionado anteriormente, esses dados foram usados em quase 100 publicações científicas revisadas por pares.
Muitos não-ornitologistas são inicialmente extremamente céticos quando ouvem pela primeira vez o eBird. Na minha opinião, parte desse ceticismo vem de pensar no eBird de maneira errada. Muitas pessoas pensam primeiro “Os dados do eBird estão perfeitos?”, E a resposta é “absolutamente não”. No entanto, essa não é a pergunta certa. A pergunta certa é: “Para certas questões de pesquisa, os dados do eBird são melhores que os dados de ornitologia existentes?” Para essa pergunta, a resposta é “definitivamente sim”, em parte porque muitas questões de interesse - como perguntas sobre migração sazonal em larga escala. - não há alternativas realistas para a coleta distribuída de dados.
O projeto do eBird demonstra que é possível envolver voluntários na coleta de dados científicos importantes. No entanto, o eBird e os projetos relacionados indicam que os desafios relacionados à amostragem e à qualidade dos dados são preocupações com projetos distribuídos de coleta de dados. Como veremos na próxima seção, no entanto, com design e tecnologia inteligentes, essas preocupações podem ser minimizadas em algumas configurações.