eBird recolle datos sobre as aves de observadores, voluntarios poden proporcionar escala xeográfica que ningún equipo de investigación pode igualar.
Aves están en todas partes, e ornitólogos quere saber onde cada paxaro é cada momento. Dado un conxunto de datos tan perfecta, ornitólogos poderían abordar moitas cuestións fundamentais da súa área. Por suposto, recoller eses datos está fóra do ámbito de calquera investigador particular. Á vez que os ornitólogos desexo de datos máis ricos e completos, "observadores" -Persoas que ir observación de aves para divertirse-se constantemente observando aves e documentar o que ven. Estas dúas comunidades teñen unha longa historia de colaboración, pero agora estas colaboracións foron transformadas pola era dixital. eBird é un proxecto de recollida de datos distribuída que solicita información de observadores de aves de todo o mundo, e xa recibiu máis de 260 millóns de avistamentos de aves de 250.000 participantes (Kelling et al. 2015) .
Antes do lanzamento de eBird, gran parte dos datos creados por observadores non estaba dispoñible para os investigadores:
"En miles de armarios en todo o mundo hoxe se encontran numerosos notas, tarxetas de índice, listas de verificación anotados, e diarios. Aqueles de nós implicados coas institucións birding coñece ben a frustración de escoitar unha e outra vez sobre 'rexistros de aves meu falecido tío' Sabemos o quão valioso que podería ser. Desafortunadamente, nós tamén sabemos que non podemos usalos. " (Fitzpatrick et al. 2002)
En vez de ter eses datos valiosos sentir non utilizado, eBird permite aos observadores para enviá-lo para un banco de datos central, dixital. Datos enviados eBird contén seis campos clave: quen, onde, cando, o que as especies, cantas, e esforzo. Para os lectores non observación de paxaros, "esforzo" refírese aos métodos utilizados ao facer observacións. comprobacións de calidade de datos comeza antes de os datos son cargados. Birders tentando presentar informes-tan inusual como informes de especie moi rara, moi contas elevadas, ou fóra de tempada informes-son sinalizadas, e na páxina web solicita automaticamente información, tales como fotografías. Tras recoller esta información adicional, os informes marcados son enviados a unha das centos de expertos rexionais voluntarios para a súa posterior avaliación. Tras investigación pola, incluíndo experto posible correspondencia adicional rexional cos birder os informes marcados ou eliminado como non fiable ou son inseridos na base de datos eBird (Kelling et al. 2012) . Esta base de datos de observacións seleccionados é entón dispoñible para calquera persoa no mundo con acceso a Internet, e ata agora, case 100 publicacións peer-reviewed telo usado (Bonney et al. 2014) . eBird mostra claramente que observadores voluntarios son capaces de recoller datos que son útiles para a investigación verdadeira ornitoloxía.
Unha das belezas de eBird é que capta "traballo" que xa está a acontecer neste caso, observación de paxaros. Esta característica permite que o proxecto alcance enorme escala. Con todo, o "traballo" feito por observadores non corresponde exactamente os datos necesarios por ornitólogos. Por exemplo, en eBird, a recollida de datos é determinada pola localización da observadores non o lugar de aves. Isto quere dicir que, por exemplo, a maioría das observacións tenden a ocorrer preto das estradas (Kelling et al. 2012; Kelling et al. 2015) . Ademais desta distribución desigual de esforzo sobre o espazo, as observacións realizadas por observadores reais non son sempre ideal. Por exemplo, algúns observadores só Cargando información sobre as especies que consideran interesantes en vez de cargar información sobre todas as especies que observados.
investigadores eBird ten dúas solucións principais para estas cuestións de calidade de datos, cuestións que xorden en moitos outros proxectos de recollida de datos distribuídos. En primeiro lugar, os investigadores eBird clasifícanse tentando mellorar a calidade dos datos presentados polos observadores de aves. Por exemplo, eBird ofrece educación para os participantes, e creou visualizacións de datos de cada participante que, na súa concepción, incentivar observadores para subir información sobre todas as especies que observados, e non só un subconxunto (Wood et al. 2011; Wiggins 2011) . En segundo lugar, os investigadores eBird utilizar modelos estatísticos que tentan corrixir a natureza barulhento e heteroxénea dos datos en bruto. Aínda non está claro se estes modelos estatísticos eliminar prexuízos a partir dos datos, pero ornitólogos están seguros o suficiente na calidade dos datos eBird axustados que, como fora mencionado anteriormente, el foi usado en case 100 publicacións científicas con revisión por pares.
Moitos non ornitólogos están inicialmente moi escépticos cando escoitan sobre eBird por primeira vez. Na miña opinión, parte dese escepticismo vén de pensar eBird no camiño mal. Moita xente pensa de entrada "Os datos son eBird perfecto?", Ea resposta é absolutamente non. Con todo, esta non é a pregunta correcta. A pregunta correcta é: "Para certas cuestións de investigación, son os datos eBird mellor que os datos ornitoloxía existentes?" Para esta pregunta a resposta é sempre si, en parte porque, para moitas cuestións de interese non hai alternativa realista para a obtención de datos distribuída.
O proxecto eBird demostra que é posible involucrar voluntarios na recollida de datos científicos importantes. Con todo, eBird e relacionados proxectos, indican que os retos relacionados coa mostraxe ea calidade dos datos son preocupacións para os proxectos de recollida de datos distribuídos. Como veremos na seguinte sección, con todo, con deseño intelixente e tecnoloxía esas preocupacións poden ser minimizados nalgunhas configuracións.