eBird recoge datos sobre las aves de los observadores de aves; los voluntarios pueden proporcionar una escala geográfica que ningún equipo de investigación puede igualar.
Las aves están en todas partes, y ornitólogos les gustaría saber donde cada ave es en cada momento. Dado un conjunto de datos tan perfecta, ornitólogos podrían abordar muchas cuestiones fundamentales de su campo. Por supuesto, la recogida de estos datos está fuera del alcance de cualquier investigador en particular. Al mismo tiempo que los ornitólogos deseo de datos más rico y completo, "observadores": personas que van de observación de aves para la diversión están observando constantemente las aves y documentar lo que ven. Estas dos comunidades tienen una larga historia de colaboración, pero ahora estas colaboraciones han sido transformados por la era digital. eBird es un proyecto de recopilación de datos distribuida que solicita información de los observadores de aves de todo el mundo, y que ya ha recibido más de 260 millones de avistamientos de aves de 250.000 participantes (Kelling et al. 2015) .
Antes de la puesta en marcha de eBird, gran parte de los datos creados por los observadores de aves no estaba disponible para los investigadores:
"En miles de armarios de todo el mundo hoy en día se encuentran innumerables cuadernos, fichas, listas de control, con anotaciones y diarios. Aquellos de nosotros involucrados con las instituciones de observación de aves saben bien la frustración de escuchar una y otra vez acerca de "registros de aves de mi difunto tío 'Sabemos lo valioso que podría ser. Por desgracia, también sabemos que no podemos usarlos ". (Fitzpatrick et al. 2002)
En lugar de tener estos valiosos datos no se emplean, eBird permite a los observadores de aves para subirlo a una base de datos centralizada, digital. Los datos descargados a eBird contiene seis campos fundamentales: quién, dónde, cuándo, qué especies, cuántos, y esfuerzo. Para los lectores no-observación de aves, "esfuerzo" se refiere a los métodos utilizados al hacer observaciones. controles de calidad de datos comienzan incluso antes de cargar los datos. Los observadores de aves que tratan de presentar informes-inusuales, tales como los informes de especies muy raras, recuento muy alto, o fuera de temporada informes se marcan, y el sitio web solicita automáticamente la información adicional, como por ejemplo fotografías. Después de recoger esta información adicional, los informes marcados se envían a uno de los cientos de voluntarios expertos regionales para su posterior revisión. Después de la investigación por la posible correspondencia adicional de expertos, incluyendo regional con los birder-los informes de bandera se descartan ya sea como poco fiable o que se introducen en la base de datos de eBird (Kelling et al. 2012) . A continuación, se hace esta base de datos de observaciones seleccionados a disposición de cualquier persona en el mundo con una conexión a Internet, y hasta ahora, casi 100 publicaciones revisadas por pares han utilizado (Bonney et al. 2014) . eBird muestra claramente que los observadores de aves voluntarios son capaces de recoger datos que son útiles para la investigación real de la ornitología.
Una de las ventajas de eBird es que captura el "trabajo" que ya está ocurriendo, en este caso, la observación de aves. Esta característica permite que el proyecto alcance tremenda escala. Sin embargo, el "trabajo" realizado por los observadores de aves no coincide exactamente con los datos necesarios por los ornitólogos. Por ejemplo, en eBird, la recogida de datos se determina por la ubicación de los observadores de aves no la ubicación de las aves. Esto significa que, por ejemplo, la mayoría de las observaciones tienden a ocurrir cerca de las carreteras (Kelling et al. 2012; Kelling et al. 2015) . Además de esta desigual distribución del esfuerzo en el espacio, las observaciones reales hechas por los observadores de aves no siempre son ideales. Por ejemplo, algunos observadores de aves sólo se cargan información sobre las especies que consideran interesante en lugar de cargar la información sobre todas las especies que se observan.
eBird investigadores tienen dos soluciones principales para estos problemas de calidad de datos, los problemas que surgen en muchos otros proyectos de recolección de datos distribuidos. En primer lugar, los investigadores eBird están constantemente tratando de mejorar la calidad de los datos presentados por los observadores de aves. Por ejemplo, eBird ofrece educación a los participantes, y se ha creado visualizaciones de datos de cada participante que, por su diseño, fomentan los observadores de aves para cargar información sobre todas las especies que se observan, no sólo un subconjunto (Wood et al. 2011; Wiggins 2011) . En segundo lugar, los investigadores eBird utilizan modelos estadísticos que tratan de corregir la naturaleza ruidoso y heterogénea de los datos en bruto. Aún no está claro si estos modelos estadísticos eliminan totalmente los sesgos de los datos, pero los ornitólogos tiene la suficiente confianza en la calidad de los datos ajustados eBird que, como se ha mencionado anteriormente, se ha utilizado en casi 100 publicaciones científicas revisadas por pares.
Muchos no ornitólogos son inicialmente muy escéptico cuando se enteran de eBird por primera vez. En mi opinión, parte de este escepticismo proviene de pensar en eBird en el camino equivocado. Muchas personas piensan primero "son los datos eBird perfecto?", Y la respuesta no es absolutamente. Sin embargo, esa no es la pregunta correcta. La pregunta correcta es: "Para ciertas preguntas de la investigación, son los datos eBird mejor que los datos existentes ornitología?" Para esta pregunta, la respuesta es definitivamente sí, en parte porque para muchas cuestiones de interés que no hay alternativa realista a la recopilación de datos distribuida.
El proyecto eBird demuestra que es posible involucrar a voluntarios en la recogida de datos científicos importantes. Sin embargo, eBird y proyectos relacionados, indican que los problemas relacionados con el muestreo y la calidad de los datos son preocupaciones para los proyectos de recogida de datos distribuidas. Como veremos en la siguiente sección, sin embargo, con un diseño inteligente y la tecnología de estas preocupaciones pueden ser minimizados en algunos entornos.