eBird recueille des données sur les oiseaux des ornithologues amateurs; bénévoles peuvent fournir échelle géographique qu'aucune équipe de recherche ne peut égaler.
Les oiseaux sont partout, et ornithologistes aimeraient savoir où chaque oiseau est à chaque instant. Étant donné un tel jeu de données parfait, ornithologistes pourraient aborder de nombreuses questions fondamentales de leur domaine. Bien sûr, la collecte de ces données est au-delà de la portée de tout chercheur particulier. En même temps que les ornithologues désirent des données plus riches et plus complètes, "birders" -les personnes qui vont observer les oiseaux pour le plaisir, sont constamment l'observation des oiseaux et de documenter ce qu'ils voient. Ces deux communautés ont une longue histoire de collaboration, mais maintenant ces collaborations ont été transformées par l'ère numérique. eBird est un projet de collecte de données distribuées sollicitant des informations auprès des ornithologues du monde entier, et il a déjà reçu plus de 260 millions d' observations d'oiseaux de 250.000 participants (Kelling et al. 2015) .
Avant le lancement de eBird, une grande partie des données créées par les ornithologues était indisponible pour les chercheurs:
"Dans des milliers de placards dans le monde d'aujourd'hui se trouvent d'innombrables cahiers, fiches, listes annotées, et les journaux. Ceux d'entre nous qui sont impliqués avec des institutions d'observation des oiseaux connaissent bien la frustration d'entendre encore et encore sur les «dossiers d'oiseaux de feu mon oncle" Nous savons combien précieux qu'ils pourraient être. Malheureusement, nous savons aussi que nous ne pouvons pas les utiliser. " (Fitzpatrick et al. 2002) , (Fitzpatrick et al. 2002)
Plutôt que d'avoir ces données précieuses sont assis inutilisés, eBird permet birders de le télécharger sur une base de données numérique centralisée. Les données téléchargées sur eBird contient six champs clés: qui, où, quand, quelles espèces, combien, et de l'effort. Pour les lecteurs non-observation des oiseaux, «effort» fait référence aux méthodes utilisées tout en faisant des observations. des contrôles de qualité des données commencent avant même les données sont téléchargées. Birders essayant de présenter des rapports tels que les rapports des espèces très rares inhabituelles, très élevés compte, ou hors de la saison des rapports en sont marqués, et le site Web demande automatiquement des informations supplémentaires, telles que des photographies. Après avoir recueilli ces informations supplémentaires, les rapports marqués sont envoyés à l'un des centaines de bénévoles experts régionaux pour un examen plus approfondi. Après enquête de la possible correspondance régionale d' experts, y compris supplémentaire avec les birder-les rapports marqués sont soit rejetées comme peu fiables ou ils sont entrés dans la base de données eBird (Kelling et al. 2012) . Cette base de données des observations dépistées est ensuite mis à la disposition à quiconque dans le monde avec une connexion Internet, et à ce jour, près de 100 publications évaluées par les pairs ont utilisé (Bonney et al. 2014) . eBird montre clairement que les ornithologues amateurs bénévoles sont en mesure de recueillir des données qui sont utiles pour la recherche réelle de l'ornithologie.
Une des beautés de eBird est qu'il capture «travail» qui est déjà le cas dans ce cas, l'observation des oiseaux. Cette fonction permet au projet d'atteindre énorme échelle. Cependant, le «travail» accompli par les ornithologues ne correspond pas exactement aux données requises par les ornithologues. Par exemple, dans eBird, la collecte de données est déterminée par l'emplacement des observateurs d'oiseaux pas l'emplacement des oiseaux. Cela signifie que, par exemple, la plupart des observations ont tendance à se produire à proximité des routes (Kelling et al. 2012; Kelling et al. 2015) . En plus de cette répartition inégale de l'effort dans l'espace, les observations réelles faites par les ornithologues amateurs ne sont pas toujours idéales. Par exemple, certains ornithologues seulement télécharger des informations sur les espèces qu'ils jugent intéressant plutôt que de télécharger des informations sur toutes les espèces qu'ils ont observées.
chercheurs eBird ont deux principales solutions à ces problèmes de qualité des données, les questions qui se posent dans de nombreux autres projets de collecte de données distribuées. Tout d'abord, les chercheurs eBird tentent constamment d'améliorer la qualité des données fournies par les ornithologues amateurs. Par exemple, eBird offre une formation aux participants, et il a créé des visualisations de données de chaque participant qui, par leur conception, encouragent les ornithologues amateurs de télécharger des informations sur toutes les espèces qu'ils ont observés, et pas seulement un sous - ensemble (Wood et al. 2011; Wiggins 2011) . Deuxièmement, les chercheurs eBird utilisent des modèles statistiques qui tentent de corriger la nature bruyante et hétérogène des données brutes. Il ne sait pas encore si ces modèles statistiques supprimer totalement les biais des données, mais ornithologistes sont assez confiants dans la qualité des données eBird ajustées qui, comme cela avait été mentionné précédemment, il a été utilisé dans près de 100 publications scientifiques évaluées par des pairs.
Beaucoup de non-ornithologistes sont d'abord très sceptique quand ils entendent parler de eBird pour la première fois. À mon avis, une partie de ce scepticisme vient de penser à eBird dans le mauvais sens. Beaucoup de gens pensent d'abord "Est les données de eBird parfait?", Et la réponse est absolument pas. Cependant, ce n'est pas la bonne question. La bonne question est: «Pour certaines questions de recherche, est mieux les données eBird que les données ornithologiques existantes?» Pour cette question, la réponse est certainement oui, en partie parce que, pour de nombreuses questions d'intérêt il n'y a pas d'alternative réaliste à la collecte de données distribuées.
Le projet eBird démontre qu'il est possible d'impliquer des volontaires dans la collecte de données scientifiques importantes. Toutefois, les projets eBird et connexes, indiquent que les défis liés à l'échantillonnage et la qualité des données sont des préoccupations pour des projets de collecte de données distribuées. Comme nous le verrons dans la section suivante, cependant, avec un design intelligent et la technologie de ces préoccupations peuvent être minimisés dans certains contextes.