eBird recueille des données sur les oiseaux d'ornithologues; Les bénévoles peuvent fournir une échelle qu'aucune équipe de recherche ne peut égaler.
Les oiseaux sont partout, et les ornithologues aimeraient savoir où chaque oiseau est à chaque instant. Compte tenu d'un ensemble de données parfait, les ornithologues pourraient répondre à de nombreuses questions fondamentales dans leur domaine. Bien sûr, la collecte de ces données dépasse la portée d'un chercheur particulier. En même temps que les ornithologues désirent des données plus riches et plus complètes, les «ornithologues» - les gens qui vont observer les oiseaux pour s'amuser - observent constamment les oiseaux et documentent ce qu'ils voient. Ces deux communautés ont une longue histoire de collaboration, mais maintenant ces collaborations ont été transformées par l'ère numérique. eBird est un projet de collecte de données distribuées qui sollicite des informations auprès des ornithologues du monde entier, et il a déjà reçu plus de 260 millions d'observations d'oiseaux de la part de 250 000 participants (Kelling, Fink, et al. 2015) .
Avant le lancement d'eBird, la plupart des données créées par les ornithologues n'étaient pas disponibles pour les chercheurs:
«Dans des milliers de placards à travers le monde, on trouve d'innombrables carnets, fiches, listes de contrôle annotées et journaux intimes. Ceux d'entre nous qui sont impliqués dans les institutions d'observation des oiseaux connaissent bien la frustration d'entendre encore et encore «les dossiers d'oiseaux de mon oncle défunt» [sic] Nous savons à quel point ils peuvent être utiles. Malheureusement, nous savons aussi que nous ne pouvons pas les utiliser. » (Fitzpatrick et al. 2002)
Plutôt que d'avoir ces données précieuses inutilisées, eBird permet aux ornithologues de les télécharger dans une base de données numérique centralisée. Les données téléchargées sur eBird contiennent six champs clés: qui, où, quand, quelles espèces, combien et effort. Pour les lecteurs qui ne s'intéressent pas aux oiseaux, «l'effort» fait référence aux méthodes utilisées pour faire des observations. Les contrôles de qualité des données commencent avant même que les données ne soient téléchargées. Les ornithologues qui essaient de soumettre des rapports inhabituels - tels que des rapports sur des espèces très rares, des comptes très élevés ou des rapports hors saison - sont signalés et le site Web demande automatiquement des informations supplémentaires, comme des photographies. Après avoir recueilli ces informations supplémentaires, les rapports signalés sont envoyés à l'un des centaines d'experts régionaux bénévoles pour un examen plus approfondi. Après enquête par l'expert régional - y compris une éventuelle correspondance supplémentaire avec le birder - les rapports signalés sont soit rejetés comme non fiables, soit entrés dans la base de données eBird (Kelling et al. 2012) . Cette base de données d'observations est ensuite mise à la disposition de toute personne disposant d'une connexion Internet dans le monde et, jusqu'à présent, près de 100 publications évaluées par des pairs l'ont utilisée (Bonney et al. 2014) . eBird montre clairement que les ornithologues amateurs sont capables de collecter des données utiles à la recherche ornithologique réelle.
L'une des beautés d'eBird est qu'il capture le «travail» qui se produit déjà - dans ce cas, l'observation des oiseaux. Cette fonctionnalité permet au projet d'atteindre une ampleur considérable. Cependant, le «travail» effectué par les ornithologues ne correspond pas exactement aux données dont les ornithologues ont besoin. Par exemple, dans eBird, la collecte de données est déterminée par l'emplacement des ornithologues et non par l'emplacement des oiseaux. Cela signifie que, par exemple, la plupart des observations tendent à se produire près des routes (Kelling et al. 2012; Kelling, Fink, et al. 2015) . En plus de cette distribution inégale de l'effort sur l'espace, les observations réelles faites par les ornithologues ne sont pas toujours idéales. Par exemple, certains ornithologues ne téléchargent que des informations sur les espèces qu'ils jugent intéressantes, plutôt que des informations sur toutes les espèces qu'ils ont observées.
Les chercheurs d'eBird ont deux solutions principales à ces problèmes de qualité des données - des solutions qui pourraient aussi être utiles dans d'autres projets de collecte de données distribuées. Premièrement, les chercheurs d'eBird essaient constamment d'améliorer la qualité des données soumises par les ornithologues. Par exemple, eBird offre une éducation aux participants et a créé des visualisations des données de chaque participant qui, par leur conception, encouragent les ornithologues à télécharger des informations sur toutes les espèces qu'ils ont observées, et pas seulement les plus intéressantes (Wood et al. 2011; Wiggins 2011) . Deuxièmement, les chercheurs d'eBird utilisent des modèles statistiques qui tentent de corriger le caractère bruyant et hétérogène des données brutes (Fink et al. 2010; Hurlbert and Liang 2012) . Il n'est pas encore clair si ces modèles statistiques éliminent complètement les biais des données, mais les ornithologues sont suffisamment confiants quant à la qualité des données eBird ajustées qui, comme mentionné précédemment, ont été utilisées dans près de 100 publications scientifiques évaluées par des pairs.
Beaucoup de non-ornithologues sont d'abord extrêmement sceptiques quand ils entendent parler d'eBird pour la première fois. À mon avis, une partie de ce scepticisme vient de penser à eBird dans le mauvais sens. Beaucoup de gens pensent d'abord "Est-ce que les données eBird sont parfaites?", Et la réponse est "absolument pas". Cependant, ce n'est pas la bonne question. La bonne question est: «Pour certaines questions de recherche, les données eBird sont-elles meilleures que les données ornithologiques existantes?» Pour cette question, la réponse est «oui», en partie parce que de nombreuses questions d'intérêt, telles que les questions de migration saisonnière à grande échelle. -Il n'existe pas d'alternatives réalistes à la collecte de données distribuées.
Le projet eBird démontre qu'il est possible d'impliquer des volontaires dans la collecte de données scientifiques importantes. Cependant, eBird, et les projets connexes, indiquent que les défis liés à l'échantillonnage et à la qualité des données sont préoccupants pour les projets de collecte de données distribués. Comme nous le verrons dans la section suivante, cependant, avec une conception et une technologie intelligentes, ces problèmes peuvent être minimisés dans certains cas.