eBird verzamelt gegevens over vogels van vogelaars; vrijwilligers kunnen een schaal leveren die geen onderzoeksteam kan evenaren.
Vogels zijn overal en ornithologen willen graag weten waar elke vogel zich op elk moment bevindt. Met zo'n perfecte dataset konden ornithologen vele fundamentele vragen in hun vakgebied aan de orde stellen. Het verzamelen van deze gegevens valt natuurlijk buiten het bereik van een bepaalde onderzoeker. Tegelijkertijd verlangen ornithologen naar rijkere en vollediger gegevens, "vogelaars" - mensen die vogels kijken voor de lol - observeren constant vogels en documenteren wat ze zien. Deze twee gemeenschappen hebben een lange geschiedenis van samenwerken, maar nu zijn deze samenwerkingsverbanden getransformeerd door het digitale tijdperk. eBird is een project voor gedistribueerde gegevensverzameling dat informatie inwint bij vogelaars over de hele wereld, en het heeft al meer dan 260 miljoen vogelwaarnemingen ontvangen van 250.000 deelnemers (Kelling, Fink, et al. 2015) .
Vóór de lancering van eBird waren de meeste gegevens die door vogelaars waren gemaakt, niet beschikbaar voor onderzoekers:
"In duizenden kasten over de hele wereld liggen tegenwoordig talloze notebooks, indexkaarten, geannoteerde checklists en dagboeken. Degenen onder ons die betrokken zijn bij vogelinstituten, weten goed hoe frustrerend het is om telkens weer te horen over 'mijn oom van de oom van vogels' [sic] We weten hoe waardevol ze kunnen zijn. Helaas weten we ook dat we ze niet kunnen gebruiken. " (Fitzpatrick et al. 2002)
In plaats van dat deze waardevolle gegevens ongebruikt blijven, biedt eBird vogels de mogelijkheid om ze te uploaden naar een gecentraliseerde, digitale database. Gegevens die naar eBird zijn geüpload bevatten zes sleutelvelden: wie, waar, wanneer, welke soort, hoeveel en inspanning. Voor niet-vogende lezers verwijst 'inspanning' naar de gebruikte methoden bij het maken van waarnemingen. De controles van de gegevenskwaliteit beginnen al voordat de gegevens worden geüpload. Birders die ongebruikelijke rapporten proberen in te dienen, zoals rapporten van zeer zeldzame soorten, zeer hoge tellingen of rapporten buiten het seizoen, worden gemarkeerd en de website vraagt automatisch om aanvullende informatie, zoals foto's. Nadat deze aanvullende informatie is verzameld, worden de gemarkeerde rapporten verzonden naar een van de honderden vrijwillige regionale experts voor verdere beoordeling. Na onderzoek door de regionale expert - inclusief mogelijke aanvullende correspondentie met de birder - worden de gemarkeerde rapporten afgedankt als onbetrouwbaar of ingevoerd in de eBird-database (Kelling et al. 2012) . Deze database van gescreende observaties wordt vervolgens ter beschikking gesteld aan iedereen in de wereld met een internetverbinding en tot nu toe hebben bijna 100 peer-reviewed publicaties deze gebruikt (Bonney et al. 2014) . eBird laat duidelijk zien dat vrijwillige vogelaars in staat zijn om gegevens te verzamelen die nuttig zijn voor echt ornithologisch onderzoek.
Een van de schoonheden van eBird is dat het "werk" vastlegt dat al aan het gebeuren is - in dit geval vogelen. Met deze functie kan het project een enorme schaal bereiken. Het 'werk' dat birders doen, komt echter niet precies overeen met de gegevens die ornithologen nodig hebben. Bijvoorbeeld, in eBird, wordt het verzamelen van gegevens bepaald door de locatie van vogelaars, niet door de locatie van de vogels. Dit betekent dat de meeste waarnemingen bijvoorbeeld vaak in de buurt van wegen voorkomen (Kelling et al. 2012; Kelling, Fink, et al. 2015) . Naast deze ongelijke verdeling van inspanning over ruimte, zijn de werkelijke waarnemingen door vogelaars niet altijd ideaal. Sommige vogelaars uploaden bijvoorbeeld alleen informatie over soorten die ze interessant vinden, in plaats van informatie over alle soorten die ze hebben waargenomen.
eBird-onderzoekers hebben twee hoofdoplossingen voor deze problemen met datakwaliteit - oplossingen die ook nuttig kunnen zijn in andere gedistribueerde projecten voor gegevensverzameling. Ten eerste proberen eBird-onderzoekers constant de kwaliteit van de door birders ingediende gegevens te verbeteren. EBird biedt bijvoorbeeld onderwijs aan deelnemers, en het heeft visualisaties van de gegevens van elke deelnemer gemaakt die, door hun ontwerp, vogelaars aanmoedigen om informatie over alle soorten die ze hebben waargenomen te uploaden, niet alleen de meest interessante (Wood et al. 2011; Wiggins 2011) . Ten tweede gebruiken eBird-onderzoekers statistische modellen die proberen te corrigeren voor de lawaaierige en heterogene aard van de onbewerkte gegevens (Fink et al. 2010; Hurlbert and Liang 2012) . Het is nog niet duidelijk of deze statistische modellen de vooroordelen van de gegevens volledig wegnemen, maar ornithologen hebben voldoende vertrouwen in de kwaliteit van de aangepaste eBird-gegevens dat deze gegevens, zoals eerder vermeld, werden gebruikt in bijna 100 peer-reviewed wetenschappelijke publicaties.
Veel niet-ornithologen zijn aanvankelijk extreem sceptisch wanneer ze voor de eerste keer over eBird horen. Naar mijn mening komt een deel van deze scepsis voort uit het verkeerd denken over eBird. Veel mensen denken eerst "Zijn de eBird-gegevens perfect?", En het antwoord is "absoluut niet". Maar dat is niet de juiste vraag. De juiste vraag is "zijn voor bepaalde onderzoeksvragen de eBird-gegevens beter dan bestaande ornithologiegegevens?" Voor die vraag is het antwoord "absoluut ja", deels omdat voor veel interessante vragen, zoals vragen over grootschalige seizoensmigratie, - Er zijn geen realistische alternatieven voor gedistribueerde gegevensverzameling.
Het eBird-project laat zien dat het mogelijk is om vrijwilligers te betrekken bij het verzamelen van belangrijke wetenschappelijke gegevens. Echter, eBird en gerelateerde projecten geven aan dat uitdagingen met betrekking tot sampling en datakwaliteit zorgen baren voor projecten voor gedistribueerde dataverzameling. Zoals we in het volgende gedeelte zullen zien, kunnen deze bezorgdheden echter met behulp van slim ontwerp en technologie in sommige situaties tot een minimum worden beperkt.