eBird samlar in uppgifter om fåglar från fågelskådare, volontärer kan ge geografisk omfattning som ingen forskargrupp kan matcha.
Fåglar finns överallt, och ornitologer skulle vilja veta var varje fågel är i varje ögonblick. Med tanke på en sådan perfekt dataset kan ornitologer behandla många grundläggande frågor om sitt område. Naturligtvis, samla dessa data är utanför ramen för en viss forskare. Samtidigt som ornitologer önskar rikare och mer fullständiga uppgifter, "birders" -Människor som går fågelskådning for fun-ständigt observera fåglar och dokumentera vad de ser. Dessa två samhällen har en lång historia av samverkande, men nu dessa samarbeten har omvandlats av den digitala tidsåldern. eBird är ett distribuerat datainsamling projekt som söker samla information från fågelskådare runt om i världen, och det har redan fått över 260 miljoner fågel iakttagelser från 250.000 deltagare (Kelling et al. 2015) .
Innan lanseringen av eBird, många av de uppgifter som skapats av birders var otillgängligt för forskare:
"I tusentals garderober runt om i världen idag ligger otaliga anteckningsböcker, registerkort, kommenterade checklistor och dagböcker. De av oss inblandade med fågelskådning institutioner känner väl frustration att höra om och om igen om 'min sena farbrors fågel register "Vi vet hur värdefulla de skulle kunna vara. Tyvärr vet vi också att vi inte kan använda dem. " (Fitzpatrick et al. 2002)
Hellre än att ha denna värdefulla data sitter oanvända, eBird gör birders att överföra den till en centraliserad, digital databas. Data laddas upp till eBird innehåller sex nyckelområden: vem, var, när, vilka arter, hur många, och ansträngning. För icke-fågel läsare, "försök" hänför sig till de metoder som används samtidigt göra observationer. kvalitetskontrollen rörande uppgifterna ens börja innan data överförs. Fågelskådare försöker lämna ovanliga rapporter-såsom rapporter om mycket sällsynta arter, mycket höga värden, eller under lågsäsong rapporter-flaggas, och webbplatsen begär automatiskt ytterligare information, såsom fotografier. Efter att samla denna ytterligare information är de flaggade rapporter skickas till en av hundratals frivilliga regionala experter för ytterligare granskning. Efter undersökning av den regionala expert inklusive eventuella ytterligare korrespondens med birder-flaggade rapporter antingen kastas som otillförlitliga eller de införs i eBird databas (Kelling et al. 2012) . Denna databas av made observationer görs sedan tillgänglig för alla i världen med en Internet-anslutning, och hittills har närmare 100 fackgranskade publikationer använde det (Bonney et al. 2014) . eBird visar tydligt att frivilliga fågelskådare kan samla in data som är användbar för riktiga ornitologi forskning.
En av de skönheter eBird är att det fångar "arbete" som redan sker i det här fallet, fågelskådning. Den här funktionen gör det möjligt för projektet för att uppnå en enorm skala. Dock inte "arbete" görs av birders inte exakt motsvarar de uppgifter som behövs av ornitologer. Till exempel, i eBird, är datainsamling bestäms av placeringen av birders inte placeringen av fåglar. Detta innebär att, till exempel, de flesta observationer tenderar att inträffa nära vägar (Kelling et al. 2012; Kelling et al. 2015) . Utöver denna ojämna fördelningen av ansträngning över rymden, de faktiska iakttagelser som gjorts av fågelskådare är inte alltid perfekt. Till exempel, bara några fågelskådare ladda upp information om arter som de anser intressant snarare än att lägga upp information om alla arter som de observerade.
eBird forskare har två huvudsakliga lösningar på dessa problem med datakvaliteten, frågor som uppstår i många andra distribuerade datainsamlingsprojekt. Först eBird forskarna ständigt försöker förbättra kvaliteten på de uppgifter som fågelskådare. Till exempel erbjuder eBird utbildning till deltagarna, och det har skapat visualiseringar av varje deltagares data som genom sin utformning, uppmuntra birders att överföra information om alla arter som de observerade, inte bara en delmängd (Wood et al. 2011; Wiggins 2011) . För det andra, eBird forskare använder statistiska modeller som försöker korrigera för bullriga och heterogena karaktären av rådata. Det är ännu inte klart om dessa statistiska modeller helt ta bort fördomar från data, men ornitologer är tillräckligt säker för kvaliteten på justerade eBird data som, som hade nämnts tidigare, har den använts i nästan 100 fackgranskade vetenskapliga publikationer.
Många icke-ornitologer är initialt mycket skeptiska när de hör om eBird för första gången. Enligt min mening kommer en del av denna skepsis från att tänka på eBird på fel sätt. Många människor först tänker "Är eBird uppgifter perfekt?", Och svaret är absolut inte. Men det är inte den rätta frågan. Den rätta frågan är: "För vissa frågeställningar, är eBird uppgifter bättre än existerande ornithology data?" För den frågan är svaret definitivt ja, delvis på grund av många frågor av intresse finns några realistiska alternativ till insamling distribuerade data.
Den eBird projektet visar att det är möjligt att involvera frivilliga i insamlingen av viktiga vetenskapliga data. Men eBird, och liknande projekt visar att utmaningarna i samband med provtagning och datakvalitet finns farhågor för distribuerade datainsamlingsprojekt. Som vi kommer att se i nästa avsnitt, men med smart design och teknik dessa problem kan minimeras i vissa inställningar.