eBird samlar data om fåglar från birders; Volontärer kan ge en skala som ingen forskargrupp kan matcha.
Fåglar är överallt, och ornitologer skulle vilja veta var varje fågel är vid varje ögonblick. Med en sådan perfekt dataset kunde ornitologer ta itu med många grundläggande frågor inom deras område. Naturligtvis är insamling av dessa data utom ramen för en viss forskare. Samtidigt som ornitologer önskar rikare och mer fullständiga data, "fågelskådare" -folk som går fågelskådning för roligt - observerar ständigt fåglar och dokumenterar vad de ser. Dessa två samhällen har en lång historia av samarbete, men nu har dessa samarbeten förvandlats av den digitala tiden. eBird är ett distribuerat datainsamlingsprojekt som efterfrågar information från fågelskådare runt om i världen, och det har redan fått över 260 miljoner fågelobservationer från 250 000 deltagare (Kelling, Fink, et al. 2015) .
Före lanseringen av eBird var de flesta data som skapades av birders inte tillgängliga för forskare:
"I tusentals garderober runt om i världen ligger idag otaliga bärbara datorer, indexkort, annoterade checklistor och dagböcker. De av oss som är involverade med fågeldagsinstitutioner vet väl frustrationen att höra om och om igen om "mina farbrors fågelskivor". Vi vet hur värdefulla de kan vara. Tyvärr vet vi också att vi inte kan använda dem. " (Fitzpatrick et al. 2002)
I stället för att ha dessa värdefulla data oanvända, gör det möjligt för birders att ladda upp dem till en centraliserad digital databas. Uppladdade data till eBird innehåller sex nyckelfält: vem, var, när, vilken art, hur många och ansträngningar. För icke-birdingläsare avser "ansträngning" de metoder som används vid observation. Datakvalitetskontroller börjar redan innan data laddas upp. Fågelskådare som försöker lägga in ovanliga rapporter, som rapporter om mycket sällsynta arter, mycket höga räkningar eller rapporter utanför säsongen, flaggas och webbplatsen begär automatiskt ytterligare information, till exempel fotografier. Efter samling av denna ytterligare information skickas de flaggade rapporterna till en av hundratals frivilliga regionala experter för vidare granskning. Efter undersökning av regional expert, inklusive eventuell ytterligare korrespondens med birder, kasseras de flaggade rapporterna antingen som opålitliga eller in i eBird-databasen (Kelling et al. 2012) . Denna databas med visade observationer görs sedan tillgänglig för alla i världen med en Internetanslutning, och hittills har nästan 100 peer-reviewed publikationer använt den (Bonney et al. 2014) . eBird visar tydligt att frivilliga fågelskyttar kan samla in data som är användbara för verklig ornitologiforskning.
En av skönheterna hos eBird är att det fångar "arbete" som redan händer - i detta fall, fågelskådning. Denna funktion gör det möjligt för projektet att uppnå en enorm skala. Men det "arbete" som fångas av fågelskådare motsvarar inte exakt den information som behövs av ornitologer. I eBird bestäms till exempel datainsamling av placeringen av fågelskådare, inte platsen för fåglarna. Det betyder att de flesta observationer till exempel tenderar att inträffa nära vägar (Kelling et al. 2012; Kelling, Fink, et al. 2015) . Förutom denna ojämlika fördelning av insats över rymden är de faktiska observationerna som fågelskådare inte alltid idealiska. Till exempel laddar vissa fågelskådare endast information om arter som de anser vara intressanta, snarare än information om alla arter som de observerade.
eBirdforskare har två huvudlösningar för dessa datakvalitetsproblem - lösningar som kan vara till hjälp i andra distribuerade datainsamlingsprojekt. Först försöker eBirdsforskare att förbättra kvaliteten på de uppgifter som lämnas av birders. EBird erbjuder till exempel utbildning till deltagare, och det har skapat visualiseringar av varje deltagares data som genom deras design uppmuntrar fågelskådare att ladda upp information om alla arter som de observerade, inte bara de mest intressanta (Wood et al. 2011; Wiggins 2011) . För det andra använder eBird-forskare statistiska modeller som försöker korrigera för den bråda och heterogena naturen hos de råa data (Fink et al. 2010; Hurlbert and Liang 2012) . Det är ännu inte klart om dessa statistiska modeller helt avlägsnar fördomar från data, men ornitologer är övertygade om kvaliteten på justerade eBird-data som, som tidigare nämnts, har använts i nästan 100 vetenskapliga publikationer med vetenskaplig vetenskap.
Många icke-ornitologer är initialt extremt skeptiska när de hör om eBird för första gången. Enligt min mening kommer en del av denna skepticism från att tänka på eBird på fel sätt. Många tror först "Är eBird-data perfekta?", Och svaret är "absolut inte". Det är dock inte den rätta frågan. Den rätta frågan är "För vissa forskningsfrågor är eBird-data bättre än befintlig ornitologidata?" För den frågan är svaret "definitivt ja", delvis för många frågor av intresse - till exempel frågor om storskalig säsongsmigration -Det finns inga realistiska alternativ till distribuerad datainsamling.
EBird-projektet visar att det är möjligt att involvera volontärer i insamlingen av viktiga vetenskapliga data. Men eBird och relaterade projekt visar att utmaningar som rör provtagning och datakvalitet är oro för distribuerade datainsamlingsprojekt. Som vi kommer att se i nästa avsnitt, med smart utformning och teknik, kan dessa problem minimeras i vissa inställningar.