eBird indsamler data om fugle fra birders; Frivillige kan give en skala, som ingen forskergruppe kan matche.
Fugle er overalt, og ornitologer vil gerne vide, hvor hver fugl er på hvert øjeblik. I betragtning af et sådant perfekt datasæt kunne ornitologer tage fat på mange grundlæggende spørgsmål inden for deres område. Selvfølgelig er indsamling af disse data uden for en bestemt forskers anvendelsesområde. Samtidig vil ornitologer ønske rigere og mere komplette data, "birders" -folk, der tager fugleture til sjov - konstant observerer fugle og dokumenterer, hvad de ser. Disse to samfund har en lang historie om samarbejde, men nu er disse samarbejder blevet forvandlet af den digitale tidsalder. eBird er et distribueret dataindsamlingsprojekt, der kræver information fra birders verden over, og den har allerede modtaget over 260 millioner fugleobservationer fra 250.000 deltagere (Kelling, Fink, et al. 2015) .
Før lanceringen af eBird var de fleste af de data, der var skabt af birders, utilgængelige for forskere:
"I tusindvis af skabe rundt om i verden ligger i dag utallige notesbøger, indekskort, annoterede tjeklister og dagbøger. De af os, der er involveret i fugleinstitutioner, kender godt frustrationen ved at høre igen og igen om "min onkelens fugloptegnelser". Vi ved, hvor værdifulde de kunne være. Desværre ved vi også, at vi ikke kan bruge dem. " (Fitzpatrick et al. 2002)
I stedet for at have disse værdifulde data sat ubrugte, gør eBird det muligt for birders at uploade dem til en centraliseret digital database. Data uploadet til eBird indeholder seks nøglefelter: hvem, hvor, hvornår, hvilke arter, hvor mange og indsats. For læsere uden birding refererer "indsats" til de metoder, der anvendes, mens man laver observationer. Datakvalitetskontrol begynder lige før dataene uploades. Fuglepersoner, der forsøger at indsende usædvanlige rapporter, som rapporter om meget sjældne arter, meget høje tæller eller rapporter uden for sæsonen, markeres, og hjemmesiden beder automatisk om yderligere oplysninger, såsom fotografier. Efter at have indsamlet disse yderligere oplysninger, sendes de rapporterede rapporter til en af hundredvis af frivillige regionale eksperter til yderligere gennemgang. Efter undersøgelse foretaget af den regionale ekspert - herunder eventuelt yderligere korrespondance med birderen - bliver de flagrede rapporter enten kasseret som upålidelige eller indgået i eBird-databasen (Kelling et al. 2012) . Denne database med screenede observationer er derefter tilgængelig for alle i verden med en internetforbindelse, og hidtil har næsten 100 peer-reviewed publikationer brugt det (Bonney et al. 2014) . eBird viser tydeligt, at frivillige birders er i stand til at indsamle data, der er nyttige til ægte ornitologisk forskning.
En af skønhederne hos eBird er, at det fanger "arbejde", der allerede sker - i dette tilfælde, fuglefugle. Denne funktion gør det muligt for projektet at opnå en enorm skala. Men det "arbejde", der udføres af birders, stemmer ikke helt overens med de data, som kræves af ornitologer. For eksempel, i eBird, er dataindsamling bestemt af placeringen af birders, ikke placeringen af fuglene. Det betyder, at de fleste observationer f.eks. Har tendens til at forekomme tæt på veje (Kelling et al. 2012; Kelling, Fink, et al. 2015) . Ud over denne ulige fordeling af indsatsen over rummet er de faktiske observationer foretaget af birders ikke altid ideelle. F.eks. Uploader nogle birders kun information om arter, som de anser for interessante, snarere end oplysninger om alle arter, som de observerede.
eBirdforskere har to hovedløsninger til disse datakvalitetsproblemer - løsninger, der kan være nyttige i andre distribuerede dataindsamlingsprojekter. For det første forsøger eBird-forskere konstant at forbedre kvaliteten af de data, som birders har indsendt. EBird tilbyder for eksempel uddannelse til deltagerne, og det har skabt visualiseringer af hver deltagers data, som ved deres design opfordrer opdrættere til at uploade oplysninger om alle arter, som de observerede, ikke kun de mest interessante (Wood et al. 2011; Wiggins 2011) . For det andet bruger eBird-forskere statistiske modeller, der forsøger at korrigere for de støjagtige og heterogene karakter af de rå data (Fink et al. 2010; Hurlbert and Liang 2012) . Det er endnu ikke klart, om disse statistiske modeller fuldt ud fjerner biaser fra dataene, men ornitologer er selvsikker nok i kvaliteten af justerede eBird-data, som tidligere nævnt, er disse data blevet brugt i næsten 100 peer-reviewed videnskabelige publikationer.
Mange ikke-ornitologer er oprindeligt meget skeptiske, når de hører om eBird for første gang. Efter min mening kommer en del af denne skepsis fra at tænke på eBird på den forkerte måde. Mange tror først "Er eBird-dataene perfekte?", Og svaret er "absolut ikke". Det er imidlertid ikke det rigtige spørgsmål. Det rigtige spørgsmål er "For visse forskningsspørgsmål er eBird data bedre end eksisterende ornitologidata?" For det spørgsmål er svaret "bestemt ja", dels fordi det for mange spørgsmål af interesse - som f.eks. Spørgsmål om stor sæsonmæssig migration -Der er ingen realistiske alternativer til distribueret dataindsamling.
EBird-projektet demonstrerer, at det er muligt at involvere frivillige i indsamling af vigtige videnskabelige data. Imidlertid viser eBird og relaterede projekter, at udfordringer i forbindelse med prøveudtagning og datakvalitet er bekymringer for distribuerede dataindsamlingsprojekter. Som vi vil se i næste afsnit, men med smart design og teknologi, kan disse bekymringer minimeres i nogle indstillinger.