eBird colectează date despre păsările de la birders; voluntarii pot oferi o scară pe care nici o echipă de cercetare nu o poate potrivi.
Păsările sunt peste tot, iar ornitologii ar dori să știe unde este fiecare pasăre în fiecare moment. Având un astfel de set de date perfect, ornitologii ar putea aborda multe întrebări fundamentale în domeniul lor. Desigur, colectarea acestor date este dincolo de sfera oricărui cercetător. În același timp, ornitologii doresc date mai bogate și mai complete, "păsătorii" - oameni care se duc la distracție - urmăresc în mod constant păsările și documentează ceea ce văd. Aceste două comunități au o lungă istorie de colaborare, dar acum aceste colaborări au fost transformate de epoca digitală. eBird este un proiect de colectare a datelor distribuit care solicită informații de la birders din întreaga lume și a primit deja peste 260 de milioane de observări de la 250 000 de participanți (Kelling, Fink, et al. 2015) .
Înainte de lansarea eBird, majoritatea datelor create de birders nu au fost disponibile cercetătorilor:
"În mii de dulapuri din întreaga lume există nenumărate notebook-uri, cărți de index, liste de verificare adnotate și jurnale. Cei dintre noi implicați în instituțiile de păsări știu foarte bine frustrarea de a auzi din nou și din nou despre "înregistrările pasarilor unchiului meu" [sic] Știm cât de valoroase ar putea fi acestea. Din păcate, știm, de asemenea, că nu le putem folosi. " (Fitzpatrick et al. 2002)
Mai degrabă decât să nu fie folosite aceste date valoroase, eBird le permite pasarilor să le încarce într-o bază de date centralizată și digitală. Datele încărcate în eBird conțin șase domenii cheie: cine, unde, când, ce specii, cât de multe și efort. Pentru cititorii care nu sunt în păsări, "efortul" se referă la metodele utilizate în timpul efectuării observațiilor. Verificările calității datelor încep chiar înainte de încărcarea datelor. Birderii care încearcă să trimită rapoarte neobișnuite - cum ar fi rapoartele despre specii foarte rare, conturile foarte mari sau rapoartele în afara sezonului - sunt marcate și site-ul web solicită automat informații suplimentare, cum ar fi fotografii. După colectarea acestor informații suplimentare, rapoartele semnalate sunt trimise uneia dintre sutele de experți regionali voluntari pentru revizuire ulterioară. După investigarea expertului regional - inclusiv posibila corespondență suplimentară cu bruia - rapoartele semnalate sunt fie aruncate ca nesigure, fie introduse în baza de date eBird (Kelling et al. 2012) . Această bază de date a observațiilor examinate este apoi pusă la dispoziția oricărei persoane din lume cu o conexiune la Internet și, până în prezent, au fost utilizate aproape 100 de publicații evaluate de colegi (Bonney et al. 2014) . eBird arată în mod clar că păsătorii voluntari pot colecta date utile pentru cercetarea reală în domeniul ornitologiei.
Una dintre frumusețile lui eBird este că surprinde "munca" care se întâmplă deja - în acest caz, pasărea. Această caracteristică permite proiectului să atingă o scară extraordinară. Cu toate acestea, "munca" făcută de birders nu se potrivește exact cu datele necesare ornitologilor. De exemplu, în eBird, colectarea datelor este determinată de locația birders, nu de locația păsărilor. Aceasta înseamnă că, de exemplu, majoritatea observațiilor au tendința de a se apropia de drumuri (Kelling et al. 2012; Kelling, Fink, et al. 2015) . În plus față de această distribuție inegală a efortului în spațiu, observațiile reale făcute de birders nu sunt întotdeauna ideale. De exemplu, unii păsători încarcă doar informații despre speciile pe care le consideră interesante, mai degrabă decât informații despre toate speciile pe care le-au observat.
Cercetătorii eBird au două soluții principale la aceste probleme de calitate a datelor - soluții care ar putea fi utile și în alte proiecte distribuite de date distribuite. În primul rând, cercetătorii eBird încearcă în mod constant să îmbunătățească calitatea datelor transmise de birders. De exemplu, eBird oferă educație participanților și a creat vizualizări ale datelor fiecărui participant care, prin design, încurajează birders să încarce informații despre toate speciile pe care le-au observat, nu doar cele mai interesante (Wood et al. 2011; Wiggins 2011) . În al doilea rând, cercetătorii eBird utilizează modele statistice care încearcă să corecteze natura zgomotoasă și eterogenă a datelor brute (Fink et al. 2010; Hurlbert and Liang 2012) . Nu este încă clar dacă aceste modele statistice elimină complet prejudecățile din date, dar ornitologii sunt destul de încrezători în calitatea datelor eBird ajustate care, așa cum sa menționat anterior, au fost utilizate în aproape 100 de publicații științifice revizuite de colegi.
Mulți non-ornitologi sunt inițial extrem de sceptici când au auzit despre eBird pentru prima dată. În opinia mea, o parte din acest scepticism vine din gândirea eBird în mod greșit. Mulți oameni cred că "datele eBird sunt perfecte?", Iar răspunsul este "absolut nu". Totuși, aceasta nu este întrebarea potrivită. Întrebarea corectă este: "Pentru anumite întrebări de cercetare, datele eBird sunt mai bune decât datele ornitologice existente?" Pentru această întrebare, răspunsul este "cu siguranță da", în parte pentru că pentru multe întrebări de interes - cum ar fi întrebările despre migrația sezonieră pe scară largă - nu există alternative reale pentru colectarea datelor distribuite.
Proiectul eBird demonstrează că este posibilă implicarea voluntarilor în colectarea de date științifice importante. Cu toate acestea, eBird și proiectele conexe indică faptul că provocările legate de eșantionare și calitatea datelor reprezintă preocupări pentru proiectele de colectare a datelor distribuite. Așa cum vom vedea în următoarea secțiune, cu un design inteligent și o tehnologie, aceste preocupări pot fi reduse la minimum în anumite situații.