eBird zbiera dane o ptakach od ptaków; wolontariusze mogą zapewnić skalę, której nie może dopasować żaden zespół badawczy.
Ptaki są wszędzie, a ornitolodzy chcieliby wiedzieć, gdzie jest każdy ptak w każdej chwili. Biorąc pod uwagę tak doskonały zbiór danych, ornitolodzy mogliby odpowiedzieć na wiele podstawowych pytań w swojej dziedzinie. Oczywiście gromadzenie tych danych wykracza poza zakres konkretnego badacza. W tym samym czasie, gdy ornitolodzy pragną bogatszych i pełniejszych danych, "ptaki" - ludzie, którzy obserwują ptaki dla zabawy - stale obserwują ptaki i dokumentują to, co widzą. Te dwie wspólnoty mają długą historię współpracy, ale teraz współpraca ta została przekształcona w erze cyfrowej. eBird to projekt gromadzenia danych rozproszonych, który pozyskuje informacje od ptaków na całym świecie i otrzymał już ponad 260 milionów obserwacji ptaków od 250 000 uczestników (Kelling, Fink, et al. 2015) .
Przed uruchomieniem eBird większość danych stworzonych przez obserwatorów ptaków była niedostępna dla badaczy:
"W tysiącach szaf na całym świecie leżą niezliczone zeszyty, karty indeksowe, listy kontrolne z notatkami i pamiętniki. Ci z nas, którzy są zaangażowani w obserwowanie ptaków, doskonale zdają sobie sprawę z frustracji, jaką często słyszymy o "ptasznikach z ostatniego wuja" [sic] Wiemy, jak cenne mogą być. Niestety, wiemy również, że nie możemy ich użyć. " (Fitzpatrick et al. 2002)
Zamiast posiadania tych cennych danych nieużywanych, eBird pozwala ptakom przesłać je do scentralizowanej, cyfrowej bazy danych. Dane przesłane do eBird zawierają sześć kluczowych pól: kto, gdzie, kiedy, jaki gatunek, ile i wysiłek. Dla osób, które nie czytają ptaków, "wysiłek" odnosi się do metod stosowanych podczas dokonywania obserwacji. Sprawdzanie jakości danych rozpoczyna się jeszcze przed przesłaniem danych. Ptaki próbujące przesłać nietypowe raporty - takie jak raporty o bardzo rzadkich gatunkach, bardzo duże liczby lub raporty poza sezonem - są oflagowane, a witryna automatycznie żąda dodatkowych informacji, takich jak fotografie. Po zebraniu tych dodatkowych informacji, oflagowane raporty są wysyłane do jednego z setek ochotniczych ekspertów regionalnych do dalszego przeglądu. Po przeprowadzeniu dochodzenia przez eksperta regionalnego - w tym ewentualnej dodatkowej korespondencji z birder - oflagowane raporty są odrzucane jako niewiarygodne lub wprowadzane do bazy danych eBird (Kelling et al. 2012) . Ta baza danych z obserwowanych obserwacji jest następnie udostępniana każdemu na świecie dzięki połączeniu z Internetem i do tej pory wykorzystało ją prawie 100 recenzowanych publikacji (Bonney et al. 2014) . eBird wyraźnie pokazuje, że wolontariusze-birderzy są w stanie zebrać dane, które są przydatne do prawdziwych badań ornitologicznych.
Jednym z uroków eBirda jest to, że przechwytuje on "pracę", która już się dzieje - w tym przypadku ptactwo. Ta funkcja umożliwia projektowi osiągnięcie olbrzymiej skali. Jednak "praca" wykonana przez obserwatorów ptaków nie odpowiada dokładnie danym potrzebnym ornitologom. Na przykład w eBird, zbieranie danych jest określane przez lokalizację ptaków, a nie lokalizację ptaków. Oznacza to, że na przykład większość obserwacji ma tendencję do występowania w pobliżu dróg (Kelling et al. 2012; Kelling, Fink, et al. 2015) . Oprócz tego nierównomiernego rozmieszczenia wysiłków nad przestrzenią, rzeczywiste obserwacje dokonywane przez obserwatorów ptaków nie zawsze są idealne. Na przykład, niektórzy z ptaków przekazują informacje o gatunkach, które ich interesują, a nie informacje o wszystkich obserwowanych gatunkach.
Badacze eBird mają dwa główne rozwiązania problemów związanych z jakością danych - rozwiązania, które mogą być pomocne również w innych projektach rozproszonego gromadzenia danych. Po pierwsze, badacze eBird nieustannie starają się podnosić jakość danych przekazywanych przez birderów. Na przykład, eBird oferuje edukację uczestnikom i stworzyła wizualizacje danych każdego uczestnika, które poprzez swój projekt zachęcają birderów do przesyłania informacji o wszystkich obserwowanych gatunkach, nie tylko najciekawszych (Wood et al. 2011; Wiggins 2011) . Po drugie, badacze eBird korzystają z modeli statystycznych, które próbują korygować hałaśliwy i heterogeniczny charakter surowych danych (Fink et al. 2010; Hurlbert and Liang 2012) . Nie jest jeszcze jasne, czy te modele statystyczne w pełni usuwają odchylenia od danych, ale ornitolodzy są wystarczająco pewni jakości dostosowanych danych e-Boot, które, jak wspomniano wcześniej, dane te zostały wykorzystane w prawie 100 recenzowanych publikacjach naukowych.
Wielu nie-ornitologów początkowo jest bardzo sceptycznie nastawionych, kiedy słyszą o eBird po raz pierwszy. Moim zdaniem część tego sceptycyzmu wynika z myślenia o eBirdzie w niewłaściwy sposób. Wiele osób najpierw myśli "Czy dane eBird są idealne?", A odpowiedź brzmi: "absolutnie nie." Jednak to nie jest właściwe pytanie. Właściwe pytanie brzmi: "W przypadku niektórych pytań badawczych, czy dane eBird są lepsze niż istniejące dane ornitologiczne?" Na to pytanie odpowiedź brzmi "zdecydowanie tak", po części dlatego, że w przypadku wielu pytań będących przedmiotem zainteresowania, takich jak pytania dotyczące migracji sezonowej na dużą skalę - nie ma realistycznych alternatyw dla rozproszonego gromadzenia danych.
Projekt eBird pokazuje, że można zaangażować wolontariuszy w gromadzenie ważnych danych naukowych. Jednak eBird i powiązane projekty wskazują, że wyzwania związane z pobieraniem próbek i jakością danych stanowią problem w projektach rozproszonego gromadzenia danych. Jak zobaczymy w następnej sekcji, jednak dzięki sprytnemu projektowi i technologii obawy te można zminimalizować w niektórych ustawieniach.