Το eBird συλλέγει δεδομένα σχετικά με πτηνά από πτηνοτρόφους. οι εθελοντές μπορούν να προσφέρουν μια κλίμακα που καμία ερευνητική ομάδα δεν μπορεί να ταιριάξει.
Τα πουλιά είναι παντού, και οι ορνιθολόγοι θα ήθελαν να μάθουν πού κάθε πουλί είναι σε κάθε στιγμή. Με δεδομένο ένα τέλειο σύνολο δεδομένων, οι ορνιθολόγοι θα μπορούσαν να αντιμετωπίσουν πολλά βασικά ερωτήματα στον τομέα τους. Φυσικά, η συλλογή αυτών των δεδομένων είναι πέρα από το πεδίο εφαρμογής κάποιου συγκεκριμένου ερευνητή. Την ίδια στιγμή που οι ορνιθολόγοι επιθυμούν πλουσιότερα και πληρέστερα δεδομένα, οι "birders" - άνθρωποι που παρακολουθούν τα πουλιά για διασκέδαση - παρακολουθούν συνεχώς τα πουλιά και τεκμηριώνουν τι βλέπουν. Αυτές οι δύο κοινότητες έχουν μακρά ιστορία συνεργασίας, αλλά τώρα αυτές οι συνεργασίες έχουν μεταμορφωθεί από την ψηφιακή εποχή. Το eBird είναι ένα κατανεμημένο έργο συλλογής δεδομένων που προσελκύει πληροφορίες από πτηνοτρόφους σε όλο τον κόσμο και έχει ήδη λάβει πάνω από 260 εκατομμύρια παρατηρήσεις πουλιών από 250.000 συμμετέχοντες (Kelling, Fink, et al. 2015) .
Πριν από την κυκλοφορία του eBird, τα περισσότερα από τα δεδομένα που δημιουργήθηκαν από τα πουλιά δεν ήταν διαθέσιμα στους ερευνητές:
"Σε χιλιάδες ντουλάπες σε όλο τον κόσμο σήμερα βρίσκονται αμέτρητα σημειωματάρια, κάρτες δεικτών, σχολιασμένες λίστες ελέγχου και ημερολόγια. Όσοι από εμάς εμπλέκονται με ιδρύματα πτηνών γνωρίζουν καλά την απογοήτευση της ακρόασης ξανά και ξανά για τα «αρχεία των πουλιών του θείου μου» [sic] Γνωρίζουμε πόσο πολύτιμες θα μπορούσαν να είναι. Δυστυχώς, γνωρίζουμε επίσης ότι δεν μπορούμε να τα χρησιμοποιήσουμε » (Fitzpatrick et al. 2002)
Αντί να μην έχουν αυτά τα πολύτιμα δεδομένα καθίστανται αχρησιμοποίητα, το eBird επιτρέπει στα πουλιά να τα μεταφορτώσουν σε μια κεντρική, ψηφιακή βάση δεδομένων. Τα δεδομένα που μεταφορτώνονται στο eBird περιέχουν έξι βασικά πεδία: ποιος, πού, πότε, ποιο είδος, πόσα, και προσπάθεια. Για τους μη αναγνώστες πουλιών, η "προσπάθεια" αναφέρεται στις μεθόδους που χρησιμοποιούνται κατά τη λήψη παρατηρήσεων. Οι έλεγχοι ποιότητας δεδομένων αρχίζουν ακόμη και πριν μεταφορτωθούν τα δεδομένα. Οι φτηνοί που προσπαθούν να υποβάλουν ασυνήθιστες αναφορές - όπως αναφορές πολύ σπάνιων ειδών, πολύ υψηλές μετρήσεις ή αναφορές εκτός εποχής - επισημαίνονται και ο ιστότοπος ζητά αυτόματα πρόσθετες πληροφορίες, όπως φωτογραφίες. Αφού συλλέξουν αυτές τις πρόσθετες πληροφορίες, οι αναφορές με επισήμανση αποστέλλονται σε μία από τις εκατοντάδες εθελοντών περιφερειακών εμπειρογνωμόνων για περαιτέρω ανασκόπηση. Μετά από έρευνα από τον περιφερειακό εμπειρογνώμονα -συμπεριλαμβανομένης πιθανής συμπληρωματικής αλληλογραφίας με τον φορέα - οι αναφορές με σημαία είτε απορρίπτονται ως αναξιόπιστες είτε εισάγονται στη βάση δεδομένων eBird (Kelling et al. 2012) . Στη συνέχεια, αυτή η βάση δεδομένων των παρατηρήσεων γίνεται διαθέσιμη σε οποιονδήποτε στον κόσμο με σύνδεση στο διαδίκτυο και μέχρι σήμερα έχουν χρησιμοποιηθεί περίπου 100 δημοσιεύσεις που έχουν αξιολογηθεί από ομοτίμους (Bonney et al. 2014) . Το eBird δείχνει σαφώς ότι οι εθελοντές πουλιών είναι σε θέση να συλλέγουν δεδομένα που είναι χρήσιμα για την πραγματική έρευνα στον τομέα της ορνιθολογίας.
Μία από τις ομορφιές του eBird είναι ότι συλλαμβάνει "εργασία" που συμβαίνει ήδη - στην περίπτωση αυτή, πουλιά. Αυτό το χαρακτηριστικό επιτρέπει στο έργο να επιτύχει μια τεράστια κλίμακα. Ωστόσο, το "έργο" που γίνεται από birders δεν ταιριάζει ακριβώς με τα δεδομένα που χρειάζονται οι ορνιθολόγοι. Για παράδειγμα, στο eBird, η συλλογή δεδομένων καθορίζεται από τη θέση των πτηνών, όχι από την τοποθεσία των πτηνών. Αυτό σημαίνει ότι, για παράδειγμα, οι περισσότερες παρατηρήσεις τείνουν να εμφανίζονται κοντά στους δρόμους (Kelling et al. 2012; Kelling, Fink, et al. 2015) . Εκτός από αυτή την άνιση κατανομή της προσπάθειας για το διάστημα, οι πραγματικές παρατηρήσεις που γίνονται από birders δεν είναι πάντα ιδανικές. Για παράδειγμα, μερικοί birders ανεβάζουν πληροφορίες μόνο για είδη που θεωρούν ενδιαφέροντα, παρά πληροφορίες για όλα τα είδη που έχουν παρατηρήσει.
Οι ερευνητές του eBird έχουν δύο βασικές λύσεις σε αυτά τα θέματα ποιότητας δεδομένων - λύσεις που μπορούν να βοηθήσουν και σε άλλα έργα συλλογής δεδομένων. Πρώτον, οι ερευνητές του eBird προσπαθούν συνεχώς να αναβαθμίζουν την ποιότητα των δεδομένων που υποβάλλουν τα πουλιά. Για παράδειγμα, το eBird προσφέρει εκπαίδευση στους συμμετέχοντες και έχει δημιουργήσει οπτικοποιήσεις των δεδομένων κάθε συμμετέχοντος, τα οποία με το σχεδιασμό τους ενθαρρύνουν τους birders να μεταφορτώσουν πληροφορίες για όλα τα είδη που παρατηρούσαν, όχι μόνο τα πιο ενδιαφέροντα (Wood et al. 2011; Wiggins 2011) . Δεύτερον, οι ερευνητές του eBird χρησιμοποιούν στατιστικά μοντέλα που επιχειρούν να διορθώσουν την θορυβώδη και ετερογενή φύση των πρώτων δεδομένων (Fink et al. 2010; Hurlbert and Liang 2012) . Δεν είναι ακόμη σαφές εάν αυτά τα στατιστικά μοντέλα εξαλείφουν πλήρως τις αποκλίσεις από τα δεδομένα, αλλά οι ορνιθολόγοι είναι αρκετά σίγουροι για την ποιότητα των προσαρμοσμένων δεδομένων eBird ότι, όπως αναφέρθηκε προηγουμένως, τα δεδομένα αυτά έχουν χρησιμοποιηθεί σε περίπου 100 επιστημονικές δημοσιεύσεις.
Πολλοί μη ορνιθολόγοι είναι αρχικά εξαιρετικά σκεπτικοί όταν ακούν για το eBird για πρώτη φορά. Κατά τη γνώμη μου, μέρος αυτού του σκεπτικισμού προέρχεται από τη σκέψη για το eBird με λάθος τρόπο. Πολλοί άνθρωποι αρχικά σκέφτονται "Είναι τα δεδομένα eBird τέλεια;" και η απάντηση είναι "απολύτως όχι." Ωστόσο, αυτό δεν είναι η σωστή ερώτηση. Η σωστή ερώτηση είναι: "Για ορισμένα ερευνητικά ερωτήματα, είναι καλύτερα τα δεδομένα του eBird από τα υπάρχοντα δεδομένα σχετικά με την ορνιθολογία;" Για την ερώτηση αυτή η απάντηση είναι "σίγουρα ναι", εν μέρει επειδή για πολλά θέματα ενδιαφέροντος, όπως ερωτήσεις σχετικά με την εποχιακή μετανάστευση μεγάλης κλίμακας -Δεν υπάρχουν ρεαλιστικές εναλλακτικές λύσεις για τη συλλογή κατανεμημένων δεδομένων.
Το σχέδιο eBird καταδεικνύει ότι είναι δυνατή η συμμετοχή εθελοντών στη συλλογή σημαντικών επιστημονικών δεδομένων. Ωστόσο, το eBird και τα συναφή έργα δείχνουν ότι οι προκλήσεις που σχετίζονται με τη δειγματοληψία και την ποιότητα των δεδομένων αποτελούν ανησυχίες για τα έργα συλλογής κατανεμημένων δεδομένων. Όπως θα δούμε στην επόμενη ενότητα, ωστόσο, με έξυπνο σχεδιασμό και τεχνολογία, αυτές οι ανησυχίες μπορούν να ελαχιστοποιηθούν σε ορισμένες ρυθμίσεις.