eBird mengumpulkan data tentang burung dari birders; relawan dapat memberikan skala yang tidak dapat ditandingi oleh tim peneliti.
Burung ada di mana-mana, dan ahli ornitologi ingin tahu di mana setiap burung berada di setiap saat. Dengan adanya dataset yang sempurna, ahli ornitologi dapat menjawab banyak pertanyaan mendasar di bidangnya. Tentu saja, mengumpulkan data ini berada di luar ruang lingkup peneliti tertentu. Pada saat yang sama, para ahli ornitologi menginginkan data yang lebih kaya dan lebih lengkap, “birders” - orang-orang yang pergi mengamati burung untuk bersenang-senang - terus-menerus mengamati burung dan mendokumentasikan apa yang mereka lihat. Kedua komunitas ini memiliki sejarah panjang berkolaborasi, tetapi sekarang kolaborasi ini telah diubah oleh era digital. eBird adalah proyek pengumpulan data terdistribusi yang mengumpulkan informasi dari birders di seluruh dunia, dan telah menerima lebih dari 260 juta penampakan burung dari 250.000 peserta (Kelling, Fink, et al. 2015) .
Sebelum peluncuran eBird, sebagian besar data yang dibuat oleh birders tidak tersedia untuk para peneliti:
“Di ribuan lemari di seluruh dunia saat ini terdapat banyak sekali buku catatan, kartu indeks, daftar periksa beranotasi, dan buku harian. Orang-orang yang terlibat dengan institusi-institusi birding tahu benar frustrasi mendengar berulang-ulang tentang 'catatan-catatan burung pamanku' Kami tahu betapa berharganya mereka. Sayangnya, kami juga tahu kami tidak bisa menggunakannya. ” (Fitzpatrick et al. 2002)
Daripada memiliki data berharga ini tidak digunakan, eBird memungkinkan birders mengunggahnya ke database digital terpusat. Data yang diunggah ke eBird berisi enam bidang utama: siapa, di mana, kapan, spesies apa, berapa banyak, dan usaha. Untuk pembaca non-birding, "upaya" mengacu pada metode yang digunakan saat melakukan pengamatan. Pemeriksaan kualitas data dimulai bahkan sebelum data diunggah. Birders berusaha mengirimkan laporan yang tidak biasa - seperti laporan spesies yang sangat langka, jumlah yang sangat tinggi, atau laporan di luar musim - ditandai, dan situs web secara otomatis meminta informasi tambahan, seperti foto. Setelah mengumpulkan informasi tambahan ini, laporan yang ditandai dikirim ke salah satu dari ratusan ahli regional sukarela untuk ditinjau lebih lanjut. Setelah penyelidikan oleh ahli regional - termasuk kemungkinan korespondensi tambahan dengan birder - laporan yang ditandai dapat dibuang karena tidak dapat diandalkan atau dimasukkan ke dalam basis data eBird (Kelling et al. 2012) . Database pengamatan terskrining ini kemudian tersedia bagi siapa saja di dunia dengan koneksi Internet, dan, sejauh ini, hampir 100 publikasi peer-review telah menggunakannya (Bonney et al. 2014) . eBird dengan jelas menunjukkan bahwa relawan birders mampu mengumpulkan data yang berguna untuk penelitian ornitologi nyata.
Salah satu keindahan eBird adalah bahwa ia menangkap "pekerjaan" yang sudah terjadi — dalam hal ini, birding. Fitur ini memungkinkan proyek untuk mencapai skala yang luar biasa. Namun, "pekerjaan" yang dilakukan oleh birders tidak sama persis dengan data yang dibutuhkan oleh ahli burung. Misalnya, di eBird, pengumpulan data ditentukan oleh lokasi birders, bukan lokasi burung. Ini berarti bahwa, misalnya, sebagian besar pengamatan cenderung terjadi di dekat jalan (Kelling et al. 2012; Kelling, Fink, et al. 2015) . Selain distribusi upaya yang tidak merata ini, pengamatan aktual yang dilakukan oleh birders tidak selalu ideal. Sebagai contoh, beberapa birders hanya mengunggah informasi tentang spesies yang mereka anggap menarik, daripada informasi tentang semua spesies yang mereka amati.
Peneliti eBird memiliki dua solusi utama untuk masalah kualitas data ini — solusi yang mungkin bisa membantu dalam proyek pengumpulan data terdistribusi lainnya juga. Pertama, peneliti eBird terus berusaha meningkatkan kualitas data yang dikirimkan oleh birders. Misalnya, eBird menawarkan pendidikan kepada peserta, dan telah menciptakan visualisasi data masing-masing peserta yang, dengan desain mereka, mendorong birders untuk mengunggah informasi tentang semua spesies yang mereka amati, bukan hanya yang paling menarik (Wood et al. 2011; Wiggins 2011) . Kedua, peneliti eBird menggunakan model statistik yang mencoba untuk mengoreksi sifat data mentah yang bising dan heterogen (Fink et al. 2010; Hurlbert and Liang 2012) . Belum jelas apakah model statistik ini sepenuhnya menghilangkan bias dari data, tetapi ahli ornitologi cukup percaya diri dalam kualitas data eBird yang telah disesuaikan, seperti yang telah disebutkan sebelumnya, data ini telah digunakan di hampir 100 publikasi ilmiah yang ditinjau oleh sejawat.
Banyak ahli non-ornitologi pada awalnya sangat skeptis ketika mereka mendengar tentang eBird untuk pertama kalinya. Menurut pendapat saya, bagian dari skeptisisme ini berasal dari pemikiran tentang eBird dengan cara yang salah. Banyak orang pertama berpikir "Apakah data eBird sempurna?", Dan jawabannya adalah "sama sekali tidak." Namun, itu bukan pertanyaan yang tepat. Pertanyaan yang tepat adalah "Untuk pertanyaan penelitian tertentu, apakah data eBird lebih baik daripada data ornitologi yang ada?" Untuk pertanyaan itu jawabannya adalah "pasti ya," sebagian karena untuk banyak pertanyaan yang menarik — seperti pertanyaan tentang migrasi musiman skala besar —Tidak ada alternatif yang realistis untuk pengumpulan data terdistribusi.
Proyek eBird menunjukkan bahwa mungkin melibatkan sukarelawan dalam pengumpulan data ilmiah yang penting. Namun, eBird, dan proyek terkait, menunjukkan bahwa tantangan yang terkait dengan pengambilan sampel dan kualitas data menjadi perhatian untuk proyek pengumpulan data terdistribusi. Akan tetapi, seperti yang akan kita lihat di bagian berikutnya, dengan desain dan teknologi yang cerdas, kekhawatiran ini dapat diminimalkan dalam beberapa pengaturan.