eBird는 새 사냥꾼의 조류에 대한 데이터를 수집; 자원 봉사자는 연구 팀은 일치하지 수있는 지리적 스케일을 제공 할 수 있습니다.
새들이 도처에 있고, 조류 학자는 모든 새가 매 순간에 어디 알고 싶습니다. 이러한 완벽한 데이터 집합을 감안할 때, 조류 학자는 자신의 분야의 많은 근본적인 문제를 해결할 수 있습니다. 물론,이 데이터를 수집하는 것은 특정 연구의 범위를 벗어납니다. 조류 학자는보다 풍부하고 완전한 데이터를 원하는 것을 동시에, "새 사냥꾼"- 사람들 재미있다 지속적으로 새를 관찰하고 그들이 무엇을보고 문서화 조류 관찰을 갈 사람. 이 두 지역 사회의 협력에서 오랜 역사를 가지고,하지만 지금은 이러한 협력은 디지털 시대로 전환되었다. eBird 전세계 들새 관찰자로부터 정보를 요구하는 분산 데이터 수집 계획이며, 이미 250,000 참가자 만 260 조류 관찰을 받았다 (Kelling et al. 2015) .
eBird의 출시에 앞서, 새 사냥꾼에 의해 생성 된 데이터의 많은 연구자에 사용할 수 있었다 :
"세상 오늘 주위 옷장의 수천에서 수없이 많은 노트북, 색인 카드, 주석 체크리스트 및 일기 거짓말. 들새 관찰 기관과 관련 우리의 사람들은 잘 '나의 늦은 삼촌의 새 기록'우리는 그들이 할 수있는 방법 귀중한 알고에 대해 반복해서 듣고 좌절을 알고있다. 슬프게도, 우리는 또한 우리가 그들을 사용할 수 없습니다 알고있다. " (Fitzpatrick et al. 2002)
오히려이 중요한 데이터가 사용되지 않는 앉아 필요없이, eBird는 중앙, 디지털 데이터베이스에 업로드 새 사냥꾼 수 있습니다. ,,, 어떤 종, 얼마나 많은, 그리고 노력 : eBird에 업로드 된 데이터는 6 개 주요 분야가 포함되어 있습니다. 비 들새 관찰 독자은 "노력"관찰하는 동안 사용되는 방법을 의미한다. 데이터 품질 검사 데이터가 업로드 전부터 시작한다. 특이한 보고서 - 같은 매우 드문 종의 보고서와 같은이 매우 높은 카운트, 또는 시즌에서 보고서-하는 플래그 및 웹 사이트가 자동으로 사진과 같은 추가 정보를 요청 제출하려고 새 사냥꾼. 이 추가 정보를 수집 한 후, 플래그 보고서는 추가 검토를 위해 자원 봉사 지역 전문가의 수백 중 하나에 전송됩니다. 새 사냥꾼 - 신고 된 보고서와 지역 전문가를 포함한 가능한 추가 대응의 조사 이후에 신뢰로 폐기 또는 그들이 eBird 데이터베이스에 입력됩니다 (Kelling et al. 2012) . 상영 관측이 데이터베이스는 인터넷 연결과 함께 세계의 사람에게 사용할 수 있습니다, 지금까지 거의 100 피어 리뷰 출판물을 사용했다 (Bonney et al. 2014) . eBird 명확 자원 봉사 새 사냥꾼 실제 조류학 연구를위한 유용한 데이터를 수집 할 수 있다는 것을 보여줍니다.
eBird의 아름다움 중 하나는 이미 발생 된이 경우, 들새 관찰 '직장'을 포착한다는 것입니다. 이 기능은 엄청난 규모를 달성하기 위해 프로젝트를 할 수 있습니다. 그러나, 들새 관찰자에 의해 수행 된 "작업"정확히 조류 학자에 필요한 데이터와 일치하지 않는다. 예를 들어, eBird에서 데이터 수집 들새 관찰자의 위치하지 조류의 위치에 의해 결정된다. 이것은 예를 들어, 대부분의 관측 도로 부근 발생하는 경향이 있다는 것을 의미한다 (Kelling et al. 2012; Kelling et al. 2015) . 공간 위에 노력이 불균등 분포에 더하여, 들새 관찰자에 의해 실제의 관측은 항상 적합하지 않다. 예를 들어, 일부 새 사냥꾼은 그들이 아니라 그들이 관찰 된 모든 종에 대한 정보를 업로드보다 흥미 고려 종에 대한 정보를 업로드 할 수 있습니다.
eBird 연구자들은 이러한 데이터 품질 문제에 대한 두 가지 솔루션, 많은 다른 분산 데이터 수집 프로젝트에서 발생하는 문제가있다. 첫째, eBird 연구자들은 지속적으로 새 사냥꾼에 의해 제출 된 데이터의 품질을 업그레이드하려고합니다. 예를 들어, eBird는 참가자들에게 교육을 제공하고, 그들이 아니라 일부를 관찰 모든 종에 대한 정보를 업로드, 설계에 의해, 새 사냥꾼을 장려 각 참가자의 데이터의 시각화를 만들었습니다 (Wood et al. 2011; Wiggins 2011) . 둘째, eBird 연구진은 원시 데이터의 노이즈 및 이기종 자연을 보정하려고 통계 모델을 사용합니다. 이 통계 모델은 완전히 데이터로부터 바이어스를 제거 할 경우는 아직 명확하지 않지만 조류 학자는 앞서 언급되었던 바와 같이,이 거의 100 피어 리뷰 과학 출판물에 사용 된 조정 eBird 데이터의 품질에 충분한 확신.
그들이 처음 eBird에 대해들을 때 많은 비 조류 학자는 처음에 매우 회의적이다. 제 생각에는,이 회의의 일부가 잘못된 방법으로 eBird에 대해 생각에서 비롯됩니다. 많은 사람들이 먼저 생각한다 "는 eBird 데이터를 완벽입니까?"대답은 절대적으로하지 않습니다. 그러나, 올바른 질문이 아니다. 올바른 질문은 "특정 연구 질문의 경우, 기존의 조류학 데이터보다 eBird 데이터 낫다?"입니다 대답은 '예, 부분에 관심이 많은 질문에 대한 분산 데이터 수집에 대한 현실적인 대안이 없기 때문에 확실히 그 질문은.
eBird 프로젝트는 중요한 과학적 데이터의 수집에 자원 봉사자를 포함 할 수 있음을 보여줍니다. 그러나, eBird 및 관련 프로젝트는, 샘플링 및 데이터 품질과 관련된 문제는 분산 데이터 수집 프로젝트에 대한 우려가 있음을 나타냅니다. 로서 우리는 이러한 우려가 일부 설정에 최소화 할 수 영리한 디자인과 기술로, 그러나, 다음 절에서 볼 수 있습니다.