eBird собирает данные о птиц из птицеловов; добровольцы могут обеспечить географический масштаб , что ни одна исследовательская группа не может сравниться.
Птицы повсюду, и орнитологи хотел бы знать, где каждая птица в каждый момент времени. Учитывая такой совершенный набор данных, орнитологи может решить многие фундаментальные вопросы своей области. Конечно, сбор этих данных выходит за рамки какого-либо конкретного исследователя. В то же время, что орнитологи желать богаче и более полные данные, "орнитологов" -Люди, которые идут наблюдение за птицами за удовольствие постоянно наблюдать птиц и документирования того, что они видят. Эти две общины имеют долгую историю сотрудничества, но теперь эти совместные работы были преобразованы в цифровую эпоху. eBird представляет собой распределенный проект сбора данных , которая обменивается информацией с птицеловов по всему миру, и он уже получил более 260 миллионов фотоохоты от 250000 участников (Kelling et al. 2015) и (Kelling et al. 2015) .
До запуска eBird, большая часть данных, созданных птицеловов был недоступен для исследователей:
"В тысячах шкафах по всему мире сегодня лежат бесчисленные записные книжки, каталожные карточки, аннотированные контрольные перечни и дневников. Те из нас, кто занимается с птицами учреждений хорошо знают разочарование слуха снова и снова о "записи птица моего покойного дяди" Мы знаем, насколько ценным они могли бы быть. К сожалению, мы также знаем , что мы не можем использовать их ". (Fitzpatrick et al. 2002) и (Fitzpatrick et al. 2002) , (Fitzpatrick et al. 2002)
Вместо того, чтобы иметь эти ценные данные сидят неиспользованные, eBird позволяет Birders загрузить его на централизованной базе данных, цифровой. Данные, загруженные в eBird содержит шесть ключевых полей: кто, где, когда, какие виды, сколько и усилий. Для читателей, не наблюдения за птицами, "усилие" относится к методам, используемым во время проведения наблюдений. проверки качества данных начинаются еще до того, как данные загружены. Birders пытаются представить необычные отчеты, такие как отчеты очень редких видов, очень большого количества ошибок, или вне сезона отчетов, помечены, и сайт автоматически запрашивает дополнительную информацию, например, фотографии. После сбора этой дополнительной информации, маркированные отчеты направляются в один из сотен добровольцев региональных экспертов для дальнейшего рассмотрения. После расследования регионального экспертного, включая возможное дополнительное соответствие с птицелов-маркированных отчетов либо отбрасываются как ненадежные или они вводятся в базу данных eBird (Kelling et al. 2012) и (Kelling et al. 2012) . Эта база данных экранированных наблюдений становится доступным любому в мире с подключением к Интернету, и до сих пор, почти 100 рецензируемых изданий использовали его (Bonney et al. 2014) и (Bonney et al. 2014) . eBird ясно показывает, что добровольческие орнитологов могут собирать данные, которые полезны для исследования реального орнитологии.
Одна из красавиц eBird является то, что она захватывает "работу", которая уже имеет место в данном случае, птицами. Эта функция позволяет проект добиться огромного масштаба. Тем не менее, "работа" сделано птицеловов точно не совпадают с данными, необходимые орнитологами. Например, в eBird, сбор данных определяется местоположением птицеловов а не расположение птиц. Это означает , что, например, большинство наблюдений , как правило, расположены близко к дорогам (Kelling et al. 2012; Kelling et al. 2015) и (Kelling et al. 2012; Kelling et al. 2015) и (Kelling et al. 2012; Kelling et al. 2015) . В дополнение к этому неравномерного распределения усилий по пространству, фактические наблюдения, сделанные птицеловов не всегда идеальны. Например, некоторые птицеловы только загрузить информацию о видах, которые они считают интересным, а не загружать информацию обо всех видов, которые они наблюдали.
Исследователи eBird есть два основных пути решения этих проблем с качеством данных, проблемы, которые возникают во многих других распределенных проектов по сбору данных. Во-первых, исследователи eBird постоянно пытаются повысить качество данных, представленных птицеловов. Например, eBird предлагает обучение для участников, и она создала визуализацию данных каждого участника , что, по их конструкции, поощряют Birders загружать информацию обо всех видов , которые они наблюдали, а не только подмножество (Wood et al. 2011; Wiggins 2011) и (Wood et al. 2011; Wiggins 2011) , Во-вторых, исследователи eBird используют статистические модели, которые пытаются исправить для шумной и гетерогенный характер исходных данных. Пока еще не ясно, если эти статистические модели полностью удалить уклоны из данных, но орнитологи достаточно уверены в качестве скорректированных данных eBird, что, как уже упоминалось ранее, она была использована в почти 100 рецензируемых научных публикаций.
Многие не-орнитологи изначально весьма скептически, когда они слышат о eBird впервые. На мой взгляд, часть этого скептицизма приходит от мыслей о eBird в неправильном направлении. Многие люди сначала думают "Является ли данные eBird совершенным?", И ответ на него абсолютно нет. Тем не менее, это не правильный вопрос. Правильный вопрос: "Для некоторых вопросов исследования, это данные eBird лучше, чем существующие данные орнитологии?» Для этого вопрос ответ, безусловно, да, отчасти потому, что по многим вопросам, представляющим интерес нет реальной альтернативы распределенной сбора данных.
Проект eBird демонстрирует, что можно привлечь добровольцев в сборе важных научных данных. Тем не менее, eBird, и связанные с ним проекты, показывают, что проблемы, связанные с отбором проб и качества данных являются проблемы для распределенных проектов по сбору данных. Как мы увидим в следующем разделе, однако, с продуманным дизайном и технологией эти проблемы могут быть сведены к минимуму в некоторых ситуациях.