PhotoCity решает качество и выборка данных проблем в распределенной сбора данных.
Веб-сайты, такие как Flickr и Facebook, позволяют людям обмениваться фотографиями со своими друзьями и семьей, а также создают огромные хранилища фотографий, которые можно использовать для других целей. Например, Самир Агарваль и его коллеги (2011) попытались использовать эти фотографии для «Построить Рим в один день», переставив 150 000 фотографий Рима, чтобы создать 3D-реконструкцию города. Для некоторых сильно сфотографированных зданий, таких как Колизей (рисунок 5.10), исследователи были частично успешными, но реконструкции пострадали, потому что большинство фотографий были взяты с одних и тех же знаковых перспектив, оставив части фотографий без фотографий. Таким образом, изображений из репозиториев фотографий было недостаточно. Но что, если добровольцев можно зачислить, чтобы собрать необходимые фотографии, чтобы обогатить уже имеющихся? Возвращаясь к аналогии с искусством в главе 1, что, если готовые изображения могут быть обогащены изображениями custommade?
Чтобы обеспечить целенаправленную сборку большого количества фотографий, Кэтлин Туйте и его коллеги разработали PhotoCity, фото-загружающую игру. PhotoCity превратила потенциально трудоемкую задачу сбора данных - загрузка фотографий - в игровое мероприятие, включающее команды, замки и флаги (рисунок 5.11), и оно было сначала развернуто для создания трехмерной реконструкции двух университетов: Корнельский университет и Университет Вашингтона. Исследователи начали процесс, загрузив семенные фотографии из некоторых зданий. Затем игроки в каждом кампусе осматривали текущее состояние реконструкции и заработали очки, загрузив изображения, улучшившие реконструкцию. Например, если текущая реконструкция библиотеки Uris (в Корнелле) была очень неоднородной, игрок мог заработать очки, загрузив новые снимки. Две особенности этого процесса загрузки очень важны. Во-первых, количество очков, полученных игроком, основывалось на сумме, которую их фотография добавила к реконструкции. Во-вторых, фотографии, которые были загружены, должны были накладываться на существующую реконструкцию, чтобы их можно было проверить. В конце концов, исследователи смогли создать 3D-модели зданий высокого разрешения на обоих кампусах (рисунок 5.12).
Дизайн PhotoCity решил две проблемы, которые часто возникают в распределенном сборе данных: проверка данных и выборка. Во-первых, фотографии были подтверждены путем сравнения их с предыдущими фотографиями, которые, в свою очередь, по сравнению с предыдущими фотографиями полностью возвращались к исходным фотографиям, которые были загружены исследователями. Другими словами, из-за этой встроенной избыточности человеку было очень сложно загрузить фотографию неправильного здания, либо случайно, либо намеренно. Эта конструктивная особенность означала, что система защищала себя от плохих данных. Во-вторых, система подсчета очков естественно обучила участников собирать самые ценные, а не самые удобные данные. На самом деле, вот некоторые из стратегий, которые описывали игроки, чтобы заработать больше очков, что эквивалентно сбору более ценных данных (Tuite et al. 2011) :
- "[Я пытался] приближают время суток и освещения, которые были приняты некоторые фотографии; это поможет предотвратить отторжение игрой. С учетом сказанного, пасмурные дни были лучшими на сегодняшний день, когда имеем дело с углами, потому что меньше контраст помог игры фигуру из геометрии из моих картин ".
- "Когда это было солнечно, я использовал функции анти-качаю камеры, чтобы позволить себе делать снимки во время прогулки по определенной зоне. Это позволило мне принять четкие фотографии, не имея, чтобы остановить мою походку. Также бонус: меньше люди смотрели на меня! "
- "Принимая множество фотографий из одного здания с 5-мегапиксельной камерой, а затем возвращаются домой, чтобы представить, иногда до 5 концертов на выходные стрелять, была основная стратегия захвата фото. Организация фотографий на внешних папках жесткого диска от кампуса региона, строительство, а затем лицо здания при условии хорошей иерархии для структурирования загрузки ".
Эти заявления показывают, что, когда участникам предоставляется соответствующая обратная связь, они могут стать экспертами в сборе данных, представляющих интерес для исследователей.
В целом, проект PhotoCity показывает, что выборка и качество данных не являются непреодолимыми проблемами в распределенном сборе данных. Кроме того, он показывает, что проекты по распределению данных не ограничиваются задачами, которые люди уже делают в любом случае, например, наблюдение за птицами. При правильном дизайне добровольцев можно поощрять делать и другие вещи.