PhotoCity giải quyết chất lượng dữ liệu và lấy mẫu các vấn đề trong thu thập dữ liệu phân tán.
Các trang web như Flickr và Facebook cho phép mọi người chia sẻ hình ảnh với bạn bè và gia đình của họ và họ cũng tạo ra các kho lưu trữ ảnh khổng lồ có thể được sử dụng cho các mục đích khác. Ví dụ, Sameer Agarwal và các đồng nghiệp (2011) đã cố gắng sử dụng những bức ảnh này để “Xây dựng Rome trong một ngày” bằng cách tái định hình 150.000 bức ảnh của Rô-ma để tạo dựng lại thành phố 3D. Đối với một số tòa nhà được chụp ảnh nặng như Đấu trường Coliseum (hình 5.10), các nhà nghiên cứu đã thành công một phần, nhưng các công trình tái cấu trúc phải chịu đựng bởi vì hầu hết các bức ảnh được chụp từ các quan điểm mang tính biểu tượng, để lại các phần của các tòa nhà không bị ảnh hưởng. Do đó, hình ảnh từ kho lưu trữ ảnh không đủ. Nhưng nếu các tình nguyện viên có thể được tranh thủ để thu thập các bức ảnh cần thiết để làm phong phú thêm những bức ảnh đã có sẵn? Nghĩ về tương tự nghệ thuật trong chương 1, điều gì sẽ xảy ra nếu hình ảnh readymade có thể được làm giàu bằng hình ảnh tùy chỉnh?
Để kích hoạt bộ sưu tập được nhắm mục tiêu với số lượng lớn các bức ảnh, Kathleen Tuite và các đồng nghiệp đã phát triển PhotoCity, một trò chơi tải lên ảnh. PhotoCity đã biến công việc thu thập dữ liệu có khả năng mất thời gian - tải ảnh lên một hoạt động giống như trò chơi liên quan đến các đội, lâu đài và cờ (hình 5.11) và lần đầu tiên được triển khai để tạo dựng lại 3D cho hai trường đại học: Đại học Cornell và Đại học của Washington. Các nhà nghiên cứu đã bắt đầu quá trình bằng cách tải lên hình ảnh hạt giống từ một số tòa nhà. Sau đó, người chơi trên mỗi khuôn viên kiểm tra trạng thái hiện tại của việc tái thiết và kiếm được điểm bằng cách tải lên hình ảnh cải thiện việc xây dựng lại. Ví dụ, nếu việc tái thiết hiện tại của Thư viện Uris (tại Cornell) là rất khó khăn, người chơi có thể kiếm điểm bằng cách tải lên hình ảnh mới của nó. Hai tính năng của quá trình tải lên này rất quan trọng. Đầu tiên, số điểm mà người chơi nhận được dựa trên số tiền mà ảnh của họ được thêm vào để tái tạo. Thứ hai, các bức ảnh đã được tải lên phải trùng lặp với quá trình tái thiết hiện có để chúng có thể được xác nhận. Cuối cùng, các nhà nghiên cứu đã có thể tạo ra các mô hình 3D có độ phân giải cao trong cả hai cơ sở (hình 5.12).
Thiết kế của PhotoCity đã giải quyết được hai vấn đề thường nảy sinh trong việc thu thập dữ liệu phân tán: xác nhận và lấy mẫu dữ liệu. Đầu tiên, các bức ảnh đã được xác nhận bằng cách so sánh chúng với các bức ảnh trước đó, lần lượt được so sánh với các bức ảnh trước đó về tất cả các bức ảnh hạt giống được các nhà nghiên cứu tải lên. Nói cách khác, vì sự tích hợp sẵn này, rất khó cho một người nào đó tải lên một bức ảnh của tòa nhà sai, vô tình hoặc cố ý. Tính năng thiết kế này có nghĩa là hệ thống tự bảo vệ chống lại dữ liệu xấu. Thứ hai, hệ thống tính điểm tự động đào tạo những người tham gia thu thập dữ liệu có giá trị nhất — không phải là thuận tiện nhất. Trên thực tế, đây là một số chiến lược mà người chơi mô tả sử dụng để kiếm được nhiều điểm hơn, tương đương với việc thu thập nhiều dữ liệu có giá trị hơn (Tuite et al. 2011) :
- "[Tôi đã cố gắng] gần đúng thời gian trong ngày và ánh sáng là một số hình ảnh được chụp; điều này sẽ giúp ngăn chặn từ chối bởi các trò chơi. Với mà nói, những ngày có mây là tốt nhất cho đến nay khi đối xử với góc vì ít tương phản giúp những con số trò chơi ra các hình học từ hình ảnh của tôi. "
- "Khi nó là nắng, tôi sử dụng các tính năng chống rung máy ảnh của tôi cho phép bản thân mình để chụp ảnh trong khi đi bộ xung quanh một khu vực cụ thể. Điều này cho phép tôi để có hình ảnh sắc nét trong khi không phải để ngăn chặn bước tiến của tôi. Ngoài tiền thưởng: ít người nhìn chằm chằm vào tôi "!
- "Đi nhiều hình ảnh của một tòa nhà với camera 5 megapixel, sau đó về nhà để gửi, đôi khi lên đến 5 đồng biểu diễn trên một shoot cuối tuần, là chiến lược chụp ảnh chính. Tổ chức các hình ảnh trên thư mục ổ đĩa cứng gắn ngoài theo vùng khuôn viên trường, xây dựng, sau đó khuôn mặt của tòa nhà cung cấp hệ thống phân cấp tốt để cơ cấu tải lên ".
Những phát biểu này cho thấy rằng khi những người tham gia được cung cấp phản hồi thích hợp, họ có thể trở nên khá chuyên nghiệp trong việc thu thập dữ liệu mà các nhà nghiên cứu quan tâm.
Nhìn chung, dự án PhotoCity cho thấy rằng việc lấy mẫu và chất lượng dữ liệu không phải là vấn đề không thể vượt qua trong việc thu thập dữ liệu phân tán. Hơn nữa, nó cho thấy rằng các dự án thu thập dữ liệu phân tán không bị giới hạn trong các nhiệm vụ mà mọi người vẫn đang làm, chẳng hạn như xem chim. Với thiết kế phù hợp, các tình nguyện viên có thể được khuyến khích làm những việc khác nữa.