PhotoCity解决了分布式数据采集数据的质量和取样的问题。
诸如Flickr和Facebook等网站使人们能够与他们的朋友和家人分享图片,并且他们还创建了大量可用于其他目的的照片存储库。例如,Sameer Agarwal及其同事(2011)试图将这些照片用于“一日建罗马”,重新利用罗马的150,000张照片来创建城市的三维重建。对于一些拍摄严重的建筑物 - 例如体育馆(图5.10) - 研究人员获得了部分成功,但由于大多数照片都是从相同的标志性视角拍摄的,所以重建受到了影响,部分建筑物未被拍摄。因此,来自照片库的图像还不够。但是,如果志愿者能够收集必要的照片以丰富已有的照片呢?回想第1章中的艺术比喻,如果现成的图像可以通过自定义图像进行丰富,该怎么办?
为了能够有针对性地收集大量照片,Kathleen Tuite及其同事开发了PhotoCity,一款照片上传游戏。 PhotoCity将数据收集的潜在费力任务 - 上传照片 - 转变为涉及团队,城堡和旗帜的类似游戏的活动(图5.11),它首次用于创建两所大学的3D重建:康奈尔大学和大学华盛顿研究人员通过从一些建筑物上传种子照片开始了这一过程。然后,每个校园的玩家通过上传改善重建的图像来检查重建的当前状态并获得积分。例如,如果Uris Library(在康奈尔大学)的当前重建非常不完整,玩家可以通过上传新的图片来获得积分。此上传过程的两个功能非常重要。首先,玩家收到的点数基于他们的照片添加到重建的数量。其次,上传的照片必须与现有的重建重叠,以便验证它们。最后,研究人员能够在两个校园中创建高分辨率的建筑物3D模型(图5.12)。
PhotoCity的设计解决了分布式数据收集中经常出现的两个问题:数据验证和抽样。首先,通过将照片与以前的照片进行比较来验证照片,然后将这些照片与之前的照片进行比较,一直回到研究人员上传的种子照片。换句话说,由于这种内置冗余,人们很难无意或有意地上传错误建筑物的照片。此设计功能意味着系统可以保护自己免受不良数据的侵害。其次,评分系统自然地训练参与者收集最有价值的 - 而不是最方便的数据。事实上,以下是玩家为了获得更多积分而使用的一些策略,相当于收集更多有价值的数据(Tuite et al. 2011) :
- “[我试着]近似一天,已采取一些照片的照明时间;这将有助于防止游戏拒绝。随着中说,阴雨天是最好的迄今为止在处理弯道,因为更少的对比有助于游戏的身影从出我的照片的几何形状。“
- “当它是晴天,我利用我的相机的防抖功能,让自己身边的同时特定区域散步拍照。这让我同时不必停下我的脚步走明快的照片。另外的好处:少人盯着我!“
- “以一栋楼的很多照片了500万像素的摄像头,然后回家提交,有时可达5演出在周末拍摄,主要是照片拍摄的策略。通过校园区域组织的外部硬盘驱动器文件夹中的照片,建筑,那么建筑的面貌提供了良好的层次来构建上传“。
这些陈述表明,当向参与者提供适当的反馈时,他们可以成为收集研究人员感兴趣的数据的专家。
总体而言,PhotoCity项目表明,采样和数据质量不是分布式数据收集中不可克服的问题。此外,它表明分布式数据收集项目不仅限于人们已经在做的任务,例如观鸟。通过正确的设计,可以鼓励志愿者做其他事情。