PhotoCity解決了分佈式數據採集數據的質量和取樣的問題。
諸如Flickr和Facebook等網站使人們能夠與他們的朋友和家人分享圖片,並且他們還創建了大量可用於其他目的的照片存儲庫。例如,Sameer Agarwal及其同事(2011)試圖將這些照片用於“一日建羅馬”,重新利用羅馬的150,000張照片來創建城市的三維重建。對於一些拍攝嚴重的建築物 - 例如體育館(圖5.10) - 研究人員獲得了部分成功,但由於大多數照片都是從相同的標誌性視角拍攝的,所以重建受到了影響,部分建築物未被拍攝。因此,來自照片庫的圖像還不夠。但是,如果志願者能夠收集必要的照片以豐富已有的照片呢?回想第1章中的藝術比喻,如果現成的圖像可以通過自定義圖像進行豐富,該怎麼辦?
為了能夠有針對性地收集大量照片,Kathleen Tuite及其同事開發了PhotoCity,一款照片上傳遊戲。 PhotoCity將數據收集的潛在費力任務 - 上傳照片 - 轉變為涉及團隊,城堡和旗幟的類似遊戲的活動(圖5.11),它首次用於創建兩所大學的3D重建:康奈爾大學和大學華盛頓研究人員通過從一些建築物上傳種子照片開始了這一過程。然後,每個校園的玩家通過上傳改善重建的圖像來檢查重建的當前狀態並獲得積分。例如,如果Uris Library(在康奈爾大學)的當前重建非常不完整,玩家可以通過上傳新的圖片來獲得積分。此上傳過程的兩個功能非常重要。首先,玩家收到的點數基於他們的照片添加到重建的數量。其次,上傳的照片必須與現有的重建重疊,以便驗證它們。最後,研究人員能夠在兩個校園中創建高分辨率的建築物3D模型(圖5.12)。
PhotoCity的設計解決了分佈式數據收集中經常出現的兩個問題:數據驗證和抽樣。首先,通過將照片與之前的照片進行比較來驗證照片,然後將這些照片與之前的照片進行比較,一直回到研究人員上傳的種子照片。換句話說,由於這種內置冗餘,人們很難無意或有意地上傳錯誤建築物的照片。此設計功能意味著系統可以保護自己免受不良數據的侵害。其次,評分系統自然地訓練參與者收集最有價值的 - 而不是最方便的數據。事實上,以下是玩家為了獲得更多積分而使用的一些策略,相當於收集更多有價值的數據(Tuite et al. 2011) :
- “[我試著]近似一天,已採取一些照片的照明時間;這將有助於防止遊戲拒絕。隨著中說,陰雨天是最好的迄今為止在處理彎道,因為更少的對比有助於遊戲的身影從出我的照片的幾何形狀。“
- “當它是晴天,我利用我的相機的防抖功能,讓自己身邊的同時特定區域散步拍照。這讓我同時不必停下我的腳步走明快的照片。另外的好處:少人盯著我!“
- “以一棟樓的很多照片了500萬像素的攝像頭,然後回家提交,有時可達5演出在週末拍攝,主要是照片拍攝的策略。通過校園區域組織的外部硬盤驅動器文件夾中的照片,建築,那麼建築的面貌提供了良好的層次來構建上傳“。
這些陳述表明,當向參與者提供適當的反饋時,他們可以成為收集研究人員感興趣的數據的專家。
總體而言,PhotoCity項目表明,採樣和數據質量不是分佈式數據收集中不可克服的問題。此外,它表明分佈式數據收集項目不僅限於人們已經在做的任務,例如觀鳥。通過正確的設計,可以鼓勵志願者做其他事情。