PhotoCity résout les problèmes de qualité des données et d' échantillonnage dans la collecte des données distribuées.
Des sites Web tels que Flickr et Facebook permettent aux gens de partager des photos avec leurs amis et leur famille, et ils créent également d'énormes dépôts de photos qui peuvent être utilisés à d'autres fins. Par exemple, Sameer Agarwal et ses collègues (2011) tenté d'utiliser ces photos pour «Construire Rome en un jour» en réutilisant 150 000 images de Rome pour créer une reconstruction 3D de la ville. Pour certains bâtiments fortement photographiés - comme le Colisée (figure 5.10) - les chercheurs ont partiellement réussi, mais les reconstructions ont souffert parce que la plupart des photos ont été prises dans les mêmes perspectives iconiques, laissant des parties des bâtiments non photographiées. Ainsi, les images des référentiels photo ne suffisaient pas. Mais que se passerait-il si des volontaires pouvaient être recrutés pour collecter les photos nécessaires pour enrichir celles déjà disponibles? En repensant à l'analogie de l'art dans le chapitre 1, que se passerait-il si les images readymade pouvaient être enrichies par des images personnalisées?
Afin de permettre la collecte ciblée d'un grand nombre de photos, Kathleen Tuite et ses collègues ont développé PhotoCity, un jeu de téléchargement de photos. PhotoCity a transformé la tâche potentiellement laborieuse de la collecte de données - télécharger des photos - en une activité semblable à un jeu impliquant des équipes, des châteaux et des drapeaux (figure 5.11), et a été déployée pour créer une reconstruction 3D de deux universités: Université Cornell et Université de Washington. Les chercheurs ont commencé le processus en téléchargeant des photos de semences de certains bâtiments. Ensuite, les joueurs de chaque campus ont inspecté l'état actuel de la reconstruction et ont gagné des points en téléchargeant des images qui ont amélioré la reconstruction. Par exemple, si la reconstruction actuelle de la bibliothèque Uris (à Cornell) était très inégale, un joueur pourrait gagner des points en téléchargeant de nouvelles images de celui-ci. Deux caractéristiques de ce processus de téléchargement sont très importantes. Tout d'abord, le nombre de points qu'un joueur a reçu était basé sur le montant que sa photo a ajouté à la reconstruction. Deuxièmement, les photos qui ont été téléchargées devaient chevaucher la reconstruction existante afin qu'elles puissent être validées. Au final, les chercheurs ont pu créer des modèles 3D de bâtiments à haute résolution sur les deux campus (figure 5.12).
PhotoCity a résolu deux problèmes qui surviennent souvent dans la collecte de données distribuées: la validation et l'échantillonnage des données. Tout d'abord, les photos ont été validées en les comparant à des photos précédentes, qui étaient à leur tour comparées aux photos précédentes, jusqu'aux photos de graines téléchargées par les chercheurs. En d'autres termes, en raison de cette redondance intégrée, il était très difficile pour quelqu'un de télécharger une photo du mauvais bâtiment, accidentellement ou intentionnellement. Cette caractéristique de conception signifiait que le système se protégeait contre les mauvaises données. Deuxièmement, le système de notation a naturellement formé les participants à recueillir les données les plus utiles - et non les plus pratiques. En fait, voici quelques-unes des stratégies décrites par les joueurs pour gagner plus de points, ce qui équivaut à collecter des données plus précieuses (Tuite et al. 2011) :
- "[J'ai essayé de] approcher l'heure du jour et de l'éclairage que certaines photos ont été prises; cela contribuerait à prévenir le rejet par le jeu. Cela dit, les jours nuageux étaient de loin le meilleur lorsqu'ils traitent avec des coins, car moins de contraste a aidé la figure de jeu sur la géométrie de mes photos ".
- «Quand il y avait du soleil, j'ai utilisé les caractéristiques anti-shake de mon appareil photo pour me permettre de prendre des photos tout en marchant autour d'une zone particulière. Cela m'a permis de prendre des photos nettes sans avoir à arrêter ma foulée. Aussi prime: moins les gens me regardaient "!
- "Prendre beaucoup de photos d'un bâtiment avec appareil photo 5 mégapixels, puis rentrer à la maison à soumettre, parfois jusqu'à 5 concerts sur un tournage de week-end, était photo stratégie de capture primaire. Organisation des photos sur les dossiers de disque dur externe par région du campus, la construction, puis le visage de la construction a fourni une bonne hiérarchie pour structurer les téléchargements ".
Ces énoncés montrent que lorsque les participants reçoivent un retour d'information approprié, ils peuvent devenir très experts dans la collecte de données présentant un intérêt pour les chercheurs.
Dans l'ensemble, le projet PhotoCity montre que l'échantillonnage et la qualité des données ne sont pas des problèmes insurmontables dans la collecte de données distribuées. De plus, cela montre que les projets de collecte de données distribués ne se limitent pas aux tâches que les gens font déjà de toute façon, comme regarder des oiseaux. Avec le bon design, les volontaires peuvent être encouragés à faire d'autres choses aussi.