PhotoCity lost de kwaliteit en de bemonstering van gegevens problemen in gedistribueerde het verzamelen van gegevens.
Websites zoals Flickr en Facebook stellen mensen in staat foto's te delen met hun vrienden en familie, en ze maken ook enorme opslagplaatsen van foto's die voor andere doeleinden kunnen worden gebruikt. Sameer Agarwal en collega's (2011) probeerden bijvoorbeeld deze foto's te gebruiken om 'Rome op een dag te bouwen' door 150.000 foto's van Rome opnieuw te gebruiken om een 3D-reconstructie van de stad te maken. Voor sommige zwaar gefotografeerde gebouwen, zoals het Colosseum (figuur 5.10), waren de onderzoekers gedeeltelijk succesvol, maar de reconstructies leden onder de meeste foto's vanuit dezelfde iconische perspectieven, waardoor delen van de gebouwen niet werden gefotografeerd. Dus de foto's uit foto-repository's waren niet voldoende. Maar wat als vrijwilligers zouden kunnen worden aangeworven om de nodige foto's te verzamelen om de reeds beschikbare foto's te verrijken? Terugdenkend aan de kunstanalogie in hoofdstuk 1, wat als de kant-en-klare beelden zouden kunnen worden verrijkt met klantgerichte beelden?
Om de gerichte verzameling van grote aantallen foto's mogelijk te maken, hebben Kathleen Tuite en collega's PhotoCity ontwikkeld, een spel voor het uploaden van foto's. PhotoCity veranderde de mogelijk moeizame taak van het verzamelen van gegevens - het uploaden van foto's - in een game-achtige activiteit met teams, kastelen en vlaggen (figuur 5.11), en het werd voor het eerst ingezet om een 3D-reconstructie van twee universiteiten te maken: Cornell University en de universiteit van Washington. Onderzoekers begonnen het proces door zaadfoto's van sommige gebouwen te uploaden. Vervolgens inspecteerden spelers op elke campus de huidige staat van de reconstructie en verdienden punten door beelden te uploaden die de reconstructie verbeterden. Als de huidige reconstructie van Uris Library (bij Cornell) erg fragmentarisch was, kon een speler punten verdienen door er nieuwe foto's van te uploaden. Twee kenmerken van dit uploadproces zijn erg belangrijk. Ten eerste was het aantal punten dat een speler ontving gebaseerd op het bedrag dat zijn foto aan de reconstructie had toegevoegd. Ten tweede moesten de foto's die werden geüpload, overlappen met de bestaande reconstructie, zodat ze konden worden gevalideerd. Uiteindelijk konden de onderzoekers 3D-modellen met hoge resolutie van gebouwen op beide campussen maken (figuur 5.12).
Het ontwerp van PhotoCity loste twee problemen op die vaak voorkomen bij gedistribueerde gegevensverzameling: gegevensvalidatie en sampling. Ten eerste werden foto's gevalideerd door ze te vergelijken met vorige foto's, die op hun beurt werden vergeleken met vorige foto's helemaal terug naar de zaadfoto's die door onderzoekers waren geüpload. Met andere woorden, vanwege deze ingebouwde redundantie was het erg moeilijk voor iemand om een foto van het verkeerde gebouw te uploaden, per ongeluk of opzettelijk. Deze ontwerpfunctie betekende dat het systeem zichzelf beschermde tegen slechte gegevens. Ten tweede leidde het scoringssysteem natuurlijk deelnemers op om de meest waardevolle - niet de meest handige - gegevens te verzamelen. Sterker nog, hier volgen enkele strategieën die spelers beschreven om meer punten te verdienen, wat overeenkomt met het verzamelen van meer waardevolle gegevens (Tuite et al. 2011) :
- "[Ik heb geprobeerd om] benaderen het tijdstip van de dag en de verlichting die een aantal foto's werden genomen; dit zou helpen afwijzing door het spel te voorkomen. Met dat gezegd, bewolkte dagen waren veruit de beste bij het omgaan met hoeken, omdat er minder contrast hielp het spel te achterhalen van de geometrie van mijn foto's. "
- "Als het zonnig was, heb ik gebruik gemaakt van anti-shake functies van mijn camera om mezelf om foto's te nemen tijdens een wandeling rond een bepaalde zone. Dit stond me toe om scherpe foto's te maken, terwijl het niet hebben van mijn pas te stoppen. Ook bonus: minder mensen staarden me "!
- "Het nemen van veel foto's van een gebouw met een 5 megapixel camera, dan thuiskomen voor te leggen, soms tot 5 optredens op een weekend shoot, was primair vastleggen van foto's strategie. Het organiseren van foto's op een externe harde schijf mappen campus gebied, de bouw, dan is het gezicht van het gebouw verstrekt goede hiërarchie uploads te structureren. "
Deze verklaringen laten zien dat wanneer deelnemers de juiste feedback krijgen, zij behoorlijk deskundig kunnen worden in het verzamelen van gegevens die interessant zijn voor onderzoekers.
Over het algemeen laat het PhotoCity-project zien dat sampling en datakwaliteit geen onoverkomelijke problemen zijn bij het verzamelen van gedistribueerde gegevens. Verder laat het zien dat gedistribueerde projecten voor gegevensverzameling niet beperkt zijn tot taken die mensen toch al doen, zoals het kijken naar vogels. Met het juiste ontwerp kunnen vrijwilligers worden aangemoedigd om ook andere dingen te doen.