PhotoCity løser datakvalitet og utvalgsproblemer i distribuert datainnsamling.
Nettsteder som Flickr og Facebook gjør folk til å dele bilder med venner og familie, men de kan også skape store samlinger av bilder som kan brukes til andre formål. For eksempel, Agarwal et al. (2011) forsøker å bruke disse bildene for å "bygge Roma på en dag" ved å bruke 150.000 bilder av Roma for å lage en 3D-rekonstruksjon av byen. For turistattraksjoner som Colosseum var det nok bilder på nettet for å produsere 3D-modeller (figur 5.10), men kvaliteten på disse rekonstruksjoner ble begrenset av det faktum at de fleste bildene er tatt fra samme ikoniske perspektiver, slik at deler av bygningene unphotographed. Videre for de fleste deler av byen, ikke nok bilder var tilgjengelig. Dermed bruker de funnet data fra foto repositories, det var ikke mulig å gjenskape hele Roma. Men, hva om frivillige kan bli vervet til å samle inn de nødvendige bildene for å virkelig "Build Roma i dag"?
For å muliggjøre målrettet innsamling av store mengder bilder, Kathleen Tuite og kolleger utviklet PhotoCity, en foto-opplasting spillet. En vakker del av PhotoCity er at det viste den potensielt arbeidskrevende oppgave for innsamling av data-opplasting av bilder-inn i et spill-lignende aktivitet som involverer lagene, slott og flagg (figur 5.11). Utformingen av PhotoCity også elegant løser prøvetaking og datakvalitet utfordringer eBird og andre distribuerte datainnsamlingsprosjekter.
PhotoCity ble først satt inn for å muliggjøre en 3D rekonstruksjon av to universiteter: Cornell University og University of Washington. Spillere på hver campus kunne inspisere den nåværende tilstanden i gjenoppbyggingen modell av deres campus. Deretter kunne de tjene poeng ved å laste opp bilder som utvider dagens modell. For eksempel, hvis den nåværende modellen av Uris Library (ved Cornell) var svært usammenhengende, kan en spiller tjene poeng ved å laste opp nye bilder av det. Kritisk, er bildene som ble lastet opp må overlappe med eksisterende bilder slik at de kan valideres, og antall poeng en spiller har mottatt basert på beløpet som sitt bilde legger til dagens modell. Til slutt, var forskerne i stand til å bruke disse lastet opp bilder for å lage høyoppløselige 3D-modeller av bygninger på begge studiesteder (figur 5.12).
Utformingen av PhotoCity løser elegant to problemer: datavalidering og prøvetaking. Først bildene ble validert ved å matche dem mot tidligere bilder som var igjen matchet til tidligere bilder hele veien tilbake til frøet bildene som ble lastet opp av forskere. Med andre ord, på grunn av denne innebygget redundans, er det meget vanskelig for systemet å akseptere dårlige data. For det andre, trener scoring system naturlig deltakerne til å samle de mest verdifulle-ikke den mest praktiske-data. Faktisk, her er noen av de strategiene som spillerne beskrevet bruker for å tjene mer poeng, noe som tilsvarer å samle mer verdifulle data (Tuite et al. 2011) :
- "[Jeg prøvde å] omtrentlig tid på dagen og belysning som noen bilder ble tatt; Dette vil bidra til å forhindre avstøtning av spillet. Med det sagt, overskyete dager var den beste av langt når du arbeider med hjørner fordi mindre kontrast hjulpet spillet finne ut geometrien fra mine bilder. "
- "Når det var sol, benyttet jeg min kameraets anti-shake funksjoner for å tillate meg selv å ta bilder mens du går rundt en bestemt sone. Dette tillater meg å ta skarpe bilder mens ikke å måtte stoppe min skride. Også bonus: mindre folk stirret på meg "!
- "Ta mange bilder av en bygning med 5 megapiksler kamera, så komme hjem å sende inn, noen ganger opp til 5 gigabyte på en helg shoot, var primære bildeopptak strategi. Organisere bilder på ekstern harddisk mapper ved campus region, bygger, så ansiktet av bygningen gitt god hierarki for å strukturere opplastinger. "
Disse uttalelsene fra deltakerne viser at når de blir gitt passende tilbakemeldinger, kan de bli ganske ekspert på å samle inn data av interesse for forskere.
Samlet sett viser PhotoCity prosjekt som prøvetaking og datakvalitet er ikke uoverstigelige problemer i fordelingen datainnsamling. Videre viser det at distribuerte datainnsamling prosjekter er ikke begrenset til oppgaver som folk allerede gjør uansett, for eksempel å se på fugler. Med riktig design, kan frivillige oppfordres til å gjøre andre ting også.