PhotoCity løser datakvalitet og utvalgsproblemer i distribuert datainnsamling.
Nettsteder som Flickr og Facebook gjør at folk kan dele bilder med sine venner og familie, og de lager også store lagre av bilder som kan brukes til andre formål. For eksempel forsøkte Sameer Agarwal og kolleger (2011) å bruke disse bildene til å "bygge Roma på en dag" ved å repurposing 150.000 bilder av Roma for å skape en 3D-rekonstruksjon av byen. For noen tunge fotograferte bygninger - som Colosseum (figur 5.10) - var forskerne delvis vellykkede, men rekonstruksjonene led for at de fleste bilder ble tatt fra de samme ikoniske perspektiver, slik at deler av bygningene ble fotografert. Dermed var bildene fra fotobiblioteker ikke nok. Men hva om frivillige kan bli oppnådd for å samle de nødvendige bildene for å berike de som allerede er tilgjengelige? Tenker tilbake til kunstanalogen i kapittel 1, hva om de ferdige bildene kunne bli beriket av custommade bilder?
For å muliggjøre målrettet innsamling av mange bilder, utviklet Kathleen Tuite og kolleger PhotoCity, et bildeopplastingsspill. PhotoCity gjorde den potensielt arbeidsomme oppgaven med datainnsamling, opplasting av bilder, til en spilllignende aktivitet som involverte lag, slott og flagg (figur 5.11), og den ble først distribuert for å skape en 3D-rekonstruksjon av to universiteter: Cornell University og University av Washington. Forskere startet prosessen ved å laste opp frøfotografier fra noen bygninger. Deretter inspiserte spillerne på hver campus nåværende tilstand av rekonstruksjonen og opptjente poeng ved å laste opp bilder som forbedret rekonstruksjonen. For eksempel, hvis den nåværende rekonstruksjonen av Uris Library (på Cornell) var veldig ujevn, kan en spiller tjene poeng ved å laste opp nye bilder av den. To funksjoner i denne opplastingsprosessen er svært viktige. For det første var antall poeng en spiller mottatt, basert på beløpet som bildet tilsatt til rekonstruksjon. For det andre måtte bildene som ble lastet overlappe sammen med eksisterende gjenoppbygging slik at de kunne valideres. Til slutt var forskerne i stand til å lage høyoppløste 3D-modeller av bygninger på begge campusene (figur 5.12).
Designet til PhotoCity løste to problemer som ofte oppstår i distribuert datainsamling: datavalidering og prøvetaking. Først ble bildene validert ved å sammenligne dem med tidligere bilder, som i sin tur ble sammenlignet med tidligere bilder helt tilbake til frøfotoene som ble lastet opp av forskere. Med andre ord, på grunn av denne innebygde redundansen, var det svært vanskelig for noen å laste opp et bilde av feil bygning, enten ved et uhell eller med vilje. Denne designfunksjonen innebar at systemet beskyttet seg mot dårlige data. For det andre trente scoring-systemet naturligvis deltakerne for å samle de mest verdifulle, ikke de mest praktiske dataene. Faktisk er det noen av strategiene som spillerne beskrev med å tjene flere poeng, noe som tilsvarer å samle mer verdifulle data (Tuite et al. 2011) :
- "[Jeg prøvde å] omtrentlig tid på dagen og belysning som noen bilder ble tatt; Dette vil bidra til å forhindre avstøtning av spillet. Med det sagt, overskyete dager var den beste av langt når du arbeider med hjørner fordi mindre kontrast hjulpet spillet finne ut geometrien fra mine bilder. "
- "Når det var sol, benyttet jeg min kameraets anti-shake funksjoner for å tillate meg selv å ta bilder mens du går rundt en bestemt sone. Dette tillater meg å ta skarpe bilder mens ikke å måtte stoppe min skride. Også bonus: mindre folk stirret på meg "!
- "Ta mange bilder av en bygning med 5 megapiksler kamera, så komme hjem å sende inn, noen ganger opp til 5 gigabyte på en helg shoot, var primære bildeopptak strategi. Organisere bilder på ekstern harddisk mapper ved campus region, bygger, så ansiktet av bygningen gitt god hierarki for å strukturere opplastinger. "
Disse uttalelsene viser at når deltakerne får riktig tilbakemelding, kan de bli ganske ekspert på å samle inn data av interesse for forskere.
Samlet viser FotoCity-prosjektet at prøvetaking og datakvalitet ikke er uoverstigelige problemer i distribuert datainnsamling. Videre viser det at distribuerte datainnsamlingsprosjekter ikke er begrenset til oppgaver som folk allerede gjør uansett, for eksempel å se på fugler. Med riktig design kan frivillige oppmuntres til å gjøre andre ting også.