Distribuirano prikupljanje podataka je moguće, au budućnosti će vjerovatno uključiti i tehnologiju i pasivno učešće.
Kako pokazuje eBird, distribuirano prikupljanje podataka može se koristiti za naučna istraživanja. Dalje, PhotoCity pokazuje da su problemi u vezi sa uzorkovanjem i kvalitetom podataka potencijalno rešljivi. Kako bi se distribuirano prikupljanje podataka moglo raditi na društvenim istraživanjima? Jedan primjer dolazi iz rada Susan Watkins i njenih kolega o projektu Malawi Journals (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . U ovom projektu 22 lokalnog stanovništva - zvani "novinari" - "razgovorni časopisi" koji su detaljno zabeležili razgovore o kojima se čuju o AIDS-u u svakodnevnom životu običnih ljudi (u vreme kada je projekat započeo, oko 15% odraslih u Malaviju bili su zaraženi HIV-om (Bello, Chipeta, and Aberle-Grasse 2006) ). Zbog njihovog statusa insajdera, ovi novinari su mogli da čuju razgovore koji su mogli biti nedostupni Vatkinsu i njenim zapadnim istraživačkim saradnicima (razmotriću etiku ovog kasnije u poglavlju kada ponudim savjete o projektovanju sopstvenog projekta masovnog kolaboriranja) . Podaci iz projekta Malawi Journals doveli su do brojnih važnih zaključaka. Na primjer, prije početka projekta, mnogi autsajderi vjerovali su da je bilo tišine o AIDS-u u podsaharskoj Africi, ali razgovorni časopisi su pokazali da to očigledno nije slučaj: novinari su čuli stotine diskusija o temi, na različitim lokacijama sahrane, barova i crkava. Štaviše, priroda ovih razgovora pomogla je istraživačima da bolje razumeju neke od otpornosti na upotrebu kondoma; način korišćenja kondoma u porukama javnog zdravlja nije bio u skladu sa načinom na koji se diskutovalo u svakodnevnom životu (Tavory and Swidler 2009) .
Naravno, kao i podaci iz eBird-a, podaci iz Malawi Journals projekta nisu savršeni, o čemu je detaljno diskutovao Watkins i kolege. Na primer, snimljeni razgovori nisu slučajni uzorak svih mogućih razgovora. Umjesto toga, oni su nepotpuni popis razgovora o AIDS-u. Što se tiče kvaliteta podataka, istraživači su vjerovali da su njihovi novinari visokokvalitetni reporteri, što je dokazano u doslednosti u časopisima i preko časopisa. To jest, jer su dovoljno novinara raspoređeni u dovoljno malom okruženju i fokusirani na određenu temu, bilo je moguće koristiti višak za procjenu i osiguranje kvaliteta podataka. Na primjer, seksualni radnik pod nazivom "Stella" pojavio se nekoliko puta u časopisima četiri različita novinara (Watkins and Swidler 2009) . Kako biste dalje izgradili svoju intuiciju, tabela 5.3 prikazuje druge primere distribuiranog prikupljanja podataka za društvena istraživanja.
Prikupljeni podaci | Referenca |
---|---|
Diskusije o HIV / AIDS-u u Malaviju | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Ulica prosjača u Londonu | Purdam (2014) |
Konfliktni događaji u Istočnom Kongu | Windt and Humphreys (2016) |
Ekonomska aktivnost u Nigeriji i Liberiji | Blumenstock, Keleher, and Reisinger (2016) |
Nadzor gripa | Noort et al. (2015) |
Svi primeri opisani u ovom odeljku uključivali su aktivno učešće: novinari su transkribirali razgovore koje su čuli; ptičari su postavili listu provjera ptica; ili su igrači otpremili svoje fotografije. Ali šta ako je učešće bilo automatsko i nije zahtevalo nikakvu specifičnu vještinu ili vrijeme za podnošenje? Ovo je obećanje koje nudi "participativno senzorisanje" ili "senzacionalno osjećanje ljudi". Na primjer, Pothole Patrol, projekat naučnika u MIT-u, montirao je akcelerometre opremljene GPS-om u sedam taksi taksi u području Bostona (Eriksson et al. 2008) . Pošto vožnja preko rupa ostavlja poseban signal akcelerometra, ovi uređaji, kada se nalaze unutar pokretnih taksija, mogu kreirati mape u Bostonu. Naravno, taksi ne slučajno prave puteve, ali, s obzirom na dovoljno taksija, može se pokriti dovoljno informacija o velikim delovima grada. Druga prednost pasivnih sistema koji se oslanjaju na tehnologiju jeste to što definiraju proces doprinosa podataka: iako zahteva veštinu da doprinese eBird-u (jer morate biti u stanju da pouzdano identifikujete vrste ptica), to ne zahteva posebne veštine doprinijeti Pothole Patrol-u.
Napredujem, pretpostavljam da će mnogi distribuirani projekti prikupljanja podataka početi iskoristiti mogućnosti mobilnih telefona koje već koriste više milijardi ljudi širom svijeta. Ovi telefoni već imaju veliki broj senzora važnih za merenje, kao što su mikrofoni, kamere, GPS uređaji i satovi. Dalje, oni podržavaju aplikacije nezavisnih proizvođača koje omogućavaju istraživačima kontrolu nad osnovnim protokolima prikupljanja podataka. Konačno, oni imaju internetno povezivanje, omogućavajući im da napuste podatke koje prikupljaju. Postoje brojni tehnički izazovi, od nepreciznih senzora do ograničenog trajanja baterije, ali ovi problemi će se vremenom smanjivati kada se tehnologija razvija. S druge strane, problemi u vezi sa privatnošću i etikom mogu postati složeniji; Vratiću se na pitanja etike kada nudim savete o dizajniranju sopstvene masovne saradnje.
U distribucijskim projektima prikupljanja podataka, volonteri doprinose podacima o svijetu. Ovaj pristup je već uspešno korišćen, a buduće upotrebe će verovatno morati da reši problem uzimanja uzoraka i kvaliteta podataka. Na sreću, postojeći projekti kao što su PhotoCity i Pothole Patrol predlažu rešenja za ove probleme. Budući da više projekata iskoriste prednosti tehnologije koja omogućava neobučeno i pasivno učešće, distribuirani projekti prikupljanja podataka bi trebalo dramatično povećati u razmjeri, omogućavajući istraživačima da prikupljaju podatke koji su u prošlosti jednostavno bili ograničeni.