Distribuirana prikupljanje podataka je moguće, au budućnosti vjerojatno će uključivati i tehnološko i pasivno sudjelovanje.
Kao što pokazuje eBird, distribuirano prikupljanje podataka može se koristiti za znanstvena istraživanja. Nadalje, PhotoCity pokazuje da su problemi vezani uz uzorkovanje i kvalitetu podataka potencijalno mogući. Kako bi mogao distribuirati rad prikupljanja podataka za društvena istraživanja? Jedan primjer dolazi od rada Susan Watkins i njezinih kolega na projektu Malavijevih časopisa (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . U ovom projektu, 22 lokalnog stanovništva - pod nazivom "novinari" - "razgovorni časopisi" koji su detaljno snimali razgovore koje su čuli o AIDS-u u svakodnevnom životu običnih ljudi (u vrijeme početka projekta, oko 15% odraslih u Malavi su zaraženi HIV-om (Bello, Chipeta, and Aberle-Grasse 2006) ). Zbog svog unutarnjeg statusa, ovi su novinari mogli čuti razgovore koji su možda bili nedostupni Watkinsu i njezinim istraživačima u zapadnim istraživanjima (raspravljat ću o etici ovoga u kasnijem poglavlju kad vam ponudim savjete o izradi vlastitog projekta masovne suradnje) , Podaci iz projekta Malavijevih časopisa doveli su do brojnih važnih otkrića. Na primjer, prije nego što je projekt započeo, mnogi autsajderi vjerovali su da postoji šutnja o AIDS-u u subsaharskoj Africi, no razgovorni časopisi pokazali su da to očito nije slučaj: novinari su čuli stotine rasprava o toj temi, na različitim mjestima kao sprovodima, barovima i crkvama. Nadalje, priroda tih razgovora pomogla je istraživačima da bolje razumiju neke od otpora na uporabu kondoma; način korištenja kondoma bio je uokviren u javnim zdravstvenim porukama nije bio u skladu s načinom na koji se raspravlja u svakodnevnom životu (Tavory and Swidler 2009) .
Naravno, kao i podaci iz eBird-a, podaci iz Projekta Malawi Journals nisu savršeni, problem koji detaljno razmatraju Watkins i njegovi kolege. Na primjer, snimljeni razgovori nisu slučajni uzorak svih mogućih razgovora. Umjesto toga, oni su nepotpuni popis razgovora o AIDS-u. U pogledu kvalitete podataka, istraživači su vjerovali da su njihovi novinari visokokvalitetni novinari, što se očituje konzistentnošću unutar časopisa i preko časopisa. To jest, jer je dovoljno novinara raspoređeno u dovoljno malenoj mjeri i usredotočeno na određenu temu, bilo je moguće iskoristiti zalihost za procjenu i osiguranje kvalitete podataka. Na primjer, seksualni radnik pod nazivom "Stella" pojavio se nekoliko puta u časopisima četiriju novinara (Watkins and Swidler 2009) . Kako bi se dodatno razvila vaša intuicija, tablica 5.3 prikazuje druge primjere distribuiranog prikupljanja podataka za društvena istraživanja.
Prikupljeni podaci | upućivanje |
---|---|
Rasprave o HIV / AIDS-u u Malavi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Ulica prosio u Londonu | Purdam (2014) |
Sukobi u istočnome Kongu | Windt and Humphreys (2016) |
Gospodarska aktivnost u Nigeriji i Liberiji | Blumenstock, Keleher, and Reisinger (2016) |
Nadzor gripe | Noort et al. (2015) |
Svi primjeri opisani u ovom odjeljku uključivali su aktivno sudjelovanje: novinari su prepisivali razgovore koje su čuli; birders su prenijeli popis promatranja ptica; ili igrači učitali svoje fotografije. Ali što ako je sudjelovanje bilo automatsko i nije zahtijevalo nikakvu specifičnu vještinu ili vrijeme za slanje? Ovo je obećanje koje nudi "participativno senziranje" ili "senzorirajući ljudi". Na primjer, Pothole Patrol, projekt znanstvenika iz MIT-a, ugrađivao je GPS-opremljene akcelerometre unutar sedam taksija u Bostonu (Eriksson et al. 2008) . Budući da vožnja preko pothole ostavlja jasan signal akcelerometra, ti uređaji, kada se nalaze unutar pokretnih taksija, mogu stvoriti bujne karte Bostona. Naravno, taksiji ne uzimaju slučajne uzorke cesta, ali, s obzirom na dovoljno taksija, postoji dovoljno pokrivenosti kako bi pružili informacije o velikim dijelovima grada. Druga prednost pasivnih sustava koji se oslanjaju na tehnologiju je da oni oskudijevaju proces pridonoseći podacima: dok zahtijeva vještinu za doprinos eBirdu (zato što morate biti u stanju pouzdano identificirati ptice), to ne zahtijeva posebne vještine doprinijeti Pothole Patrolu.
I dalje, sumnjam da će mnogi distribuirani projekti prikupljanja podataka početi iskorištavati mogućnosti mobilnih telefona koje već milijuni ljudi šalju diljem svijeta. Ovi telefoni već imaju veliki broj senzora važnih za mjerenje, kao što su mikrofoni, kamere, GPS uređaji i satovi. Nadalje, podržavaju aplikacije trećih strana koje istraživačima omogućuju neku kontrolu nad temeljnim protokolima prikupljanja podataka. Konačno, oni imaju internetsku povezivost, što im omogućuje da off-load podataka prikupljaju. Postoje brojni tehnički izazovi, u rasponu od netočnih senzora do ograničenog vijeka trajanja baterije, no ti će se problemi s vremenom smanjivati tijekom razvoja tehnologije. Pitanja vezana uz privatnost i etiku, s druge strane, mogu biti složenija; Vratit ću se na pitanja o etici kada vam ponudim savjete o osmišljavanju vlastite masovne suradnje.
U distribuiranim projektima prikupljanja podataka dobrovoljci pridonose podacima o svijetu. Ovaj je pristup već uspješno upotrijebljen, a buduće upotrebe vjerojatno će morati riješiti problem uzorkovanja i kvalitete podataka. Srećom, postojeći projekti kao što su PhotoCity i Pothole Patrol predlažu rješenja za te probleme. Kako većina projekata iskoristi tehnologiju koja omogućava de-kvalificirano i pasivno sudjelovanje, projekti prikupljanja prikupljenih podataka trebaju dramatično povećati razmjere, omogućujući istraživačima prikupljanje podataka koji su u prošlosti bili isključeni.