Distributed prikupljanje podataka je moguće, au budućnosti će se vjerojatno uključiti tehnologiju i pasivno sudjelovanje.
Kao eBird pokazuje, distribuirati prikupljanja podataka mogu se koristiti za naučna istraživanja. Nadalje, PhotoCity pokazuje da se problemi vezani za uzorkovanje i kvaliteta podataka su potencijalno rješiva.
Kako se distribuira posao prikupljanja podataka za društvena istraživanja? A wonderful primjer dolazi iz rada Susan Watkins i njene kolege na Časopisi projekta Malavi (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . U ovom projektu, 22 mještana takozvani "novinari" -kept "konverzacijske časopisa" da snima, detaljnije, razgovori su čuli o AIDS-u svakodnevnom životu običnih ljudi (u to vrijeme je počeo projekt, oko 15% odraslih u Malaviju su zaražene HIV-om (Bello, Chipeta, and Aberle-Grasse 2006) ). Zbog svoje insajderske statusa, ovi novinari su bili u mogućnosti da se čuje razgovore koji bi mogli biti nedostupan Susan Watkins i njen zapadni istraživanja saradnici (ja ću razgovarati o etici kasnije u poglavlju, kada sam ponuditi savjete o dizajniranju vlastite mase suradnji projekta ). Podaci iz Malavija Časopisi projekta je dovelo do niza važnih zaključaka. Na primjer, prije početka projekta, mnogi autsajderi vjerovali da je tišina o AIDS-u u subsaharskoj Africi, ali časopisima pokazala da je to očigledno nije slučaj: novinari čuo stotine razgovora na tu temu, na lokacijama kao što raznolik kao sahrane , barovi, i crkve. Nadalje, priroda tih razgovora pomogao istraživači bolje razumiju neke od otpornosti na korištenje kondoma; na način da upotreba kondoma je uokvirena u javnom zdravstvu poruka je u suprotnosti sa načinom na koji se razgovaralo u svakodnevnom životu (Tavory and Swidler 2009) .
Naravno, kao što su podaci iz eBird, podaci iz časopisa projekta Malavi nije savršen, što je pitanje raspravlja detaljno Watkins i kolege. Na primjer, snimljeni razgovori nisu slučajni uzorak od svih mogućih razgovora. Umjesto toga, oni su nepotpuni popis razgovora o AIDS-u. U pogledu kvaliteta podataka, istraživači vjeruju da su njihovi novinari su visoko kvalitetne novinarima, o čemu svjedoči i dosljednost u časopisima i preko časopisa. Nadalje, kada se dovoljno novinari raspoređeni u dovoljno malim postavku i izvještaji su fokusirani na određenu temu, redundantnost postalo moguće, čime se povećava povjerenje u kvalitetu podataka. Na primjer, seksualni radnik pod nazivom "Stella" pojavio nekoliko puta u časopisima četiri različita novinara (Watkins and Swidler 2009) . Kao što je bilo u PhotoCity, korištenje viška je važan princip za procjenu i osiguranje kvaliteta podataka u distribuiranim projektima prikupljanja podataka. Kako bi se dodatno izgraditi svoju intuiciju, Tabela 5.3 prikazuje drugi primjeri distribuiranih prikupljanja podataka za društvena istraživanja.
prikupljenih podataka | citiranje |
---|---|
Rasprave o HIV / AIDS-u Malaviju | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Prosjačenja u Londonu | Purdam (2014) |
Sukob događaja u istočnoj Kongo | Windt and Humphreys (2016) |
Ekonomska aktivnost u Nigeriji i Liberija | Blumenstock, Keleher, and Reisinger (2016) |
nadzor influence | Noort et al. (2015) |
Svi primjeri su opisani u ovom poglavlju su uključeni aktivno učešće: novinari transkribovao razgovore koji su čuli; Birders upload njihove birding kontrolne liste; ili igrači upload svoje fotografije. Ali šta ako je učešće bilo automatski i nije potrebna nikakva specifična vještinu ili vremena da podnese? To je obećanje koje nudi "participativne sensing" ili "ljudi-centric sensing." Na primjer, Pothole Patrol, projekt naučnici na MIT-u, s GPS opremljen ubrzanja unutar sedam taksija u području Bostona (Eriksson et al. 2008) . Zbog vožnje preko rupa ostavlja poseban akcelerometar signal, ovi uređaji, kada je postavljen unutar kreće taksi, može stvoriti rupa mape Boston. Naravno, taksi ne slučajno uzorak puteva, ali s obzirom dovoljno taksija, ne može biti dovoljno pokriće za pružanje informacija o velikim delovima oni grada. Druga korist pasivnih sistema koji se oslanjaju na tehnologiju je da de-vještina proces doprinosi podataka: dok se zahtijeva vještinu da doprinese eBird (jer morate biti u mogućnosti da pouzdano identificirati vrsta ptica), to ne zahtijeva posebne vještine za doprinose Pothole Patrol.
U narednom periodu, pretpostavljam da će projekti prikupljanje mnoge distribuiranim podacima početi da iskoriste mogućnosti mobilnih telefona koji su već nosili milijarde ljudi širom svijeta. Ovi telefoni već imaju veliki broj senzora važno za mjerenje, kao što su mikrofoni, kamere, GPS uređaje, i satovi. Nadalje, ovi mobilni telefoni podržavaju aplikacije treće strane omogućava istraživačima neke kontrole nad osnovnim protokole za prikupljanje podataka. Na kraju, ovi telefoni imaju Internet-povezivanje, što je moguće za njih da off-učitavanje podataka koje prikupljaju. Postoje brojne tehničke izazove od netačne senzora na ograničenu trajanje baterije, ali ovi problemi će vjerovatno smanjiti s vremenom kao tehnologija razvija. Pitanja koja se odnose na privatnost i etiku, s druge strane, može se dodatno komplicira kako tehnologija razvija; Ja ću se vratiti na pitanja etike, kada sam ponuditi savjete o dizajniranju vlastite mase suradnji.
U distribuiranim projektima prikupljanja podataka, volonteri doprinose podaci o svijetu. Ovaj pristup je već uspješno koristi, i buduće upotrebe će vjerovatno morati da se bavi uzorkovanje i kvaliteta podataka zabrinutost. Srećom, postojećim projektima kao što su PhotoCity i Pothole Patrol predložiti rješenja za ove probleme. Kao što je više projekata iskoristiti tehnologiju koja omogućuje de-stručnih i pasivno sudjelovanje, distribuirati projektima prikupljanja podataka treba dramatično povećati u skali, omogućavajući istraživačima za prikupljanje podataka koje je jednostavno van granica u prošlosti.