Distributed prikupljanje podataka je moguće, au budućnosti će vjerojatno uključivati tehnologiju i pasivno sudjelovanje.
Kao eBird pokazuje, distribuirati prikupljanje podataka može se koristiti za znanstvena istraživanja. Nadalje, PhotoCity pokazuje da se problemi vezani za uzorkovanje i kvalitete podataka su potencijalno rješivi.
Kako bi distribuirani zbirka posao podataka za društvena istraživanja? Prekrasan primjer dolazi iz rada Susan Watkins i njenih kolega o Malavi dnevnicima projekta (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . U ovom projektu, 22 mještani nazivaju "novinarima" -kept "razgovorni časopisa" koje su ostvarile, u detalje, razgovori su su čuli o AIDS-u svakodnevnom životu običnih ljudi (u to vrijeme je projekt započeo, oko 15% odraslih u Malaviju su zaraženi HIV-om (Bello, Chipeta, and Aberle-Grasse 2006) ). Zbog njihove insider statusa, ovi novinari su mogli čuti razgovore koji bi mogli biti nedostupan Susan Watkins i njenih zapadnih znanstvenih suradnika (ja ću raspravljati o etičnosti to kasnije u poglavlju kad sam ponuditi savjet o dizajniranje vlastitog projekta masa suradnju ). Podaci iz Malavi dnevnicima projekta dovela je do nekoliko važnih otkrića. Na primjer, prije nego što je projekt započeo, mnogi neupućeni vjeruju da je šutnja o AIDS-u subsaharskoj Africi, ali časopisi pokazali da je to očito nije slučaj: novinari čuo stotine razgovora na tu temu, na mjestima kao što raznolik kao sahrane , barovi, i crkve. Nadalje, priroda tih razgovora pomogao znanstvenicima da bolje razumiju neke otpornosti prema uporabi kondoma; način na koji kondom korištenje bilo uokvireno u porukama javnog zdravstva nije bilo u skladu s načinom na koji se o njemu raspravljalo u svakodnevnom životu (Tavory and Swidler 2009) .
Naravno, kao i podataka iz eBird, podaci iz Malavi dnevnicima projekta nije savršen, problem je objašnjeno u detaljnije Watkins i kolege. Na primjer, snimljeni razgovori nisu slučajni uzorak od svih mogućih razgovora. Umjesto toga, oni su nepotpuni popis razgovora o AIDS-u. U pogledu kvalitete podataka, istraživači vjeruju da su njihovi novinari su kvalitetni novinari, kao što pokazuje dosljednost u časopisima i preko časopisa. Nadalje, kada se dovoljno novinari raspoređeni u malom dovoljno okruženju i izvještaji su usmjereni na određenu temu, zalihost postalo moguće, čime se povećava povjerenje u kvalitetu podataka. Na primjer, prostitutka pod nazivom "Stella" pojavio nekoliko puta u časopisima četiri različita novinara (Watkins and Swidler 2009) . Kao što je to bilo u PhotoCity, korištenje redundancije važan princip za procjenu i osiguranje kvalitete podataka u raspodijeljenim projektima prikupljanja podataka. Kako bi se dodatno izgraditi svoju intuiciju, Tablica 5.3 prikazuje druge primjere distribuiranog prikupljanja podataka za društvena istraživanja.
podaci prikupljeni | Citat |
---|---|
Rasprave o HIV / AIDS-a u Malaviju | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Ulica prosjačenje u Londonu | Purdam (2014) |
Sukob događaji u istočnom Kongu | Windt and Humphreys (2016) |
Gospodarska aktivnost u Nigeriji i Liberiji | Blumenstock, Keleher, and Reisinger (2016) |
Gripa nadzor | Noort et al. (2015) |
Sve od primjera opisanih u ovom poglavlju su uključeni aktivno sudjelovanje: novinari prepisana razgovore koji su čuli; birders ustupio svoje birding provjeru; ili igrači upload svoje fotografije. Ali što ako je sudjelovanje bilo automatski i ne zahtijeva bilo koji određenu vještinu ili vremena da podnese? To je obećanje koje nudi "participativnog istraživanja" ili "ljudi u središtu istraživanja." Na primjer, Rupa Patrol, projekt znanstvenici na MIT-u, montiran GPS opremljene akcelerometra unutar sedam taxi cabs u području Bostona (Eriksson et al. 2008) . Zbog vožnje preko jame ostavlja poseban Akcelerometar signal, te uređaje, kada je postavljen unutar pokretnih taksija, može stvoriti rupa karata Bostonu. Naravno, taksiji ne slučajno uzorak ceste, ali s obzirom dovoljno taksija, postoji svibanj biti dovoljno pokrivenost pružiti informacije o velikim dijelovima Oni grada. Druga korist od pasivnih sustava koji se oslanjaju na tehnologije je da se de-skill proces pridonosi podatke: a to zahtijeva vještinu doprinijeti eBird (jer morate biti u mogućnosti pouzdano identificirati vrste ptica), to ne zahtijeva nikakve posebne vještine za doprinose rupa Patrol.
U budućnosti, pretpostavljam da će se projekti skupljanja mnogi distribuirani podaci početi koristiti mogućnosti mobitela koji su već nosili milijarde ljudi širom svijeta. Ovi telefoni već imaju veliki broj senzora važnih za mjerenje, kao što su mikrofoni, kamere, GPS uređaja i satova. Nadalje, ovi mobiteli podržavaju third-party aplikacije koje omogućavaju istraživačima kontrolu nad nekim temeljnim protokole za prikupljanje podataka. Konačno, ovi telefoni imaju internet-veze, tako da je moguće za njih da off-učitati podaci prikupljeni. Postoje brojni tehnički problemi s netočnim senzora do ograničenog trajanja baterije, ali ti problemi će se vjerojatno smanjiti s vremenom kao tehnologija razvija. Pitanja vezana uz privatnost i etiku, s druge strane, može dobiti više komplicirana razvojem tehnologije; Ja ću se vratiti na pitanja etike, kada sam ponuditi savjet o dizajniranje vlastitog masovnu suradnju.
U raspodijeljenim projektima prikupljanja podataka, volonteri doprinose podataka o svijetu. Ovaj pristup je već uspješno koristi i buduće koristi će vjerojatno morati pozabaviti uzorkovanja i kvalitete podataka zabrinutost. Srećom, postoje projekti poput PhotoCity i rupa Patrol predložiti rješenja za te probleme. Kao što je više projekata iskoristiti tehnologiju koja omogućuje de-vješt i pasivno sudjelovanje, raspoređen prikupljanja podataka projekti trebali bi dramatično povećati u mjerilu, omogućujući znanstvenicima za prikupljanje podataka koje je jednostavno izvan granica u prošlosti.