Distribúcia zberu dát je možná a v budúcnosti bude pravdepodobne zahŕňať technológiu a pasívnu účasť.
Ako uvádza eBird, zhromažďovanie distribuovaných údajov sa môže použiť na vedecký výskum. Ďalej spoločnosť PhotoCity ukazuje, že problémy súvisiace s odberom vzoriek a kvalitou údajov sú potenciálne riešiteľné. Ako môže distribuované zhromažďovanie údajov pracovať pre sociálny výskum? Jeden príklad pochádza z práce Susan Watkinsovej a jej kolegov z projektu Malawi Journals (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . V tomto projekte 22 miestnych obyvateľov - tzv. "Novinárov" - hovorilo o "konverzačných časopisoch", ktoré detailne zaznamenali rozhovory o AIDS v každodennom živote obyčajných ľudí (v čase začatia projektu asi 15% dospelých v Malawi boli infikované vírusom HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Kvôli svojmu zasväteniu mohli títo novinári počuť rozhovory, ktoré by mohli byť pre Watkinsa a jej západných výskumných spolupracovníkov neprístupné (o tejto téme budem hovoriť neskôr v kapitole, keď vám ponúknem poradenstvo pri navrhovaní vášho projektu masovej spolupráce) , Údaje z projektu Malawi Journals viedli k niekoľkým dôležitým zisteniam. Napríklad, pred začatím projektu sa mnohí outsideri domnievali, že v subsaharskej Afrike bolo mlčanie o AIDS, ale rozhovory v konverzačnom projekte ukázali, že to tak jednoznačne nie je: novinári počuli stovky diskusií o téme v miestach, ktoré sú rozmanité pohreby, bary a kostoly. Navyše povaha týchto rozhovorov pomohla výskumným pracovníkom lepšie porozumieť časti odolnosti voči používaniu kondómov; spôsob, akým používanie kondómov bolo zaradené do správ o verejnom zdraví, bolo v rozpore so spôsobom, akým sa diskutovalo v každodennom živote (Tavory and Swidler 2009) .
Samozrejme, ako údaje z eBird, údaje z projektu Malawi Journals nie sú dokonalé, čo je otázka, ktorú detailne diskutuje Watkins a kolegovia. Napríklad zaznamenané konverzácie nie sú náhodnou vzorkou všetkých možných konverzácií. Skôr ide o neúplné sčítanie rozhovorov o AIDS. Pokiaľ ide o kvalitu údajov, výskumní pracovníci verili, že ich novinári sú vysokokvalitnými reportérmi, o čom svedčí konzistencia v časopisoch a časopisoch. To znamená, že dostatok novinárov bol nasadený v dostatočne malom prostredí a zameral sa na konkrétnu tému, bolo možné použiť prepúšťanie na posúdenie a zabezpečenie kvality údajov. Napríklad sexuálny pracovník s názvom "Stella" sa niekoľkokrát objavil v časopisoch štyroch rôznych novinárov (Watkins and Swidler 2009) . S cieľom ďalej budovať svoju intuíciu uvádza tabuľka 5.3 ďalšie príklady distribuovaného zberu údajov pre sociálny výskum.
Zozbierané údaje | referencie |
---|---|
Diskusie o HIV / AIDS v Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Street prosí v Londýne | Purdam (2014) |
Konfliktné udalosti vo východnom Kongu | Windt and Humphreys (2016) |
Hospodárska činnosť v Nigérii a Libérii | Blumenstock, Keleher, and Reisinger (2016) |
Monitorovanie chrípky | Noort et al. (2015) |
Všetky príklady opísané v tejto časti zahŕňali aktívnu účasť: novinári prepísali rozhovory, ktoré počuli; vtáci nahrali svoje kontrolné zoznamy vtáctva; alebo hráči nahrali svoje fotografie. Ale čo keď bola účasť automatická a nevyžadovala si žiadnu konkrétnu zručnosť alebo čas na predloženie? Toto je sľub, ktorý ponúka "participatívne snímanie" alebo "zameranie na ľudí". Napríklad projekt Pothole Patrol, projekt vedcov na MIT, namontoval akcelerometre vybavené GPS v siedmich kabínach taxíkov v oblasti Bostonu (Eriksson et al. 2008) . Pretože jazda cez výmolie opúšťa zreteľný signál akcelerometra, tieto zariadenia, keď sú umiestnené vnútri pohyblivých taxíkov, môžu vytvoriť výtržnícke mapy Bostonu. Samozrejme, taxíky nemajú náhodne vzorky ciest, ale vzhľadom na to, že dostatočne taxíky, môže byť dostatočné pokrytie, aby poskytli informácie o veľkých častiach mesta. Druhá výhoda pasívnych systémov, ktoré sa spoliehajú na technológiu, spočíva v tom, že zrušujú proces prispievania k údajom: hoci vyžaduje zručnosť prispievať k systému eBird (pretože potrebujete byť schopný spoľahlivo identifikovať druhy vtákov), nevyžaduje žiadne špeciálne zručnosti prispieť k hliadkovaniu.
Pokračujem, domnievam sa, že mnohé distribuované projekty zhromažďovania údajov začnú využívať možnosti mobilných telefónov, ktoré už prenesú miliardy ľudí po celom svete. Tieto telefóny už majú veľký počet senzorov dôležitých pre meranie, napríklad mikrofóny, kamery, GPS zariadenia a hodiny. Ďalej podporujú aplikácie tretích strán, ktoré umožňujú výskumným pracovníkom určitú kontrolu nad základnými protokolmi zhromažďovania údajov. Konečne majú pripojenie na internet, čo im umožňuje odoberať údaje, ktoré zhromažďujú. Existuje množstvo technických problémov, od nepresných snímačov až po obmedzenú výdrž batérie, ale tieto problémy sa pravdepodobne časom zmenia, keď sa technológia vyvíja. Problémy týkajúce sa ochrany súkromia a etiky by sa naopak mohli komplikovať; Vrátim sa k etickým otázkam, keď vám poskytnem poradenstvo pri navrhovaní vlastnej masovej spolupráce.
V projektoch na zhromažďovanie distribuovaných údajov poskytujú dobrovoľníci údaje o svete. Tento prístup sa už úspešne využil a budúce využitie sa bude pravdepodobne musieť zaoberať otázkami vzorkovania a kvality údajov. Našťastie existujúce projekty ako PhotoCity a Pothole Patrol ponúkajú riešenia týchto problémov. Keďže viaceré projekty využívajú technológiu umožňujúcu kvalifikovanú a pasívnu účasť, distribuované projekty zhromažďovania údajov by sa mali dramaticky zvyšovať v rozsahu, čo umožňuje výskumníkom zhromažďovať údaje, ktoré boli v minulosti jednoducho obmedzené.