Distribuovaný sběr dat je možný a v budoucnu bude pravděpodobně zahrnovat technologii a pasivní účast.
Jak demonstruje eBird, distribuovaný sběr dat může být použit pro vědecký výzkum. Společnost PhotoCity dále ukazuje, že problémy týkající se odběru vzorků a kvality dat jsou potenciálně řešitelné. Jak může distribuované shromažďování údajů pracovat pro společenský výzkum? Jeden příklad pochází z práce Susan Watkinsové a jejích kolegů na projektu Malawi Journals (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . V tomto projektu 22 místních obyvatel - zvaných "novináři" - zabývalo "konverzačními časopisy", které zaznamenaly podrobně rozhovory, které zaslechli o AIDS v každodenním životě obyčejných lidí (v době, kdy projekt začal, asi 15% dospělých v Malawi byli infikováni HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Kvůli svému zasvěcenci mohli tito novináři zaslechnout konverzace, které by mohly být Watkinsovi a jeho západním výzkumným spolupracovníkům nepřístupné (o této otázce budu diskutovat později v kapitole, když vám nabídnu radu ohledně navrhování vlastního projektu masové spolupráce) . Údaje z projektu Malawi Journals vedly k řadě důležitých zjištění. Například před zahájením projektu se mnoho cizinců domnívalo, že v subsaharské Africe je ticho o AIDS, ale konverzační časopisy ukázaly, že to jednoznačně není pravda: novináři slyšeli stovky diskusí o tématu v místech, která jsou různorodá pohřby, bary a kostely. Dále povaha těchto rozhovorů pomohla vědcům lépe porozumět odporu kondomu; způsob, jakým byl používán kondom v (Tavory and Swidler 2009) veřejného zdraví, byl v rozporu se způsobem, jakým byl diskutován v každodenním životě (Tavory and Swidler 2009) .
Samozřejmě, stejně jako údaje z eBird, data z časopisu Malawi Journals Project nejsou dokonalá, což je otázka, kterou detailně diskutuje Watkins a kolegové. Například nahrané konverzace nejsou náhodným příkladem všech možných konverzací. Spíše jsou neúplným sčítáním rozhovorů o AIDS. Z hlediska kvality dat vědci věřili, že jejich novináři jsou vysoce kvalitní reportéři, o čemž svědčí konzistence v časopisech a v časopisech. To znamená, že jelikož bylo v dostatečně malém prostředí nasazeno dostatečné množství novinářů a bylo zaměřeno na konkrétní téma, bylo možné použít redundanci k posouzení a zajištění kvality dat. Například sexuální pracovník s názvem "Stella" se několikrát objevil v časopisech čtyř různých novinářů (Watkins and Swidler 2009) . Za účelem dalšího budování vaší intuice uvádí tabulka 5.3 další příklady distribuce shromažďovaných dat pro společenský výzkum.
Shromážděné údaje | Odkaz |
---|---|
Diskuse o HIV / AIDS v Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Ulice prosí v Londýně | Purdam (2014) |
Konfliktní události ve východním Kongu | Windt and Humphreys (2016) |
Hospodářská činnost v Nigérii a Libérii | Blumenstock, Keleher, and Reisinger (2016) |
Monitorování chřipky | Noort et al. (2015) |
Všechny příklady popsané v této části zahrnovaly aktivní účast: novináři přepisovali rozhovory, které slyšeli; birders nahrál své kontrolní seznamy ptáků; nebo hráči nahrali své fotky. Ale co když účast byla automatická a nevyžadovala nějakou konkrétní dovednost nebo čas na podání? Toto je slib, který nabízí "participativní snímání" nebo "zaměřování na člověka". Například studie Pothole Patrol, projekt vědců z MIT, namontovala akcelerometry vybavené GPS v sedmi kabinách taxi v oblasti Bostonu (Eriksson et al. 2008) . Vzhledem k tomu, že jízdy přes výmol zanechávají zřetelný signál akcelerometru, mohou tato zařízení, když jsou umístěna uvnitř pohyblivých taxíků, vytvářet výklenkové mapy Bostonu. Samozřejmě, taxíky nevybírají náhodně silnice, ale vzhledem k dostatečnému počtu taxíků může být dostačující pokrytí informací o velkých částech města. Druhou výhodou pasivních systémů, které se opírají o technologii, je to, že zrušují proces přispívání dat: zatímco vyžaduje dovednost přispívat k eBird (protože musíte být schopni spolehlivě identifikovat druhy ptáků), nevyžaduje žádné speciální dovednosti přispět k hloubkovému hlídkování.
V budoucnu se domnívám, že mnoho distribuovaných projektů pro shromažďování dat začne využívat schopnosti mobilních telefonů, které již jsou přepravovány miliardami lidí po celém světě. Tyto telefony již disponují velkým počtem senzorů důležitých pro měření, jako jsou mikrofony, kamery, přístroje GPS a hodiny. Dále podporují aplikace třetích stran umožňující výzkumným pracovníkům určitou kontrolu nad základními protokoly sběru dat. Konečně mají připojení k internetu, což jim umožňuje vybírat data, která shromažďují. Existuje řada technických problémů, od nepřesných senzorů až po omezenou životnost baterie, ale tyto problémy se s technologií vyvíjejí pravděpodobně v průběhu času. Problémy týkající se soukromí a etiky by se naopak mohly komplikovat; Vrátím se k etickým otázkám, když vám nabídnu radu ohledně navrhování vaší masové spolupráce.
V rámci projektů sběru distribuovaných dat přispívají dobrovolníci data o světě. Tento přístup byl již úspěšně použit a budoucí využití pravděpodobně bude muset řešit problémy s výběrem a kvalitou dat. Naštěstí existující projekty jako PhotoCity a Pothole Patrol navrhují řešení těchto problémů. Vzhledem k tomu, že více projektů využívá technologii, která umožňuje kvalifikovanou a pasivní účast, měly by projekty distribuovaného sběru dat dramaticky vzrůst, což umožní výzkumníkům shromažďovat údaje, které byly v minulosti prostě mimo hranice.