Distribuovaný sběr dat je možné, a v budoucnu bude pravděpodobně zahrnovat technologii a pasivní účast.
Jako eBird demonstruje, distribuovaný sběr dat mohou být použity pro vědecký výzkum. Dále PhotoCity ukazuje, že problémy související s odběrem vzorků a kvalitu dat jsou potenciálně řešitelné.
Jak by distribuovány Data Collection práci pro sociální výzkum? Skvělý příklad pochází z práce Susan Watkins a kolegy na Malawi časopisů Projektu (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . V rámci tohoto projektu, 22 místní obyvatelé zvané "novináři" -kept "konverzačních deníků", které zaznamenané, v detailu, rozhovory oni zaslechli o AIDS v každodenním životě obyčejných lidí (v té době zahájení projektu, asi 15% dospělých v Malawi byly infikovány virem HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Vzhledem k jejich status zasvěcených, tito novináři byli schopni zaslechnout rozhovory, které mohly být nepřístupné pro Susan Watkins a jejími západními výzkumnými spolupracovníky (budu diskutovat o etice později v této kapitole, když jsem poskytovat poradenství o navrhování své vlastní hmotnost spolupracovat na projektech, ). Data z Malawi časopisů projekt vedl k řadě významných nálezů. Například před zahájením projektu, mnozí outsideři věřil, že to tam bylo ticho o AIDS v subsaharské Africe, ale časopisy prokázaly, že to zjevně není případ: novináři vyslechl stovky rozhovoru na toto téma, v místech, jak různorodý jako pohřby , bary a kostely. Dále, povaha těchto rozhovorů pomohl vědci lépe pochopit některé z odolnosti proti používání kondomů; tak, že kondom použití byl sestaven ve zprávách veřejného zdraví bylo v rozporu s tím, jak že to bylo diskutováno v každodenním životě (Tavory and Swidler 2009) .
Samozřejmě, stejně jako data z eBird, data z Malawi Journals projektu není dokonalý, problém diskutováno podrobně Watkins a spol. Například nahrané rozhovory nejsou náhodný vzorek ze všech možných konverzací. Spíše se jedná neúplný soupis rozhovory o AIDS. Z hlediska kvality dat, výzkumníci věří, že jejich novináři byli vysoce kvalitní reportéry, o čemž svědčí konzistence v časopisech a napříč časopisech. Dále, když jsou dost novináři rozmístěny v dostatečně malém prostředí a zprávy jsou zaměřeny na konkrétní téma, redundance bylo možné, což zvyšuje důvěru v kvalitu údajů. Například, sexuální pracovnice s názvem "Stella" se objevil několikrát v časopisech čtyř různých novinářů (Watkins and Swidler 2009) . Jak to bylo v PhotoCity, využití redundance je důležitou zásadou pro hodnocení a zajištění kvality dat v distribuovaných projektů sběru dat. Aby bylo možné dále stavět svou intuici, Tabulka 5.3 ukazuje další příklady distribuovaného sběru dat pro sociální výzkum.
shromážděná data | Citace |
---|---|
Diskuse o HIV / AIDS v Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Pouliční žebrání v Londýně | Purdam (2014) |
Konfliktní události ve východním Kongu | Windt and Humphreys (2016) |
Ekonomická aktivita v Nigérii av Libérii | Blumenstock, Keleher, and Reisinger (2016) |
chřipka dohled | Noort et al. (2015) |
Všechny příklady popsané v této části se týkaly aktivní účast: novináři přepsal rozhovory, které slyšel; birders nahrál své birding seznamy; nebo přehrávače nahráli své fotografie. Ale co v případě, že účast byla automatická a nevyžaduje žádné zvláštní dovednosti nebo čas k předložení žádosti? To je slib nabízených "participativní snímání" nebo "people-centric průzkumu." Například, výmol Patrol, projekt vědci na MIT, se zvyšoval GPS vybavené zrychlení uvnitř sedmi taxíky v oblasti Bostonu (Eriksson et al. 2008) . Vzhledem k tomu, jízdě přes výmol zanechává zřetelný signál, akcelerometr tato zařízení při umístění uvnitř pohyblivých taxislužby, mohou vytvářet výmol mapy Bostonu. Samozřejmě, že taxíky nejsou náhodně ochutnat silnice, ale vzhledem k tomu dost taxi, může být dostačující krytí poskytovat informace o velkých částech oni města. Druhou výhodou pasivní systémy, které jsou založeny na technologii je, že de-dovednost proces přispívá údaje: zatímco vyžaduje zručnost, aby přispěly k eBird (protože je nutné, aby bylo možné spolehlivě identifikovat druhy ptáků), nevyžaduje žádné speciální dovednosti na přispět k Pothole Patrol.
Do budoucna mám podezření, že projekty sběru mnoho distribuovaných dat začne využívat schopností mobilních telefonů, které jsou již provedených miliardy lidí na celém světě. Tyto telefony již mají velký počet čidel které jsou důležité pro měření, jako jsou mikrofony, kamery, zařízení GPS a hodiny. Dále, tyto mobilní telefony podporují aplikace třetích stran umožňující vědcům nějakou kontrolu nad podkladovým protokolů sběru dat. A nakonec, tyto telefony mají internet-připojení, takže je možné, aby off-načíst údaje, které shromáždily. Existují četné technické problémy z nepřesných senzorů k omezené životnosti baterie, ale tyto problémy bude pravděpodobně časem sníží vývojem technologií. Problémy spojené s soukromí a etiky, na druhé straně, mohl dostat složitější, protože technologie se vyvíjí; Vrátím se k otázkám etiky, když jsem se poradí o vytvořením vlastního masovou spolupráci.
V distribuovaných projektů sběru dat, dobrovolníci přispívají údaje o světa. Tento přístup byl již úspěšně použit, a budoucí využití bude pravděpodobně muset řešit odběru vzorků a kvality dat problémy. Naštěstí stávající projekty, jako je PhotoCity a Pothole Patrol navrhnout řešení těchto problémů. Jako další projekty využívají technologii, která umožňuje de-kvalifikované a pasivní účast, distribuované projekty shromažďování údajů by mělo výrazně zvýšit v měřítku, což umožňuje vědcům sbírat data, která byla prostě tabu v minulosti.