Ukazuje się zbiór danych jest możliwe, aw przyszłości prawdopodobnie będzie obejmować technologię i biernego uczestnictwa.
Jak pokazuje eBird, rozprowadzane do zbierania danych mogą być wykorzystywane do badań naukowych. Ponadto PhotoCity pokazuje, że problemy związane z pobieraniem próbek i jakości danych są potencjalnie rozwiązywalne.
Jak może rozprowadzane pracę Gromadzenie danych dla badań społecznych? Wspaniały przykład pochodzi z pracy Susan Watkins i jej współpracowników w Malawi Journals Projektu (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . W tym projekcie, 22 mieszkańców zwanych "dziennikarzy" -kept czasopismach "konwersacyjne", które nagrane, w szczegółach, rozmowy są overheard o AIDS w codziennym życiu zwykłych ludzi (w momencie rozpoczęcia projektu, około 15% osób dorosłych Malawi zakażonych wirusem HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Ze względu na ich status poufnych, dziennikarze mogli podsłuchać rozmowy, które mogły być niedostępne dla Susan Watkins i jej zachodnich współpracowników badawczych (Omówię etykę tego w dalszej części rozdziału, kiedy oferować porady na temat projektowania własnych realizowanego projektu masowe ). Dane z Malawi Journals Projektu doprowadziło do szeregu ważnych ustaleń. Na przykład, przed rozpoczęciem projektu, wiele z zewnątrz Uważa się, że zapadła cisza na temat AIDS w Afryce subsaharyjskiej, ale czasopisma wykazało, że był to z pewnością nie przypadek: dziennikarze podsłuchał setki rozmów na ten temat, w miejscach tak różnych, jak pogrzeby , bary i kościoły. Ponadto, charakter tych rozmów pomogły naukowcom lepiej zrozumieć niektóre z opornością na stosowanie prezerwatyw; sposób, że używanie prezerwatyw został wrobiony w wiadomościach zdrowia publicznego było niezgodne ze sposobem, że został omówiony w życiu codziennym (Tavory and Swidler 2009) .
Oczywiście, podobnie jak dane z eBird, dane z Malawi Journals projekt nie jest doskonały, to problem szczegółowo omówione przez Watkins i współpracowników. Na przykład, nagrane rozmowy nie są losowe próbki wszystkich możliwych rozmów. Przeciwnie, są one niekompletne spis rozmów na temat AIDS. Pod względem jakości danych, naukowcy są przekonani, że ich dziennikarze byli reporterzy wysokiej jakości, o czym świadczą konsystencji ciągu czasopismach iw poprzek czasopism. Ponadto, gdy wystarczająca dziennikarze są rozmieszczone w dostatecznie małym otoczeniu oraz raporty skupiają się na określonym temacie, redundancja stało się możliwe, co zwiększa zaufanie do jakości danych. Na przykład, pracownik sex nazwie "Stella" pojawił się kilka razy w czasopismach z czterech dziennikarzy (Watkins and Swidler 2009) . Jak to było w PhotoCity, zastosowanie zwolnienia jest ważną zasadą oceny i zapewnienia jakości danych w rozproszonych projektów gromadzenia danych. W celu dalszego budowania swojej intuicji, Tabela 5.3 pokazuje inne przykłady rozproszonego zbierania danych dla badań społecznych.
dane zbierane | Cytat |
---|---|
Dyskusje na temat HIV / AIDS w Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Ulica żebractwa w Londynie | Purdam (2014) |
wydarzenia konfliktu w wschodnim Kongo | Windt and Humphreys (2016) |
Działalność gospodarcza w Nigerii i Liberii | Blumenstock, Keleher, and Reisinger (2016) |
nadzór grypy | Noort et al. (2015) |
Każdy z przykładów opisanych w tej sekcji zostały zaangażowane aktywny udział: dziennikarze transkrypcji rozmów, że słyszał; birders przesłanych swoje listy kontrolne dla obserwacji ptaków; lub gracze przesłanych swoje zdjęcia. Ale co, jeśli udział był automatyczny i nie wymaga żadnych szczególnych umiejętności lub czasu, aby złożyć? To jest obietnica oferowane przez "uczestniczącej sensing" lub "osoby zorientowane sensing". Na przykład, Pothole Patrol, projekt przez naukowców z MIT, zamontowany GPS wyposażone akcelerometry wewnątrz siedmiu taksówki w okolicach Bostonu (Eriksson et al. 2008) . Ponieważ najechaniu na dziurę pozostawia wyraźny sygnał akcelerometr, te urządzenia po umieszczeniu wewnątrz ruchu taksówek, można utworzyć dziurę mapy Boston. Oczywiście, taksówki nie losowo próbki dróg, ale biorąc pod uwagę wystarczająco dużo taksówek, nie może być wystarczający zasięg do informowania o dużych porcjach They miasta. Drugą zaletą systemów pasywnych, które opierają się na technologii jest to, że de-skill proces przyczyniając dane: mimo to wymaga umiejętności, aby przyczynić się do eBird (bo trzeba być w stanie wiarygodnie identyfikacji gatunków ptaków), to nie wymaga żadnych specjalnych umiejętności do przyczynić się do wybojami Patrol.
Idąc dalej, podejrzewam, że wiele projektów gromadzenia danych rozproszonych zaczną wykorzystywać możliwości telefonów komórkowych, które zostały już przeprowadzone przez miliardy ludzi na całym świecie. Te telefony mają już wiele ważnych czujników do pomiaru, takich jak mikrofony, kamery, urządzenia GPS i zegarów. Ponadto, te telefony obsługują aplikacje innych firm umożliwiających naukowcom pewną kontrolę nad podstawowych protokołów gromadzenia danych. Wreszcie, te telefony mają Internet-łączności, umożliwiając im odciążyć gromadzone dane. Istnieje wiele wyzwań technicznych z niedokładnych czujników do ograniczonej żywotności baterii, ale problemy te zostaną prawdopodobnie zmniejsza się z czasem wraz z rozwojem technologii. Zagadnienia związane z prywatnością i etyki, z drugiej strony, może się bardziej skomplikowane w miarę rozwoju technologii; Wrócę do kwestii etyki kiedy oferować porady na temat projektowania własnych współpracę masowej.
W rozproszonych projektów gromadzenia danych, wolontariuszy przyczynić dane o świecie. Takie podejście zostało już z powodzeniem stosowane i przyszłych zastosowań prawdopodobnie będzie musiała zająć pobierania próbek i jakości danych obawy. Na szczęście, istniejące projekty, takie jak PhotoCity i wybojami Patrol sugerują rozwiązania tych problemów. Ponieważ coraz więcej projektów wykorzystujących technologię, która umożliwia uczestnictwo de wykwalifikowanej i bierną, rozproszone projekty gromadzenia danych powinna znacząco zwiększyć skalę, umożliwiając naukowcom do zbierania danych, który był po prostu poza zasięgiem w przeszłości.