Verteilte Datenerfassung ist möglich und wird in Zukunft wahrscheinlich Technologie und passive Beteiligung beinhalten.
Wie eBird demonstriert, kann die verteilte Datensammlung für die wissenschaftliche Forschung genutzt werden. Darüber hinaus zeigt PhotoCity, dass Probleme im Zusammenhang mit Stichproben und Datenqualität potenziell lösbar sind. Wie könnte die verteilte Datensammlung für die Sozialforschung funktionieren? Ein Beispiel stammt aus der Arbeit von Susan Watkins und ihren Kollegen vom Malawi Journals Project (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . In diesem Projekt haben 22 Anwohner - sogenannte "Journalisten" - "Konversationsjournale" geführt, in denen die Gespräche, die sie über AIDS hörten, im Alltag der gewöhnlichen Menschen aufgezeichnet wurden (zum Zeitpunkt des Projektbeginns waren es etwa 15% der Erwachsenen) in Malawi wurden mit HIV infiziert (Bello, Chipeta, and Aberle-Grasse 2006) ). Aufgrund ihres Insiderstatus waren diese Journalisten in der Lage, Gespräche zu hören, die Watkins und seinen westlichen Forschern möglicherweise nicht zugänglich waren (ich werde die Ethik später in diesem Kapitel besprechen, wenn ich Ratschläge für die Gestaltung eines eigenen Massenkollaborationsprojekts ausspreche). . Die Daten des Malawi Journals Project haben zu einer Reihe wichtiger Erkenntnisse geführt. Zum Beispiel glaubten viele Außenseiter vor Beginn des Projekts, dass in Afrika südlich der Sahara Schweigen über AIDS herrschte, aber die Gesprächszeitungen zeigten, dass dies eindeutig nicht der Fall war: Journalisten hörten Hunderte von Diskussionen über das Thema an so unterschiedlichen Orten wie Beerdigungen, Bars und Kirchen. Darüber hinaus half die Art dieser Gespräche den Forschern, etwas von der Resistenz gegen Kondomgebrauch besser zu verstehen; Die Art und Weise, wie (Tavory and Swidler 2009) in öffentlichen Gesundheitsberichten verwendet wurden, widersprach der Art und Weise, wie sie im Alltag diskutiert wurde (Tavory and Swidler 2009) .
Natürlich sind die Daten aus dem Malawi Journals Project, wie die Daten von eBird, nicht perfekt, ein Thema, das von Watkins und seinen Kollegen ausführlich diskutiert wurde. Zum Beispiel sind die aufgezeichneten Gespräche keine Zufallsstichprobe aller möglichen Gespräche. Sie sind eher eine unvollständige Zählung von Gesprächen über AIDS. In Bezug auf die Datenqualität glaubten die Forscher, dass ihre Journalisten qualitativ hochwertige Reporter waren, was durch die Konsistenz innerhalb der Zeitschriften und in den Zeitschriften belegt wurde. Da genügend Journalisten in einem kleinen Umfeld eingesetzt wurden und sich auf ein bestimmtes Thema konzentrierten, war es möglich, Redundanz zu nutzen, um die Datenqualität zu bewerten und sicherzustellen. Zum Beispiel erschien eine Sexarbeiterin namens "Stella" mehrmals in den Journalen von vier verschiedenen Journalisten (Watkins and Swidler 2009) . Um Ihre Intuition weiter auszubauen, zeigt Tabelle 5.3 weitere Beispiele für die verteilte Datensammlung für die Sozialforschung.
Daten gesammelt | Referenz |
---|---|
Diskussionen über HIV / AIDS in Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Straße, die in London bittet | Purdam (2014) |
Konfliktgeschehen im Ostkongo | Windt and Humphreys (2016) |
Wirtschaftstätigkeit in Nigeria und Liberia | Blumenstock, Keleher, and Reisinger (2016) |
Influenza Überwachung | Noort et al. (2015) |
Bei allen in diesem Abschnitt beschriebenen Beispielen ging es um aktive Teilnahme: Journalisten schrieben Gespräche, die sie gehört hatten; Vogelbeobachter haben ihre Vogelbeobachtungslisten hochgeladen; oder Spieler haben ihre Fotos hochgeladen. Aber was, wenn die Teilnahme automatisch war und keine spezielle Fähigkeit oder Zeit erforderte, um sich zu bewerben? Dies ist das Versprechen von "partizipatorischem Sensing" oder "people-centric sensing". Zum Beispiel haben die Pothole Patrol, ein Projekt von Wissenschaftlern des MIT, mit GPS ausgestattete Beschleunigungssensoren in sieben Taxis im Raum Boston installiert (Eriksson et al. 2008) . Weil das Fahren über einem Schlagloch ein unterschiedliches Beschleunigungsmessersignal hinterlässt, können diese Vorrichtungen, wenn sie innerhalb sich bewegender Taxis platziert werden, Schlaglochkarten von Boston erzeugen. Natürlich taxieren Taxis nicht zufällig Straßen, aber bei genügend Taxis kann es eine ausreichende Abdeckung geben, um Informationen über große Teile der Stadt bereitzustellen. Ein zweiter Vorteil passiver Systeme, die auf Technologie beruhen, besteht darin, dass sie den Prozess der Dateneingabe entfer- nen: Obwohl es Fähigkeiten erfordert, zu eBird beizutragen (weil Sie Vogelarten zuverlässig identifizieren können), sind keine besonderen Fähigkeiten erforderlich trage zu Pothole Patrol bei.
Ich gehe davon aus, dass viele verteilte Datenerfassungsprojekte beginnen werden, die Fähigkeiten der Mobiltelefone zu nutzen, die bereits von Milliarden von Menschen auf der Welt getragen werden. Diese Telefone haben bereits eine große Anzahl von Sensoren, die für die Messung wichtig sind, wie Mikrofone, Kameras, GPS-Geräte und Uhren. Darüber hinaus unterstützen sie Apps von Drittanbietern, die den Forschern eine gewisse Kontrolle über die zugrunde liegenden Datenerfassungsprotokolle ermöglichen. Schließlich verfügen sie über eine Internetverbindung, die es ihnen ermöglicht, die von ihnen gesammelten Daten zu entlasten. Es gibt zahlreiche technische Herausforderungen, die von ungenauen Sensoren bis hin zu begrenzter Batterielebensdauer reichen. Diese Probleme werden jedoch mit der Zeit mit der Entwicklung der Technologie abnehmen. Fragen im Zusammenhang mit Privatsphäre und Ethik könnten jedoch komplizierter werden; Ich werde auf Fragen der Ethik zurückkommen, wenn ich Ratschläge für die Gestaltung einer eigenen Massenzusammenarbeit gebe.
In verteilten Datensammlungsprojekten liefern Freiwillige Daten über die Welt. Dieser Ansatz wurde bereits erfolgreich angewendet, und zukünftige Anwendungen werden sich wahrscheinlich mit Stichproben- und Datenqualitätsproblemen befassen müssen. Glücklicherweise schlagen bestehende Projekte wie PhotoCity und Pothole Patrol Lösungen für diese Probleme vor. Da immer mehr Projekte Technologien nutzen, die eine qualifizierte und passive Beteiligung ermöglichen, sollten Projekte zur verteilten Datenerhebung erheblich erweitert werden, damit Forscher Daten sammeln können, die in der Vergangenheit einfach tabu waren.