Gedistribueerde het verzamelen van gegevens mogelijk is, en in de toekomst zal waarschijnlijk betrekken technologie en passieve deelname.
Zoals eBird demonstreert, kan gedistribueerde het verzamelen van gegevens worden gebruikt voor wetenschappelijk onderzoek. Verder PhotoCity blijkt dat problemen met betrekking tot de bemonstering en de kwaliteit van de gegevens zijn potentieel oplosbaar.
Hoe kunnen gedistribueerde data verzamelen werk voor sociaal-wetenschappelijk onderzoek? Een prachtig voorbeeld komt uit het werk van Susan Watkins en haar collega's op de Malawi Journals Project (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . In dit project, 22 omwonenden zogenaamde "journalisten" -kept "conversatie journals" dat opgenomen, in detail, de gesprekken die ze hoorde over AIDS in het dagelijks leven van gewone mensen (op het moment dat het project begon, ongeveer 15% van de volwassenen in Malawi werden geïnfecteerd met HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Vanwege hun insider status van deze journalisten waren in staat om gesprekken die niet toegankelijk zou zijn geweest Susan Watkins en haar westerse onderzoek medewerkers overhear (ik zal de ethiek van dit later in het hoofdstuk bespreken wanneer ik advies geven over het ontwerpen van je eigen massa samenwerkingsproject ). De gegevens uit het Malawi Journals Project heeft geleid tot een aantal belangrijke bevindingen. Bijvoorbeeld, voordat het project begon, veel buitenstaanders geloofden dat er stilte over AIDS in Afrika bezuiden de Sahara, maar de tijdschriften aangetoond dat dit was duidelijk niet het geval: de journalisten afgeluisterd honderden gesprek over het onderwerp, op locaties zo divers als begrafenissen , bars, en kerken. Verder is de aard van deze gesprekken geholpen onderzoekers beter begrijpen sommige van de weerstand tegen condoom gebruiken; de manier waarop condoomgebruik werd omlijst in de volksgezondheid berichten in strijd was met de manier waarop het in het dagelijks leven werd besproken (Tavory and Swidler 2009) .
Natuurlijk, net als de gegevens van eBird, de gegevens van de Malawi Journals Project is niet perfect, een probleem in detail besproken door Watkins en collega's. Bijvoorbeeld, de opgenomen gesprekken niet een aselecte steekproef van alle mogelijke gesprekken. Integendeel, zij zijn een onvolledige telling van gesprekken over aids. In termen van kwaliteit van de gegevens, de onderzoekers zijn van mening dat hun journalisten waren van hoge kwaliteit verslaggevers, zoals blijkt uit de consistentie binnen tijdschriften en over tijdschriften. Verder, als er voldoende journalisten worden ingezet in een klein genoeg setting en rapportages zijn gericht op een specifiek onderwerp, werd redundantie mogelijk, die het vertrouwen in de kwaliteit van de gegevens verhoogt. Bijvoorbeeld, een prostituee met de naam "Stella" kwam meerdere malen in de dagboeken van vier verschillende journalisten (Watkins and Swidler 2009) . Zoals het was in PhotoCity, het gebruik van redundantie is een belangrijk uitgangspunt voor de beoordeling van en het waarborgen van de kwaliteit van gegevens in gedistribueerde het verzamelen van gegevens projecten. Met het oog op je intuïtie verder te bouwen, tabel 5.3 toont andere voorbeelden van gedistribueerde het verzamelen van gegevens voor sociaal-wetenschappelijk onderzoek.
De verzamelde gegevens | Citaat |
---|---|
Discussies over HIV / AIDS in Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Bedelen op straat in Londen | Purdam (2014) |
Conflict gebeurtenissen in Oost-Congo | Windt and Humphreys (2016) |
De economische activiteit in Nigeria en Liberia | Blumenstock, Keleher, and Reisinger (2016) |
influenza surveillance | Noort et al. (2015) |
Alle in dit hoofdstuk beschreven voorbeelden zijn betrokken actieve participatie: journalisten getranscribeerd gesprekken die zij hoorden; vogelaars publiceerde hun vogelen checklists; of spelers hun foto's geüpload. Maar wat als de participatie was automatische en geen specifieke vaardigheden of tijd niet nodig hebben om te dienen? Dit is de belofte die door "participatieve sensing" of "people-centric sensing." Bijvoorbeeld, de Pothole Patrol, een project dat door wetenschappers van MIT, gemonteerd GPS uitgerust versnellingsmeters binnen zeven taxi's in de omgeving van Boston (Eriksson et al. 2008) . Omdat het rijden over een kuil laat een duidelijk signaal accelerometer, deze apparaten, wanneer geplaatst binnenkant van het verplaatsen van taxi's, kan kuil kaarten van Boston te creëren. Natuurlijk, taxi's niet willekeurig monster wegen, maar gezien genoeg taxi's, kan er voldoende dekking om informatie over grote delen van deze stad te verschaffen. Een tweede voordeel van passieve systemen die vertrouwen op de technologie is dat ze aan de vakkundigheid van het proces bij te dragen gegevens: terwijl deze vaardigheid vereist om bij te dragen aan eBird (want je moet in staat zijn om betrouwbaar te identificeren vogelsoorten), het vereist geen speciale vaardigheden te bijdragen aan Pothole Patrol.
Naar de toekomst toe, ik vermoed dat het verzamelen van vele gedistribueerde data projecten zullen beginnen met het gebruik van de mogelijkheden van mobiele telefoons die reeds door miljarden mensen over de hele wereld worden afgewikkeld. Deze telefoons hebben al een groot aantal sensoren voor belangrijke meting, zoals microfoons, camera's, GPS apparatuur en klokken. Verder zijn deze mobiele telefoons ondersteunen van derden apps waarmee onderzoekers enige controle over de onderliggende protocollen voor gegevensverzameling. Tot slot, deze telefoons hebben Internet-connectiviteit, waardoor het voor hen mogelijk om off-laden van de gegevens die zij verzamelen. Er zijn tal van technische uitdagingen van onjuiste sensoren de beperkte levensduur van de batterij, maar deze problemen zal waarschijnlijk afnemen in de tijd als de technologie zich ontwikkelt. Kwesties in verband met privacy en ethiek, aan de andere kant, zou kunnen krijgen meer ingewikkeld als de technologie zich ontwikkelt; Ik zal terugkeren naar de vragen van de ethiek als ik advies geven over het ontwerpen van je eigen massasamenwerking.
In gedistribueerde gegevensverzameling gerichte projecten, vrijwilligers een bijdrage leveren gegevens over de wereld. Deze aanpak is al met succes toegepast, en in de toekomst gebruik zal waarschijnlijk moeten bemonstering en kwaliteit van de gegevens aan te pakken. Gelukkig zijn bestaande projecten zoals PhotoCity en Pothole Patrol stellen oplossingen voor deze problemen. Naarmate er meer projecten profiteren van de technologie die de-geschoolde en passieve deelname mogelijk maakt, gedistribueerde het verzamelen van gegevens projecten moeten drastisch te verhogen in de schaal, waardoor onderzoekers de gegevens die was gewoon off limits in het verleden te verzamelen.