Gedistribueerde gegevensverzameling is mogelijk en in de toekomst zal dit waarschijnlijk gepaard gaan met technologie en passieve participatie.
Zoals eBird aantoont, kan gedistribueerde verzameling van gegevens worden gebruikt voor wetenschappelijk onderzoek. Verder laat PhotoCity zien dat problemen in verband met sampling en datakwaliteit mogelijk oplosbaar zijn. Hoe kan gedistribueerde gegevensverzameling werken voor sociaal onderzoek? Een voorbeeld is afkomstig van het werk van Susan Watkins en haar collega's van het Malawi Journals Project (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . In dit project hebben 22 lokale bewoners - "journalisten" genoemd - "gespreksjournaals" bijgehouden die de gesprekken die ze in het dagelijks leven van gewone mensen over AIDS hebben gehoord (toen het project begon, ongeveer 15% van de volwassenen) in detail hebben opgenomen in Malawi waren besmet met HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Vanwege hun insider-status konden deze journalisten gesprekken horen die mogelijk niet toegankelijk waren voor Watkins en haar westerse onderzoeksmedewerkers (ik zal de ethiek hiervan later in het hoofdstuk bespreken als ik advies geef over het ontwerpen van uw eigen massasamenwerkingsproject) . De gegevens van het Malawi Journals Project hebben geleid tot een aantal belangrijke bevindingen. Voordat het project van start ging, geloofden veel buitenstaanders dat er stilte heerste in Afrika ten zuiden van de Sahara, maar de conversationele tijdschriften toonden aan dat dit duidelijk niet het geval was: journalisten hoorden honderden discussies over het onderwerp, op locaties zo divers als begrafenissen, bars en kerken. Verder hielpen de aard van deze gesprekken onderzoekers sommige van de weerstand tegen condoomgebruik beter te begrijpen; de manier waarop condoomgebruik in openbare gezondheidsboodschappen werd ingekaderd was niet consistent met de manier waarop het in het dagelijks leven werd besproken (Tavory and Swidler 2009) .
Natuurlijk zijn de gegevens van het Malawi Journals Project, net als de gegevens van eBird, niet perfect, een kwestie die door Watkins en collega's uitvoerig is besproken. De opgenomen gesprekken zijn bijvoorbeeld geen willekeurige steekproef van alle mogelijke gesprekken. Het is veeleer een onvolledige telling van gesprekken over aids. Wat betreft de kwaliteit van de gegevens, dachten de onderzoekers dat hun journalisten kwalitatief goede verslaggevers waren, zoals blijkt uit de consistentie in tijdschriften en in tijdschriften. Dat wil zeggen, omdat genoeg journalisten werden ingezet in een omgeving die klein genoeg was en op een specifiek onderwerp was gericht, was het mogelijk om redundantie te gebruiken om de gegevenskwaliteit te beoordelen en te waarborgen. Bijvoorbeeld, een sekswerker genaamd "Stella" verscheen meerdere keren in de tijdschriften van vier verschillende journalisten (Watkins and Swidler 2009) . Om uw intuïtie verder op te bouwen, geeft tabel 5.3 andere voorbeelden van gedistribueerde gegevensverzameling voor sociaal onderzoek.
Verzamelde data | Referentie |
---|---|
Discussies over HIV / AIDS in Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Straat smeken in Londen | Purdam (2014) |
Conflictgebeurtenissen in Oost-Congo | Windt and Humphreys (2016) |
Economische activiteit in Nigeria en Liberia | Blumenstock, Keleher, and Reisinger (2016) |
Griepsurveillance | Noort et al. (2015) |
Alle voorbeelden die in dit gedeelte worden beschreven, hebben betrekking op actieve deelname: journalisten hebben de gesprekken die ze hoorden getranscribeerd; vogelaars hebben hun checklist voor vogelen geüpload; of spelers hebben hun foto's geüpload. Maar wat als de deelname automatisch was en geen specifieke vaardigheid of tijd vereiste om in te dienen? Dit is de belofte die wordt geboden door 'participatory sensing' of 'people-centric sensing'. De Pothole Patrol, een project van wetenschappers van het MIT, heeft bijvoorbeeld GPS-uitgeruste versnellingsmeters gemonteerd in zeven taxi's in de omgeving van Boston (Eriksson et al. 2008) . Omdat het rijden over een kuil een duidelijk accelerometer-signaal laat, kunnen deze apparaten, wanneer ze in bewegende taxi's worden geplaatst, pothole-kaarten van Boston maken. Natuurlijk nemen taxi's niet willekeurig wegen uit, maar als er genoeg taxi's zijn, kan er voldoende dekking zijn om informatie te geven over grote delen van die stad. Een tweede voordeel van passieve systemen die afhankelijk zijn van technologie, is dat ze het proces van bijdragende gegevens afdoen: hoewel het vaardigheid vereist om bij te dragen aan eBird (omdat je op betrouwbare wijze vogelsoorten moet kunnen identificeren), vereist het geen speciale vaardigheden om bijdragen aan Pothole Patrol.
In de toekomst vermoed ik dat veel gedistribueerde projecten voor gegevensverzameling zullen beginnen met het gebruik van de mogelijkheden van de mobiele telefoons die al door miljarden mensen over de hele wereld worden gedragen. Deze telefoons hebben al een groot aantal sensoren die belangrijk zijn voor metingen, zoals microfoons, camera's, GPS-apparaten en klokken. Verder ondersteunen ze apps van derden waarmee onderzoekers controle hebben over de onderliggende protocollen voor gegevensverzameling. Ten slotte hebben ze een internetverbinding, waardoor ze de gegevens die ze verzamelen kunnen ontladen. Er zijn tal van technische uitdagingen, variërend van onnauwkeurige sensoren tot een beperkte levensduur van de batterij, maar deze problemen zullen waarschijnlijk na verloop van tijd afnemen naarmate de technologie zich ontwikkelt. Problemen met betrekking tot privacy en ethiek kunnen daarentegen gecompliceerder worden; Ik kom terug op ethische vragen wanneer ik advies geef over het ontwerpen van je eigen massale samenwerking.
In gedistribueerde projecten voor gegevensverzameling leveren vrijwilligers gegevens over de wereld. Deze aanpak is al met succes toegepast en toekomstige toepassingen zullen waarschijnlijk te maken hebben met bezorgdheid over bemonstering en gegevenskwaliteit. Gelukkig suggereren bestaande projecten zoals PhotoCity en Pothole Patrol oplossingen voor deze problemen. Naarmate meer projecten gebruik maken van technologie die de-geschoolde en passieve participatie mogelijk maakt, moeten gedistribueerde projecten voor gegevensverzameling dramatisch toenemen, waardoor onderzoekers gegevens kunnen verzamelen die in het verleden eenvoudigweg verboden waren.