La recopilació de dades distribuïda és possible, i en el futur probablement implicarà la tecnologia i la participació passiva.
Com demostra eBird, la recopilació de dades distribuïda pot ser utilitzat per a la investigació científica. A més, PhotoCity mostra que els problemes relacionats amb el mostreig i la qualitat de les dades són potencialment solucionable.
Com podria distribuït el treball de recopilació de dades per a la investigació social? Un meravellós exemple prové de l'obra de Susan Watkins i els seus col·legues en el Projecte Revistes Malawi (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . En aquest projecte, 22 residents locals anomenats "periodistes" -kept "revistes conversacionals" que van registrar, en detall, les converses que van sentir per casualitat sobre la SIDA a la vida diària de la gent comuna (en el moment que el projecte va començar, al voltant del 15% dels adults a Malawi estaven infectats pel VIH (Bello, Chipeta, and Aberle-Grasse 2006) ). A causa de la seva situació privilegiada, aquests periodistes van ser capaços d'escoltar converses que podrien haver estat inaccessible a Susan Watkins i els seus col·laboradors de la investigació occidentals (Vaig a parlar de l'ètica d'això més endavant en el capítol, quan ofereixo consells sobre el disseny del seu propi projecte de col·laboració massiva ). Les dades del Projecte Malawi Journals ha donat lloc a una sèrie d'importants conclusions. Per exemple, abans que comencés el projecte, molts estrangers creien que es va fer el silenci sobre la SIDA a l'Àfrica subsahariana, però les revistes van demostrar que això era clarament no és el cas: els periodistes escoltades centenars de conversa sobre el tema, en llocs tan diversos com els funerals , bars i esglésies. A més, la naturalesa d'aquestes converses va ajudar als investigadors a entendre millor algunes de la resistència a l'ús del condó; la forma en què l'ús del condó es va emmarcar en els missatges de salut pública era incompatible amb la forma en què es va discutir en la vida quotidiana (Tavory and Swidler 2009) .
Per descomptat, igual que les dades de eBird, les dades del Projecte de Revistes Malawi no és perfecte, un tema discutit en detall per Watkins i col·legues. Per exemple, les converses gravades no són una mostra aleatòria de totes les converses possibles. Més aviat, són un cens incomplet de les converses sobre la SIDA. En termes de qualitat de les dades, els investigadors creuen que els seus periodistes van ser reporters d'alta qualitat, com ho demostra la coherència dins de les revistes ia través de revistes. A més, quan un nombre suficient periodistes es despleguen en un entorn prou petit i els informes se centren en un tema específic, la redundància es va fer possible, el que augmenta la confiança en la qualitat de les dades. Per exemple, una treballadora sexual anomenat "Stella" es va presentar diverses vegades en els diaris de quatre periodistes diferents (Watkins and Swidler 2009) . Com era al PhotoCity, l'ús de la redundància és un principi important per avaluar i garantir la qualitat de les dades en els projectes de recollida de dades distribuïdes. Per tal de construir encara més la seva intuïció, la Taula 5.3 mostra altres exemples de recol·lecció de dades distribuïda per a la investigació social.
Les dades recollides | citació |
---|---|
Les discussions sobre el VIH / SIDA a Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Pidolant en un carrer de Londres | Purdam (2014) |
esdeveniments de conflicte a l'est del Congo | Windt and Humphreys (2016) |
L'activitat econòmica a Nigèria i Libèria | Blumenstock, Keleher, and Reisinger (2016) |
vigilància de la grip | Noort et al. (2015) |
Tots els exemples descrits en aquesta secció han implicat la participació activa: periodistes transcriuen converses que escolten; observadors d'aus carreguen les seves llistes de verificació d'observació d'aus; o jugadors carreguen les seves fotos. Però, i si la participació és automàtica i no requereix cap habilitat o temps específic a presentar? Aquesta és la promesa oferta per la "detecció participativa" o "detecció centrada en les persones". Per exemple, el sot de la patrulla, un projecte realitzat per científics del MIT, muntat GPS acceleròmetres equipades d'aquí a set taxis a l'àrea de Boston (Eriksson et al. 2008) . A causa de que la conducció per un mal moment deixa un senyal de l'acceleròmetre diferent, aquests dispositius, quan es col·loca a l'interior dels taxis en moviment, pot crear mapes de sots de Boston. Per descomptat, els taxis no una mostra aleatòria de carreteres, però donat prou taxis, pot existir una cobertura suficient per proporcionar informació sobre una gran part d'ells de la ciutat. Un segon avantatge dels sistemes passius que depenen de la tecnologia és que es de-habilitat el procés d'aportació de dades: si bé requereix habilitat per a contribuir a eBird (perquè cal ser capaç d'identificar de manera fiable espècies d'aus), que no requereix habilitats especials a contribuir a la Patrulla de sots.
De cara al futur, sospito que molts projectes de recol·lecció de dades distribuïdes començaran a fer ús de les capacitats dels telèfons mòbils que ja són transportats per milers de milions de persones a tot el món. Aquests telèfons tenen ja un gran nombre de sensors per al mesurament importants, com ara micròfons, càmeres, dispositius GPS i rellotges. A més, aquests telèfons mòbils compatibles amb aplicacions de tercers que permetin als investigadors un cert control sobre els protocols de recollida de dades subjacents. Finalment, aquests telèfons tenen Internet de connectivitat, pel que és possible per a ells sense càrrega les dades que recullen. Existeixen nombrosos desafiaments tècnics de sensors imprecisos a la vida limitada de la bateria, però aquests problemes és probable que disminueixi amb el temps a mesura que avança la tecnologia. Les qüestions relacionades amb la privacitat i l'ètica, per contra, pot ser que aconsegueixi més complicat a mesura que avança la tecnologia; Vaig a tornar a les qüestions de l'ètica quan m'ofereixo consells sobre el disseny de la seva pròpia col·laboració massiva.
En projectes de recol·lecció de dades distribuïdes, els voluntaris aporten dades sobre el món. Aquest enfocament ja ha estat utilitzat amb èxit, i els usos futurs probablement haurà de fer front a mostreig i de qualitat de dades es refereix. Afortunadament, els projectes existents, com PhotoCity i sots Patrulla suggereixen solucions a aquests problemes. A mesura que més projectes s'aprofiten de la tecnologia que permet la participació-d'experts i passiva, distribuït projectes de recol·lecció de dades ha d'augmentar considerablement en escala, el que permet als investigadors a recopilar dades que era simplement fora dels límits en el passat.