La recopilació de dades distribuïdes és possible, i en el futur probablement inclourà tecnologia i participació passiva.
Tal com eBird demostra, la recopilació de dades distribuïda es pot utilitzar per a la investigació científica. A més, PhotoCity mostra que els problemes relacionats amb el mostreig i la qualitat de les dades són potencialment resolables. Com es podrien distribuir els treballs de recollida de dades per a la investigació social? Un exemple prové del treball de Susan Watkins i els seus col · legues en el Projecte de revistes de Malawi (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . En aquest projecte, 22 residents locals, anomenats "periodistes", van escollir "revistes de conversa" que van registrar, en detall, les converses que van escoltar sobre la SIDA en la vida quotidiana de les persones comunes (en el moment de començar el projecte, al voltant del 15% d'adults a Malawi es van infectar amb el VIH (Bello, Chipeta, and Aberle-Grasse 2006) ). A causa del seu estatut d'informació privilegiada, aquests periodistes van poder escoltar converses que podrien haver estat inaccessibles a Watkins i als seus col·laboradors de recerca occidentals (vaig a parlar sobre l'ètica d'això més tard al capítol quan ofereixi consells sobre el disseny del vostre propi projecte de col·laboració massiva) . Les dades del projecte de revistes de Malawi han donat lloc a una sèrie de troballes importants. Per exemple, abans de començar el projecte, molts estrangers creien que hi havia silenci sobre la sida a l'Àfrica subsahariana, però les revistes conversacionals van demostrar que això no era clar: els periodistes van escoltar centenars de debats sobre el tema, en llocs tan diversos com funerals, bars i esglésies. A més, la naturalesa d'aquestes converses va ajudar els investigadors a comprendre millor algunes de les resistències a l'ús del preservatiu; la manera en què l'ús del preservatiu es va emmarcar en els missatges de salut pública va ser incompatible amb la manera en què es debatia a la vida quotidiana (Tavory and Swidler 2009) .
Per descomptat, igual que les dades d'eBird, les dades del Projecte de revistes de Malawi no són perfectes, un tema discutit en detall per Watkins i col·legues. Per exemple, les converses gravades no són una mostra aleatòria de totes les converses possibles. Més aviat, són un cens incomplet de converses sobre la sida. Pel que fa a la qualitat de les dades, els investigadors creien que els periodistes eren periodistes d'alta qualitat, com ho demostra la coherència entre revistes i revistes. És a dir, perquè es van desplegar bastants periodistes en un entorn prou petit i es van centrar en un tema específic, es va poder fer servir la redundància per avaluar i garantir la qualitat de les dades. Per exemple, un treballador de sexe anomenat "Stella" es va mostrar diverses vegades a les revistes de quatre periodistes diferents (Watkins and Swidler 2009) . Per seguir construint la vostra intuïció, la taula 5.3 mostra altres exemples de recopilació de dades distribuïdes per a la recerca social.
Dades recopilades | Referència |
---|---|
Debats sobre el VIH / SIDA a Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Street begging in London | Purdam (2014) |
Esdeveniments de conflicte al Congo oriental | Windt and Humphreys (2016) |
Activitat econòmica a Nigèria i a Libèria | Blumenstock, Keleher, and Reisinger (2016) |
Vigilància contra la influença | Noort et al. (2015) |
Tots els exemples descrits en aquesta secció han implicat la participació activa: els periodistes van transcriure converses que van escoltar; els observadors d'aus van pujar les seves llistes d'observació d'aus; o els jugadors han penjat les seves fotos. Però, què passa si la participació era automàtica i no requeria cap habilitat o temps específic per enviar? Aquesta és la promesa que ofereix la "detecció participativa" o la "detecció centrada en les persones". Per exemple, la Pothole Patrol, un projecte de científics del MIT, va muntar acceleròmetres equipats amb GPS dins de set taxis a la zona de Boston (Eriksson et al. 2008) . Atès que el maneig d'un espiol deixa un senyal acceleròmetre diferent, aquests dispositius, quan es col·loquen dins de taxis mòbils, poden crear mapes de bots de Boston. Per descomptat, els taxis no mostren camins a l'atzar, però, amb prou taxis, hi pot haver una cobertura suficient per proporcionar informació sobre grans parts de la ciutat. Un segon benefici dels sistemes passius que es basen en la tecnologia és que desqualifica el procés de contribució de dades: mentre que requereix habilitat per contribuir a eBird (perquè cal identificar de forma fiable les espècies d'ocells), no requereix cap habilitat especial contribueix a la patrulla Pothole.
Avançant, sospito que molts projectes de recopilació de dades distribuïdes començaran a fer ús de les capacitats dels telèfons mòbils que ja porten milers de milions de persones a tot el món. Aquests telèfons ja tenen una gran quantitat de sensors importants per a la mesura, com ara micròfons, càmeres, dispositius GPS i rellotges. A més, admeten aplicacions de tercers que permeten als investigadors controlar els protocols de recopilació de dades subjacents. Finalment, tenen connectivitat a Internet, que permet que es desconnectin les dades que recopilen. Hi ha nombrosos reptes tècnics, que van des de sensors inexactes fins a una vida limitada de la bateria, però aquests problemes probablement disminuiran amb el temps a mesura que es desenvolupi la tecnologia. Els problemes relacionats amb la privadesa i l'ètica, d'altra banda, podrien arribar a ser més complicats; Tornaré a qüestions d'ètica quan ofereixi consells sobre com dissenyar la vostra pròpia col·laboració en massa.
En projectes de recollida de dades distribuïdes, els voluntaris aporten dades sobre el món. Aquest enfocament ja s'ha utilitzat amb èxit, i probablement els usos futurs hauran d'abordar els problemes de mostreig i qualitat de dades. Afortunadament, els projectes existents com PhotoCity i Pothole Patrol suggereixen solucions a aquests problemes. A mesura que més projectes aprofitin la tecnologia que permeti la participació desqualificada i passiva, els projectes de recollida de dades distribuïts haurien d'augmentar dramàticament, fet que permetrà als investigadors recol·lectar dades que simplement estaven fora de límits en el passat.