La recopilación de datos distribuida es posible, y en el futuro probablemente implicará la tecnología y la participación pasiva.
Como demuestra eBird, la recopilación de datos distribuida puede ser utilizado para la investigación científica. Además, PhotoCity muestra que los problemas relacionados con el muestreo y la calidad de los datos son potencialmente solucionable.
¿Cómo podría distribuido el trabajo de recopilación de datos para la investigación social? Un maravilloso ejemplo proviene de la obra de Susan Watkins y sus colegas en el Proyecto Revistas Malawi (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . En este proyecto, 22 residentes locales llamados "periodistas" -kept "revistas conversacionales" que registraron, en detalle, las conversaciones que oyeron por casualidad sobre el SIDA en la vida diaria de la gente común (en el momento que el proyecto comenzó, alrededor del 15% de los adultos en Malawi estaban infectados por el VIH (Bello, Chipeta, and Aberle-Grasse 2006) ). Debido a su situación privilegiada, estos periodistas fueron capaces de escuchar conversaciones que podrían haber sido inaccesible a Susan Watkins y sus colaboradores de la investigación occidentales (Voy a hablar de la ética de esto más adelante en el capítulo, cuando ofrezco consejos sobre el diseño de su propio proyecto de colaboración masiva ). Los datos del Proyecto Malawi Journals ha dado lugar a una serie de importantes conclusiones. Por ejemplo, antes de que comenzara el proyecto, muchos extranjeros creían que se hizo el silencio sobre el SIDA en el África subsahariana, pero las revistas demostraron que esto era claramente no es el caso: los periodistas escuchadas cientos de conversación sobre el tema, en lugares tan diversos como los funerales , bares e iglesias. Además, la naturaleza de estas conversaciones ayudó a los investigadores a entender mejor algunas de la resistencia al uso del condón; la forma en que el uso del condón se enmarcó en los mensajes de salud pública era incompatible con la forma en que se discutió en la vida cotidiana (Tavory and Swidler 2009) .
Por supuesto, al igual que los datos de eBird, los datos del Proyecto de Revistas Malawi no es perfecto, un tema discutido en detalle por Watkins y colegas. Por ejemplo, las conversaciones grabadas no son una muestra aleatoria de todas las conversaciones posibles. Más bien, son un censo incompleto de las conversaciones sobre el SIDA. En términos de calidad de los datos, los investigadores creen que sus periodistas fueron reporteros de alta calidad, como lo demuestra la coherencia dentro de las revistas ya través de revistas. Además, cuando un número suficiente periodistas se despliegan en un entorno suficientemente pequeño y los informes se centran en un tema específico, la redundancia se hizo posible, lo que aumenta la confianza en la calidad de los datos. Por ejemplo, una trabajadora sexual llamado "Stella" se presentó varias veces en los diarios de cuatro periodistas diferentes (Watkins and Swidler 2009) . Como era en PhotoCity, el uso de la redundancia es un principio importante para evaluar y garantizar la calidad de los datos en los proyectos de recogida de datos distribuidas. Con el fin de construir aún más su intuición, la Tabla 5.3 muestra otros ejemplos de recolección de datos distribuida para la investigación social.
Datos recolectados | Citación |
---|---|
Las discusiones sobre el VIH / SIDA en Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Mendigando en una calle de Londres | Purdam (2014) |
eventos de conflicto en el este del Congo | Windt and Humphreys (2016) |
La actividad económica en Nigeria y Liberia | Blumenstock, Keleher, and Reisinger (2016) |
vigilancia de la gripe | Noort et al. (2015) |
Todos los ejemplos descritos en esta sección han implicado la participación activa: periodistas transcriben conversaciones que escuchan; observadores de aves cargan sus listas de verificación de observación de aves; o jugadores cargan sus fotos. Pero ¿y si la participación es automática y no requiere ninguna habilidad o tiempo específico a presentar? Esta es la promesa ofrecida por la "detección participativa" o "detección centrada en las personas". Por ejemplo, el bache de la patrulla, un proyecto realizado por científicos de MIT, montado GPS acelerómetros equipadas dentro de siete taxis en el área de Boston (Eriksson et al. 2008) . Debido a que la conducción por un bache deja una señal del acelerómetro distinta, estos dispositivos, cuando se coloca en el interior de los taxis en movimiento, puede crear mapas de baches de Boston. Por supuesto, los taxis no una muestra aleatoria de carreteras, pero dado suficientes taxis, puede existir una cobertura suficiente para proporcionar información sobre una gran parte de ellos de la ciudad. Una segunda ventaja de los sistemas pasivos que dependen de la tecnología es que se de-habilidad el proceso de aportación de datos: si bien requiere habilidad para contribuir a eBird (porque hay que ser capaz de identificar de forma fiable especies de aves), que no requiere habilidades especiales a contribuir a la Patrulla de baches.
De cara al futuro, sospecho que muchos proyectos de recolección de datos distribuidos comenzarán a hacer uso de las capacidades de los teléfonos móviles que ya son transportados por miles de millones de personas en todo el mundo. Estos teléfonos tienen ya un gran número de sensores para la medición importantes, tales como micrófonos, cámaras, dispositivos GPS y relojes. Además, estos teléfonos móviles compatibles con aplicaciones de terceros que permitan a los investigadores un cierto control sobre los protocolos de recogida de datos subyacentes. Por último, estos teléfonos tienen Internet de conectividad, por lo que es posible para ellos sin carga los datos que recogen. Existen numerosos desafíos técnicos de sensores imprecisos a la vida limitada de la batería, pero estos problemas es probable que disminuya con el tiempo a medida que avanza la tecnología. Las cuestiones relacionadas con la privacidad y la ética, por el contrario, puede ser que consiga más complicado a medida que avanza la tecnología; Voy a volver a las cuestiones de la ética cuando me ofrezco consejos sobre el diseño de su propia colaboración masiva.
En proyectos de recolección de datos distribuidos, los voluntarios aportan datos sobre el mundo. Este enfoque ya ha sido utilizado con éxito, y los usos futuros probablemente tendrá que hacer frente a muestreo y de calidad de datos se refiere. Afortunadamente, los proyectos existentes, como PhotoCity y baches Patrulla sugieren soluciones a estos problemas. A medida que más proyectos se aprovechan de la tecnología que permite la participación-de expertos y pasiva, distribuido proyectos de recolección de datos debe aumentar considerablemente en escala, lo que permite a los investigadores a recopilar datos que era simplemente fuera de los límites en el pasado.