Coleta de dados distribuído é possível, e no futuro provavelmente envolverá tecnologia e participação passiva.
Como eBird demonstra, coleta de dados distribuída pode ser usado para a pesquisa científica. Além disso, PhotoCity mostra que os problemas relacionados com a amostragem e a qualidade dos dados são potencialmente solucionável.
Como pode distribuídos trabalho de coleta de dados para a investigação social? Um maravilhoso exemplo vem do trabalho de Susan Watkins e seus colegas sobre o Projeto Revistas Malawi (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . Neste projeto, 22 residentes locais chamados "jornalistas" -kept "revistas de conversação" que registraram, em detalhe, as conversas que ouviu sobre a Aids no cotidiano das pessoas comuns (no momento do início do projeto, cerca de 15% dos adultos no Malawi foram infectados com HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Devido ao seu estatuto de informação privilegiada, esses jornalistas foram capazes de ouvir as conversas que poderiam ter sido inacessível para Susan Watkins e seus colaboradores de pesquisa ocidentais (eu vou discutir a ética desta tarde no capítulo quando eu oferecer conselhos sobre como criar seu próprio projeto de colaboração em massa ). Os dados do Projeto Malawi Revistas levou a uma série de descobertas importantes. Por exemplo, antes do início do projeto, muitas pessoas de fora acreditavam que havia um silêncio sobre a AIDS na África sub-saariana, mas os jornais demonstraram que este foi claramente não é o caso: os jornalistas ouviu centenas de conversa sobre o tema, em locais tão diversos como funerais , bares e igrejas. Além disso, a natureza dessas conversas ajudaram os pesquisadores a entender melhor parte da resistência ao uso do preservativo; a maneira que o uso do preservativo foi enquadrado em mensagens de saúde pública era inconsistente com a maneira que foi discutida na vida cotidiana (Tavory and Swidler 2009) .
Claro que, como os dados de eBird, os dados do Projeto Revistas Malawi não é perfeito, um problema discutido em detalhe por Watkins e colegas. Por exemplo, as conversas gravadas não são uma amostra aleatória de todas as conversas possíveis. Em vez disso, eles são um censo incompleta de conversas sobre AIDS. Em termos de qualidade de dados, os pesquisadores acreditam que seus jornalistas eram os repórteres de alta qualidade, como evidenciado pela consistência dentro de revistas e em jornais. Além disso, quando os jornalistas suficientes são implantados em um ambiente bastante pequeno e relatórios estão focados em um tópico específico, redundância tornou-se possível, o que aumenta a confiança na qualidade dos dados. Por exemplo, um trabalhador do sexo chamado "Stella" mostrou-se várias vezes nas revistas de quatro jornalistas diferentes (Watkins and Swidler 2009) . Como foi nos PhotoCity, o uso de redundância é um princípio importante para avaliar e garantir a qualidade dos dados em projectos de recolha de dados distribuídos. A fim de construir ainda mais a sua intuição, a Tabela 5.3 mostra outros exemplos de coleta de dados distribuída para a investigação social.
Os dados recolhidos | Citação |
---|---|
As discussões sobre HIV / AIDS no Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Mendicidade nas ruas em Londres | Purdam (2014) |
eventos conflito no leste do Congo | Windt and Humphreys (2016) |
A actividade económica na Nigéria e Libéria | Blumenstock, Keleher, and Reisinger (2016) |
vigilância da gripe | Noort et al. (2015) |
Todos os exemplos descritos nesta seção envolveram a participação activa: jornalistas transcrita conversas que eles ouviram; birders carregado suas listas de observação de pássaros; ou jogadores carregado suas fotos. Mas e se a participação era automático e não requer nenhuma habilidade ou tempo específico para enviar? Esta é a promessa oferecida pela "detecção participativa" ou "centrada nas pessoas de detecção." Por exemplo, o caldeirão Patrol, um projeto por cientistas do MIT, montado GPS acelerômetros equipados dentro de sete táxis na área de Boston (Eriksson et al. 2008) . Porque dirigindo sobre um buraco deixa um sinal acelerômetro distinta, esses dispositivos, quando colocado no interior de táxis em movimento, pode criar mapas de buracos de Boston. É claro, os táxis não amostragem aleatória de estradas, mas dado o suficiente táxis, pode haver uma cobertura suficiente para fornecer informações sobre grandes porções de que cidade. Um segundo benefício de sistemas passivos que dependem da tecnologia é que eles diminuem a habilidade do processo de contribuir de dados: ao mesmo tempo que requer habilidade para contribuir para eBird (porque você precisa ser capaz de identificar com segurança as espécies de aves), que não requer habilidades especiais para contribuir para Pothole Patrol.
Indo para a frente, eu suspeito que muitos projectos de recolha de dados distribuídos vai começar a fazer uso das capacidades de telefones celulares que já estão carregados por milhares de milhões de pessoas em todo o mundo. Estes telefones já tem um grande número de sensores importantes para a medição, tais como microfones, câmeras, aparelhos de GPS e relógios. Além disso, esses telefones móveis suportam aplicativos de terceiros para permitir aos pesquisadores algum controle sobre os protocolos de coleta de dados subjacentes. Finalmente, esses telefones têm internet de conectividade, tornando possível para eles para off-carregar os dados que coletam. Existem inúmeros desafios técnicos de sensores imprecisos a vida útil da bateria limitada, mas esses problemas provavelmente irá diminuir ao longo do tempo como a tecnologia se desenvolve. Questões relacionadas com a privacidade e ética, por outro lado, pode ficar mais complicado, pois a tecnologia se desenvolve; Eu vou voltar para questões de ética quando eu oferecer conselhos sobre como projetar sua própria colaboração em massa.
Em projectos de recolha de dados distribuídos, os voluntários contribuir com dados sobre o mundo. Esta abordagem já foi utilizada com sucesso, e utilizações futuras provavelmente vai ter que lidar com amostragem e de qualidade de dados preocupações. Felizmente, os projectos existentes, tais como PhotoCity e Caldeirão Patrol sugerir soluções para estes problemas. À medida que mais projetos de tirar proveito da tecnologia que permite a participação de qualificados e passiva, distribuídos projectos de recolha de dados deve aumentar dramaticamente em escala, permitindo aos investigadores recolher dados que era simplesmente fora dos limites no passado.