2.3.1.3 Não reativo

A medição é muito menos propensos a mudar o comportamento em fontes de dados grandes.

Um desafio da pesquisa social é que as pessoas podem mudar seu comportamento quando sabem que estão sendo observados pelos pesquisadores. Os cientistas sociais geralmente chamamos essa mudança de comportamento em resposta a reactividade medição pesquisador (Webb et al. 1966) . Um aspecto do big data que muitos pesquisador encontrar promissor é que os participantes geralmente não estão cientes de que seus dados estão sendo capturados ou que se tornaram tão acostumados a esta recolha de dados que já não muda seu comportamento. Porque eles são não-reactivo, por conseguinte, muitas fontes de dados grandes podem ser utilizados para estudar o comportamento que não foi alteráveis ​​a medição precisa anteriormente. Por exemplo, Stephens-Davidowitz (2014) usou a prevalência de termos racistas em consultas motor de busca para medir animus racial em diferentes regiões dos Estados Unidos. A natureza não-reativo e grande (ver secção anterior) dos dados de pesquisa medições que seriam difíceis de usar outros métodos, como inquéritos habilitado.

Não reatividade, no entanto, não garante que estes dados são de alguma forma uma relação directa reflectir de comportamento ou atitudes das pessoas. Por exemplo, como um respondente disse Newman et al. (2011) , "Não é que eu não tenho problemas, eu só não estou colocando eles no Facebook." Em outras palavras, embora algumas fontes de dados grandes são não-reativa, eles não são sempre livre de preconceitos desejabilidade social , a tendência para que as pessoas querem se apresentar da melhor maneira possível. Além disso, como vou descrever mais abaixo, estas fontes de dados são, por vezes, impactado pelas metas dos proprietários de plataforma, um problema chamado de confusão algorítmica (descrito mais abaixo).

Embora não reatividade é vantajoso para a investigação, acompanhando o comportamento das pessoas sem o seu consentimento e consciência levanta preocupações éticas discutidos abaixo e em detalhe no Capítulo 6. A reação pública contra o aumento da vigilância digital pode levar os sistemas de dados grandes para tornar-se mais reativo ao longo do tempo, e forte preocupação com vigilância digital poderia até mesmo levar algumas pessoas a tentar optar por sistemas de dados grandes completamente, aumentando preocupações sobre a não-representatividade (descrito mais abaixo).

Estes três boas propriedades de grandes dados para a investigação social,-grande, always-on, e não reativa-geralmente surgem porque essas fontes de dados não foram criadas por pesquisadores para a investigação. Agora, eu vou voltar para as sete propriedades de fontes de dados grandes que são ruins para a investigação. Esses recursos também tendem a surgir, porque esses dados não foi criado por pesquisadores para a investigação.