2.3.1.3 Non reactivo

A medida é moito menos propensos a cambiar o comportamento en fontes de datos grandes.

Un reto da busca social é que a xente pode cambiar o seu comportamento cando saben que están a ser observados polos investigadores. Os científicos sociais xeralmente chamamos ese cambio de comportamento en resposta a reactividade medición investigador (Webb et al. 1966) . Un aspecto do big data que moitos investigador atopar prometedor é que os participantes xeralmente non son conscientes de que os seus datos están sendo capturados ou que se fan tan afeitos a esta recollida de datos que xa non cambia o seu comportamento. Porque son non-reactivo, polo tanto, moitas fontes de datos grandes poden ser utilizados para estudar o comportamento que non foi alterabades a medición precisa anteriormente. Por exemplo, Stephens-Davidowitz (2014) usou a prevalencia de termos racistas en consultas buscador para medir animus racial en diferentes rexións de Estados Unidos. A natureza non reactivo e grande (ver sección anterior) dos datos de investigación medicións que serían difíciles de usar outros métodos, como enquisas activado.

Non reactividade, con todo, non garante que estes datos son de algunha maneira unha relación directa reflexionar de comportamento ou actitudes das persoas. Por exemplo, como un respondente dixo Newman et al. (2011) , "Non é que eu non teño problemas, eu só non estou poñendo eles en Facebook." Noutras palabras, aínda que algunhas fontes de datos grandes son non-reactiva, non son sempre libre de prexuízos desejabilidade social , a tendencia a que a xente quere presentarse da mellor maneira posible. Ademais, como vou describir máis abaixo, estas fontes de datos son, por veces, impactado polas metas dos propietarios de plataforma, un problema chamado confusión algorítmica (descrito máis abaixo).

Aínda non reactividade é vantaxoso para a investigación, acompañando o comportamento das persoas sen o seu consentimento e conciencia levanta preocupacións éticas discutidos abaixo e detallados no capítulo 6. A reacción pública contra o aumento da vixilancia dixital pode levar os sistemas de datos grandes para facer-se máis reactivo ao longo do tempo, e forte preocupación vixilancia dixital podería incluso levar algunhas persoas intentando optar por sistemas de datos grandes completo, aumentando preocupacións sobre a non-representatividade (descrito máis abaixo).

Estes tres boas propiedades de grandes datos para a investigación social, -Gran, always-on, e non reactiva-xeralmente xorden porque estas fontes de datos non foron creadas por investigadores para a investigación. Agora, eu vou volver para as sete propiedades de fontes de datos grandes que son malas para a investigación. Estes recursos tamén tenden a xurdir, porque eses datos non foi creado por investigadores para a investigación.