2.3.1.3 No reactivo

La medición es mucho menos probable que cambie el comportamiento de las fuentes de datos grandes.

Uno de los retos de la investigación social es que las personas pueden cambiar su comportamiento cuando saben que están siendo observados por los investigadores. Los científicos sociales en general, llaman a este cambio de comportamiento en respuesta a la reactividad de medición investigador (Webb et al. 1966) . Un aspecto de grandes volúmenes de datos que muchos investigadores a encontrar prometedor es que los participantes generalmente no son conscientes de que sus datos están siendo capturados o se han acostumbrado tanto a esta recopilación de datos que ya no cambia su comportamiento. Debido a que son no reactivos, por lo tanto, muchas fuentes de datos grandes se pueden utilizar para estudiar el comportamiento que no ha sido modificable para una medición precisa anteriormente. Por ejemplo, Stephens-Davidowitz (2014) utiliza la prevalencia de términos racistas en las consultas de los motores de búsqueda para medir la animosidad racial en diferentes regiones de los Estados Unidos. La naturaleza no reactiva y grande (ver sección anterior) de los datos de búsqueda activado medidas que serían difíciles de utilizar otros métodos, como las encuestas.

No reactividad, sin embargo, no garantizan que estos datos son de alguna manera una forma directa de reflejar el comportamiento o las actitudes de la gente. Por ejemplo, como uno de los encuestados dicho Newman et al. (2011) , "No es que yo no tengo problemas, sólo que no estoy poniendo en Facebook." En otras palabras, a pesar de que algunas fuentes de datos son grandes no reactivo, que no siempre están libres de sesgo de deseabilidad social , la tendencia de las personas que quieran presentarse de la mejor manera posible. Además, como describiré más adelante, estas fuentes de datos a veces son afectados por los objetivos de los propietarios de la plataforma, un problema que se llama confusión algorítmica (descrito más adelante).

Aunque no reactividad es ventajosa para la investigación, el seguimiento del comportamiento de las personas sin su consentimiento y el conocimiento plantea preocupaciones éticas discuten a continuación y en detalle en el capítulo 6. Una reacción pública contra la vigilancia digital aumentado podría llevar sistemas de datos grandes para ser más reactiva con el tiempo, y fuerte preocupación por la vigilancia digital podría incluso llevar a algunas personas para tratar de darse de baja de los sistemas de datos grandes por completo, la creciente preocupación por la no-representatividad (descrito más adelante).

Estas tres buenas propiedades de grandes volúmenes de datos para la investigación social-grande, siempre activo, y surgen debido a que estas fuentes de datos no fueron creados por los investigadores para la investigación no reactivo-general. Ahora, Voy a su vez a los siete propiedades de las fuentes de datos grandes que son malos para la investigación. Estas características también tienden a surgir porque esta información no fue creada por los investigadores para la investigación.