2.3.1.3 Нереактивный

Измерение гораздо меньше шансов изменить поведение в больших источниках данных.

Одна из задач социального исследования является то, что люди могут изменить свое поведение, когда они знают, что за ними наблюдают исследователями. Социологи обычно называем это изменение поведения в ответ на измерения исследователя реактивности (Webb et al. 1966) и (Webb et al. 1966) , (Webb et al. 1966) . Одним из аспектов больших объемов данных, что многие исследователь найти перспективных является то, что участники, как правило, не знают, что их данные перехватываются или они настолько привыкли к этому сбору данных, что она больше не меняет свое поведение. Так как они не реагируют, поэтому многие источники больших объемов данных может быть использована для изучения поведения, которая не была исправимо для точного измерения ранее. Например, Stephens-Davidowitz (2014) использовали распространенность расистских терминов в запросах в поисковых системах для измерения расовой анимус в различных регионах Соединенных Штатов. Неактивного и большой (см предыдущий раздел) характер данных поиска позволило результаты измерений, которые было бы трудно с помощью других методов, таких как опросы.

Non-реакционная способность, однако, не гарантирует, что эти данные каким-то прямым отражают поведение или отношение людей. Например, в качестве одного из респондентов сказал Newman et al. (2011) и Newman et al. (2011) , "Это не то, что у меня нет проблем, я просто не прикладывая их на Facebook." Другими словами, даже если некоторые большие источники данных не являются реактивными, они не всегда свободны от предвзятости социальной желательности , тенденция людей хотят представить себя в лучшем виде. Кроме того, как я опишу более ниже, эти источники данных иногда влияние целей владельцев платформы, проблема называется алгоритмической вмешивающимся (более подробно описано ниже).

Хотя не-реактивность является предпочтительным для исследования, отслеживания поведения людей без их согласия и понимания вызывает этические проблемы обсуждаются ниже и подробно описаны в главе 6. Публичное люфта против увеличения цифрового наблюдения может привести большие системы данных, чтобы стать более реактивным с течением времени, и сильный беспокойство по поводу цифрового наблюдения может даже привести некоторых людей , чтобы попытаться отказаться от больших систем данных полностью, увеличивая обеспокоенность по поводу отсутствия репрезентативности (описано более ниже).

Эти три хорошие свойства больших объемов данных для социальных исследований, большой, всегда на, и не реактивно-возникают, как правило, потому что эти источники данных не были созданы исследователями для исследования. Теперь, я превращу к семи свойств больших источников данных, которые плохо для исследований. Эти функции также, как правило, возникают из-за этих данных не была создана исследователями для исследования.