Вымярэнне ў вялікіх крыніцах дадзеных значна менш шанцаў змяніць паводзіны.
Адна з задач сацыяльнага даследавання з'яўляецца тое, што людзі могуць змяніць свае паводзіны, калі яны ведаюць, што за імі назіраюць даследчыкі. Сацыёлагі звычайна называюць гэтую рэактыўнасць (Webb et al. 1966) і (Webb et al. 1966) , (Webb et al. 1966) . Напрыклад, людзі могуць быць больш шчодрымі ў лабараторных даследаваннях , чым палявыя даследаванні , так як у першым выпадку яны вельмі добра разумеюць , што яны назіраюць (Levitt and List 2007a) . Адным з аспектаў вялікіх дадзеных, што многія даследчыкі знаходзяць перспектыўныя з'яўляецца тое, што ўдзельнікі, як правіла, не ведае, што іх дадзеныя Перахапляюцца або яны настолькі прывыклі да гэтага зборы дадзеных, што ён больш не мяняе свае паводзіны. Паколькі ўдзельнікі інэртныя, таму шматлікія крыніцы вялікіх аб'ёмаў дадзеных могуць быць выкарыстаны для вывучэння паводзінаў , якія не былі прыдатна для дакладнага вымярэння раней. Напрыклад, Stephens-Davidowitz (2014) выкарыстаў распаўсюджанасць расісцкіх тэрмінаў у запытах ў пошукавых сістэмах для вымярэння расавай анимус ў розных рэгіёнах Злучаных Штатаў. Інэртны і вялікі (глядзі раздзел 2.3.1) характар дадзеных пошуку дазволілі вымярэння, якія было б цяжка з выкарыстаннем іншых метадаў, такіх як абследавання.
Nonreactivity, аднак, не гарантуе, што гэтыя дадзеныя нейкія прамое адлюстраванне або паводзін людзей. Напрыклад, як адзін з рэспандэнтаў у даследаванні інтэрв'ю на аснове сказаў: «Гэта не тое, што ў мяне няма праблем, я проста не пакласці іх на Facebook» (Newman et al. 2011) і (Newman et al. 2011) . Іншымі словы, нават калі некаторыя буйныя крыніцы дадзеных інэртныя, яны не заўсёды вольныя ад прадузятасцяў сацыяльнай пажаданасці, тэндэнцыі для людзей хацелі б прадставіць сябе ў лепшым выглядзе. Акрамя таго, як я апішу пазней у гэтым раздзеле, паводзіны захопленае ў вялікіх крыніцах дадзеных часам ўплывае на мэты уладальнікаў платформы, пытанне я буду называць алгарытмічнай ўмешваюцца. Нарэшце, хоць nonreactivity выгадна для даследавання, адсочваць паводзіны людзей без іх згоды і ўсведамленне падымае этычныя праблемы, якія я буду апісваць падрабязна ў главе 6.
Тры ўласцівасці, якія я толькі што апісаў, вялікі, заўсёды на, і інэртны-звычайна, але не заўсёды, выгадна для сацыяльных даследаванняў. Далей, я ўключу да сямі уласцівасцях вялікіх крыніц-няпоўных дадзеных, недаступнасць, нерепрезентативного, неабсяжным, алгарытмічная пасаромлены, брудным, і адчувальныя, што ў цэлым, але не заўсёды, ствараю праблемы для даследавання.