Вымярэнне значна менш шанцаў змяніць паводзіны ў вялікіх крыніцах дадзеных.
Адна з задач сацыяльнага даследавання з'яўляецца тое, што людзі могуць змяніць свае паводзіны, калі яны ведаюць, што за імі назіраюць даследнікамі. Сацыёлагі звычайна называем гэта змяненне паводзін у адказ на вымярэння даследчыка рэактыўнасці (Webb et al. 1966) і (Webb et al. 1966) , (Webb et al. 1966) . Адным з аспектаў вялікіх аб'ёмаў дадзеных, што многія даследчык знайсці перспектыўных з'яўляецца тое, што ўдзельнікі, як правіла, не ведаюць, што іх дадзеныя Перахапляюцца або яны настолькі прывыклі да гэтага зборы дадзеных, што яна больш не мяняе свае паводзіны. Так як яны не рэагуюць, таму шматлікія крыніцы вялікіх аб'ёмаў дадзеных можа быць выкарыстана для вывучэння паводзінаў, якая не была папраўная для дакладнага вымярэння раней. Напрыклад, Stephens-Davidowitz (2014) выкарыстоўвалі распаўсюджанасць расісцкіх тэрмінаў у запытах ў пошукавых сістэмах для вымярэння расавай анимус ў розных рэгіёнах Злучаных Штатаў. Неактыўнага і вялікі (гл папярэдні раздзел) характар дадзеных пошуку дазволіла вынікі вымярэнняў, якія было б цяжка з дапамогай іншых метадаў, такіх як апытанні.
Non-рэакцыйная здольнасць, аднак, не гарантуе, што гэтыя дадзеныя нейкім прамым адлюстроўваюць паводзіны або стаўленне людзей. Напрыклад, у якасці аднаго з рэспандэнтаў сказаў Newman et al. (2011) і Newman et al. (2011) , "Гэта не тое, што ў мяне няма праблем, я проста не прыкладваючы іх на Facebook." Іншымі словамі, нават калі некаторыя вялікія крыніцы дадзеных не з'яўляюцца рэактыўнымі, яны не заўсёды вольныя ад прадузятасці сацыяльнай пажаданасці , тэндэнцыя людзей хочуць прадставіць сябе ў лепшым выглядзе. Акрамя таго, як я апішу больш ніжэй, гэтыя крыніцы дадзеных часам ўплыў мэтаў уладальнікаў платформы, праблема называецца алгарытмічнай ўмешваецца (больш падрабязна апісана ніжэй).
Хоць не-рэактыўнасць з'яўляецца пераважнай для даследавання, адсочвання паводзін людзей без іх згоды і разумення выклікае этычныя праблемы абмяркоўваюцца ніжэй і падрабязна апісаны ў чале 6. Публічная люфта супраць павелічэння лічбавага назірання можа прывесці вялікія сістэмы дадзеных, каб стаць больш рэактыўным з цягам часу, і моцны неспакой па нагоды лічбавага назірання можа нават прывесці некаторых людзей , каб паспрабаваць адмовіцца ад вялікіх сістэм дадзеных цалкам, павялічваючы занепакоенасць па нагоды адсутнасці рэпрэзентатыўнасці (апісана больш ніжэй).
Гэтыя тры добрыя ўласцівасці вялікіх аб'ёмаў дадзеных для сацыяльных даследаванняў, вялікі, заўсёды на, і ня рэактыўна-ўзнікаюць, як правіла, таму што гэтыя крыніцы дадзеных не былі створаны даследнікамі для даследавання. Зараз, я ператвару да сямі уласцівасцяў вялікіх крыніц дадзеных, якія дрэнна для даследаванняў. Гэтыя функцыі таксама, як правіла, узнікаюць з-за гэтых дадзеных не была створана даследчыкамі для даследавання.