Mjerenje je mnogo manje vjerojatno promijeniti ponašanje u velikim izvorima podataka.
Jedan od izazova za društvena istraživanja je da se ljudi mogu promijeniti svoje ponašanje kada znaju da ih se posmatra od strane istraživača. Sociolozi uglavnom zovu ovu promjenu ponašanja kao odgovor na mjerenja istraživač reaktivnost (Webb et al. 1966) . Jedan aspekt od velike količine podataka da su mnogi istraživač naći obećava je da učesnici uglavnom nisu svjesni da su njihovi podaci su zarobljeni ili su postali toliko navikli na takav prikupljanja podataka da više ne mijenja svoje ponašanje. Zato što su ne-reaktivne, stoga, mnogi izvori velikih podataka mogu se koristiti za proučavanje ponašanja koji nije bio dostupan državnim precizno mjerenje ranije. Na primjer, Stephens-Davidowitz (2014) koristi rasprostranjenosti rasističke termina u upite tražilicu za mjerenje rasne Animus u različitim regijama SAD-a. Non-reaktivnog i velika (vidi prethodni odjeljak) prirodu podataka pretraživanje omogućen mjerenja da bi bilo teško koriste druge metode, kao što su ankete.
Non-reaktivnost, međutim, ne bi se osiguralo da ovi podaci su na neki način direktno odražava ponašanja ili stavova ljudi. Na primjer, kao jedan ispitanik rekao Newman et al. (2011) , "Nije da nemam problema, ja samo ne stavljajući ih na Facebook-u." Drugim riječima, iako su neki veliki izvori podataka su ne-reaktivni, oni nisu uvijek bez predrasuda socijalne poželjnosti , tendencija da ljudi žele da se predstave na najbolji mogući način. Nadalje, kao što ću opisati još niže, ovi izvori podataka su ponekad pod uticajem ciljeva vlasnika platforme, problem se zove algoritamske zbunjujućih (opisan dolje).
Iako ne reaktivnost je prednost za istraživanje, praćenje ponašanja ljudi bez njihovog pristanka i svijest podiže etička pitanja razgovarali ispod i detaljnije u Poglavlju 6. javne reakcije protiv povećan digitalni nadzor moglo dovesti velike sisteme podataka kako bi postali više reaktivne vremenom, i jak briga o digitalnim nadzor čak mogao dovesti neki ljudi u pokušaju da se odluče-od velikih sistema podataka potpuno, povećavajući zabrinutost zbog ne-reprezentativnost (opisan dolje).
Ove tri dobre osobine velikih podataka za društvena istraživanja-veliki, uvijek-na, i ne-reaktivni-uglavnom nastaju jer ovi izvori podataka nisu stvorili istraživači za istraživanje. Sada, ja ću okrenuti na sedam svojstava velikih izvora podataka koji su loše za istraživanje. Ove karakteristike također imaju tendenciju da se javljaju zato što ove podatke nisu stvorili istraživači za istraživanje.