Mjerenje u velikim izvorima podataka je mnogo manje vjerovatno da će promijeniti ponašanje.
Jedan izazov društvenog istraživanja jeste da ljudi mogu da promijene svoje ponašanje kada znaju da ih posmatraju istraživači. Društveni naučnici generalno nazivaju ovu reaktivnost (Webb et al. 1966) . Na primjer, ljudi mogu biti daleko velikodušniji u laboratorijskim studijama nego na terenskim studijama, jer su u prvom svijetu vrlo svjesni da ih se posmatraju (Levitt and List 2007a) . Jedan aspekt velikih podataka koji mnogi istraživači smatraju obećavajućim je da učesnici uglavnom nisu svjesni da su njihovi podaci zarobljeni ili su se tako navikli na ovo prikupljanje podataka da više ne mijenja svoje ponašanje. Zbog toga što su učesnici nereaktivni , stoga se mnogi izvori velikih podataka mogu koristiti za proučavanje ponašanja koje ranije nisu bile podložne tačnim mjerenjima. Na primer, Stephens-Davidowitz (2014) koristio rasprostranjenost rasističkih termina u upitima pretraživača radi merenja rasne animuse u različitim regionima Sjedinjenih Država. Nereaktivna i velika (vidi odeljak 2.3.1) priroda podataka za pretragu omogućila je mjerenja koja bi bilo teško korištenje drugih metoda, kao što su ankete.
Nepreaktivnost, međutim, ne garantuje da su ovi podaci na neki način direktno odraz ponašanja ili stavova ljudi. Na primer, kako je jedan ispitanik u studiji zasnovanom na intervjuu rekao: "Nije to što nemam problema, ne stavljam ih na Facebook" (Newman et al. 2011) . Drugim rečima, iako su neki veliki izvori podataka nereaktivni, oni nisu uvek oslobođeni pristranosti društvene poželjnosti, tendencije da se ljudi na najbolji mogući način prezentuju. Dalje, kao što ću opisati kasnije u poglavlju, ponašanje uzeto u velikim izvorima podataka ponekad utiču ciljevi vlasnika platformi, pitanje kojeg ću nazvati algoritamskim zbunjenjem . Konačno, iako je neaktivnost korisna za istraživanje, praćenje ponašanja ljudi bez njihove saglasnosti i svesti podiže etičke probleme koje ću detaljno opisati u poglavlju 6.
Tri osobine koja sam upravo opisala - velika, uvek i neaktivna - generalno su, ali ne uvek, pogodna za društvena istraživanja. Zatim ću se okrenuti na sedam osobina velikih izvora podataka - nepotpunih, nepristupačnih, neregistributivnih, driftinga, algoritamski konfuzanog, prljavog i osjetljivog - koji generalno, ali ne uvijek, stvaraju probleme za istraživanje.