Meranie vo veľkých zdrojoch údajov je oveľa menej pravdepodobné, že zmení správanie.
Jednou z výziev sociálneho výskumu je to, že ľudia môžu zmeniť svoje správanie, keď vedia, že ich pozorujú výskumní pracovníci. Sociálni vedci vo všeobecnosti nazývajú túto reaktivitu (Webb et al. 1966) . Napríklad ľudia môžu byť v laboratórnych štúdiách štedrejší než v terénnych štúdiách, pretože v prvom prípade si veľmi dobre uvedomujú, že sú pozorované (Levitt and List 2007a) . Jedným z aspektov veľkých údajov, ktoré mnohí výskumníci považujú za sľubné, je to, že účastníci vo všeobecnosti nevedia, že ich údaje sú zachytené, alebo sa tak zvykli na zhromažďovanie údajov, že už ich správanie nezmení. Pretože účastníci sú nereaktívni , preto je možné použiť množstvo zdrojov veľkých údajov na štúdium správania, ktoré predtým nebolo možné presne vyhodnotiť. Napríklad Stephens-Davidowitz (2014) použil prevalenciu rasistických pojmov vo vyhľadávacích dotazoch na meranie rasovej animácie v rôznych regiónoch Spojených štátov. Nereaktívne a veľké (viď časť 2.3.1) povaha vyhľadávacích údajov umožňovala merania, ktoré by bolo ťažké pri použití iných metód, ako sú prieskumy.
Nereaktivita však nezaručuje, že tieto údaje sú nejakým priamym odrazom správania alebo postojov ľudí. Napríklad, ako jeden respondent v štúdii založenej na rozhovoroch povedal: "Nie je to tak, že nemám problémy, jednoducho ich neukladám na Facebook" (Newman et al. 2011) . Inými slovami, napriek tomu, že niektoré veľké zdroje údajov sú nereaktívne, nie sú vždy oslobodené od sociálnej príťažlivosti, tendencie k tomu, aby sa ľudia chcú prezentovať s najlepším možným spôsobom. Ďalej, ako budem opísať neskôr v tejto kapitole, správanie zachytené vo veľkých zdrojoch údajov je niekedy ovplyvnené cieľmi majiteľov platforiem, problémom, ktorý budem nazývať algoritmickým zmätkom . A napokon, aj keď nereaktivita je pre výskum výhodná, sledovanie správania ľudí bez ich súhlasu a uvedomenia vyvoláva etické obavy, ktoré podrobne popíšem v kapitole 6.
Tri vlastnosti, ktoré som práve popísal - veľké, vždy a nereaktívne - sú všeobecne, ale nie vždy, výhodné pre spoločenský výskum. Ďalej sa obrátim na sedem vlastností veľkých zdrojov údajov - neúplné, neprístupné, nereprezentatívne, unášané, algoritmicky zmätené, špinavé a citlivé - ktoré vo všeobecnosti, ale nie vždy, vytvárajú problémy pre výskum.