Мјерење у великим изворима података је много мање вјероватно да ће промијенити понашање.
Један изазов друштвеног истраживања је да људи могу да промене своје понашање када знају да их истраживачи посматрају. Друштвени научници генерално називају ову реактивност (Webb et al. 1966) . На примјер, људи могу бити далеко великодушни у лабораторијским студијама него на теренским студијама, јер су у првом свијету врло свјесни да их посматрају (Levitt and List 2007a) . Један аспект великих података који многи истраживачи сматрају обећавајућим је да учесници углавном нису свјесни да су њихови подаци заробљени или су се тако навикли на ову прикупљање података да више не мијења своје понашање. Због тога што су учесници нереактивни , стога се многи извори великих података могу користити за проучавање понашања које раније нису биле подложне тачном мерењу. На пример, Stephens-Davidowitz (2014) користио распрострањеност расистичких термина у упитима претраживача за мерење расне анимусе у различитим регионима Сједињених Држава. Нереактивна и велика (види одељак 2.3.1) природа мјерења омогућених података које би било тешко кориштење других метода, као што су анкете.
Непреактивност, међутим, не осигурава да су ови подаци на неки начин директно одраз понашања или ставова људи. На пример, како је један испитаник у студији заснованом на интервјуу рекао: "Није то што немам проблема, не стављам их на Фацебоок" (Newman et al. 2011) . Другим речима, иако су неки велики извори података нереактивни, они нису увек ослобођени пристраности друштвене пожељности, тенденције да се људи на најбољи могући начин презентују. Даље, као што ћу касније описати у поглављу, понашање у великим изворима података понекад утичу циљеви власника платформи, проблем који ћу назвати алгоритамским збуњењем . На крају, иако је неактивност корисна за истраживање, праћење понашања људи без њиховог пристанка и свести подиже етичке проблеме које ћу детаљно описати у поглављу 6.
Три особине која сам управо описала - велика, увек и неактивна - генерално су, али не увек, погодна за друштвена истраживања. Затим ћу се окренути на седам особина великих извора података - непотпуних, неприступачних, нерегистрибутивих, дрифтинга, алгоритамски конфузаног, прљавог и осјетљивог - који опћенито, али не увијек, стварају проблеме за истраживање.