Измерването е много по-малко вероятно да се промени поведението на големите източници на данни.
Едно от предизвикателствата на социалното изследване е, че хората могат да променят поведението си, когато те знаят, че те са били наблюдавани от изследователите. Социолозите обикновено наричат тази промяна в поведението, в отговор на измерване изследовател реактивност (Webb et al. 1966) . Един от аспектите на големи данни, че много изследовател намери обещава, е, че като цяло участниците не са наясно, че техните данни са били заловени или те са станали толкова свикнали да това събиране на данни, които вече не се променя поведението си. Тъй като те са нереактивни, следователно, много източници на големи данни могат да бъдат използвани за изследване на поведението, който не е поправим за точно измерване преди. Например, Stephens-Davidowitz (2014) , използвани за разпространението на расистки термини в заявките за търсене на двигателя, за да се измери расова враждебност в различни райони на Съединените щати. В не-реактивен и голям (виж предишната точка) естеството на данните от търсенето активиран измервания, че би било трудно се използват други методи, като например проучвания.
Non-реактивност, обаче, не гарантира, че тези данни са някак си по-директни отразява на поведението или отношението на хората. Например, тъй като един от респондентите каза Newman et al. (2011) , "Това не е, че аз нямам проблеми, аз съм просто не ги поставят на Facebook." С други думи, въпреки че някои от големите източници на данни не са реактивни, те не винаги са свободни на социалната желателност пристрастия , тенденцията хората да искат да се представят по най-добрия възможен начин. Освен това, тъй като аз ще опиша по-долу, тези източници на данни понякога се влияе от целите на собствениците на платформата, проблем, наречен алгоритмична смущаващи (описано по-долу).
Въпреки, че не-реактивност е изгодно за научни изследвания, проследяване на поведението на хората без тяхното съгласие и информираност повдига обсъдени по-долу и в подробности етични съображения в глава 6. обществена реакция срещу увеличи цифрово наблюдение би могло да доведе големи системи за данни, за да стане по-реактивен с течение на времето, и силна загриженост за цифрово наблюдение може да доведе дори някои хора да се опитат да се откажете от големите информационни системи напълно, нарастващата загриженост за не-представителност (описано по-долу).
Тези три добри свойства на големи данни за социални изследвания-голям, винаги-на, и не-реактивен-обикновено възникват, защото тези източници на данни не са били създадени от изследователи за научни изследвания. Сега, аз ще се обърнат към седемте свойства на големи източници на данни, които са лоши за научни изследвания. Тези характеристики също са склонни да възникне, защото тези данни не е създаден от изследователи за научни изследвания.