Измерването в големи източници на данни е много по-малко вероятно да промени поведението.
Едно предизвикателство за социалните изследвания е, че хората могат да променят поведението си, когато знаят, че те се наблюдават от изследователи. Социалните учени обикновено наричат тази реактивност (Webb et al. 1966) . Например, хората могат да бъдат по-щедри в лабораторните изследвания, отколкото в теренните проучвания, защото в първите са много наясно, че те се наблюдават (Levitt and List 2007a) . Един от аспектите на големите данни, които много изследователи намира за обещаващи, е, че участниците като цяло не знаят, че техните данни са заловени или са станали свикнали с това събиране на данни, че вече не променят поведението си. Тъй като участниците са нереактивни , следователно, много източници на големи данни могат да бъдат използвани за изследване на поведение, което не е било податливо на точна оценка преди това. Например Stephens-Davidowitz (2014) използва широко разпространените термини за расизъм в заявките за търсачки за измерване на расистката анимус в различни региони на Съединените щати. Нереактивният и големият (виж раздел 2.3.1) характер на данните от търсенето, позволяващи измервания, би било трудно да се използват други методи, като например проучвания.
Нереактивността обаче не гарантира, че тези данни по някакъв начин са пряко отражение на поведението или нагласите на хората. Например, според един от интервюираните изследователи: "Не че нямам проблеми, просто не ги поставям във Facebook" (Newman et al. 2011) . С други думи, макар че някои големи източници на данни не реагират, те не винаги са свободни от пристрастност към обществото, тенденцията хората да искат да се представят по най-добрия възможен начин. Освен това, както ще опиша по-нататък в тази глава, поведението, заловен в големи източници на данни, понякога се влияе от целите на собствениците на платформи, проблем, който ще нарека алгоритмично объркване . И накрая, въпреки че нереактивността е изгодна за научни изследвания, проследяването на поведението на хората без тяхното съгласие и осъзнаване повдига етични опасения, които ще опиша подробно в глава 6.
Трите свойства, които току-що описах - големи, винаги, и нереактивни - обикновено са, но не винаги, полезни за социалните изследвания. После ще се обърна към седемте свойства на големите източници на данни - непълни, недостъпни, непредставени, плаващи, алгоритмично объркани, мръсни и чувствителни - които обикновено, но не винаги, създават проблеми за изследванията.