Pomiar jest znacznie mniej prawdopodobne, aby zmienić zachowanie w dużych źródeł danych.
Jednym z wyzwań badań społecznych jest to, że ludzie mogą zmienić swoje zachowanie, gdy wiedzą, że są obserwowane przez naukowców. Socjologowie nazywają to na ogół zmianę zachowania w odpowiedzi na reaktywność pomiaru badacz (Webb et al. 1966) . Jednym z aspektów, że wiele danych wielkiego naukowca znaleźć obiecujące jest to, że uczestnicy nie są na ogół świadomi, że ich dane są przechwytywane lub stały się one tak przyzwyczajeni do gromadzenia danych, które już nie zmienia się ich zachowanie. Ponieważ nie są reaktywne, więc wiele źródeł dużych danych może być wykorzystywany do badania zachowania, która nie była nowelizacji do dokładnego pomiaru poprzednio. Na przykład, Stephens-Davidowitz (2014) użył rasistowskich względem występowania w wyszukiwarkach zmierzyć Animus rasowej w różnych regionach Stanów Zjednoczonych. Non-reaktywne i duże (patrz poprzedni rozdział) charakter danych wyszukiwania włączona pomiary, które byłyby trudne przy użyciu innych metod, takich jak ankiety.
Neutralności, jednak nie gwarantuje, że dane te są w jakiś sposób bezpośredni odzwierciedlać zachowania lub postawy ludzi. Na przykład, w jednym respondentem powiedziano Newman et al. (2011) , "To nie tak, że nie mam problemów, ja po prostu nie umieszczając je na Facebooku." Innymi słowy, mimo że niektóre duże źródła danych są niereaktywne, nie zawsze są one wolne od efekt społecznych oczekiwań tendencja dla osób chce zaprezentować się w najlepszy możliwy sposób. Ponadto, jak opiszę więcej poniżej, te źródła danych są czasami wpływ celami właścicieli platformy, zwany problem algorytmiczny zakłócającym (opisane poniżej).
Mimo braku reaktywności jest korzystne dla badań, śledzenie zachowań ludzi bez ich zgody i świadomości budzi wątpliwości etyczne omówione poniżej, a szczegółowo w rozdziale 6. Publiczna luzu wobec zwiększonego nadzoru cyfrowego może prowadzić dużych systemów danych, by stać się bardziej reaktywne w miarę upływu czasu i silne zaniepokojenie nadzoru cyfrowego może prowadzić nawet niektórzy ludzie próbują zrezygnować z dużych systemów danych całkowicie, zwiększając obawy o braku reprezentatywności (opisane dalej poniżej).
Te trzy dobre właściwości dużych danych dotyczących społecznego badawczo-duży, zawsze włączony i nie reagujący-zwykle powstają dlatego, że te źródła danych nie zostały stworzone przez naukowców do badań. Teraz będę włączyć do siedmiu właściwości dużych źródeł danych, które są szkodliwe dla badań. Cechy te często również powstać, ponieważ dane te nie został stworzony przez naukowców do badań.