Мерењето во големи извори на податоци е многу помалку веројатно да се промени однесувањето.
Еден предизвик од општествените истражувања е дека луѓето можат да го променат своето однесување кога знаат дека ги следат истражувачите. Општествените научници генерално ја нарекуваат оваа реактивност (Webb et al. 1966) . На пример, луѓето можат да бидат повеликодушни во лабораториските студии отколку теренски студии, бидејќи во првиот се свесни дека се набљудуваат (Levitt and List 2007a) . Еден аспект на големите податоци за кои многу истражувачи сметаат дека ветуваат е дека учесниците генерално не се свесни дека нивните податоци се заробени или тие се толку навикнати на оваа збирка на податоци што веќе не го менува нивното однесување. Бидејќи учесниците се нереактивни , затоа, многу извори на големи податоци може да се користат за да се проучи однесувањето кое претходно не било можно да се прецизира. На пример, Stephens-Davidowitz (2014) користеше распространетоста на расистички термини во пребарувачките пребарувања за мерење на расните анимус во различни региони на САД. Нереактивните и големите (види дел 2.3.1) природата на мерењата со овозможените податоци што би било тешко користејќи други методи, како што се анкети.
Нереактивноста, сепак, не гарантира дека овие податоци се некако директен одраз на однесувањето или ставовите на луѓето. На пример, како што еден испитаник во една интервју-базирана студија рече: "Не е тоа што немам проблеми, јас едноставно не ги ставам на Фејсбук" (Newman et al. 2011) . Со други зборови, иако некои големи извори на податоци се нереактивни, тие не се секогаш ослободени од пристрасност кон социјалната пожелност, тенденцијата луѓето да сакаат да се претстават на најдобар можен начин. Понатаму, како што подоцна ќе го опишам во поглавјето, однесувањето фатено во големи извори на податоци понекогаш е загрозено од целите на сопствениците на платформата, прашање кое ќе го наречам алгоритамски конфузија . Конечно, иако не-реактивноста е поволна за истражување, следењето на однесувањето на луѓето без нивна согласност и свесност ги покренува етичките загрижености што ќе ги опишам детално во поглавјето 6.
Трите особини што ги опишав - големи, секогаш и нереактивни - генерално, но не секогаш, поволни за општествени истражувања. Следно, ќе се свртам кон седумте својства на големи извори на податоци - нецелосни, недостапни, нерепрезентативни, лебдат, алгоритамски збунети, валкани и чувствителни - кои генерално, но не секогаш, создаваат проблеми за истражување.