Mērījumi lielos datu avotos ir daudz mazāk ticami, lai mainītu uzvedību.
Viens no sociālās izpētes uzdevumiem ir tas, ka cilvēki var mainīt savu uzvedību, kad viņi zina, ka pētnieki tos novēro. Sociologi parasti to sauc par reaktivitāti (Webb et al. 1966) . Piemēram, cilvēki var būt daudz dāsni laboratorijas pētījumos, nevis lauka pētījumos, jo bijušajos viņi ļoti labi apzinās, ka tie tiek ievēroti (Levitt and List 2007a) . Viens lielo datu aspekts, ko daudzi pētnieki uzskata par daudzsološu, ir tāds, ka dalībnieki parasti nezina, ka viņu dati tiek uztverti vai viņi ir tik pieraduši pie šīs datu vākšanas, ka vairs neietekmē viņu uzvedību. Tāpēc, ka dalībnieki ir nereaģējoši , tāpēc daudzus lielu datu avotus var izmantot, lai izpētītu uzvedību, kas iepriekš nav bijusi piemērota precīzam mērījumam. Piemēram, Stephens-Davidowitz (2014) izmantoja rasisma izteicienu izplatību meklēšanas vaicājumos, lai noteiktu rasu animusu dažādos Amerikas Savienoto Valstu reģionos. Neaktīvie un lielie (sk. 2.3.1. Iedaļu) raksturojošie meklēšanas datu iespējotie mērījumi, kurus būtu grūti izmantot, izmantojot citas metodes, piemēram, aptaujas.
Neatkarība tomēr nenodrošina, ka šie dati kaut kā tieši atspoguļo cilvēku uzvedību vai attieksmi. Piemēram, kā viens respondents intervē balstītajā pētījumā teica: "Man nav problēmu, es to vienkārši neiesniedzu Facebook" (Newman et al. 2011) . Citiem vārdiem sakot, pat ja daži lieli datu avoti ir nereaģējoši, tie ne vienmēr ir brīvi no sociālās vēlmes, bet arī tendence, ka cilvēki vēlas izteikties vislabākajā veidā. Turklāt, kā es vēlāk aprakstīšu nodaļā, lielos datu avotos uztverto uzvedību dažkārt ietekmē platformu īpašnieku mērķi, tādēļ es runāju par algoritmisko sajūsmu . Visbeidzot, lai gan reaktivitāte ir izdevīga pētījumiem, cilvēku uzvedības izsekošana bez viņu piekrišanas un izpratnes rada ētiskas bažas, kuras es sīki aprakstīšu 6. nodaļā.
Trīs īpašības, ko es tikko aprakstīju - lielas, pastāvīgas un nereaģējošas - parasti, bet ne vienmēr ir izdevīgas sociālajiem pētījumiem. Tālāk es pievērsīšos septiņiem lielu datu avotu īpašībām - nepilnīgiem, nepieejamiem, nereprezentatīviem, dreifējošiem, algoritmiski sajauktiem, netīriem un jutīgiem -, kas kopumā, bet ne vienmēr rada problēmas pētniecībai.