Mätning i stora datakällor är mycket mindre sannolikt att förändra beteendet.
En utmaning med social forskning är att människor kan ändra sitt beteende när de vet att de observeras av forskare. Sociala forskare kallar vanligtvis denna reaktivitet (Webb et al. 1966) . Till exempel kan människor vara mer generösa i laboratoriestudier än fältstudier eftersom de i det förra är mycket medvetna om att de följs (Levitt and List 2007a) . En aspekt av stora data som många forskare finner lovande är att deltagarna i allmänhet inte är medvetna om att deras data fångas eller de har blivit så vana vid denna datainsamling att det inte längre ändrar sitt beteende. Eftersom deltagarna är icke-reaktiva , kan många källor till stora data användas för att studera beteenden som inte varit föremål för noggrann mätning tidigare. Exempelvis Stephens-Davidowitz (2014) förekomsten av rasistiska termer i sökmotorfrågor för att mäta rasens animus i olika regioner i USA. Den icke-reaktiva och stora (se avsnitt 2.3.1) karaktären av de sökdataaktiverade mätningarna som skulle vara svåra att använda med andra metoder, såsom undersökningar.
Nonreaktivitet garanterar emellertid inte att dessa data på något sätt är en direkt återspegling av människors beteende eller attityder. Till exempel, som en respondent i en intervju-baserad studie sa: "Det är inte så att jag inte har problem, jag lägger dem inte på Facebook" (Newman et al. 2011) . Med andra ord, även om vissa stora datakällor är icke-reaktiva, är de inte alltid fria från socialt önskvärt bias, tendensen för att människor vill presentera sig på bästa möjliga sätt. Vidare, som jag kommer att beskriva senare i kapitlet, påverkas beteendet som fångas i stora datakällor ibland av målen för plattformsägare, ett problem som jag kallar algoritmisk confounding . Slutligen, även om icke-reaktivitet är fördelaktig för forskning, spårar folkets beteende utan sitt samtycke och medvetenhet upphov till etiska problem som jag kommer att beskriva i detalj i kapitel 6.
De tre egenskaper som jag just beskrivit-stora, alltid på och icke-reaktiva-är i allmänhet men inte alltid fördelaktiga för social forskning. Därefter vänder jag mig till de stora datakällans sju egenskaper - ofullständig, otillgänglig, icke-representativ, drivande, algoritmiskt förvirrad, smutsig och känslig - som generellt men inte alltid skapar problem för forskning.