Meting in groot data bronne is baie minder geneig om gedrag te verander.
Een uitdaging van sosiale navorsing is dat mense hul gedrag kan verander wanneer hulle weet dat hulle deur navorsers waargeneem word. Sosiale wetenskaplikes noem gewoonlik hierdie reaktiwiteit (Webb et al. 1966) . Byvoorbeeld, mense kan meer vrygewig wees in laboratoriumstudies as veldstudies, want in die eerste is hulle baie bewus daarvan dat hulle waargeneem word (Levitt and List 2007a) . Een aspek van groot data wat baie navorsers bevredigend vind, is dat deelnemers oor die algemeen nie bewus is dat hul data gevang word nie, of dat hulle so gewoond geraak het aan hierdie data-insameling dat dit nie meer hul gedrag verander nie. Omdat deelnemers niereaktief is nie , kan baie bronne van groot data gebruik word om gedrag te ondersoek wat voorheen nie aanleiding gegee het tot akkurate meting nie. Byvoorbeeld, Stephens-Davidowitz (2014) het die voorkoms van rassistiese terme in soekenjins gebruik om rasse-animus in verskillende streke van die Verenigde State te meet. Die nie-reaktiewe en groot (sien afdeling 2.3.1) aard van die soektog-geaktiveerde metings wat moeilik sou wees om ander metodes te gebruik, soos opnames.
Nie-reaktiwiteit verseker egter nie dat hierdie data op een of ander manier 'n direkte weerspieëling is van mense se gedrag of houdings nie. Byvoorbeeld, soos een respondent in 'n onderhoud-gebaseerde studie gesê het, "Dit is nie dat ek nie probleme het nie, ek plaas dit nie net op Facebook nie" (Newman et al. 2011) . Met ander woorde, selfs al is sommige groot databronne nie-reaktief, is hulle nie altyd vry van sosiale voorkeur nie, die neiging dat mense hulself op die beste moontlike manier wil aanbied. Verder, soos ek later in die hoofstuk beskryf, word die gedrag wat in groot databronne gevang word, soms beïnvloed deur die doelwitte van platform eienaars, 'n probleem wat ek algoritmiese verwarring sal noem. Ten slotte, hoewel nie-reaktiwiteit voordelig is vir navorsing, word mense se gedrag sonder hul toestemming en bewustheid gevoer, etiese kwessies wat ek in detail in hoofstuk 6 sal beskryf, verhoog.
Die drie eienskappe wat ek net beskryf het-groot, altyd-aan en nie-reaktief-is oor die algemeen, maar nie altyd voordelig vir sosiale navorsing nie. Vervolgens gaan ek na die sewe eienskappe van groot databronne - onvolledig, ontoeganklik, nie-verteenwoordigend, dryfend, algoritmies verward, vuil en sensitief - wat oor die algemeen maar nie altyd probleme skep vir navorsing nie.