2.3.1.3 Non-reaktivni

Mjerenje je mnogo manje vjerojatno da će promijeniti ponašanje u velikim izvorima podataka.

Jedan od izazova društvenog istraživanja je da se ljudi mogu promijeniti svoje ponašanje kada znaju da ih poštuju od strane istraživača. Sociolozi općenito nazvati ovu promjenu ponašanja kao odgovor na mjerenja istraživač reaktivnosti (Webb et al. 1966) . Jedan aspekt velikog podataka da su mnogi istraživači smatraju obećavajuće je da sudionici u pravilu nisu svjesni da su njihovi podaci su zarobljeni ili su postali tako navikli na ovaj prikupljanja podataka koji se više ne mijenja svoje ponašanje. Budući da su ne-reaktivni, dakle, mnogi izvori velikih podataka mogu se koristiti za proučavanje ponašanja koje nije popravljiv za precizno mjerenje ranije. Na primjer, Stephens-Davidowitz (2014) koristi prevalenciju rasističkih izraza u upite tražilicu za mjerenje rasnu Animus u različitim dijelovima SAD-a. Ne-reaktivni i velik (vidi prethodni odjeljak) priroda podacima za pretraživanje omogućen mjerenja koje bi bilo teško pomoću drugih metoda, kao što su ankete.

Non-reaktivnost, međutim, ne bi se osiguralo da su ti podaci su nekako izravni odraz ponašanja ili stavova ljudi. Na primjer, kao jedan ispitanik je rekao Newman et al. (2011) , "Nije da nemam problema, ja samo ne stavljajući ih na Facebook-u." Drugim riječima, iako neki veliki izvori podataka nisu reaktivni, oni nisu uvijek bez Pristranost društvene poželjnosti , tendencija za ljude da se žele predstaviti na najbolji mogući način. Nadalje, kao što ću opisati još niže, ovi izvori podataka su ponekad utjecali ciljevima vlasnika platforme, problem se zove algoritamski zbunjivanje (opisano više u nastavku).

Iako ne-reaktivnosti je povoljan za istraživanje, praćenje ponašanja ljudi bez njihovog pristanka i svijesti podiže etičke zabrinutosti objašnjeno u nastavku, a detaljno u poglavlju 6. javnu reakciju protiv povećanog digitalnog nadzora mogao bi dovesti velike sustava podataka da se više reaktivni s vremenom i jaka briga o digitalnim nadzorom čak mogao dovesti neke ljude pokušati isključiti iz velikih sustava za obradu podataka u potpunosti, što povećava zabrinutost zbog ne-reprezentativnosti (više u nastavku je opisan).

Ove tri dobre osobine velikih podataka za društvena istraživanja-velika, uvijek na, i ne-reaktivni-uglavnom nastati, jer ti izvori podataka nisu stvoreni od strane istraživača za istraživanja. Sada ću se obratiti sedam svojstava velikih izvora podataka koji su štetni za istraživanje. Ove značajke također imaju tendenciju da se pojave, jer se ti podaci ne stvoren od strane istraživača za istraživanje.