2.3.1.3 Icke-reaktiv

Mätning är mycket mindre sannolikt att ändra beteende i stora datakällor.

En utmaning för social forskning är att människor kan ändra sitt beteende när de vet att de följs av forskare. Samhällsvetare kalla allmänhet detta beteende förändring som svar på forskarmätning reaktivitet (Webb et al. 1966) . En aspekt av stora data som många forskare att hitta lovande är att deltagarna i allmänhet är inte medvetna om att deras uppgifter fångas eller de har blivit så vana vid denna uppgiftsinsamling att det inte längre ändrar sitt beteende. Eftersom de är icke-reaktiva, därför, många källor till stora data kan användas för att studera beteende som inte har varit möjligt att ändra till korrekt mätning tidigare. Till exempel Stephens-Davidowitz (2014) använde förekomsten av rasistiska termer i sökmotorn frågor för att mäta ras Animus i olika regioner i USA. Den icke-reaktiva och stora (se föregående avsnitt) typ av sökdata aktiverade mätningar som skulle vara svårt att använda andra metoder, såsom undersökningar.

Icke-reaktivitet, dock inte garantera att dessa uppgifter på något sätt är en direkt reflektera över människors beteende eller attityder. Till exempel, som en respondent berättade Newman et al. (2011) , "Det är inte så att jag inte har problem, jag bara inte sätta dem på Facebook." Med andra ord, även om några stora datakällor är icke-reaktiva, de är inte alltid gratis social önskvärdhet partiskhet , tendensen för människor att vilja att presentera sig på bästa möjliga sätt. Vidare, som jag ska beskriva mer nedan, dessa datakällor ibland påverkas av målen för plattformsägarna, ett problem som kallas algoritmisk confounding (beskrivs mer nedan).

Även icke-reaktivitet är fördelaktig för forskning, spårning människors beteende utan deras samtycke och medvetenhet höjer etiska frågor diskuteras nedan och i detalj i kapitel 6. En offentlig motreaktion mot ökad digital övervakning kan leda stora datasystem att bli mer reaktiv med tiden, och stark oro digital övervakning kan även leda till att vissa människor att försöka välja bort stora datasystem helt, vilket ökar oron icke-representativt (beskrivs mer nedan).

Dessa tre goda egenskaper hos stora uppgifter för social forskning, stora, alltid-på, och icke-reaktiv i allmänhet uppstå eftersom dessa datakällor inte skapades av forskare för forskning. Nu ska jag vända sig till de sju egenskaperna hos stora datakällor som är dåligt för forskning. Dessa egenskaper tenderar också att uppstå på grund av dessa uppgifter inte skapades av forskare för forskning.