2.3.1.3 Ikke-reaktiv

Måling er langt mindre tilbøjelige til at ændre adfærden i store datakilder.

En udfordring af social forskning er, at folk kan ændre deres adfærd, når de ved, at de bliver observeret af forskere. Samfundsforskere generelt kalder denne adfærdsændring som reaktion på forsker måling reaktivitet (Webb et al. 1966) . Et aspekt af big data, som mange forsker finde lovende er, at deltagerne er generelt ikke klar over, at deres data bliver fanget, eller de er blevet så vant til denne dataindsamling, at det ikke længere ændrer deres adfærd. Fordi de er ikke-reaktive derfor mange kilder til store data kan anvendes til at studere adfærd, der har ikke været amendable til nøjagtig måling tidligere. For eksempel Stephens-Davidowitz (2014) brugte forekomsten af racistiske udtryk i søgemaskine forespørgsler til at måle race animus i forskellige regioner i USA. Den ikke-reaktive og store (se tidligere afsnit) arten af ​​søgedata aktiveret målinger som vil være vanskelige at anvende andre metoder, såsom undersøgelser.

Ikke-reaktivitet, dog ikke sikre, at disse data er en eller anden måde en direkte reflektere over folks adfærd eller holdninger. For eksempel som en af de adspurgte fortalte Newman et al. (2011) , "Det er ikke, at jeg ikke har problemer, jeg bare ikke sætte dem på Facebook." Med andre ord, selv om nogle store datakilder er ikke-reaktive, de ikke altid er fri for social ønskelige forudindtagethed tendensen for folk at ønsker at præsentere sig selv på den bedst mulige måde. Endvidere, som jeg vil beskrive mere nedenfor, disse datakilder undertiden påvirket af målene for platform ejere, et problem kaldet algoritmisk confounding (beskrevet mere nedenfor).

Selv ikke-reaktivitet er fordelagtig for forskning, sporing folks adfærd uden deres samtykke og bevidsthed rejser etiske betænkeligheder diskuteret nedenfor og i detaljer i kapitel 6. En offentlig modreaktion mod øget digital overvågning kunne føre store datasystemer til at blive mere reaktivt over tid, og stærk bekymring over digital overvågning kan endda føre nogle mennesker til at forsøge at fravælge store datasystemer helt, stigende bekymring ikke-repræsentativitet (beskrevet mere nedenfor).

Disse tre gode egenskaber af store data til social forskning-store, altid-on, og ikke-reaktivt-generelt opstår, fordi disse datakilder ikke blev skabt af forskere til forskning. Nu vil jeg gå over til de syv egenskaber af store datakilder, der er dårligt for forskning. Disse funktioner også en tendens til at opstå, fordi disse data ikke blev skabt af forskere til forskning.