Meten is veel minder kans om gedrag in grote gegevensbronnen veranderen.
Een uitdaging van sociaal-wetenschappelijk onderzoek is dat mensen hun gedrag kunnen veranderen als ze weten dat ze worden geobserveerd door de onderzoekers. Sociale wetenschappers in het algemeen noemen dit gedrag te veranderen in reactie op de onderzoeker meting reactiviteit (Webb et al. 1966) . Een aspect van big data dat veel onderzoekers vinden veelbelovende is dat de deelnemers zijn over het algemeen niet van bewust dat hun gegevens worden vastgelegd of ze zijn zo gewend geraakt aan het verzamelen van gegevens dat het niet langer hun gedrag verandert worden. Omdat ze niet-reactief derhalve vele bronnen van grote data kunnen worden gebruikt om gedrag dat niet wijzigbaar nauwkeurige meting eerder is bestuderen. Bijvoorbeeld Stephens-Davidowitz (2014) gebruikte de prevalentie van racistische termen in de zoekmachine queries raciale animus in verschillende regio's van de Verenigde Staten te meten. De niet-reactieve en groot (zie vorige paragraaf) aard van zoekgegevens ingeschakeld metingen die moeilijk zou worden met behulp van andere methoden, zoals enquêtes.
Non-reactiviteit, echter niet garanderen dat deze gegevens zijn een of andere manier een directe afspiegeling van het gedrag of de houding van mensen. Bijvoorbeeld, als een respondent vertelde Newman et al. (2011) , "Het is niet dat ik geen problemen, ik ben gewoon niet te zetten op Facebook. Hebben" Met andere woorden, hoewel sommige grote gegevensbronnen zijn niet-reactief, ze zijn niet altijd vrij zijn van sociale wenselijkheid vertekening de tendens voor mensen om zich willen presenteren in de best mogelijke manier. Verder, zoals ik hieronder meer zal beschrijven, deze gegevens bronnen worden soms beïnvloed door de doelstellingen van het platform eigenaars, een probleem dat algoritmische verstorende (beschreven hieronder meer).
Hoewel de niet-reactiviteit is voordelig voor onderzoek, het volgen van het gedrag van mensen zonder hun toestemming en het bewustzijn verhoogt ethische bezwaren hieronder en in detail besproken in hoofdstuk 6. Een openbare verzet tegen verhoogde digitale surveillance kan leiden big data-systemen om meer reactieve loop van de tijd, en sterk bezorgdheid over digitale surveillance zou zelfs kunnen leiden dat sommige mensen proberen om volledig opt-out van big data-systemen, de toenemende bezorgdheid over niet-representativiteit (meer hieronder beschreven).
Deze drie goede eigenschappen van big data voor sociaal onderzoek-big, always-on, en niet-reactieve-algemeen ontstaan omdat deze gegevens bronnen werden niet gemaakt door onderzoekers voor onderzoek. Nu zal ik ingaan op de zeven eigenschappen van big data bronnen die slecht zijn voor het onderzoek. Deze kenmerken ook de neiging te ontstaan, omdat deze gegevens is niet gemaakt door onderzoekers voor onderzoek.