D'Mesure vun de groussen Datenquellen ass vill méi onwahrscheinlech fir Verhalen ze änneren.
Eng Erausfuerderung vun der sozialer Fuerschung ass datt d'Leit kënnen hir Verhalen änneren wann se wëssen datt se vun de Fuerscher observéiert ginn. Sozial Wëssenschaftler nennt all dës Reaktivitéit (Webb et al. 1966) . Zum Beispill kënnen d'Leit méi grouss sinn an de Labourstudien wéi Feldforschung, well an der fréierer si se bewosst, datt se observéiert ginn (Levitt and List 2007a) . Een Aspekt mat groussen Daten déi vill Fuerscher verspriechen sinn, dass d'Participanten normalerweis net bewosst ginn datt hir Donnéeën ageholl ginn oder se sou gewonnen gi sinn datt dës Datensammlung net méi verännert. Well d'Participanten netreaktiv sinn , ass och vill Quelle vu groussen Daten benotzt fir Studienverhalen ze benotzen, déi bis haut nach net präziséiert war. Zum Beispill huet d' Stephens-Davidowitz (2014) d'Prévalence vun de rassistesche Konditioune am Suchmaschinn gebraucht fir Rassegeschlecht an ënnerschiddlechen Regiounen vun den USA ze mellen. Déi netreaktiv a grousst (kuckt Abschnitt 2.3.1) Natur vun de Sich-Daten aktivéiert Miessungen, déi schwéier mat anere Methoden sinn, wéi zB Ëmfroen.
D'Netreaktivitéit erënnert awer net datt déi Daten irgendwie eng direkt Reflexioun vu Leitverhalen oder Attituden sinn. Zum Beispill, wéi een Interviewter bei enger Interviewbasisstudie gesot huet: "Et ass net datt ech kee Problem hunn, ech sinn net einfach op Facebook" (Newman et al. 2011) . An anere Wierder, och wa vill grouss Datenquellen netreaktiv sinn, sinn se net ëmmer frei vun der sozialer Wënschstabilitéit, ma d'Tendenz fir d'Leit op déi beschtméiglech Wee ze presentéieren. Weider, wéi ech spéider am Kapitel beschreift, ass d'Verhalensféierung an grousser Datenquelle sometimes duerch d'Ziler vun de Plattformer Proprietären betrëfft, eng Fro déi ech algorithmesch verwiesselt . Schlussendlech, obwuel d'Netreaktivitéit virgesinn ass fir d'Fuerschung ze maachen, verfolgt d'Verhalen vum Vollek ouni hir Zoustëmmung an d'Sensibilitéit erhéicht ethesch Bedenken, déi ech am Detail am Kapitel 6 beschreift.
Déi dräi Properties, déi ech just beschriwwen hunn, grouss, ëmmer op, an net reaktiv sinn, sinn allgemeng, awer net ëmmer, virdeeler fir Sozialversécherungen. Als nächst wäerte mir déi siwen Objete vu groussen Datenquellen hunn - onkomplett, net zougänglech, net repräsentativ, dréifend, algorithmesch verwiesselt, dreckeg an empfindlech sinn - déi allgemeng, awer net ëmmer, Problemer probéieren fir Recherchen ze maachen.