Die Messung ist viel weniger wahrscheinlich , dass das Verhalten in großen Datenquellen zu ändern.
Eine Herausforderung der Sozialforschung ist, dass die Menschen ihr Verhalten ändern können, wenn sie wissen, dass sie von den Forschern beobachtet werden. Sozialwissenschaftler nennen im Allgemeinen diese Verhaltensänderung als Reaktion auf Forscher Messung Reaktivität (Webb et al. 1966) . Ein Aspekt der großen Daten, die viele Forscher finden vielversprechend ist, dass die Teilnehmer in der Regel nicht bewusst, dass ihre Daten erfasst werden, oder sie haben sich so daran gewöhnt, diese Datensammlung, die es nicht mehr ihr Verhalten ändert. Weil sie nicht reaktiv sind, können daher viele Quellen von großen Daten verwendet werden , das Verhalten zu untersuchen, die zuvor auf eine genaue Messung nicht abänderbar war. Zum Beispiel, Stephens-Davidowitz (2014) verwendet , um die Verbreitung von rassistischen Begriffen in Suchmaschinen - Abfragen Rassen Animus in verschiedenen Regionen der Vereinigten Staaten zu messen. Die nicht-reaktiv und groß (siehe vorheriger Abschnitt) Art von Suchdaten Messungen ermöglicht, die nur schwer mit anderen Methoden wäre, wie Umfragen.
Nicht-Reaktivität jedoch nicht gewährleistet, dass diese Daten irgendwie eine direkte sind das Verhalten der Menschen oder Haltungen reflektieren von. Zum Beispiel, wie ein Befragter sagte Newman et al. (2011) : "Es ist nicht , dass ich Probleme nicht haben, ich bin sie auf Facebook einfach nicht setzen." Mit anderen Worten, auch wenn einige große Datenquellen sind nicht reaktiv, sie sind nicht immer frei von Soziale Erwünschtheit die Tendenz der Menschen, wollen sich auf die bestmögliche Art und Weise zu präsentieren. Ferner ist , wie ich weiter unten noch mehr beschreiben werden, werden diese Datenquellen manchmal von den Zielen der Plattform Besitzer betroffen, ein Problem algorithmischen verwirrende (mehr weiter unten beschrieben) genannt.
Obwohl nicht Reaktivität ist vorteilhaft für die Forschung, das Verhalten der Menschen ohne ihre Zustimmung und das Bewusstsein Tracking wirft ethische Bedenken unten und im Detail in Kapitel 6. Eine öffentliche Gegenreaktion gegen erhöhte digitale Überwachung könnten große Datensysteme zu werden reaktiveren im Laufe der Zeit führen, und eine starke Besorgnis über die digitale Überwachung könnten auch einige Menschen völlig zu opt-out von großen Datensysteme zu versuchen , führen die Sorgen um nicht Repräsentativität zu erhöhen (mehr unten beschrieben).
Diese drei guten Eigenschaften der großen Daten für Sozialforschung-big, always-on, und nicht reaktiv-Regel entstehen, weil diese Datenquellen nicht von den Forschern für die Forschung geschaffen wurden. Jetzt werde ich zu den sieben Eigenschaften von großen Datenquellen verwandeln, die für die Forschung schlecht sind. Diese Funktionen sind in der Regel auch entstehen, weil diese Daten nicht von den Forschern für die Forschung geschaffen.