2.3.2.4 Driften

Bevölkerung Drift, Nutzung Drift und Drift - System machen es schwer , große Datenquelle verwendet werden langfristige Trends zu studieren.

Einer der großen Vorteile von vielen großen Datenquellen sind, dass sie Daten im Laufe der Zeit sammeln. Sozialwissenschaftler nennen diese Art von über Zeitdaten, Langzeitdaten. Und natürlich sind Längs Daten sehr wichtig für den Wandel zu studieren. Um jedoch sicher zu Veränderung zu messen, das Messsystem selbst muss stabil sein. In den Worten des Soziologen Otis Dudley Duncan, "wenn Sie wollen Veränderung zu messen, nicht die Maßnahme ändern" (Fischer 2011) .

Leider sind viele große Datensysteme-insbesondere Business - System , die Erstellung und Erfassung digitaler Spuren-ändern sich die ganze Zeit, ein Prozess, den ich Drift nennen werde. Insbesondere ändern sich diese Systeme auf drei Arten: Bevölkerung Drift (Veränderung wer sie nutzt), Verhaltens Drift (Veränderung , wie die Menschen sie verwenden) und Systemdrift (Änderung im System selbst). Die drei Quellen der Drift bedeuten, dass jedes Muster in der digitalen Trace-Daten durch eine wichtige Veränderung in der Welt verursacht werden könnten, oder es könnte durch irgendeine Form von Drift verursacht werden.

Die erste Quelle der Drift-Bevölkerung drift ist, die das System verwendet, und dies ändert sich auf Langzeitskalen und Kurzzeitskalen. Zum Beispiel aus dem Jahr 2008 präsentieren das Durchschnittsalter der Menschen auf Social Media zugenommen hat. Neben diesen langfristigen Trends, variiert die Menschen ein System zu jedem Zeitpunkt verwendet wird. Während der US - Präsidentenwahl von 2012 zum Beispiel der Anteil von Tweets über die Politik, die von Frauen geschrieben wurden , schwankte von Tag zu Tag (Diaz et al. 2016) . So was könnte scheinen, eine Änderung in der Stimmung der Twitter-Vers eigentlich nur sein könnte zu sein, Änderungen in die in jedem Moment spricht.

Zusätzlich zu den Veränderungen in die ein System verwendet, gibt es auch Veränderungen in, wie das System verwendet wird. Zum Beispiel während der Occupy Gezi Park Proteste in Istanbul, Türkei 2013 Demonstranten ihre Verwendung von Hashtags wie der Protest entwickelte sich verändert. Hier ist , wie Zeynep Tüfekçi (2014) die Drift beschrieben, die sie in der Lage war zu erkennen , weil sie das Verhalten auf Twitter und auf dem Boden beobachtet wurde:

"Was war geschehen? Dass, sobald der Protest wurde die dominierende Geschichte, eine große Zahl von Menschen. . . verzichteten die Hashtags außer Aufmerksamkeit auf ein neues Phänomen zu ziehen. . .. Während die Proteste fortgesetzt und sogar intensiviert, starben die Hashtags nach unten. Interviews ergab zwei Gründe. Zunächst einmal jeder das Thema wusste, war der Hashtag auf einmal überflüssig und verschwenderisch auf den Charakter begrenzte Twitter-Plattform. Zweitens Hashtags wurden nur als nützlich betrachtet die Aufmerksamkeit auf ein bestimmtes Thema für die Anziehung, nicht darüber zu reden. "

So Forscher, die die Proteste studierten von Tweets mit Protest im Zusammenhang mit Hashtags Analyse würde ein verzerrtes Sinn dessen, was wegen dieser Verhaltens Drift geschah. Zum Beispiel könnten sie glauben, dass die Diskussion über den Protest lange verringert, bevor es tatsächlich verringert.

Die dritte Art von Drift ist Systemdrift. In diesem Fall ist es nicht die Menschen ändern oder ihr Verhalten ändern, aber das System selbst zu verändern. Beispielsweise im Laufe der Zeit hat Face die Grenze für die Länge der Statusaktualisierungen erhöht. Somit wird jede Längsschnittstudie von Status-Updates sein anfällig für Artefakte, die durch diese Änderung verursacht. System-Drift ist eng verwandt mit Problem genannt algorithmischen verwirrende, auf die wir uns jetzt zuwenden.