2.3.1.2 Always-on

Always-on Big Data ermöglicht die Untersuchung von unerwarteten Ereignissen und Echtzeitmessung.

Viele große Datensysteme sind immer-on; sie sammeln ständig Daten. Diese always-on Merkmal liefert den Forschern Längsschnittdaten (dh Daten über die Zeit). Always-on zu sein, hat zwei wichtige Implikationen für die Forschung.

Zunächst stets auf die Datenerfassung ermöglicht es Forschern, unerwartete Ereignisse in einer Weise zu studieren, die vorher nicht möglich waren. Zum Beispiel interessierte Forscher in der Gezi Proteste in der Türkei im Sommer 2013 würde der Schwerpunkt der Regel auf das Verhalten von Demonstranten während der Veranstaltung besetzen zu studieren. Ceren Budak und Duncan Watts (2015) waren in der Lage , mehr zu tun , indem Sie die stets auf die Natur von Twitter verwenden , bevor Twitter-mit Demonstranten zu studieren, während und nach der Veranstaltung. Und sie konnten eine Vergleichsgruppe von Nicht-Teilnehmern (oder Teilnehmer, die nicht über den Protest tweet haben) zu erstellen, vor, während und nach dem Ereignis (Abbildung 2.1). Insgesamt ihre Ex-post - Panel enthalten die Tweets von 30.000 Menschen mehr als zwei Jahren. Durch die Vermehrung viel mehr zu lernen, die häufig verwendeten Daten aus den Protesten mit dieser anderen Informationen, Budak und Watts konnten: sie waren in der Lage zu schätzen, welche Arten von Menschen in den Gezi Protesten teilnehmen wahrscheinlicher waren, und die Veränderungen in der Einstellung zur Abschätzung von Teilnehmer und Nichtteilnehmer, sowohl in der kurzfristigen und langfristigen (Vergleich pre-Gezi zu post-Gezi) (während Gezi pre-Gezi zu vergleichen).

Abbildung 2.1: Konstruktion, die von Budak und Watts (2015) das Besetzen Gezi Proteste in der Türkei im Sommer 2013 Durch den Einsatz der stets auf die Natur von Twitter zu untersuchen, schufen die Forscher, was sie eine Ex-post-Panel genannt, die über enthalten 30.000 Menschen mehr als zwei Jahren. Im Gegensatz dazu ist die typische Studie, die auf die Teilnehmer während der Proteste konzentriert, fügt der Ex-post-Panel 1) Daten von den Teilnehmern vor und nach der Veranstaltung und 2) Daten von Nicht-Teilnehmern vor, während und nach der Veranstaltung. Diese angereicherte Datenstruktur ermöglicht Budak und Watts zu schätzen, welche Arten von Menschen waren eher in den Gezi Protesten teilzunehmen und die Veränderungen in der Einstellung der Teilnehmer und Nichtteilnehmer, sowohl in der kurzfristigen (Vergleich pre-Gezi abzuschätzen während Gezi) und in der langfristigen (Vergleich pre-Gezi zu post-Gezi).

Abbildung 2.1: Konstruktion , die von Budak and Watts (2015) das Besetzen Gezi Proteste in der Türkei im Sommer 2013 Durch den Einsatz der stets auf die Natur von Twitter zu untersuchen, schufen die Forscher , was sie eine Ex-post - Panel genannt , die über enthalten 30.000 Menschen mehr als zwei Jahren. Im Gegensatz dazu ist die typische Studie, die auf die Teilnehmer während der Proteste konzentriert, fügt der Ex-post-Panel 1) Daten von den Teilnehmern vor und nach der Veranstaltung und 2) Daten von Nicht-Teilnehmern vor, während und nach der Veranstaltung. Diese angereicherte Datenstruktur ermöglicht Budak und Watts zu schätzen, welche Arten von Menschen waren eher in den Gezi Protesten teilzunehmen und die Veränderungen in der Einstellung der Teilnehmer und Nichtteilnehmer, sowohl in der kurzfristigen (Vergleich pre-Gezi abzuschätzen während Gezi) und in der langfristigen (Vergleich pre-Gezi zu post-Gezi).

Es ist wahr, dass einige dieser Schätzungen ohne stets auf die Datenerhebung Quellen (zB langfristige Schätzungen der Haltung ändern) gemacht worden sein könnte, obwohl eine solche Datensammlung für 30.000 Menschen recht teuer gewesen wäre. Und selbst ein unbegrenztes Budget gegeben, kann ich glaube , keine andere Methode , die im Wesentlichen die Forscher in die Zeit erlaubt zurück zu reisen und unmittelbar Teilnehmer Verhalten in der Vergangenheit zu beobachten. Die nächste Alternative wäre, retrospektive Berichte über das Verhalten sammeln, aber diese Berichte über begrenzte Granularität und fragwürdige Genauigkeit wäre. Tabelle 2.1 liefert weitere Beispiele für Studien, die eine Always-On-Datenquelle verwenden, um ein unerwartetes Ereignis zu studieren.

Tabelle 2.1: Studien von unerwarteten Ereignissen mit Always-on großen Datenquellen.
unerwartetes Ereignis Always-on-Datenquelle Zitat
Besetzen Gezi Bewegung in der Türkei zwitschern Budak and Watts (2015)
Regenschirm Proteste in Hongkong Weibo Zhang (2016)
Shootings der Polizei in New York City Stop-and-Frisk Berichte Legewie (2016)
Person Beitritt ISIS zwitschern Magdy, Darwish, and Weber (2016)
11. September 2001 Angriff livejournal.com Cohn, Mehl, and Pennebaker (2004)
11. September 2001 Angriff Pager-Nachrichten Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Zweitens, stets auf die Datenerfassung ermöglicht es Forschern, Echtzeitmessungen zu erzeugen, die in den Einstellungen von Bedeutung sein können, wo die politischen Entscheidungsträger wollen nicht nur aus bestehenden Verhalten lernen, sondern auch darauf reagieren. Zum Beispiel können Social - Media - Daten verwendet werden , um Antworten auf Naturkatastrophen zu führen (Castillo 2016) .

Abschließend ermöglichen stets auf Datensysteme Forscher unerwartete Ereignisse zu untersuchen und Informationen in Echtzeit an die politischen Entscheidungsträger liefern. Ich habe jedoch nicht schlagen vor, dass stets auf Datensysteme den Forschern ermöglichen, Veränderungen über längere Zeiträume zu verfolgen. Das ist , weil viele große Datensysteme verändern sich ständig-einen Prozess namens Drift (Abschnitt 2.3.2.4).