Ëmmer-iwwert grouss Daten erméiglecht der Etude vun onerwaart Événementer an real-Zäit Miessung.
Vill grouss Daten Systemer sinn ëmmer-iwwert; si sammelt konstant Daten. Dëst ëmmer-iwwert charakteristesche stellt Fuerscher mat longitudinal Donnéeën (dh, Donnéeën iwwer Zäit). ëmmer-iwwert ginn huet zwou wichteg Donnéeën fir Fuerschung.
Éischtens, ëmmer op Datensammlung erméiglecht d'Fuerscher onerwaart Aktiounen un Weeër ze studéieren déi soss net méiglech sinn. Zum Beispill, Fuerscher déi un der Studie vun den Occupy Gezi Proteste an der Türkei am Summer 2013 studéiere wëllen normalerweis d'Oppositioun vun Demonstranten während der Manifestatioun konzentréieren. Ceren Budak an Duncan Watts (2015) konnten méi maachen, andeems se d'ëmmer op der Natur vum Twitter benotzen fir Studenten ze studéieren déi Twitter viru, während an no der Manifestatioun benotzt hunn. An, sie konnten eng Vergréisserungsgrupp vun Nullpartner hunn, virun an no der Manifestatioun (2.2). Am Ganzen hunn d' Ex-Post-Panel d'Tweets vun 30.000 Leit iwwer zwee Joer. Duerch d'Vergaangenheet vun den allgemengen benotzt Daten aus de Protester mat dësen aner Informatiounen konnte Budak a Watts vill méi léieren: si konnten geschätzten, wéi vill Leit méi e wahrscheinlech bei de Gezi-Proteste matmaachen an d'Verännerunge vun der Astellung vun Participanten an onpartizipanten, souwuel am kuerze Begrëff (de Pre Gezi fir Gezi) a laangfristeg (de Pre Gezi mat Post Gezi).
Eng Skeptiker kënnen weisen, datt verschidde vun dëse Schätzungen ouni ëmmer op Datenquellenquellen gemaach hunn (z. B. laangfristeg Schätzung vun der Haltung änneren), an dat ass richteg, obwuel dës Datensammlung fir 30.000 Mënsche ganz deier. Och mat engem onlimitéierten Budget kann ech awer keng aner Methode denken, datt d'Fuerscher erlaabt an der Zäit erëm ze reesen an direkt an de Verglach vun den Participanten ze observéieren an der Vergaangenheet. Déi nächst Alternativ wäerte retrospectéiert Rapport vum Verhalen gesammelt ginn, awer dës Berichte wäerten vun enger limitéierter Granularitéit an der frëndlecher Genauegkeet sinn. D'Tabelle 2.1 liwwert aner Beispiller vu Studien déi eng ëmmer-on Datenquelle benotzt fir eng onerwaart Event ze studéieren.
Unexpected Event | Always-on Datenquelle | Citation |
---|---|---|
Occasioun Gezi Bewegung an der Türkei | Budak and Watts (2015) | |
Regenschirm protestéiert an Hong Kong | Zhang (2016) | |
Polizisten vun Police zu New York City | Stop-a-frisk Reportagen | Legewie (2016) |
Persoun ronderëm ISIS | Magdy, Darwish, and Weber (2016) | |
11. September 2001 attackéiert | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11. September 2001 attackéiert | Pager Message | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Zousätzlech zu onerwaarten Evenementer ze studéieren, ëmmer op grouss Dateschutzsystemer erméiglechen et och Forscher fir Echtzäit Schätzungen ze produzéieren, wat wichteg sinn an Astellungen, wou Politiker an der Regierung oder der Industrie wëllen op Basis vun der situatorescher Bewosstsinn reagéieren. Zum Beispill sozialen Datebank kënne benotzt ginn fir d'Noutfallreaktioun op Naturkatastrophen (Castillo 2016) an eng Rei vun verschiddenen groussen Datenquellen ze produzéieren kënnen produzéieren Echtzäit Schätzungen vun der wirtschaftlecher Aktivitéit (Choi and Varian 2012) .
Schlussendlech sinn ëmmer Datenbootsysteme fir Fuerscher et onerwaart Eventer ze studéieren an ze informéieren Echtzäit fir politesch Entscheedunge. Ech mengen awer net, datt ëmmer Daten op Systemer suivéiert sinn fir d'Verännerunge vu ganz laang Zäit ze verfolgen. Dat ass well vill grouss Daten Systemer konstant sinn Zaïtgeescht-engem Prozess, dass ech am Kapitel (Rubrik 2.3.7) spéider sech Opruff wäert.