2.3.1.2 alati sees

Alati on suur andmed võimaldavad uuringu ootamatud sündmused ja reaalajas mõõtmiseks.

Paljud suured infosüsteemid on alati sees; nad on pidevalt andmete kogumisel. See alati-omadus annab teadlastele kestevandmetest (st andmete ajas). Olles alati-on kaks olulist mõju uuringuid.

Esiteks, alati-andmekogumise võimaldab teadlastel uurida ootamatute sündmuste viisil, mis ei olnud võimalik varem. Näiteks teadlased huvitatud õppimisest Occupy Gezi protestid Türgi 2013. aasta suveks on tavaliselt keskenduda käitumist protestijate sündmuse ajal. Ceren Budak ja Duncan Watts (2015) suutsid teha rohkem abil alati-iseloom Twitter õppida Twitter tarbivate meeleavaldajad enne, selle ajal ja pärast üritust. Ja nad suutsid luua võrdlus rühma mitteosalejad (või osalejad, kes ei piiksuma umbes protesti) enne, selle ajal ja pärast üritust (joonis 2.1). Kokku oma tagantjärele paneel sisaldas tweets 30000 inimest üle kahe aasta. Autor täiendada levinud andmeid protestid selle muu teave, Budak ja Watts suutsid õppida palju: nad suutsid hinnata, milliseid inimesi olid suurema tõenäosusega osaleda Gezi proteste ja hinnata muutusi hoiakutes osalejad ja mitte-osalejad, nii lühiajaliste (võrreldes eelnevalt Gezi et ajal Gezi) ja pikaajaline (võrreldes eelnevalt Gezi post-Gezi).

Joonis 2.1: Design kasutada Budak ja Watts (2015) uurida Occupy Gezi protestid Türgi suvel 2013. Kasutades alati-iseloom Twitter teadlased loonud, mida nad kutsusid tagantjärele paneel, mis sisaldas umbes 30.000 inimest rohkem kui kaks aastat. Erinevalt tüüpiline uuring, mis keskendus osalejate protestide tagantjärele paneel lisab 1) andmeid osalejaid enne ja pärast sündmust ja 2) andmeid mitteosalejad enne, selle ajal ja pärast üritust. See rikastatud andmestruktuur lubatud Budak ja Watts, et hinnata, milliseid inimesi olid suurema tõenäosusega osaleda Gezi proteste ja hinnata muutusi suhtumises osalejate ja mitte-osalejad, nii lühiajaliste (võrreldes eelnevalt Gezi et ajal Gezi) ja pikaajaline (võrreldes eelnevalt Gezi post-Gezi).

Joonis 2.1: Design kasutada Budak and Watts (2015) uurida Occupy Gezi protestid Türgi suvel 2013. Kasutades alati-iseloom Twitter teadlased loonud, mida nad kutsusid tagantjärele paneel, mis sisaldas umbes 30.000 inimest rohkem kui kaks aastat. Erinevalt tüüpiline uuring, mis keskendus osalejate protestide tagantjärele paneel lisab 1) andmeid osalejaid enne ja pärast sündmust ja 2) andmeid mitteosalejad enne, selle ajal ja pärast üritust. See rikastatud andmestruktuur lubatud Budak ja Watts, et hinnata, milliseid inimesi olid suurema tõenäosusega osaleda Gezi proteste ja hinnata muutusi suhtumises osalejate ja mitte-osalejad, nii lühiajaliste (võrreldes eelnevalt Gezi et ajal Gezi) ja pikaajaline (võrreldes eelnevalt Gezi post-Gezi).

On tõsi, et mõned neist hinnangutest oleks tehtud ilma alati-andmekogumise allikaid (nt pikaajalised prognoosid suhtumine muutus), kuigi selline andmete kogumine 30.000 inimest oleks olnud üsna kallis. Ja isegi antud piiramatu eelarve, ma ei saa mõelda muul meetodil, mis sisuliselt võimaldab teadlastel reisida ajas tagasi ja vahetult jälgida osalejate käitumist minevikus. Lähim võimalus oleks koguda tagasiulatuva teateid käitumist, kuid need aruanded oleks piiratud detailsust ja küsitav täpsust. Tabel 2.1 annab teisi näiteid uuringuid, mis kasutavad alati-andmeallika õppima ootamatu sündmus.

Tabel 2.1: Studies ootamatute sündmuste kasutades alati-big allikatele.
ootamatu sündmus Alati andmete allikas Viide
Occupy Gezi liikumine Türgis puperdama Budak and Watts (2015)
Umbrella proteste Hong Kong Weibo Zhang (2016)
Tulistamine politsei New Yorgis Stopp-ja-Frisk aruanded Legewie (2016)
Isik liitumist ISIS puperdama Magdy, Darwish, and Weber (2016)
11. september 2001 rünnak livejournal.com Cohn, Mehl, and Pennebaker (2004)
11. september 2001 rünnak piipari sõnumid Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Teiseks, alati-andmekogumise võimaldab teadlastel toota reaalajas mõõtmised, mis võib olla oluline tingimustes, kus poliitikakujundajad taha mitte ainult õppida senistest käitumist, vaid ka sellele reageerida. Näiteks sotsiaalmeedia andmetele saab suunata vastuseid loodusõnnetused (Castillo 2016) .

Kokkuvõtteks võib öelda, alati-infosüsteemid võimaldavad teadlastel uurida ootamatud sündmused ja pakkuda reaalajas teavet poliitikakujundajatele. Ma ei ole siiski ettepaneku, et alati-infosüsteemid võimaldavad teadlastel jälgida muutusi üle pika aja. Seda seetõttu, et paljud suured infosüsteemid muutuvad pidevalt, seda protsessi nimetatakse triiv (§ 2.3.2.4).