2.3.1.2 Uvijek na

Uvijek na velikim podataka omogućava proučavanje neočekivanih događaja i mjerenje u realnom vremenu.

Mnogi velike sisteme podaci su uvijek na; oni su stalno prikupljanje podataka. To uvijek na karakterističnim pruža istraživačima sa uzdužnim podacima (tj, podaci tokom vremena). Biti uvijek na ima dvije važne implikacije za istraživanje.

Prvo, uvijek na prikupljanje podataka omogućava istraživačima da proučavaju neočekivanih događaja na načine koji nisu bili mogući ranije. Na primjer, istraživači zainteresirani za proučavanje Occupy Gezi protesta u Turskoj u ljeto 2013. godine bi se obično fokusiraju na ponašanje demonstranata tokom događaja. Ceren Budak i Duncan Watts (2015) bili su u stanju da učine više koristeći uvijek na prirodu Twitter za proučavanje Twitter-pomoću demonstranata prije, za vrijeme i nakon događaja. I, oni su bili u stanju da stvori poređenje grupa ne-učesnika (ili učesnika koji nisu tweet o protestu) prije, za vrijeme i nakon događaja (Slika 2.1). Ukupno njihova ex-post panel uključuju tweetove od 30.000 ljudi više od dvije godine. Do povećavanje najčešće koristi podatke iz protesta sa ovim drugim informacijama, Budak i Watts mogli naučiti mnogo više: oni su bili u stanju procijeniti kakve su ljudi češće da učestvuju u Gezi protestima i procijeniti promjene u stavovima učesnika i ne-učesnika, kako u kratkom roku (u odnosu prethodno Gezi u toku Gezi) i dugoročno (u odnosu prethodno Gezi u post-Gezi).

Slika 2.1: Design koriste Budak i Watts (2015) da prouči Occupy Gezi protesta u Turskoj u ljeto 2013. godine koristi uvijek-na prirodu Twitter, istraživači su stvorili ono što su nazvali ex-post panela koja je uključivala oko 30.000 ljudi više od dvije godine. Za razliku od tipičnih studija koja se bavila učesnici tokom protesta, ex-post panel dodaje 1) Podaci iz učesnicima prije i poslije događaja i 2) podaci iz ne-učesnika prije, za vrijeme i nakon događaja. Ovo obogaćenog struktura podataka omogućen Budak i Watts procijeniti kakve su ljudi češće da učestvuju u Gezi protestima i za procjenu promjena u stavovima sudionika i ne-učesnika, kako u kratkom roku (u odnosu prethodno Gezi u toku Gezi) i dugoročno (u odnosu prethodno Gezi u post-Gezi).

Slika 2.1: Design koriste Budak and Watts (2015) da prouči Occupy Gezi protesta u Turskoj u ljeto 2013. godine koristi uvijek-na prirodu Twitter, istraživači su stvorili ono što su nazvali ex-post panela koja je uključivala oko 30.000 ljudi više od dvije godine. Za razliku od tipičnih studija koja se bavila učesnici tokom protesta, ex-post panel dodaje 1) Podaci iz učesnicima prije i poslije događaja i 2) podaci iz ne-učesnika prije, za vrijeme i nakon događaja. Ovo obogaćenog struktura podataka omogućen Budak i Watts procijeniti kakve su ljudi češće da učestvuju u Gezi protestima i za procjenu promjena u stavovima sudionika i ne-učesnika, kako u kratkom roku (u odnosu prethodno Gezi u toku Gezi) i dugoročno (u odnosu prethodno Gezi u post-Gezi).

Istina je da su neki od ovih procjena mogla biti napravljen bez uvijek na izvore prikupljanja podataka (npr dugoročne procjene promjena stava), iako prikupljanje takvih podataka za 30.000 ljudi bi bilo prilično skupo. A, čak i dati neograničen budžet, ne mogu da se setim bilo koji drugi način koji u osnovi omogućava istraživačima da putuju natrag u vrijeme i neposredno posmatrati ponašanje učesnika u prošlosti. Najbliži alternativa bi bila da se prikupe retrospektivna izvještaje ponašanja, ali ovi izvještaji će biti ograničenog granulaciju i upitna preciznost. Tabela 2.1 daje druge primjere studija koje koriste uvijek na izvor podataka za proučavanje neočekivani događaj.

Tabela 2.1: Studije neočekivanih događaja koristeći uvijek na velikim izvorima podataka.
neočekivani događaj Uvijek na izvor podataka citiranje
Occupy Gezi pokret u Turskoj cvrkut Budak and Watts (2015)
Umbrella protesti u Hong Kongu Weibo Zhang (2016)
Pucnjave policije u New Yorku Stop-and-Frisk izvještaja Legewie (2016)
Osoba spajanje ISIS cvrkut Magdy, Darwish, and Weber (2016)
11 Sep 2001 napad livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 Sep 2001 napad pager poruka Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Drugo, uvijek na prikupljanje podataka omogućava istraživačima da proizvedu mjerenja u realnom vremenu, što može biti važno u postavkama gdje kreatori politike žele da ne samo učiti od postojećeg ponašanja, ali i odgovoriti na to. Na primjer, društvenih medija podaci mogu se koristiti za usmjeravanje odgovora na prirodne katastrofe (Castillo 2016) .

U zaključku, uvijek na podacima sistemi omogućavaju istraživačima da proučavaju neočekivanih događaja i pružaju informacije u realnom vremenu za kreatore politike. Nisam, međutim, predlaže da je uvijek na podacima sistemi omogućavaju istraživačima da prate promjene kroz duži vremenski period. To je zbog toga što mnoge velike sisteme podaci se stalno mijenjaju-proces koji se zove drift (Odjeljak 2.3.2.4).