Uvijek na velikim podataka omogućava proučavanje neočekivanih događaja i mjerenje u realnom vremenu.
Mnogi velike sisteme podaci su uvijek na; oni su stalno prikupljanje podataka. To uvijek na karakterističnim pruža istraživačima sa uzdužnim podacima (tj, podaci tokom vremena). Biti uvijek na ima dvije važne implikacije za istraživanje.
Prvo, uvijek na prikupljanje podataka omogućava istraživačima da proučavaju neočekivanih događaja na načine koji nisu bili mogući ranije. Na primjer, istraživači zainteresirani za proučavanje Occupy Gezi protesta u Turskoj u ljeto 2013. godine bi se obično fokusiraju na ponašanje demonstranata tokom događaja. Ceren Budak i Duncan Watts (2015) bili su u stanju da učine više koristeći uvijek na prirodu Twitter za proučavanje Twitter-pomoću demonstranata prije, za vrijeme i nakon događaja. I, oni su bili u stanju da stvori poređenje grupa ne-učesnika (ili učesnika koji nisu tweet o protestu) prije, za vrijeme i nakon događaja (Slika 2.1). Ukupno njihova ex-post panel uključuju tweetove od 30.000 ljudi više od dvije godine. Do povećavanje najčešće koristi podatke iz protesta sa ovim drugim informacijama, Budak i Watts mogli naučiti mnogo više: oni su bili u stanju procijeniti kakve su ljudi češće da učestvuju u Gezi protestima i procijeniti promjene u stavovima učesnika i ne-učesnika, kako u kratkom roku (u odnosu prethodno Gezi u toku Gezi) i dugoročno (u odnosu prethodno Gezi u post-Gezi).
Istina je da su neki od ovih procjena mogla biti napravljen bez uvijek na izvore prikupljanja podataka (npr dugoročne procjene promjena stava), iako prikupljanje takvih podataka za 30.000 ljudi bi bilo prilično skupo. A, čak i dati neograničen budžet, ne mogu da se setim bilo koji drugi način koji u osnovi omogućava istraživačima da putuju natrag u vrijeme i neposredno posmatrati ponašanje učesnika u prošlosti. Najbliži alternativa bi bila da se prikupe retrospektivna izvještaje ponašanja, ali ovi izvještaji će biti ograničenog granulaciju i upitna preciznost. Tabela 2.1 daje druge primjere studija koje koriste uvijek na izvor podataka za proučavanje neočekivani događaj.
neočekivani događaj | Uvijek na izvor podataka | citiranje |
---|---|---|
Occupy Gezi pokret u Turskoj | cvrkut | Budak and Watts (2015) |
Umbrella protesti u Hong Kongu | Zhang (2016) | |
Pucnjave policije u New Yorku | Stop-and-Frisk izvještaja | Legewie (2016) |
Osoba spajanje ISIS | cvrkut | Magdy, Darwish, and Weber (2016) |
11 Sep 2001 napad | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11 Sep 2001 napad | pager poruka | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Drugo, uvijek na prikupljanje podataka omogućava istraživačima da proizvedu mjerenja u realnom vremenu, što može biti važno u postavkama gdje kreatori politike žele da ne samo učiti od postojećeg ponašanja, ali i odgovoriti na to. Na primjer, društvenih medija podaci mogu se koristiti za usmjeravanje odgovora na prirodne katastrofe (Castillo 2016) .
U zaključku, uvijek na podacima sistemi omogućavaju istraživačima da proučavaju neočekivanih događaja i pružaju informacije u realnom vremenu za kreatore politike. Nisam, međutim, predlaže da je uvijek na podacima sistemi omogućavaju istraživačima da prate promjene kroz duži vremenski period. To je zbog toga što mnoge velike sisteme podaci se stalno mijenjaju-proces koji se zove drift (Odjeljak 2.3.2.4).