Uvijek na velikim podataka omogućuje istraživanje neočekivanih događaja i mjerenja u realnom vremenu.
Mnogi veliki sustavi podataka su uvijek na; oni su stalno prikupljanje podataka. To je uvijek na svojstvo omogućuje istraživačima longitudinalnih podataka (tj podataka tijekom vremena). Biti uvijek na ima dvije važne implikacije za istraživanje.
Prvo, uvijek na prikupljanje podataka omogućuje istraživačima da proučavaju neočekivanim događajima na načine koji nisu bili mogući ranije. Na primjer, istraživači zainteresirani za proučavanje Occupy Gezi prosvjedima u Turskoj, u ljeto 2013. godine obično bi se usredotočiti na ponašanje prosvjednika tijekom događaja. Ceren Budak i Duncan Watts (2015) bili u mogućnosti učiniti više pomoću uvijek na prirodu Twitter na studij Twitter-pomoću prosvjednike prije, za vrijeme i nakon natjecanja. A, oni su bili u stanju stvoriti usporednoj skupini ne-sudionicima (ili sudionika koji nisu tweet o prosvjedu) prije, za vrijeme i nakon natjecanja (Slika 2.1). Ukupno je njihova naknadna ploča uključena tweetove 30.000 ljudi više od dvije godine. Povećavajući se obično koriste podatke iz protesta se s ovim drugim informacijama, Budak i Watts su mogli naučiti mnogo više: oni su bili u stanju procijeniti što vrste ljudi su više vjerojatno da će sudjelovati u Gezi prosvjedima i procjenu promjena u stavovima sudionici i ne-sudionicima, kako u kratkom roku (uspoređujući prethodno Gezi na vrijeme Gezi) i dugoročno (uspoređujući prethodno Gezi u post-Gezi).
Istina je da su neki od tih procjena mogla biti donesena bez uvijek na izvore prikupljanja podataka (npr dugoročne procjene promjene stava), iako je prikupljanje takvih podataka za 30.000 ljudi bi bili vrlo skupo. A, čak i daje neograničen proračun, ne mogu se sjetiti bilo koji drugi način da se u suštini omogućuje istraživačima da putuju natrag u vrijeme i neposredno promatrati sudionike ponašanje u prošlosti. Najbliže Alternativa bi bila da prikuplja retrospektivne izvješća o ponašanju, ali ta izvješća će biti ograničene preciznosti i upitne točnosti. Tablica 2.1 nudi i druge primjere studija koje koristite uvijek na izvoru podataka za proučavanje neočekivani događaj.
Neočekivani događaj | Uvijek se na podacima izvor | Citat |
---|---|---|
Occupy Gezi pokret u Turskoj | Cvrkut | Budak and Watts (2015) |
Kišobran prosvjedi u Hong Kongu | Zhang (2016) | |
Pucnjava u policiji u New Yorku | Stop-and-Frisk izvješća | Legewie (2016) |
Osoba pridružio ISIS | Cvrkut | Magdy, Darwish, and Weber (2016) |
11. rujna 2001 napada | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11. rujna 2001 napada | pager poruke | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Drugo, uvijek na prikupljanje podataka omogućuje istraživačima da proizvode u stvarnom vremenu mjerenja, što može biti važno u postavkama gdje kreatori politike žele ne samo učiti od postojećeg ponašanja, ali i odgovoriti na njega. Na primjer, društveni mediji podaci se mogu koristiti za usmjeravanje odgovora na prirodne katastrofe (Castillo 2016) .
U zaključku, uvijek na podacima sustavi omogućuju istraživačima da proučavaju neočekivanih događaja i pružiti podatke u stvarnom vremenu političarima. Nisam, međutim, predlaže da je uvijek na podacima sustavi omogućuju istraživačima za praćenje promjena tijekom dugog vremenskog razdoblja. To je zato što mnogi veliki sustavi podataka stalno se mijenjaju-procesu koji se zove nanos (odjeljak 2.3.2.4).