Beti-orrian datuak big ustekabeko gertaerak eta denbora errealeko neurketa aztertu ahal.
Big datuak sistema asko daude beti-on; dute datuak etengabe jasotzen ari. beti-on Ezaugarri hori datu luzetarako dituzten ikertzaileei eskaintzen da (hau da, datuak denboran zehar). beti-on izatea ikerketarako bi inplikazio garrantzitsuak ditu.
Lehenik eta behin, datuen bilketarako beti aukera ematen du ikertzaileek ustekabeko gertaerak ikertzeko, bestela ezingo luketen moduan. Adibidez, Turkiako Occupy Gezi protestak 2013ko udan aztertzeko interesa duten ikertzaileek normalean ekitaldian protestanteen jokabidea izango lukete. Ceren Budakek eta Duncan Watts-ek (2015) gehiago egin ahal izan zuten Twitterren izaera beti erabiltzen dutenak, aurretik, zehar eta ondorengoak Twitter erabiltzen zituztenak. Eta parte-hartzaileen arteko konparazio-talde bat sortu ahal izan zuten gertaera baino lehen, zehar eta ondoren (2.2. Irudia). Guztira, 30 hilabete baino gehiagoko tweetek ex-post panelek bi urte baino gehiago daramatzate. Protokoloek beste informazio horrekin erabilitako datuak handituz gero, Budak eta Watts-ek askoz ere gehiago ikasi ahal izan zuten: Gezi-ren protestak zein motatakoak izan ziren eta norberaren jarreretan aldaketak kalkulatzeko gai ziren. parte-hartzaileak eta parte-hartzaileak, bai epe laburrean (pre-Gezi Gezi zehar alderatuz) eta epe luzera (pre-Gezi post Gezi alderatuz).
Eszeptiko batek esaten duenez, estimazio horietako batzuk beti izan daitezke datuen bilketa-iturririk gabe (adibidez, jarrera aldaketaren epe luzerako kalkuluak), eta hori zuzena da, 30.000 lagunentzako datu-bilketa hori nahiko nahiko garestia. Nahiz eta aurrekontu mugagabea eman, ordea, ezin dut inolaz ere inolaz ere beste ikertzaile batzuek , denboran zehar bidaiatzeko eta zuzenean parte hartzaileen portaera behatzeko. Bestalde, portaera atzera begirakoaren txostenak biltzea nahiago izango litzateke, baina txosten horiek oso kopuru txikia eta zalantzazko zehaztasuna izango lirateke. 2.1 taulan datu esperimental bat erabiltzen duten ikasketen beste adibide batzuk eskaintzen dira ustekabeko gertaera ikertzera.
Ustekabeko gertaera | Beti datu-iturburuan | Citation |
---|---|---|
Okupatzen Gezi mugimendua Turkian | Budak and Watts (2015) | |
Hong Kongeko parke protestak | Zhang (2016) | |
Poliziak New Yorken | Gelditu eta freskoa txostenak | Legewie (2016) |
ISISen sartuko pertsona | Magdy, Darwish, and Weber (2016) | |
2001eko irailaren 11n erasoa | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
2001eko irailaren 11n erasoa | Pager mezuak | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Ustekabeko gertaerak aztertzeaz gain, beti ere datu-sistema handiek ere denbora errealean kalkulatzeko aukera ematen diete ikertzaileek, zeinek garrantzi handikoak izan daitezkeen erabakiak hartzerakoan, gobernuek edo industria-sektoreek egoera kontzientzian oinarritutako erantzuna eman nahi baitute. Adibidez, gizarte-komunikabideen datuak hondamendi naturalen larrialdi-erantzunari (Castillo 2016) gidatzeko erabil daitezke eta hainbat datu-iturri desberdin erabil daitezke jarduera ekonomikoan denbora errealean kalkulatzeko (Choi and Varian 2012) .
Azkenean, beti datu-sistemek ikertzaileek ustekabeko gertaerak ikasi eta denbora errealean informazioa ematen diete arduradunei. Hala eta guztiz ere, ez dut uste beti datu-sistemek oso egokiak direla denbora tarte osoetan aldaketak jarraitzeko. Hori dela eta, datu sistema handiak etengabe aldatzen ari dira (kapituluko kapituluan aurrerantzean deitzen diegun prozesua (2.3.7 atala).