Visada ant didelių duomenų leidžia netikėtų įvykių ir realaus laiko matavimo tyrimą.
Daugelis didelių duomenų sistemos yra visada ant; jie nuolat rinkti duomenis. Tai visada ant savybė suteikia tyrėjams išilginio pjūvio duomenų (ty duomenų laike). Būdamas visada ant yra du svarbių pasekmių tyrimus.
Pirma, visada ant duomenų rinkimas leidžia mokslininkams tirti netikėtų įvykių tokiais būdais, kurie nebuvo įmanoma anksčiau. Pavyzdžiui, mokslininkai, besidomintys studijuoja Užima Gezi protestus Turkijoje 2013 metų vasarą būtų paprastai sutelkti dėmesį į protestuotojų elgesį įvykio metu. Ceren Budak ir Duncanas W (2015) galėjo padaryti daugiau naudojant visada ant pobūdį Twitter prieš studijuoti Twitter per protestuotojų, per ir po renginio. Ir jie sugebėjo sukurti palyginimo grupę ne dalyvių (arba dalyviai, kurie nebuvo Čivināšana apie protesto) prieš, per ir po renginio (2.1 pav.) Iš viso jų ex post pultas įtrauktas 30.000 žmonių tweets daugiau kaip dvejus metus. Iki plėsti dažniausiai naudojamas duomenis iš protestų su šiuo kita informacija, Budak ir vatai galėjo išmokti daug daugiau: jie galėjo įvertinti, kokių rūšių žmonių buvo labiau linkę dalyvauti Gezi protestų ir įvertinti savo požiūrį į pokyčius dalyviai ir ne dalyviai, tiek trumpuoju laikotarpiu (lyginant anksto gezi į per gezi) ir ilgalaikių (lyginant anksto gezi kad galėtumėte-gezi).
Tiesa, kad kai kurie iš šių apskaičiavimų galėjo būti ne visada ant duomenų rinkimo šaltinių (pvz, ilgalaikiai vertinimai požiūrio kaita), nors tokie duomenys kolekcija 30.000 žmonių būtų buvę gana brangus. Ir net suteikta neribotą biudžetą, aš negaliu galvoti apie bet kurį kitą metodą, kad iš esmės leidžia mokslininkams keliauti atgal laiku ir tiesiogiai stebėti dalyvių elgesį praeityje. Artimiausias alternatyva būtų surinkti atgaline data ataskaitas elgesio, tačiau šie pranešimai būtų ribota detalumo ir abejotino tikslumo. 2.1 lentelėje pateikiami kitų pavyzdžių tyrimų, kurie naudoja visada ant duomenų šaltinio studijuoti netikėtą įvykį.
netikėtas įvykis | Visada duomenimis šaltinis | citata |
---|---|---|
Užima Gezi judėjimą Turkijoje | "Twitter" | Budak and Watts (2015) |
Skėčių protestai Honkonge | Zhang (2016) | |
Šaudyklos policijos New York City | Stop-and-Frisk pranešimus | Legewie (2016) |
Asmuo prisijungti ISIS | "Twitter" | Magdy, Darwish, and Weber (2016) |
11 Rgs 2001 išpuolis | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11 Rgs 2001 išpuolis | pager pranešimai | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Antra, visada ant duomenų rinkimas leidžia mokslininkams gaminti realiu laiku matavimus, kurie gali būti svarbūs aplinkoje, kur politikai nori ne tik mokytis iš esamo elgesio, bet ir atsakyti į jį. Pavyzdžiui, socialinės žiniasklaidos duomenys gali būti naudojami nukreipti atsakymus į stichinių nelaimių (Castillo 2016) .
Taigi, visada duomenimis sistemos leidžia mokslininkams studijuoti netikėtų įvykių ir teikti realaus laiko informaciją politikos formuotojams. Aš ne, tačiau, pasiūlyti, kad šis visada duomenimis sistemos įgalinti tyrinėtojus stebėti pokyčius per ilgą laiką. Tai yra todėl, kad daugelis didelių duomenų sistemas nuolat keičiasi-procesas vadinamas dreifo (2.3.2.4 skirsnį).