Vienmēr-on lielie dati ļauj pētījumu par negaidītiem notikumiem un reālā laika mērījumiem.
Daudzi lielie datu sistēmas vienmēr-on; tie pastāvīgi datu vākšanai. Tas vienmēr-on īpašība nodrošina pētniekiem garengriezuma dati (ti, datu laika gaitā). Būt vienmēr-on ir divas svarīgas sekas pētniecībai.
Pirmkārt, pastāvīga datu vākšana ļauj pētniekiem pētīt negaidītus notikumus tādos veidos, kuri citādi nebūtu iespējami. Piemēram, pētnieki, kas ir ieinteresēti 2013. gada vasarā Turcijā apgūt Occupy Gezi protestus, parasti koncentrējas uz protestētāju uzvedību pasākuma laikā. Ceren Budak un Duncan Watts (2015) varēja paveikt vairāk, izmantojot čivināt, kas vienmēr tiek raksturīgi, lai pētītu protestētājus, kuri izmantoja čivināt pirms notikuma, tā laikā un pēc tā. Un viņi varēja izveidot salīdzinošo grupu dalībniekiem pirms notikuma, tā laikā un pēc tā (2.2. Attēls). Kopumā to ex-post panelī iekļāva tweets 30 000 cilvēku vairāk nekā divus gadus. Budak un Vatts, papildinot parasti izmantotos protesta datus ar šo citu informāciju, varēja uzzināt daudz vairāk: viņi varēja novērtēt, kādi cilvēki ir biežāk piedalījušies Gezi protestos, un novērtēt viņu attieksmes izmaiņas. gan īstermiĦā (salīdzinot pre-Gezi ar Gezi laikā), gan ilgtermiņā (salīdzinot pre-Gezi ar post-Gezi).
Skeptisks varētu norādīt, ka dažas no šīm aplēsēm varēja tikt izdarītas bez jebkādiem datu vākšanas avotiem (piemēram, ilgtermiņa aplēses par attieksmes maiņu), un tas ir pareizi, lai gan šāds datu vākšana 30 000 cilvēkiem būtu bijis diezgan dārgi. Tomēr, neraugoties uz neierobežotu budžetu, es nevaru iedomāties nevienu citu metodi, kas principā ļauj pētniekiem atgriezties laikā un tieši novērot dalībnieku uzvedību agrāk. Tuvākā alternatīva būtu apkopot retrospektīvus uzvedības ziņojumus, taču šajos ziņojumos nebūtu pietiekami detalizēta un apšaubāma precizitāte. Tabulā 2.1 ir sniegti citi pētījumu piemēri, kuros vienmēr izmantots datu avots, lai pētītu negaidītu notikumu.
Neparedzēts notikums | Vienmērīgs datu avots | Citāts |
---|---|---|
Aizņem Gezi kustību Turcijā | Čivināt | Budak and Watts (2015) |
Umbrella protesti Honkongā | Zhang (2016) | |
Policijas šāviens Ņujorkā | Stop-and-frisk ziņojumi | Legewie (2016) |
Persona, kas pievienojas ISIS | Čivināt | Magdy, Darwish, and Weber (2016) |
2001.gada 11.septembra uzbrukums | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
2001.gada 11.septembra uzbrukums | peidžeru ziņojumi | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Papildus neparedzētu notikumu izpētei vienmēr lielas datu sistēmas ļauj pētniekiem iegūt reāllaika aprēķinus, kas var būt svarīgi vietās, kur politikas veidotāji - valdībā vai nozarē - vēlas reaģēt, pamatojoties uz situācijas izpratni. Piemēram, sociālo mediju datus var izmantot, lai palīdzētu reaģēt ārkārtas situācijās dabas katastrofu gadījumos (Castillo 2016) un var izmantot dažādus lielus datu avotus, lai iegūtu ekonomiskās aktivitātes reāllaika aprēķinus (Choi and Varian 2012) .
Noslēgumā, pastāvīgas datu sistēmas ļauj pētniekiem izpētīt neparedzētus notikumus un sniegt informāciju politikas veidotājiem reāllaikā. Tomēr es nedomāju, ka pastāvīgas datu sistēmas ir piemērotas izmaiņu izsekošanai ļoti ilgu laiku. Tas ir tāpēc, ka daudzas lielas datu sistēmas nepārtraukti mainās - process, ko es aicināšu novirzīt vēlāk nodaļā (2.3.7. Sadaļa).