Vienmēr-on lielie dati ļauj pētījumu par negaidītiem notikumiem un reālā laika mērījumiem.
Daudzi lielie datu sistēmas vienmēr-on; tie pastāvīgi datu vākšanai. Tas vienmēr-on īpašība nodrošina pētniekiem garengriezuma dati (ti, datu laika gaitā). Būt vienmēr-on ir divas svarīgas sekas pētniecībai.
Pirmkārt, vienmēr-on datu vākšana ļauj zinātniekiem pētīt negaidītu notikumu veidos, kas nebija iespējams iepriekš. Piemēram, zinātnieki ir ieinteresēti pētot Aizņem Gezi protestus Turcijā vasarā 2013. gadā parasti koncentrējas uz uzvedību protestētāju pasākuma laikā. Ceren Budak un Duncan Watts (2015) varēja izdarīt vairāk, izmantojot vienmēr-on raksturu čivināt studēt Twitter patērējošu protestētājus laikā, pirms un pēc pasākuma. Un viņi varēja izveidot salīdzinājums grupu nepilsoņu dalībnieku (vai dalībniekiem, kuriem nav čivināt par protesta) laikā, pirms un pēc pasākuma (2.1 attēls). Kopumā to ex-post panelis iekļauti tweets 30.000 cilvēku vairāk nekā divus gadus. Ar paplašināšanā, ko parasti izmanto datus no protestiem ar šo citu informāciju, Budak un Watts varēja uzzināt daudz vairāk: viņi varēja novērtēt, kāda veida cilvēki biežāk piedalīties Gezi protestus un novērtēt izmaiņas attieksmi dalībnieki un nepiedalās, gan īstermiņā (salīdzinot iepriekš Gezi lai laikā Gezi) un ilgtermiņa (salīdzinot iepriekš Gezi post-Gezi).
Tā ir taisnība, ka daži no šiem aprēķiniem varēja veikt bez vienmēr-on datu vākšanas avotiem (piemēram, ilgtermiņa aplēses attieksmes maiņu), lai gan šādu datu vākšana 30000 cilvēkiem būtu diezgan dārgi. Un, pat ņemot vērā neierobežots budžets, es nevaru iedomāties kādu citu metodi, kas būtībā ļauj pētniekiem ceļot atpakaļ laikā un tieši novērot dalībnieki uzvedību pagātnē. Visciešākā alternatīva būtu savākt retrospektīvu ziņojumus par uzvedību, bet šie ziņojumi būs ierobežots detalizācijas un apšaubāmu precizitāti. 2.1 tabula sniedz citus piemērus pētījumu, kas izmanto vienmēr-par datu avotu, lai pētītu negaidītu notikumu.
negaidīts notikums | Vienmēr-on datu avots | citēšana |
---|---|---|
Aizņem Gezi kustību Turcijā | Tviteris | Budak and Watts (2015) |
Umbrella protesti Hong Kong | Zhang (2016) | |
Šaušanu policijas New York City | Stop-and-Frisk ziņojumus | Legewie (2016) |
Persona savieno ISIS | Tviteris | Magdy, Darwish, and Weber (2016) |
11. septembris 2001 uzbrukums | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11. septembris 2001 uzbrukums | peidžeri ziņas | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Otrkārt, vienmēr-on datu vākšana ļauj pētniekiem, lai iegūtu reālā laika mērījumiem, kas var būt svarīgi vietās, kur politikas veidotāji vēlas ne tikai mācīties no esošās uzvedības, bet arī atbildēt uz to. Piemēram, sociālo mediju datus var izmantot, lai palīdzētu reaģēt uz dabas katastrofām (Castillo 2016) .
Noslēgumā, vienmēr-on datu sistēmas ļauj pētniekiem studēt neparedzētiem notikumiem un sniedz reālā laika informāciju politikas veidotājiem. Man nav, tomēr, iesaku, ka vienmēr-on datu sistēmas ļauj pētniekiem, lai izsekotu izmaiņām ilgākā laika periodā. Tas ir tāpēc, ka daudzi lieli datu sistēmas pastāvīgi mainās-procesu, ko sauc drift (2.3.2.4 sadaļu).