2.3.1.2 Vienmēr-on

Vienmēr-on lielie dati ļauj pētījumu par negaidītiem notikumiem un reālā laika mērījumiem.

Daudzi lielie datu sistēmas vienmēr-on; tie pastāvīgi datu vākšanai. Tas vienmēr-on īpašība nodrošina pētniekiem garengriezuma dati (ti, datu laika gaitā). Būt vienmēr-on ir divas svarīgas sekas pētniecībai.

Pirmkārt, vienmēr-on datu vākšana ļauj zinātniekiem pētīt negaidītu notikumu veidos, kas nebija iespējams iepriekš. Piemēram, zinātnieki ir ieinteresēti pētot Aizņem Gezi protestus Turcijā vasarā 2013. gadā parasti koncentrējas uz uzvedību protestētāju pasākuma laikā. Ceren Budak un Duncan Watts (2015) varēja izdarīt vairāk, izmantojot vienmēr-on raksturu čivināt studēt Twitter patērējošu protestētājus laikā, pirms un pēc pasākuma. Un viņi varēja izveidot salīdzinājums grupu nepilsoņu dalībnieku (vai dalībniekiem, kuriem nav čivināt par protesta) laikā, pirms un pēc pasākuma (2.1 attēls). Kopumā to ex-post panelis iekļauti tweets 30.000 cilvēku vairāk nekā divus gadus. Ar paplašināšanā, ko parasti izmanto datus no protestiem ar šo citu informāciju, Budak un Watts varēja uzzināt daudz vairāk: viņi varēja novērtēt, kāda veida cilvēki biežāk piedalīties Gezi protestus un novērtēt izmaiņas attieksmi dalībnieki un nepiedalās, gan īstermiņā (salīdzinot iepriekš Gezi lai laikā Gezi) un ilgtermiņa (salīdzinot iepriekš Gezi post-Gezi).

2.1 attēls: Design by Budak un Watts (2015), ko izmanto, lai pētītu Aizņem Gezi protestus Turcijā vasarā 2013. Izmantojot vienmēr-on raksturu čivināt, pētnieki radīja to, ko viņi sauc par ex-post panelis, kas ietver aptuveni 30.000 cilvēki pārsniedz divus gadus. Turpretī tipisks pētījums, kas vērsta uz dalībnieku protestu laikā, ex-post panelis piebilst 1) dati no dalībniekiem pirms un pēc pasākuma un 2) dati no nenoteiktas dalībniekiem laikā, pirms un pēc pasākuma. Tas bagātināts datu struktūra ļāva Budak un Watts novērtēt, kāda veida cilvēki biežāk piedalīties Gezi protestus un novērtēt izmaiņas attieksmē dalībnieku un nepilsoņu dalībniekiem, gan īstermiņā (salīdzinot iepriekš Gezi to laikā Gezi) un ilgtermiņa (salīdzinot iepriekš Gezi ievietot-Gezi).

2.1 attēls: Design by izmanto Budak and Watts (2015) izpētīt Aizņem Gezi protestus Turcijā vasarā 2013. Izmantojot vienmēr-on raksturu čivināt, pētnieki radīja to, ko viņi sauc par ex-post panelis, kas ietver aptuveni 30.000 cilvēki pārsniedz divus gadus. Turpretī tipisks pētījums, kas vērsta uz dalībnieku protestu laikā, ex-post panelis piebilst 1) dati no dalībniekiem pirms un pēc pasākuma un 2) dati no nenoteiktas dalībniekiem laikā, pirms un pēc pasākuma. Tas bagātināts datu struktūra ļāva Budak un Watts novērtēt, kāda veida cilvēki biežāk piedalīties Gezi protestus un novērtēt izmaiņas attieksmē dalībnieku un nepilsoņu dalībniekiem, gan īstermiņā (salīdzinot iepriekš Gezi to laikā Gezi) un ilgtermiņa (salīdzinot iepriekš Gezi ievietot-Gezi).

Tā ir taisnība, ka daži no šiem aprēķiniem varēja veikt bez vienmēr-on datu vākšanas avotiem (piemēram, ilgtermiņa aplēses attieksmes maiņu), lai gan šādu datu vākšana 30000 cilvēkiem būtu diezgan dārgi. Un, pat ņemot vērā neierobežots budžets, es nevaru iedomāties kādu citu metodi, kas būtībā ļauj pētniekiem ceļot atpakaļ laikā un tieši novērot dalībnieki uzvedību pagātnē. Visciešākā alternatīva būtu savākt retrospektīvu ziņojumus par uzvedību, bet šie ziņojumi būs ierobežots detalizācijas un apšaubāmu precizitāti. 2.1 tabula sniedz citus piemērus pētījumu, kas izmanto vienmēr-par datu avotu, lai pētītu negaidītu notikumu.

2.1 tabula: Pētījumi par negaidītiem notikumiem, izmantojot vienmēr-on lieliem datu avotiem.
negaidīts notikums Vienmēr-on datu avots citēšana
Aizņem Gezi kustību Turcijā Tviteris Budak and Watts (2015)
Umbrella protesti Hong Kong Weibo Zhang (2016)
Šaušanu policijas New York City Stop-and-Frisk ziņojumus Legewie (2016)
Persona savieno ISIS Tviteris Magdy, Darwish, and Weber (2016)
11. septembris 2001 uzbrukums livejournal.com Cohn, Mehl, and Pennebaker (2004)
11. septembris 2001 uzbrukums peidžeri ziņas Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Otrkārt, vienmēr-on datu vākšana ļauj pētniekiem, lai iegūtu reālā laika mērījumiem, kas var būt svarīgi vietās, kur politikas veidotāji vēlas ne tikai mācīties no esošās uzvedības, bet arī atbildēt uz to. Piemēram, sociālo mediju datus var izmantot, lai palīdzētu reaģēt uz dabas katastrofām (Castillo 2016) .

Noslēgumā, vienmēr-on datu sistēmas ļauj pētniekiem studēt neparedzētiem notikumiem un sniedz reālā laika informāciju politikas veidotājiem. Man nav, tomēr, iesaku, ka vienmēr-on datu sistēmas ļauj pētniekiem, lai izsekotu izmaiņām ilgākā laika periodā. Tas ir tāpēc, ka daudzi lieli datu sistēmas pastāvīgi mainās-procesu, ko sauc drift (2.3.2.4 sadaļu).