2.3.1.2 Always-op

Always-op grutte gegevens stelt de stúdzje fan ûnferwachte eveneminten en real-time mjitting.

In protte grutte gegevens systemen binne altyd-op; se wurde hieltyd it sammeljen fan gegevens. Dit altyd-op karakteristyk jout ûndersikers mei longitudinaal gegevens (ie, gegevens oer tiid). Being altyd-op hat twa wichtige gefolgen foar ûndersyk.

Earste, altyd-op gegevens samling stelt ûndersikers te studearjen ûnferwachte foarfallen yn wizen dat wienen net mooglik earder. Bygelyks, ûndersikers ynteressearre yn stúdzje de Occupy Gezi protest yn Turkije yn de simmer fan 2013 soe typysk rjochtsje op it gedrach fan de demonstranten yn it evenemint. Warren Budak en Duncan Watts (2015) wienen by steat om te dwaan mear troch it brûken fan de altyd-op aard fan Twitter te studearjen Twitter-mei help fan demonstranten foar, tidens en nei it evenemint. En, se wienen by steat om in ferliking groep fan net-dielnimmers (of dielnimmers dy't net tweet oer it protest) foar, tidens en nei it evenemint (Figure 2.1). Yn totaal harren eks-post paniel opnaam de tweets fan 30.000 minsken mear as twa jier. Troch augmenting de brûkte gegevens út de protesten mei dizze oare ynformaasje, Budak en Watts koenen leare folle mear: hja wiene by steat om te skatten wat soarten fan minsken wienen mear kâns om mei te dwaan yn 'e Gezi protest en te skatten de feroarings yn de hâlding fan dielnimmers en net-dielnimmers, sawol yn de koarte-termyn (fergelykjen pre-Gezi nei ûnder Gezi) en yn it lange-termyn (fergelykjen pre-Gezi te post-Gezi).

Figuer 2.1: Design brûkt troch Budak en Watts (2015) te bestudearjen de Occupy Gezi protest yn Turkije yn de simmer fan 2013. By it brûken fan it altyd-op aard fan Twitter, de ûndersikers makke wat se neamden in ex-post paniel dy't opnommen oer 30.000 minsken mear as twa jier. Yn tsjinstelling de typyske stúdzje dy't rjochte op dielnimmers tidens de protesten, de eks-post paniel heakket 1) gegevens út dielnimmers foar en nei it evenemint en 2) gegevens út net-dielnimmers foar, tidens en nei it evenemint. Dit ferrike gegevens struktuer ynskeakele Budak en Watts te skatten wat soarten fan minsken wienen mear kâns om mei te dwaan yn 'e Gezi protest en te skatten de feroarings yn de hâlding fan dielnimmers en net-dielnimmers, sawol yn de koarte-termyn (fergelykjen pre-Gezi nei ûnder Gezi) en yn it lange-termyn (fergelykjen pre-Gezi te post-Gezi).

Figuer 2.1: Design brûkt troch Budak and Watts (2015) te bestudearjen de Occupy Gezi protest yn Turkije yn de simmer fan 2013. By it brûken fan it altyd-op aard fan Twitter, de ûndersikers makke wat se neamden in ex-post paniel dy't opnommen oer 30.000 minsken mear as twa jier. Yn tsjinstelling de typyske stúdzje dy't rjochte op dielnimmers tidens de protesten, de eks-post paniel heakket 1) gegevens út dielnimmers foar en nei it evenemint en 2) gegevens út net-dielnimmers foar, tidens en nei it evenemint. Dit ferrike gegevens struktuer ynskeakele Budak en Watts te skatten wat soarten fan minsken wienen mear kâns om mei te dwaan yn 'e Gezi protest en te skatten de feroarings yn de hâlding fan dielnimmers en net-dielnimmers, sawol yn de koarte-termyn (fergelykjen pre-Gezi nei ûnder Gezi) en yn it lange-termyn (fergelykjen pre-Gezi te post-Gezi).

It is wier dat guon fan dy rûzings koene binne makke sûnder altyd-op gegevens samling boarnen (byg, lange-termyn rûzings fan hâlding feroaring), alhoewol't sokke gegevens samling foar 30.000 minsken soe west ha hiel djoer. En, sels jûn in ûnbeheinde budzjet, ik kin net tinke fan in oare metoade, dy't yn wêzen lit ûndersikers te reizgjen werom yn de tiid en streekrjocht observearjen dielnimmers gedrach yn it ferline. De neiste alternatyf soe wêze te sammeljen retrospektive rapporten fan gedrach, mar dizze rapporten soe wêze fan beheinde granularity en twifelich krektens. Tabel 2.1 jout oare foarbylden fan ûndersiken dy't brûk in altyd-op gegevens boarne te studearjen in ûnferwachte evenemint.

Tabel 2.1: Stúdzjes fan ûnferwachte eveneminten mei help fan altyd-op grutte gegevens boarnen.
unexpected evenemint Always-op gegevens boarne Citation
Occupy Gezi beweging yn Turkije Twitter Budak and Watts (2015)
Paraplu protest yn Hong Kong Weibo Zhang (2016)
Shootings fan plysje yn New York City Stop-en-frisk rapporten Legewie (2016)
Person joining ISIS Twitter Magdy, Darwish, and Weber (2016)
11 septimber, 2001 oanfal livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 septimber, 2001 oanfal pager berjochten Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Twadde, altyd-op gegevens samling stelt ûndersikers te produsearjen real-time mjittingen, dat kin wêze fan belang yn ynstellings dêr't beliedsmakkers wolle net krekt leare út besteande gedrach, mar ek ynspylje nei it. Bygelyks, sosjale media gegevens kinne brûkt wurde om te begelieden reaksjes te natuerrampen (Castillo 2016) .

Yn konklúzje, altyd-op gegevens systemen ynskeakelje ûndersikers te studearjen ûnferwachte eveneminten en soargje real-time ynformaasje oan beliedsmakkers. Ik wist net, lykwols, stelle dat dat altyd-op gegevens systemen ynskeakelje ûndersikers te track feroarings oer lange perioaden fan tiid. Dat is om't in soad grutte gegevens systemen binne hieltyd feroaret-in proses neamd drift (paragraaf 2.3.2.4).