2.3.1.2 Always-on

Vždy-na veľkých dát umožňuje štúdium neočakávaných udalostí a meranie v reálnom čase.

Mnoho veľkých dátových systémov sú vždy v zapnutom stave; sú neustále zberu dát. To vždycky-on charakteristika poskytuje vedcom s pozdĺžnymi dát (tj údaje v priebehu času). Byť vždy-on má dva významné dôsledky pre výskum.

Po prvé, vždy k dispozícii zberu dát umožňuje vedcom študovať neočakávané udalosti spôsobom, ktorý nebolo možné skôr. Napríklad výskumníci majú záujem o štúdium Occupy gezi protesty v Turecku v lete roku 2013 by sa zvyčajne zameriavajú na správanie demonštrantov v priebehu akcie. Ceren Budak a Duncan Watts (2015) boli schopní urobiť viac pomocou vždy-na povahu Twitter, ako študovať Twitter pomocou demonštrantov, počas a po udalosti. A boli schopní vytvoriť porovnávaciu skupinu osôb, ktoré nie sú účastníkmi (alebo účastníkmi, ktorí nemali tweet o proteste) pred, počas a po udalosti (Obrázok 2.1). Celkovo ich ex-post panel zahŕňal tweety o 30.000 ľudí viac ako dva roky. Tým rozširovať bežne používané dáta z protestov s týmto ďalšími informáciami, Budak a Watts boli schopní sa učiť oveľa viac: boli schopní odhadnúť, aké typy ľudí, ktorí boli s väčšou pravdepodobnosťou podieľať sa na gezi protestov a odhadnúť zmeny v postojoch účastníci a nezúčastňujú, a to ako v krátkodobom horizonte (v porovnaní pre-gezi sa počas gezi) av dlhodobom horizonte (v porovnaní pre-gezi k post-gezi).

Obrázok 2.1: Konštrukcia používajú Budak a Watts (2015) študovať Occupy gezi protesty v Turecku v lete roku 2013. Pri použití vždy-na povahu Twitteri, výskumníci vytvorili to, čo nazýva ex post panel, ktorý zahŕňal asi 30.000 ľudí viac ako dva roky. Naproti tomu typická štúdia, ktorá sa zamerala na účastníkov počas protestov, ex-post panel pridáva 1) Údaje z účastníkov pred a po akcii a 2) dáta z non-účastníci pred, počas a po udalosti. Táto obohatená dátová štruktúra povolený Budak a Watts odhadnúť, aký druh ľudí sa častejšie podieľať sa na gezi protestov a odhadnúť zmeny v postoji účastníkov a non-účastníkov, a to ako v krátkodobom horizonte (v porovnaní pre-gezi sa v priebehu gezi) a v dlhodobom horizonte (v porovnaní pre-gezi post-gezi).

Obrázok 2.1: Konštrukcia používajú Budak and Watts (2015) na štúdium Occupy gezi protesty v Turecku v lete roku 2013. Pri použití vždy-na povahu Twitteri, výskumníci vytvorili to, čo nazýva ex post panel, ktorý zahŕňal asi 30.000 ľudí viac ako dva roky. Naproti tomu typická štúdia, ktorá sa zamerala na účastníkov počas protestov, ex-post panel pridáva 1) Údaje z účastníkov pred a po akcii a 2) dáta z non-účastníci pred, počas a po udalosti. Táto obohatená dátová štruktúra povolený Budak a Watts odhadnúť, aký druh ľudí sa častejšie podieľať sa na gezi protestov a odhadnúť zmeny v postoji účastníkov a non-účastníkov, a to ako v krátkodobom horizonte (v porovnaní pre-gezi sa v priebehu gezi) a v dlhodobom horizonte (v porovnaní pre-gezi post-gezi).

Je pravda, že niektoré z týchto odhadov by boli vykonané bez toho, aby vždy-na zdroje zberu dát (napr dlhodobé odhady zmeny postoja), hoci by boli zberu údajov pre 30.000 ľudí dosť drahé. A to aj vzhľadom k tomu, neobmedzený rozpočet, nemôžem myslieť na akúkoľvek inú metódou, ktorá v podstate umožňuje výskumníci cestovať späť v čase a priamo pozorovať účastníci správanie v minulosti. Najbližšie Alternatívou by bolo zbierať spätnej správy o správaní, ale tieto správy by mať obmedzený zrnitosti a diskutabilné presnosťou. Tabuľka 2.1 poskytuje ďalšie príklady štúdií, ktoré používajú vždy-na zdroji údajov k štúdiu neočakávané udalosti.

Tabuľka 2.1: Štúdia neočakávaných udalostí, ktoré používajú vždy-na veľkých dátových zdrojov.
neočakávaná udalosť Always-on dát source citácie
Zaujímajú Geházi hnutie v Turecku cvrlikání Budak and Watts (2015)
Umbrella protesty v Hongkongu Weibo Zhang (2016)
Strieľanie polícia v New Yorku Stop-and-Frisk správy Legewie (2016)
Osoba nástupom do ISIS cvrlikání Magdy, Darwish, and Weber (2016)
11.09.2001 útok livejournal.com Cohn, Mehl, and Pennebaker (2004)
11.09.2001 útok pager správy Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Po druhé, vždy k dispozícii zberu dát umožňuje vedcom vyrábať v reálnom čase merania, ktoré môžu byť dôležité v prostredí, kde politici chcú nielen poučiť sa z existujúceho správania, ale aj na neho reagovať. Napríklad dáta sociálnych médií môže byť použitý ako vodítko reakcia na prírodné katastrofy (Castillo 2016) .

Záverom možno povedať, vždy-na dátach systémy umožňujú vedcom študovať neočakávané udalosti a poskytovať informácie v reálnom čase tvorcom politiky. Nechcel som však navrhujú, že vždy-na dátach systémy umožňujú vedcom sledovať zmeny po dlhú dobu. To je preto, že mnoho veľkých dátových systémov sa neustále mení-procese zvanom drift (§ 2.3.2.4).