Vždy-na veľkých dát umožňuje štúdium neočakávaných udalostí a meranie v reálnom čase.
Mnoho veľkých dátových systémov sú vždy v zapnutom stave; sú neustále zberu dát. To vždycky-on charakteristika poskytuje vedcom s pozdĺžnymi dát (tj údaje v priebehu času). Byť vždy-on má dva významné dôsledky pre výskum.
Po prvé, vždy k dispozícii zberu dát umožňuje vedcom študovať neočakávané udalosti spôsobom, ktorý nebolo možné skôr. Napríklad výskumníci majú záujem o štúdium Occupy gezi protesty v Turecku v lete roku 2013 by sa zvyčajne zameriavajú na správanie demonštrantov v priebehu akcie. Ceren Budak a Duncan Watts (2015) boli schopní urobiť viac pomocou vždy-na povahu Twitter, ako študovať Twitter pomocou demonštrantov, počas a po udalosti. A boli schopní vytvoriť porovnávaciu skupinu osôb, ktoré nie sú účastníkmi (alebo účastníkmi, ktorí nemali tweet o proteste) pred, počas a po udalosti (Obrázok 2.1). Celkovo ich ex-post panel zahŕňal tweety o 30.000 ľudí viac ako dva roky. Tým rozširovať bežne používané dáta z protestov s týmto ďalšími informáciami, Budak a Watts boli schopní sa učiť oveľa viac: boli schopní odhadnúť, aké typy ľudí, ktorí boli s väčšou pravdepodobnosťou podieľať sa na gezi protestov a odhadnúť zmeny v postojoch účastníci a nezúčastňujú, a to ako v krátkodobom horizonte (v porovnaní pre-gezi sa počas gezi) av dlhodobom horizonte (v porovnaní pre-gezi k post-gezi).
Je pravda, že niektoré z týchto odhadov by boli vykonané bez toho, aby vždy-na zdroje zberu dát (napr dlhodobé odhady zmeny postoja), hoci by boli zberu údajov pre 30.000 ľudí dosť drahé. A to aj vzhľadom k tomu, neobmedzený rozpočet, nemôžem myslieť na akúkoľvek inú metódou, ktorá v podstate umožňuje výskumníci cestovať späť v čase a priamo pozorovať účastníci správanie v minulosti. Najbližšie Alternatívou by bolo zbierať spätnej správy o správaní, ale tieto správy by mať obmedzený zrnitosti a diskutabilné presnosťou. Tabuľka 2.1 poskytuje ďalšie príklady štúdií, ktoré používajú vždy-na zdroji údajov k štúdiu neočakávané udalosti.
neočakávaná udalosť | Always-on dát source | citácie |
---|---|---|
Zaujímajú Geházi hnutie v Turecku | cvrlikání | Budak and Watts (2015) |
Umbrella protesty v Hongkongu | Zhang (2016) | |
Strieľanie polícia v New Yorku | Stop-and-Frisk správy | Legewie (2016) |
Osoba nástupom do ISIS | cvrlikání | Magdy, Darwish, and Weber (2016) |
11.09.2001 útok | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11.09.2001 útok | pager správy | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Po druhé, vždy k dispozícii zberu dát umožňuje vedcom vyrábať v reálnom čase merania, ktoré môžu byť dôležité v prostredí, kde politici chcú nielen poučiť sa z existujúceho správania, ale aj na neho reagovať. Napríklad dáta sociálnych médií môže byť použitý ako vodítko reakcia na prírodné katastrofy (Castillo 2016) .
Záverom možno povedať, vždy-na dátach systémy umožňujú vedcom študovať neočakávané udalosti a poskytovať informácie v reálnom čase tvorcom politiky. Nechcel som však navrhujú, že vždy-na dátach systémy umožňujú vedcom sledovať zmeny po dlhú dobu. To je preto, že mnoho veľkých dátových systémov sa neustále mení-procese zvanom drift (§ 2.3.2.4).