Always-on nagy adatok lehetővé teszik a vizsgálat váratlan események és a valós idejű mérés.
Sok nagy adatrendszerek mindig-on; azok folyamatosan gyűjti az adatokat. Ez mindig bekapcsolt jellemző kutatók így longitudinális adatokat (azaz az adatok idővel). Mivel mindig bekapcsolt két fontos következménnyel jár a kutatás.
Először is, a folyamatos adatgyűjtés lehetővé teszi a kutatók számára, hogy olyan váratlan eseményeket tanulmányozzanak, amelyek egyébként nem lennének lehetségesek. Például azok a kutatók, akik 2013 nyarán a Törökországban elfoglalták a Gezi-i tiltakozásokat, érdeklődnek általában a tüntetők magatartására. Ceren Budak és Duncan Watts (2015) többet tudtak tenni azzal, hogy a Twitter mindig a természeténél fogva megtudta a tennivalókat, akik a Twittert használják az esemény előtt, alatt és után. És képesek voltak létrehozni egy összehasonlító csoportot a résztvevők között az esemény előtt, alatt és után (2.2. Ábra). Összesen ex-post panelükben 30.000 ember tweetje volt a két év alatt. A tiltakozásokkal közösen használt adatokkal kiegészítve ezzel a másik információval Budak és Watts sokkal többet tudtak tanulni: tudták megbecsülni, hogy milyen emberek nagyobb valószínűséggel vesznek részt a Gezi-tüntetésekben, és becsülik meg a változások viselkedését. a résztvevők és a nem résztvevők mind rövid távon (összehasonlítva a pre-Gezi-t a Gezi alatt), és hosszú távon (összehasonlítva a pre-Gezit a poszt-Gezivel).
A szkeptikus rámutathat arra, hogy ezek a becslések némelyike nem mindig adatgyűjtési források nélkül történhetne (pl. Hosszú távú becslések a hozzáállás megváltoztatására), és helyes, bár egy ilyen adatgyűjtés 30 000 ember számára elég volt drága. Még korlátlan költségvetés mellett sem gondolhatok olyan más módszerekre, amelyek lényegében lehetővé teszik a kutatók számára az időben történő utazást, és közvetlenül figyelik a résztvevők magatartását a múltban. A legközelebbi alternatíva a visszamenőleges viselkedésről szóló beszámolók összegyűjtése lenne, de ezek a jelentések korlátozott határtalan és megkérdőjelezhető pontosságúak lennének. a 2.1. táblázat további példákat mutat be olyan vizsgálatokra, amelyek egy mindig bekapcsolt adatforrást használnak egy váratlan esemény vizsgálatára.
Váratlan esemény | Mindig bekapcsolt adatforrás | Idézet |
---|---|---|
Fogadja Gezi mozgalmát Törökországban | Budak and Watts (2015) | |
Esküvői tiltakozások Hongkongban | Zhang (2016) | |
A rendőrség lőszerei New Yorkban | Stop-and-frisk jelentések | Legewie (2016) |
Az ISIS-hez csatlakozó személy | Magdy, Darwish, and Weber (2016) | |
2001. szeptember 11-i támadás | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
2001. szeptember 11-i támadás | pager üzeneteket | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
A váratlan események tanulmányozása mellett a mindig nagy adatrendszerek lehetővé teszik a kutatók számára, hogy valós idejű becsléseket készítsenek, amelyek fontosak lehetnek olyan környezetben, ahol a politikai döntéshozók - a kormányzatban vagy az iparban - a helyzetfeltárás alapján reagálnak. Például a közösségi médiaadatok felhasználhatók a természeti katasztrófákra adott válaszok (Castillo 2016) és számos különböző nagy adatforrás felhasználható valós idejű gazdasági becslések készítésére (Choi and Varian 2012) .
Összefoglalva, a folyamatosan működő adatrendszerek lehetővé teszik a kutatók számára, hogy váratlan eseményeket tanuljanak, és valós idejű információt nyújtsanak a döntéshozóknak. Nem gondolom azonban, hogy az állandóan működő adatrendszerek nagyon alkalmasak a változások nyomon követésére nagyon hosszú időn keresztül. Ez azért van, mert sok nagy adatrendszerek folyamatosan változik-egy folyamat, hívom sodródás később a fejezetben (2.3.7 szakasz).