Alltaf-á stórum gögnum gerir rannsókn á óvæntum atburðum og rauntíma mælingar.
Mörg stór gögn kerfi eru alltaf-á; þeir eru stöðugt að safna gögnum. Þetta alltaf-á einkennandi veitir vísindamönnum með langsniðsgögnum (þ.e. gögn með tímanum). Vera alltaf-á hefur tvö mikilvæg áhrif á rannsóknir.
Í fyrsta lagi gerir alltaf vísindamenn kleift að kynna óvæntar viðburði á þann hátt sem annars væri ekki hægt. Til dæmis, vísindamenn sem hafa áhuga á að læra hernema Gezi mótmælin í Tyrklandi sumarið 2013 myndi venjulega einbeita sér að hegðun mótmælenda meðan á viðburðinum stendur. Ceren Budak og Duncan Watts (2015) voru fær um að gera meira með því að nota alltaf á eðli Twitter til að kynna mótmælendur sem notuðu Twitter áður, á meðan og eftir atburðinn. Og þeir gátu búið til samanburðarhóp þátttakenda áður en, meðan og eftir atburðinn (mynd 2.2). Alls fyrrverandi staða þeirra spjaldið með kvak um 30.000 manns á tveimur árum. Með því að auka almennt notaðar gögn frá mótmælunum með þessum öðrum upplýsingum, voru Budak og Watts fær um að læra mikið meira: þeir gátu metið hvaða líkur voru líklegri til að taka þátt í Gezi mótmælunum og meta breytingar á viðhorfum þátttakendur og ekki þátttakendur, bæði til skamms tíma (samanburður á Gezi á Gezi) og til lengri tíma litið (samanburður fyrir Gezi með Post-Gezi).
Efasemdamaður kann að benda á að sumar þessar áætlanir gætu verið gerðar án ávallt gagnasöfnunar (td langtímaáætlanir um breytingar á viðhorfum) og það er rétt, þó að slík gagnasöfnun fyrir 30.000 manns hefði verið alveg dýrt. Jafnvel gefið ótakmarkaðan fjárhagsáætlun, en ég get ekki hugsað um neina aðra aðferð sem gerir vísindamenn í raun kleift að ferðast aftur í tímann og fylgjast beint með hegðun þátttakenda í fortíðinni. Næst val væri að safna afturvirkum skýrslum um hegðun en þessar skýrslur myndu vera af skornum skammti og vafasama nákvæmni. Tafla 2.1 gefur til kynna aðrar dæmi um rannsóknir sem nota ávallt gagnasöfn til að kynna óvæntar atburði.
Óvænt atburður | Alltaf á gagnasafni | Tilvitnun |
---|---|---|
Hernema Gezi hreyfing í Tyrklandi | Budak and Watts (2015) | |
Umbrots mótmæli í Hong Kong | Zhang (2016) | |
Skotleikir lögreglu í New York City | Hætta-og-frisk skýrslur | Legewie (2016) |
Persónulegur þátttakandi í ISIS | Magdy, Darwish, and Weber (2016) | |
11. september 2001 árás | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11. september 2001 árás | skilaboðum skilaboðum | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Auk þess að læra óvæntar viðburði gerir alltaf vísindamenn kleift að framleiða rauntíma áætlanir sem geta verið mikilvægar í stillingum þar sem stefnumótendur - í ríkisstjórn eða iðnaði - vilja bregðast við með hliðsjón af staðbundinni vitund. Til dæmis er hægt að nota félagsleg gögn til að leiðbeina neyðarviðbrögðum við náttúruhamförum (Castillo 2016) og margs konar stórum gögnum sem hægt er að nota framleiða rauntíma mat á atvinnustarfsemi (Choi and Varian 2012) .
Niðurstaðan er sú að alltaf-á gagna kerfi gerir vísindamenn kleift að kynna óvæntar viðburði og veita rauntíma upplýsingar til stefnumótandi aðila. Ég held hins vegar ekki á því að ávallt gagnasöfn séu vel til þess að fylgjast með breytingum á mjög langan tíma. Það er vegna þess að mörg stórar gagnakerfi eru stöðugt að breytast - ferli sem ég mun kalla svíf síðar í kafla (kafla 2.3.7).