2.3.1.2 Увек-у

Увек на великим података омогућава проучавање неочекиване догађаје и мерења у реалном времену.

Многи велики системи података су увек на; они су стално прикупљање података. Ово увек на карактеристика омогућава истраживачима лонгитудиналних података (нпр, подаци током времена). Бити увек на има две важне импликације за истраживање.

Прво, увек на прикупљање података омогућава истраживачима да студирају неочекиване догађаје на начин који није било могуће раније. На пример, истраживачи заинтересовани за проучавање Оццупи Гези протесте у Турској у лето 2013. године се обично фокусирати на понашање демонстраната током догађаја. Церен Будак и Данкан В (2015) у стању да уради више помоћу увек на природу Твиттер да уче Твиттер-користећи протесте пре, за време, и после догађаја. И, они су били у стању да створи поређења групе неучесника (или учесника који нису Твеет о протесту) пре, за време, и после догађаја (слика 2.1). Укупно је њихова накнадна Панел укључио твеетс од 30.000 људи преко две године. Би повећавајући се обично користе податке из протеста са овим другим информацијама, Будак и В су били у могућности да науче много више: они су у стању да процени какви људи су чешће учествују у Гези протеста и да се процене промене у ставовима učesnici и не учествују, како у кратком року (у односу пре-Гези у току Гези) и на дужи рок (у односу пре-Гези у пост-Гези).

Слика 2.1: Дизајн користи Будак и Ваттс (2015) за проучавање Оццупи Гези протесте у Турској у лето 2013. године Коришћењем увек на природу Твиттер, научници створили како су га назвали ек-пост панел који је укључивао око 30.000 људи преко две године. Насупрот томе, типичан студија која се бави учесника током протеста, ек-пост Панел додаје 1) податке од учесника пре и после догађаја и 2) подаци из неучесника пре, за време, и после догађаја. Ово обогаћен структура података омогућити Будак и Вотс да процени какви људи су чешће учествују у Гези протеста и да се процене промене у ставовима учесника и неучесника, како у кратком року (у односу пре-Гези у току гези) и на дужи рок (у односу пре гези до пост-гези).

Слика 2.1: Дизајн користи Budak and Watts (2015) проучавање Оццупи Гези протесте у Турској у лето 2013. године Коришћењем увек на природу Твиттер, научници створили како су га назвали ек-пост панел који је укључивао око 30.000 људи преко две године. Насупрот томе, типичан студија која се бави учесника током протеста, ек-пост Панел додаје 1) податке од учесника пре и после догађаја и 2) подаци из неучесника пре, за време, и после догађаја. Ово обогаћен структура података омогућити Будак и Вотс да процени какви људи су чешће учествују у Гези протеста и да се процене промене у ставовима учесника и неучесника, како у кратком року (у односу пре-Гези у току гези) и на дужи рок (у односу пре гези до пост-гези).

Тачно је да су неки од ових процена могла да буде обављена без увек на изворе прикупљања података (нпр, дугорочне процене промене ставова), иако прикупљање таквих података за 30.000 људи би били прилично скупи. И, чак дао неограничен буџет, не могу да смислим неки други начин да у суштини омогућава истраживачима да путују кроз време и директно посматрати учесника понашање у прошлости. Најближи алтернатива би била да се прикупи ретроспективне извештаје о понашању, али ови извештаји ће бити ограничене прецизности и упитне прецизности. Табела 2.1 даје друге примере студија који користи увек на извор података за проучавање неочекивани догађај.

Табела 2.1: Студије неочекиваних догађаја који користе увек на великим изворима података.
неочекивани догађај Увек основу података извор цитат
Оццупи Гези покрет у Турској твиттер Budak and Watts (2015)
Умбрелла протести у Хонг Конгу Веибо Zhang (2016)
Пуцњаве полиције у Њујорку Стоп-анд-Фриск извештаје Legewie (2016)
Лице које се придружи ИСИС твиттер Magdy, Darwish, and Weber (2016)
11. септембра 2001. године напад ливејоурнал.цом Cohn, Mehl, and Pennebaker (2004)
11. септембра 2001. године напад Пагер поруке Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Друго, увек на прикупљање података омогућава истраживачима да произведе у реалном времену мерења, што може бити важно у условима када креатори политике желе да не само уче од постојећег понашања, али и одговорити на то. На пример, социал медиа подаци се могу користити за вођење одговора на природне катастрофе (Castillo 2016) .

У закључку, увек на подацима системи омогућавају истраживачима да студирају неочекиване догађаје и дају информације у реалном времену за креаторе политике. Нисам, међутим, предлаже да тај увек на подацима системи омогућавају истраживачима да прате промене током дужег временског периода. То је зато што многи велики системи података се стално мењају-а процес се зове Дрифт (поглавље 2.3.2.4).