2.3.1.2 Винаги включена

Винаги-на големи данни позволява изучаването на неочаквани събития и измерване в реално време.

Много големи системи за данни са винаги-на; те постоянно събиране на данни. Това винаги-на характеристика осигурява изследователи с надлъжни данни (т.е. данни с течение на времето). Да бъдеш винаги-на има две важни последици за научни изследвания.

Първо, винаги-на събиране на данни дава възможност на учените да изучават неочаквани събития по начини, които не са били възможни преди това. Например, учените се интересуват от изучаване на Occupy Gezi протести в Турция през лятото на 2013 г., обикновено ще се фокусират върху поведението на протестиращите по време на събитието. Джерен Budak и Дънкан Уотс (2015) са били в състояние да направи повече с помощта на винаги-на естеството на Twitter да учат Twitter-, използващи протестиращите преди, по време и след събитието. А, те са в състояние да се създаде група за сравнение на чуждестранни участници (или участници, които не са чуруликам за протеста) преди, по време и след събитието (Фигура 2.1). В общия им последваща панел включваше туита на 30000 души над две години. С увеличаването на често използвани данни от протестите с тази друга информация, Budak и Watts са били в състояние да научите много повече: те са били в състояние да оцени какви хора са по-склонни да участват в Gezi протестите и да се оцени промените в нагласите на участници и не участват, както в краткосрочен план (сравняващи предварително Gezi до време Gezi) и в дългосрочен план (сравняващи предварително Gezi да публикувате-Gezi).

Фигура 2.1: Проектиране, използван от Budak и Watts (2015 г.) за проучване на Occupy Gezi протести в Турция през лятото на 2013 г. С помощта на винаги-на естеството на Twitter, учените създадоха това, което те наричат ​​последваща панел, който включва около 30000 души над две години. За разлика от типичните изследване, което се фокусира върху участниците по време на протестите, последваща панел добавя 1) данни от участниците преди и след събитието и 2) данни от неучастващи преди, по време и след събитието. Това обогатена структура данни активиран Budak и Watts да изчислите какви хора са по-склонни да участват в Gezi протестите и да се оцени промените в нагласите на участниците и не участват, както в краткосрочен план (сравняване на предварително Gezi до време Gezi) и в дългосрочен план (сравняване на предварително Gezi да публикувате-Gezi).

Фигура 2.1: Проектиране, използван от Budak and Watts (2015) за проучване на Occupy Gezi протести в Турция през лятото на 2013 г. С помощта на винаги-на естеството на Twitter, учените създадоха това, което те наричат ​​последваща панел, който включва около 30000 души над две години. За разлика от типичните изследване, което се фокусира върху участниците по време на протестите, последваща панел добавя 1) данни от участниците преди и след събитието и 2) данни от неучастващи преди, по време и след събитието. Това обогатена структура данни активиран Budak и Watts да изчислите какви хора са по-склонни да участват в Gezi протестите и да се оцени промените в нагласите на участниците и не участват, както в краткосрочен план (сравняване на предварително Gezi до време Gezi) и в дългосрочен план (сравняване на предварително Gezi да публикувате-Gezi).

Вярно е, че някои от тези оценки са могли да бъдат направени без винаги-на източници за събиране на данни (например, дългосрочни прогнози за промяна отношението), въпреки че събирането на такива данни за 30,000 души биха били доста скъпи. И, дори даден неограничен бюджет, не мога да се сетя за друг метод, който по същество позволява на изследователите да пътуват назад във времето и пряко да наблюдават поведението на участниците в миналото. Най-близкото Алтернативата е да се съберат ретроспективни съобщения за поведение, но тези доклади ще бъдат с ограничен детайлност и съмнителна точност. Таблица 2.1 дава други примери за проучвания, които използват винаги-на източник на данни за проучване неочаквано събитие.

Таблица 2.1: Проучвания на неочаквани събития, които използват винаги-на големи източници на данни.
Неочакван събитие Винаги включена данни източник цитат
Occupy Gezi движение в Турция кикотене Budak and Watts (2015)
Чадър протести в Хонг Конг Weibo Zhang (2016)
Сесии на полицията в Ню Йорк Спиране и Фриск доклади Legewie (2016)
Лице присъедини ISIS кикотене Magdy, Darwish, and Weber (2016)
11-ти септември, 2001 атака livejournal.com Cohn, Mehl, and Pennebaker (2004)
11-ти септември, 2001 атака съобщения по пейджър Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Второ, винаги-на събиране на данни дава възможност на учените да произвеждат измервания в реално време, което може да бъде важно в настройките където политиците искат не само да се учат от съществуващото поведение, но също така отговори на него. Например, социални медии данни могат да се използват за насочване на отговор на природни бедствия (Castillo 2016) .

В заключение, винаги-на данни системи позволяват на изследователите да изучават неочаквани събития и да предоставят информация в реално време за политиците. Аз не, обаче, предлагам, че винаги-на данни системи позволяват на изследователите да следите промените на дълги периоди от време. Това е така, защото много от големите информационни системи постоянно се променят, процес, наречен дрейф (раздел 2.3.2.4).