Винаги-на големи данни позволява изучаването на неочаквани събития и измерване в реално време.
Много големи системи за данни са винаги-на; те постоянно събиране на данни. Това винаги-на характеристика осигурява изследователи с надлъжни данни (т.е. данни с течение на времето). Да бъдеш винаги-на има две важни последици за научни изследвания.
Първо, винаги-на събиране на данни дава възможност на учените да изучават неочаквани събития по начини, които не са били възможни преди това. Например, учените се интересуват от изучаване на Occupy Gezi протести в Турция през лятото на 2013 г., обикновено ще се фокусират върху поведението на протестиращите по време на събитието. Джерен Budak и Дънкан Уотс (2015) са били в състояние да направи повече с помощта на винаги-на естеството на Twitter да учат Twitter-, използващи протестиращите преди, по време и след събитието. А, те са в състояние да се създаде група за сравнение на чуждестранни участници (или участници, които не са чуруликам за протеста) преди, по време и след събитието (Фигура 2.1). В общия им последваща панел включваше туита на 30000 души над две години. С увеличаването на често използвани данни от протестите с тази друга информация, Budak и Watts са били в състояние да научите много повече: те са били в състояние да оцени какви хора са по-склонни да участват в Gezi протестите и да се оцени промените в нагласите на участници и не участват, както в краткосрочен план (сравняващи предварително Gezi до време Gezi) и в дългосрочен план (сравняващи предварително Gezi да публикувате-Gezi).
Вярно е, че някои от тези оценки са могли да бъдат направени без винаги-на източници за събиране на данни (например, дългосрочни прогнози за промяна отношението), въпреки че събирането на такива данни за 30,000 души биха били доста скъпи. И, дори даден неограничен бюджет, не мога да се сетя за друг метод, който по същество позволява на изследователите да пътуват назад във времето и пряко да наблюдават поведението на участниците в миналото. Най-близкото Алтернативата е да се съберат ретроспективни съобщения за поведение, но тези доклади ще бъдат с ограничен детайлност и съмнителна точност. Таблица 2.1 дава други примери за проучвания, които използват винаги-на източник на данни за проучване неочаквано събитие.
Неочакван събитие | Винаги включена данни източник | цитат |
---|---|---|
Occupy Gezi движение в Турция | кикотене | Budak and Watts (2015) |
Чадър протести в Хонг Конг | Zhang (2016) | |
Сесии на полицията в Ню Йорк | Спиране и Фриск доклади | Legewie (2016) |
Лице присъедини ISIS | кикотене | Magdy, Darwish, and Weber (2016) |
11-ти септември, 2001 атака | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11-ти септември, 2001 атака | съобщения по пейджър | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Второ, винаги-на събиране на данни дава възможност на учените да произвеждат измервания в реално време, което може да бъде важно в настройките където политиците искат не само да се учат от съществуващото поведение, но също така отговори на него. Например, социални медии данни могат да се използват за насочване на отговор на природни бедствия (Castillo 2016) .
В заключение, винаги-на данни системи позволяват на изследователите да изучават неочаквани събития и да предоставят информация в реално време за политиците. Аз не, обаче, предлагам, че винаги-на данни системи позволяват на изследователите да следите промените на дълги периоди от време. Това е така, защото много от големите информационни системи постоянно се променят, процес, наречен дрейф (раздел 2.3.2.4).