2.3.1.2 Завжди-на

Завжди-на великих даних дозволяє вивчати несподіваних подій і вимірювань в режимі реального часу.

Багато великих інформаційні системи завжди-на; вони постійно збирає дані. Це завжди на характеристика забезпечує дослідникам поздовжніх даних (тобто даних з плином часу). Будучи завжди на два важливих наслідки для досліджень.

По-перше, завжди на зборі даних дозволяє дослідникам вивчати несподівані події способами, що не були можливі раніше. Наприклад, дослідники, зацікавлені у вивченні Займайте Gezi протести в Туреччині влітку 2013 року, як правило, зосереджені на поведінці учасників протесту під час заходу. Серен Будак і Дункан Уоттс (2015) були в змозі зробити більше, використовуючи завжди на природу Twitter , щоб , перш ніж вивчати Twitter-використовуючи протестуючих, під час і після заходу. І вони були в змозі створити групу порівняння осіб, які не є учасниками (або учасників, які не чірікать про протест) до, під час і після заходу (Малюнок 2.1). В цілому їх постфактум групи входили твіти 30000 чоловік в протягом двох років. Шляхом збільшення часто використовувані дані від протестів з цієї іншої інформації, Будак і Уоттс змогли дізнатися набагато більше: вони були в змозі оцінити, які люди були більш схильні до участі в Gezi протестів і оцінити зміни у відносинах учасники і які не є учасниками, як в короткостроковій перспективі (порівнюючи попередньо Gezi протягом Gezi) і в довгостроковій перспективі (порівнюючи пре-Gezi пост-Gezi).

Малюнок 2.1: Конструкція використовується Будак і Уоттс (2015) для вивчення Займайте Gezi протести в Туреччині влітку 2013 року Використовуючи завжди на природу Twitter, дослідники створили те, що вони називають постфактум панель, яка включала близько 30000 чоловік протягом двох років. На відміну від типового дослідження, яке зосереджено на учасників під час протестів, екс-пост панель додає 1) дані від учасників до і після події і 2) дані, які не є учасниками до, під час і після заходу. Ця збагачена структура даних дозволило Будак і вати, щоб оцінити, які люди були більш схильні до участі в Gezi протестів і оцінити зміни у ставленні учасників і неучастников, як в короткостроковій перспективі (порівнюючи попередньо Gezi протягом Gezi) і в довгостроковій перспективі (порівнюючи попередньо Gezi пост-Gezi).

Малюнок 2.1: Конструкція використовується Budak and Watts (2015) для вивчення Займайте Gezi протести в Туреччині влітку 2013 року Використовуючи завжди на природу Twitter, дослідники створили то , що вони називають постфактум панель , яка включала близько 30000 чоловік протягом двох років. На відміну від типового дослідження, яке зосереджено на учасників під час протестів, екс-пост панель додає 1) дані від учасників до і після події і 2) дані, які не є учасниками до, під час і після заходу. Ця збагачена структура даних дозволило Будак і вати, щоб оцінити, які люди були більш схильні до участі в Gezi протестів і оцінити зміни у ставленні учасників і неучастников, як в короткостроковій перспективі (порівнюючи попередньо Gezi протягом Gezi) і в довгостроковій перспективі (порівнюючи попередньо Gezi пост-Gezi).

Це правда, що деякі з цих оцінок могли б бути зроблені без завжди на джерела збору даних (наприклад, довгострокові оцінки зміни ставлення), хоча збір таких даних для 30000 чоловік були б досить дорого. І, навіть з огляду на необмежений бюджет, я не можу думати про яку - небудь інший метод , який по суті дозволяє дослідникам подорожувати назад в часі і безпосередньо спостерігати за поведінкою учасників в минулому. Найближчою альтернативою буде збирати ретроспективні звіти про поведінку, однак ці звіти будуть мати обмежену зернистості і сумнівною точності. У таблиці 2.1 представлені інші приклади досліджень, які використовують завжди на джерелі даних для вивчення несподівана подія.

Таблиця 2.1: Дослідження з використанням несподіваних подій завжди на великих джерел даних.
несподівана подія Завжди-на вихідних даних цитування
Займайте рух Gezi в Туреччині щебетати Budak and Watts (2015)
Парасолька протести в Гонконзі Weibo Zhang (2016)
Зйомки поліції в Нью-Йорку Стоп-і-FRISK звіти Legewie (2016)
Вступник ISIS щебетати Magdy, Darwish, and Weber (2016)
11 вересня 2001 напад livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 вересня 2001 напад пейджера повідомлення Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

По-друге, завжди на зборі даних дозволяє дослідникам проводити вимірювання в реальному часі, що може бути важливо в умовах, коли політики хочуть не тільки вчитися у існуючого поведінки, але і відповість на нього. Наприклад, дані соціальні медіа можуть бути використані для направлення реагування на стихійні лиха (Castillo 2016) .

На закінчення, завжди на дані системи дозволяють дослідникам вивчати несподівані події і надавати інформацію в реальному часі для осіб, що визначають політику. Я, однак, не передбачають, що, що завжди на дані системи дозволяють дослідникам відстежувати зміни протягом тривалих періодів часу. Це відбувається тому , що багато великих інформаційні системи постійно змінюються-процесу , званого дрейфом (розділ 2.3.2.4).