2.3.1.2 Всегда-на

Всегда-на больших данных позволяет изучать неожиданных событий и измерений в режиме реального времени.

Многие крупные информационные системы всегда-на; они постоянно собирает данные. Это всегда на характеристика обеспечивает исследователям продольных данных (т.е. данных с течением времени). Будучи всегда на два важных последствия для исследований.

Во-первых, всегда на сборе данных позволяет исследователям изучать неожиданные события способами, которые не были возможны ранее. Например, исследователи, заинтересованные в изучении Занимайте Gezi протесты в Турции летом 2013 года, как правило, сосредоточены на поведении протестующих во время мероприятия. Серен Будак и Дункан Уоттс (2015) были в состоянии сделать больше, используя всегда на природу Twitter , чтобы , прежде чем изучать Twitter-используя протестующих, во время и после мероприятия. И они были в состоянии создать группу сравнения лиц, не являющихся участниками (или участников, которые не чирикать о протесте) до, во время и после мероприятия (Рисунок 2.1). В общей сложности их постфактум группы входили твиты 30000 человек в течение двух лет. Путем увеличения часто используемые данные от протестов с этой другой информации, Будак и Уоттс смогли узнать гораздо больше: они были в состоянии оценить, какие люди были более склонны к участию в Gezi протестов и оценить изменения в отношениях участники и не являющиеся участниками, как в краткосрочной перспективе (сравнивая предварительно Gezi в течение Gezi) и в долгосрочной перспективе (сравнивая пре-Gezi пост-Gezi).

Рисунок 2.1: Конструкция используется Будак и Уоттс (2015) для изучения Занимайте Gezi протесты в Турции летом 2013 года Используя всегда на природу Twitter, исследователи создали то, что они называют постфактум панель, которая включала около 30000 человек в течение двух лет. В отличие от типичного исследования, которое сосредоточено на участников во время протестов, экс-пост панель добавляет 1) данные от участников до и после события и 2) данные, не являющихся участниками до, во время и после мероприятия. Эта обогащенная структура данных позволило Будак и ватты, чтобы оценить, какие люди были более склонны к участию в Gezi протестов и оценить изменения в отношении участников и неучастников, как в краткосрочной перспективе (сравнивая предварительно Gezi в течение Gezi) и в долгосрочной перспективе (сравнивая предварительно Gezi пост-Gezi).

Рисунок 2.1: Конструкция используется Budak and Watts (2015) для изучения Занимайте Gezi протесты в Турции летом 2013 года Используя всегда на природу Twitter, исследователи создали то , что они называют постфактум панель , которая включала около 30000 человек в течение двух лет. В отличие от типичного исследования, которое сосредоточено на участников во время протестов, экс-пост панель добавляет 1) данные от участников до и после события и 2) данные, не являющихся участниками до, во время и после мероприятия. Эта обогащенная структура данных позволило Будак и ватты, чтобы оценить, какие люди были более склонны к участию в Gezi протестов и оценить изменения в отношении участников и неучастников, как в краткосрочной перспективе (сравнивая предварительно Gezi в течение Gezi) и в долгосрочной перспективе (сравнивая предварительно Gezi пост-Gezi).

Это правда, что некоторые из этих оценок могли бы быть сделаны без всегда на источники сбора данных (например, долгосрочные оценки изменения отношения), хотя сбор таких данных для 30000 человек были бы довольно дорого. И, даже учитывая неограниченный бюджет, я не могу думать о какой - либо другой метод , который по существу позволяет исследователям путешествовать назад во времени и непосредственно наблюдать за поведением участников в прошлом. Ближайшей альтернативой будет собирать ретроспективные отчеты о поведении, однако эти отчеты будут иметь ограниченную зернистости и сомнительной точности. В таблице 2.1 представлены другие примеры исследований, которые используют всегда на источнике данных для изучения неожиданное событие.

Таблица 2.1: Исследования с использованием неожиданных событий всегда на больших источников данных.
Неожиданное событие Всегда-на исходных данных цитирование
Занимайте движение Gezi в Турции щебетать Budak and Watts (2015)
Зонт протесты в Гонконге Weibo Zhang (2016)
Съёмки полиции в Нью-Йорке Стоп-и-FRISK отчеты Legewie (2016)
Вступающий ISIS щебетать Magdy, Darwish, and Weber (2016)
11 сентября 2001 нападение livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 сентября 2001 нападение пейджера сообщения Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Во-вторых, всегда на сборе данных позволяет исследователям производить измерения в реальном времени, что может быть важно в условиях, когда политики хотят не только учиться у существующего поведения, но и ответит на него. Например, данные социальные медиа могут быть использованы для направления реагирования на стихийные бедствия (Castillo 2016) .

В заключение, всегда на данные системы позволяют исследователям изучать неожиданные события и предоставлять информацию в реальном времени для лиц, определяющих политику. Я, однако, не предполагают, что, что всегда на данные системы позволяют исследователям отслеживать изменения в течение длительных периодов времени. Это происходит потому , что многие крупные информационные системы постоянно меняются-процесса , называемого дрейфом (раздел 2.3.2.4).