2.3.1.2 Always-on

Секогаш на големи податоци им овозможува на студија на неочекувани настани и мерење во реално време.

Многу големи системи на податоци се секогаш на; тие се постојано собирање на податоци. Ова секогаш-на карактеристика обезбедува истражувачи со надолжни податоци (на пример, податоци со текот на времето). Да се ​​биде секогаш на има две важни импликации за истражување.

Прво, секогаш на собирање на податоци овозможува на истражувачите да учат неочекувани настани на начини кои не се можни претходно. На пример, истражувачите заинтересирани за изучување на Окупирај Гези протести во Турција во текот на летото на 2013 година, обично ќе се фокусира на однесувањето на демонстрантите за време на настанот. Ceren Будак и Данкан Вотс (2015) беа во можност да се направи повеќе со користење на секогаш-на природата на Твитер да учат Твитер користење на демонстрантите пред, за време и по настанот. И, тие беа во можност да се создаде споредба група на не-учесници (или учесници кои не чуруликам за протестот) пред, за време и по настанот (Слика 2.1). Во нивната вкупна ex-post комисијата е вклучен tweets на 30.000 лица во текот на две години. Преку јакнење на најчесто се користи за податоци од протестите со овој и други информации, Будак и Вотс имаа можност да научат многу повеќе: тие беа во можност да се процени какви типови на луѓе се со поголема веројатност да учествуваат во Гези протести и да се процени промени во ставовите на учесниците и не-учесници, и на краток рок (во споредба претходно Гези на време Гези) и на долг рок (во споредба претходно Гези во пост-Гези).

Слика 2.1: дизајн се користи од страна на Будак и Вотс (2015) ги проучува Окупирај Гези протести во Турција во текот на летото на 2013 година Со користење на секогаш-на природата на Твитер, истражувачите создаде она што се нарекува на ex-post панел кој учествуваа околу 30.000 луѓе во текот на две години. За разлика од типичните студија, фокусирана на учесниците за време на протестите, ex-post панел додава 1) податоци од учесниците пред и по настанот и 2) податоци од не-учесниците пред, за време и по настанот. Ова збогатен податоци структура от Будак и Вотс за да се процени какви типови на луѓе се со поголема веројатност да учествуваат во Гези протести и да се процени промени во ставовите на учесниците и не-учесници, и на краток рок (во споредба претходно Гези на време Гези) и на долг рок (во споредба претходно Гези во пост-Гези).

Слика 2.1: дизајн се користи од страна на Budak and Watts (2015) да се учат на Окупирај Гези протести во Турција во текот на летото на 2013 година Со користење на секогаш-на природата на Твитер, истражувачите создаде она што се нарекува на ex-post панел кој учествуваа околу 30.000 луѓе во текот на две години. За разлика од типичните студија, фокусирана на учесниците за време на протестите, ex-post панел додава 1) податоци од учесниците пред и по настанот и 2) податоци од не-учесниците пред, за време и по настанот. Ова збогатен податоци структура от Будак и Вотс за да се процени какви типови на луѓе се со поголема веројатност да учествуваат во Гези протести и да се процени промени во ставовите на учесниците и не-учесници, и на краток рок (во споредба претходно Гези на време Гези) и на долг рок (во споредба претходно Гези во пост-Гези).

Точно е дека некои од овие проценки би можело да се направи без секогаш на извори на собирање на податоци (на пример, долгорочните проценки за промена став), иако колекција таквите податоци за 30.000 луѓе би биле прилично скапи. И, дури и со оглед неограничен буџет, не можам да се сетам на било кој друг метод, кој во основа им овозможува на истражувачите да патуваат назад во времето и директно набљудување на однесувањето на учесниците во минатото. Најблиску алтернатива би била да се соберат ретроспективни извештаи на однесување, но овие извештаи ќе биде ограничена на честички и сомнителни точност. Табела 2.1, обезбедува и други примери на студии кои користат секогаш на извор на податоци за да се учат на неочекуван настан.

Табела 2.1: Студии на неочекувани настани, користејќи секогаш на големите извори на податоци.
неочекуван настан Секогаш на извор на податоци цитат
Окупираат движење Гези во Турција Твитер Budak and Watts (2015)
Чадор протести во Хонг Конг Веибо Zhang (2016)
Престрелки на полицијата во Њујорк Стоп-и-frisk извештаи Legewie (2016)
Лице се приклучи на ИСИС Твитер Magdy, Darwish, and Weber (2016)
Септември 11, 2001 напад livejournal.com Cohn, Mehl, and Pennebaker (2004)
Септември 11, 2001 напад пејџер пораки Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Второ, секогаш на собирање на податоци овозможува на истражувачите да се произведе мерења во реално време, кои можат да бидат важни во подесувањата каде што креаторите на политиката сакате да не само да учат од постоечките однесување, туку и одговори на неа. На пример, социјалните медиуми податоци можат да се користат за одговори на природни катастрофи (Castillo 2016) .

Во заклучок, секогаш на податоци системи им овозможуваат на истражувачите да учат неочекувани настани и да се обезбеди информации во реално време за креаторите на политиката. Јас не, сепак, да предложи дека секогаш на податоци системи им овозможуваат на истражувачите да се следат промените во текот на долги периоди на време. Тоа е затоа што многу големи податоци системи се постојано се менува-процес наречен лебдат (Оддел 2.3.2.4).