2.3.1.2 Sempre-on

Always-on big data permite o estudo de eventos inesperados e medición en tempo real.

Moitos sistemas de datos grandes son sempre ligado; están constantemente a recollida de datos. Isto always-on ofrece aos investigadores datos lonxitudinais (é dicir, os datos ao longo do tempo). Sendo always-on ten dúas implicacións importantes para a investigación.

En primeiro lugar, sempre-en recolección de datos permite aos investigadores estudar eventos inesperados de formas que non eran posibles antes. Por exemplo, os investigadores interesados ​​en estudar o ocupe protestas Gezi en Turquía no verán de 2013 será xeralmente se concentran no comportamento dos manifestantes durante o evento. Ceren Budak e Duncan Watts (2015) foron capaces de facer máis, a través da natureza always-on de Twitter para estudar Twitter-usando manifestantes antes, durante e despois do evento. E, eles foron capaces de crear un grupo de comparación de non participantes (ou participantes que non tweet sobre a protesta) antes, durante e despois do evento (Figura 2.1). En total, o seu panel de ex post incluídos os tweets de 30.000 persoas con máis de dous anos. Aumentando os datos comunmente usados ​​as protestas con este outras informacións, Budak e Watts puideron aprender moito máis: eles foron capaces de estimar que tipo de persoas eran máis propensos a participar nas protestas Gezi e estimar os cambios nas actitudes de participantes e non participantes, tanto a curto prazo (comparando condición Gezi para durante Gezi) e, a longo prazo (comparando condición Gezi a post-Gezi).

Figura 2.1: Proxecto usado por Budak e Watts (2015) para estudar o ocupe protestas Gezi en Turquía no verán de 2013. Usando a natureza always-on Twitter, os investigadores crearon o que chamaron de un panel de ex post, que incluíu uns 30.000 persoas con máis de dous anos. En contraste, o estudo típico que incidir sobre os participantes durante as protestas, o panel de ex post engade 1) Os datos dos participantes 2) datos de non-participantes antes, durante, antes e despois do evento e, e despois do evento. Esta estrutura de datos enriquecido habilitado Budak e Watts para estimar que tipo de persoas eran máis propensos a participar nas protestas Gezi e estimar os cambios nas actitudes dos participantes e non participantes, tanto a curto prazo (comparando condición Gezi para durante Gezi) e, a longo prazo (comparando condición Gezi a post-Gezi).

Figura 2.1: Proxecto usado por Budak and Watts (2015) para estudar o ocupe protestas Gezi en Turquía no verán de 2013. Usando a natureza always-on Twitter, os investigadores crearon o que chamaron de un panel de ex post, que incluíu uns 30.000 persoas con máis de dous anos. En contraste, o estudo típico que incidir sobre os participantes durante as protestas, o panel de ex post engade 1) Os datos dos participantes 2) datos de non-participantes antes, durante, antes e despois do evento e, e despois do evento. Esta estrutura de datos enriquecido habilitado Budak e Watts para estimar que tipo de persoas eran máis propensos a participar nas protestas Gezi e estimar os cambios nas actitudes dos participantes e non participantes, tanto a curto prazo (comparando condición Gezi para durante Gezi) e, a longo prazo (comparando condición Gezi a post-Gezi).

É certo que algunhas destas estimacións podería ser feito sen always-on fontes de obtención de datos (por exemplo, as estimacións de longo prazo do cambio de actitude), aínda que esta recollida de datos para 30.000 persoas serían moi caro. E, mesmo cun orzamento ilimitado, eu non podo pensar en calquera outro método que esencialmente permite aos investigadores para viaxar de volta no tempo e observar directamente o comportamento participantes no pasado. A alternativa máis próxima sería a recoller informes retrospectivos de comportamento, pero estes informes serían de granularidade limitada e precisión cuestionable. Táboa 2.1 ofrece outros exemplos de estudos que usan un sempre-en fonte de datos para estudar un evento inesperado.

Táboa 2.1: Estudos de eventos inesperados usando sempre-en fontes de datos grandes.
acontecemento inesperado Always-on de datos de orixe cita
Ocupe o movemento Gezi en Turquía chilro Budak and Watts (2015)
protestas paraugas en Hong Kong Weibo Zhang (2016)
Tiroteos de policía de Nova York Stop-and-Frisk informes Legewie (2016)
Unha persoa que une ISIS chilro Magdy, Darwish, and Weber (2016)
11 de setembro de 2001 de ataque livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 de setembro de 2001 de ataque mensaxes de pager Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

En segundo lugar, always-on obtención de datos permite aos investigadores para producir medicións en tempo real, que pode ser importante en lugares onde os decisores políticos queren non só aprender o comportamento existente, senón tamén responder a ela. Por exemplo, datos de comunicación social pode ser usado para orientar respostas desastres naturais (Castillo 2016) .

En conclusión, always-on Data Systems permitir aos investigadores estudar eventos inesperados e proporcionar información en tempo real para os decisores políticos. Non, non obstante, propoñen que que always-on Data Systems permitir aos investigadores para seguir os cambios durante longos períodos de tempo. Isto é porque moitos sistemas de datos grandes están constantemente a cambiar-un proceso chamado deriva (Sección 2.3.2.4).