2.3.1.2 Sempre-on

Esta tradución foi creado por un ordenador. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

2.3.1.2 Sempre-on

Always-on big data permite o estudo de eventos inesperados e medición en tempo real.

Moitos sistemas de datos grandes son sempre ligado; están constantemente a recollida de datos. Isto always-on ofrece aos investigadores datos lonxitudinais (é dicir, os datos ao longo do tempo). Sendo always-on ten dúas implicacións importantes para a investigación.

En primeiro lugar, sempre-en recolección de datos permite aos investigadores estudar eventos inesperados de formas que non eran posibles antes. Por exemplo, os investigadores interesados en estudar o ocupe protestas Gezi en Turquía no verán de 2013 será xeralmente se concentran no comportamento dos manifestantes durante o evento. Ceren Budak e Duncan Watts (2015) foron capaces de facer máis, a través da natureza always-on de Twitter para estudar Twitter-usando manifestantes antes, durante e despois do evento. E, eles foron capaces de crear un grupo de comparación de non participantes (ou participantes que non tweet sobre a protesta) antes, durante e despois do evento (Figura 2.1). En total, o seu panel de ex post incluídos os tweets de 30.000 persoas con máis de dous anos. Aumentando os datos comunmente usados as protestas con este outras informacións, Budak e Watts puideron aprender moito máis: eles foron capaces de estimar que tipo de persoas eran máis propensos a participar nas protestas Gezi e estimar os cambios nas actitudes de participantes e non participantes, tanto a curto prazo (comparando condición Gezi para durante Gezi) e, a longo prazo (comparando condición Gezi a post-Gezi).

Figura 2.1: Proxecto usado por Budak e Watts (2015) para estudar o ocupe protestas Gezi en Turquía no verán de 2013. Usando a natureza always-on Twitter, os investigadores crearon o que chamaron de un panel de ex post, que incluíu uns 30.000 persoas con máis de dous anos. En contraste, o estudo típico que incidir sobre os participantes durante as protestas, o panel de ex post engade 1) Os datos dos participantes 2) datos de non-participantes antes, durante, antes e despois do evento e, e despois do evento. Esta estrutura de datos enriquecido habilitado Budak e Watts para estimar que tipo de persoas eran máis propensos a participar nas protestas Gezi e estimar os cambios nas actitudes dos participantes e non participantes, tanto a curto prazo (comparando condición Gezi para durante Gezi) e, a longo prazo (comparando condición Gezi a post-Gezi).

Figura 2.1: Proxecto usado por Budak and Watts (2015) para estudar o ocupe protestas Gezi en Turquía no verán de 2013. Usando a natureza always-on Twitter, os investigadores crearon o que chamaron de un panel de ex post, que incluíu uns 30.000 persoas con máis de dous anos. En contraste, o estudo típico que incidir sobre os participantes durante as protestas, o panel de ex post engade 1) Os datos dos participantes 2) datos de non-participantes antes, durante, antes e despois do evento e, e despois do evento. Esta estrutura de datos enriquecido habilitado Budak e Watts para estimar que tipo de persoas eran máis propensos a participar nas protestas Gezi e estimar os cambios nas actitudes dos participantes e non participantes, tanto a curto prazo (comparando condición Gezi para durante Gezi) e, a longo prazo (comparando condición Gezi a post-Gezi).

É certo que algunhas destas estimacións podería ser feito sen always-on fontes de obtención de datos (por exemplo, as estimacións de longo prazo do cambio de actitude), aínda que esta recollida de datos para 30.000 persoas serían moi caro. E, mesmo cun orzamento ilimitado, eu non podo pensar en calquera outro método que esencialmente permite aos investigadores para viaxar de volta no tempo e observar directamente o comportamento participantes no pasado. A alternativa máis próxima sería a recoller informes retrospectivos de comportamento, pero estes informes serían de granularidade limitada e precisión cuestionable. Táboa 2.1 ofrece outros exemplos de estudos que usan un sempre-en fonte de datos para estudar un evento inesperado.

Táboa 2.1: Estudos de eventos inesperados usando sempre-en fontes de datos grandes.
acontecemento inesperado	Always-on de datos de orixe	cita
Ocupe o movemento Gezi en Turquía	chilro	Budak and Watts (2015)
protestas paraugas en Hong Kong	Weibo	Zhang (2016)
Tiroteos de policía de Nova York	Stop-and-Frisk informes	Legewie (2016)
Unha persoa que une ISIS	chilro	Magdy, Darwish, and Weber (2016)
11 de setembro de 2001 de ataque	livejournal.com	Cohn, Mehl, and Pennebaker (2004)
11 de setembro de 2001 de ataque	mensaxes de pager	Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

En segundo lugar, always-on obtención de datos permite aos investigadores para producir medicións en tempo real, que pode ser importante en lugares onde os decisores políticos queren non só aprender o comportamento existente, senón tamén responder a ela. Por exemplo, datos de comunicación social pode ser usado para orientar respostas desastres naturais (Castillo 2016) .

En conclusión, always-on Data Systems permitir aos investigadores estudar eventos inesperados e proporcionar información en tempo real para os decisores políticos. Non, non obstante, propoñen que que always-on Data Systems permitir aos investigadores para seguir os cambios durante longos períodos de tempo. Isto é porque moitos sistemas de datos grandes están constantemente a cambiar-un proceso chamado deriva (Sección 2.3.2.4).