Always-on big data permite o estudo de eventos inesperados e medición en tempo real.
Moitos sistemas de datos grandes son sempre ligado; están constantemente a recollida de datos. Isto always-on ofrece aos investigadores datos lonxitudinais (é dicir, os datos ao longo do tempo). Sendo always-on ten dúas implicacións importantes para a investigación.
En primeiro lugar, sempre-en recolección de datos permite aos investigadores estudar eventos inesperados de formas que non eran posibles antes. Por exemplo, os investigadores interesados en estudar o ocupe protestas Gezi en Turquía no verán de 2013 será xeralmente se concentran no comportamento dos manifestantes durante o evento. Ceren Budak e Duncan Watts (2015) foron capaces de facer máis, a través da natureza always-on de Twitter para estudar Twitter-usando manifestantes antes, durante e despois do evento. E, eles foron capaces de crear un grupo de comparación de non participantes (ou participantes que non tweet sobre a protesta) antes, durante e despois do evento (Figura 2.1). En total, o seu panel de ex post incluídos os tweets de 30.000 persoas con máis de dous anos. Aumentando os datos comunmente usados as protestas con este outras informacións, Budak e Watts puideron aprender moito máis: eles foron capaces de estimar que tipo de persoas eran máis propensos a participar nas protestas Gezi e estimar os cambios nas actitudes de participantes e non participantes, tanto a curto prazo (comparando condición Gezi para durante Gezi) e, a longo prazo (comparando condición Gezi a post-Gezi).
É certo que algunhas destas estimacións podería ser feito sen always-on fontes de obtención de datos (por exemplo, as estimacións de longo prazo do cambio de actitude), aínda que esta recollida de datos para 30.000 persoas serían moi caro. E, mesmo cun orzamento ilimitado, eu non podo pensar en calquera outro método que esencialmente permite aos investigadores para viaxar de volta no tempo e observar directamente o comportamento participantes no pasado. A alternativa máis próxima sería a recoller informes retrospectivos de comportamento, pero estes informes serían de granularidade limitada e precisión cuestionable. Táboa 2.1 ofrece outros exemplos de estudos que usan un sempre-en fonte de datos para estudar un evento inesperado.
acontecemento inesperado | Always-on de datos de orixe | cita |
---|---|---|
Ocupe o movemento Gezi en Turquía | chilro | Budak and Watts (2015) |
protestas paraugas en Hong Kong | Zhang (2016) | |
Tiroteos de policía de Nova York | Stop-and-Frisk informes | Legewie (2016) |
Unha persoa que une ISIS | chilro | Magdy, Darwish, and Weber (2016) |
11 de setembro de 2001 de ataque | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11 de setembro de 2001 de ataque | mensaxes de pager | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
En segundo lugar, always-on obtención de datos permite aos investigadores para producir medicións en tempo real, que pode ser importante en lugares onde os decisores políticos queren non só aprender o comportamento existente, senón tamén responder a ela. Por exemplo, datos de comunicación social pode ser usado para orientar respostas desastres naturais (Castillo 2016) .
En conclusión, always-on Data Systems permitir aos investigadores estudar eventos inesperados e proporcionar información en tempo real para os decisores políticos. Non, non obstante, propoñen que que always-on Data Systems permitir aos investigadores para seguir os cambios durante longos períodos de tempo. Isto é porque moitos sistemas de datos grandes están constantemente a cambiar-un proceso chamado deriva (Sección 2.3.2.4).