Altyd-op groot data in staat stel om die studie van onverwagse gebeure en real-time meting.
Baie groot data stelsels is altyd-op; Hulle is voortdurend die versameling van data. Dit altyd-op kenmerkende bied navorsers longitudinale data (dit wil sê, data met verloop van tyd). Om altyd-op het twee belangrike implikasies vir navorsing.
In die eerste plek maak dit altyd moontlik dat navorsers onverwagte gebeure bestudeer op maniere wat andersins nie moontlik sou wees nie. Byvoorbeeld, navorsers wat belangstel om die Occupy Gezi-protes in Turkye in die somer van 2013 te bestudeer, sal tipies fokus op die gedrag van betogers tydens die geleentheid. Ceren Budak en Duncan Watts (2015) was in staat om meer te doen deur die gebruik van die voortdurende natuur van Twitter te gebruik om betogers te gebruik wat Twitter voor, gedurende en na die geleentheid gebruik het. En hulle kon 'n vergelykingsgroep van nie-deelnemers voor, gedurende en na die gebeurtenis skep (figuur 2.2). In totaal het hul ekspaneelpaneel die tweets van 30,000 mense oor twee jaar ingesluit. Deur die algemeen gebruikte data uit die protes met hierdie ander inligting te vergroot, kon Budak en Watts baie meer leer: hulle was in staat om te skat watter soort mense meer geneig was om aan die Gezi-protes deel te neem en die veranderinge in houdings van deelnemers en nie-deelnemers, beide op kort termyn (vergelykende pre-Gezi na Gezi) en op lang termyn (vergelyking van pre-Gezi met post-Gezi).
'N Skeptiese kan daarop wys dat sommige van hierdie ramings sonder onophoudelike data-insamelingsbronne gemaak kon word (bv. Langtermynberamings van houdingsverandering) en dit is korrek, hoewel so 'n data-insameling vir 30 000 mense nogal sou gewees het duur. Selfs 'n onbeperkte begroting gegee, kan ek egter nie aan enige ander metode dink wat navorsers in wese toelaat om betyds terug te keer en die gedrag van deelnemers in die verlede direk te waarneem nie. Die naaste alternatief sal wees om terugwerkende verslae van gedrag te versamel, maar hierdie verslae sal van beperkte korrelasie en twyfelagtige akkuraatheid wees. tabel 2.1 verskaf ander voorbeelde van studies wat 'n voortdurend data bron gebruik om 'n onverwagte gebeurtenis te bestudeer.
Onverwagte gebeurtenis | Altyd op data bron | aanhaling |
---|---|---|
Beoefen Gezi-beweging in Turkye | Budak and Watts (2015) | |
Sambreel protes in Hong Kong | Zhang (2016) | |
Skietery van die polisie in New York | Stop-en-vars verslae | Legewie (2016) |
Persoon wat by ISIS aansluit | Magdy, Darwish, and Weber (2016) | |
11 September 2001 aanval | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11 September 2001 aanval | pager boodskappe | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Behalwe om onverwagte gebeure te bestudeer, stel altyd-op groot datastelsels ook navorsers in staat om real-time ramings te produseer. Dit kan belangrik wees in instellings waar beleidmakers in die regering of in die industrie wil reageer op grond van situasionele bewustheid. Byvoorbeeld, sosiale media data kan gebruik word om noodreaksie op natuurrampe (Castillo 2016) en 'n verskeidenheid verskillende groot data bronne kan gebruik word om real-time ramings van ekonomiese aktiwiteit te produseer (Choi and Varian 2012) .
Ten slotte stel altyd-op-datastelsels navorsers in staat om onverwagte gebeure te bestudeer en real-time inligting aan beleidsmakers te bied. Ek dink egter nie dat altyd-op-datastelsels goed geskik is vir die dop van veranderinge oor baie lang tydperke nie. Dit is omdat baie groot datastelsels voortdurend verander - 'n proses wat ek later in die hoofstuk gaan dryf (afdeling 2.3.7).