2.3.1.2 Bob amser-on

Bob amser-ar ddata mawr yn galluogi astudiaeth o ddigwyddiadau annisgwyl a mesur amser real.

Mae llawer o systemau data mawr bob amser-ar; maent yn gyson yn casglu data. Mae'r nodwedd hon bob amser-ar yn darparu ymchwilwyr data hydredol (hy, data dros gyfnod o amser). Being ymlaen bob amser wedi dwy oblygiadau pwysig ar gyfer ymchwil.

Yn gyntaf, bob amser yn-ar gasglu data yn galluogi ymchwilwyr i astudio digwyddiadau annisgwyl mewn ffyrdd nad oedd yn bosibl o'r blaen. Er enghraifft, byddai ymchwilwyr sydd â diddordeb mewn astudio y Occupy protestiadau Gezi yn Nhwrci yn ystod haf 2013 fel arfer yn canolbwyntio ar ymddygiad protestwyr yn ystod y digwyddiad. Ceren Budak a Duncan Watts (2015) yn gallu gwneud mwy drwy ddefnyddio natur Twitter bob amser-ar i astudio Twitter-ddefnyddio protestwyr cyn, yn ystod, ac ar ôl y digwyddiad. Ac, roeddent yn gallu i greu grŵp cymhariaeth o nad ydynt yn cymryd rhan (neu gyfranogwyr nad oedd yn trydar am y brotest) cyn, yn ystod, ac ar ôl y digwyddiad (Ffigur 2.1). Yn gyfanswm eu panel ex-post yn cynnwys y tweets o 30,000 o bobl dros ddwy flynedd. Trwy ychwanegu at y data a ddefnyddir yn gyffredin gan y protestiadau gyda hyn wybodaeth arall, roedd Budak a Watts gallu dysgu llawer mwy: roeddent yn gallu amcangyfrif pa fathau o bobl yn fwy tebygol o gymryd rhan yn y protestiadau Gezi ac i amcangyfrif y newidiadau mewn agweddau o cyfranogwyr a nad ydynt yn cyfranogi, yn y tymor byr (cymharu cyn-Gezi i ystod Gezi) ac yn y tymor hir (cymharu cyn-Gezi i-Gezi postio).

Ffigur 2.1: Dylunio a ddefnyddir gan Budak a Watts (2015) i astudio'r Occupy protestiadau Gezi yn Nhwrci yn ystod haf 2013. Drwy ddefnyddio natur Twitter bob amser-ar, yr ymchwilwyr a grëwyd yr hyn y maent elwir panel ex-bost a oedd yn cynnwys tua 30,000 o bobl dros ddwy flynedd. Mewn cyferbyniad yr astudiaeth nodweddiadol a oedd yn canolbwyntio ar y cyfranogwyr yn ystod y protestiadau, mae'r panel ex-post yn ychwanegu 1) data gan gyfranogwyr cyn ac ar ôl y digwyddiad a 2) data o nad ydynt yn cyfranogi cyn, yn ystod, ac ar ôl y digwyddiad. Mae'r strwythur data gyfoethogi galluogi Budak a Watts i amcangyfrif pa fathau o bobl yn fwy tebygol o gymryd rhan yn y protestiadau Gezi ac i amcangyfrif y newidiadau mewn agweddau o gyfranogwyr a nad ydynt yn cyfranogi, yn y tymor byr (cymharu cyn-Gezi i ystod Gezi) ac yn y tymor hir (cymharu cyn-Gezi i ôl-Gezi).

Ffigur 2.1: Dylunio a ddefnyddir gan Budak and Watts (2015) i astudio'r Occupy protestiadau Gezi yn Nhwrci yn ystod haf 2013. Drwy ddefnyddio natur Twitter bob amser-ar, yr ymchwilwyr a grëwyd yr hyn y maent elwir panel ex-bost a oedd yn cynnwys tua 30,000 o bobl dros ddwy flynedd. Mewn cyferbyniad yr astudiaeth nodweddiadol a oedd yn canolbwyntio ar y cyfranogwyr yn ystod y protestiadau, mae'r panel ex-post yn ychwanegu 1) data gan gyfranogwyr cyn ac ar ôl y digwyddiad a 2) data o nad ydynt yn cyfranogi cyn, yn ystod, ac ar ôl y digwyddiad. Mae'r strwythur data gyfoethogi galluogi Budak a Watts i amcangyfrif pa fathau o bobl yn fwy tebygol o gymryd rhan yn y protestiadau Gezi ac i amcangyfrif y newidiadau mewn agweddau o gyfranogwyr a nad ydynt yn cyfranogi, yn y tymor byr (cymharu cyn-Gezi i ystod Gezi) ac yn y tymor hir (cymharu cyn-Gezi i ôl-Gezi).

Mae'n wir y gallai rhai o'r amcangyfrifon hyn wedi cael eu gwneud heb bob amser-ar ffynonellau casglu data (ee, amcangyfrifon tymor hir o newid agwedd), er y byddai casglu data o'r fath ar gyfer 30,000 o bobl wedi bod yn eithaf drud. Ac, hyd yn oed o ystyried cyllideb anghyfyngedig, ni allaf feddwl am unrhyw ddull arall sydd yn y bôn yn caniatáu i ymchwilwyr i deithio yn ôl mewn amser ac arsylwi cyfranogwyr ymddygiad yn uniongyrchol yn y gorffennol. Y dewis arall agosaf yn casglu adroddiadau ôl-weithredol o ymddygiad, ond byddai adroddiadau hyn fod o granularity cyfyngedig a chywirdeb amheus. Tabl 2.1 yn rhoi enghreifftiau eraill o astudiaethau sy'n defnyddio bob amser-ar y ffynhonnell ddata i astudio digwyddiad annisgwyl.

Tabl 2.1: Astudiaethau o ddigwyddiadau annisgwyl gan ddefnyddio bob amser-ar ffynonellau data mawr.
digwyddiad annisgwyl Bob amser-ar ddata ffynhonnell Enwi
Meddiannu symudiad Gezi yn Nhwrci Twitter Budak and Watts (2015)
protestiadau Umbrella yn Hong Kong Weibo Zhang (2016)
Shootings yr heddlu yn Ninas Efrog Newydd adroddiadau-a-frisk Stop Legewie (2016)
Person ymuno ISIS Twitter Magdy, Darwish, and Weber (2016)
Medi 11, 2001 ymosodiad livejournal.com Cohn, Mehl, and Pennebaker (2004)
Medi 11, 2001 ymosodiad negeseuon peiriant galw Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Yn ail, bob amser yn-ar gasglu data yn galluogi ymchwilwyr i gynhyrchu mesuriadau amser real, a all fod yn bwysig mewn lleoliadau lle mae gwneuthurwyr polisi eisiau nid yn unig yn dysgu oddi wrth ymddygiad presennol ond hefyd yn ymateb iddo. Er enghraifft, gall data cyfryngau cymdeithasol yn cael eu defnyddio i arwain ymateb i drychinebau naturiol (Castillo 2016) .

I gloi, bob amser yn-ar ddata systemau galluogi ymchwilwyr i astudio digwyddiadau annisgwyl ac yn darparu gwybodaeth amser real i lunwyr polisi. na wnes i, fodd bynnag, yn cynnig bod hynny bob amser-ar ddata systemau galluogi ymchwilwyr i olrhain newidiadau dros gyfnodau hir o amser. Mae hynny oherwydd bod llawer o systemau data mawr yn newid-proses o'r enw drifft (Adran 2.3.2.4) yn gyson.