Always-op grutte gegevens stelt de stúdzje fan ûnferwachte eveneminten en real-time mjitting.
In protte grutte gegevens systemen binne altyd-op; se wurde hieltyd it sammeljen fan gegevens. Dit altyd-op karakteristyk jout ûndersikers mei longitudinaal gegevens (ie, gegevens oer tiid). Being altyd-op hat twa wichtige gefolgen foar ûndersyk.
Earst, altyd op datasammeljen kin ûndersikers ûnferwachte eveneminten ûndersiikje op wegen dy't net oars mooglik wêze. Bygelyks binne ûndersikers dy't yn 'e simmer fan 2013 ûndersykje te ûndersykjen fan' e Occupy Gezi protesten yn Turkije yn 'e simmer fan 2013 soe it gewoan op it gedrach fan' e protestanten yn 't barre rjochtsje. Ceren Budak en Duncan Watts (2015) kinne mear dwaan troch it brûken fan de altiten op natuer fan Twitter om ûndersikers te studearjen dy't Twitter foardat, yn en nei it barren brûkt hawwe. En, se wienen in fergeliking groep fan nonparticipanten te meitsjen foar, yn 'e nach en nei it evenemint (figuer 2.2). Yn totaal hawwe har eks- postpaniel de tweets fan 30.000 minsken oer twa jier opnommen. Troch it útwreidzjen fan gewoan gebrûkte gegevens fan 'e protesten mei dizze oare ynformaasje, kinne Budak en Watts folle mear leare: se wisten te beskriuwen hokker soarten minsken wierskynlik meidwaan meidwaan oan' e Gezi-protesten en om de feroaringen yn 'e hâlding fan dielnimmers en net-partisipanten, sawol op 'e koarte termyn (fergeliking foar Gezi oant Gezi) en op lange termyn (fergeliking foar Gezi mei post-Gezi).
In skeptikus kin oanjaan dat guon fan dizze skatten sûnder altyd op data sammelingsboarnen makke wurde kinne (bygelyks langstannige skatten fan attitude-feroaring), en dat is krekt, hoewol't sa'n dataekolleksje foar 30.000 minsken frij wêze soe djoer. Sawol in unlimitearre budzjet kin lykwols net tinke oan in oare metoade dy't de ûndersikers yn 'e rin fan elke wize tagelyk reizgje kinne en direkt it gedrach fan dielnimmers yn it ferline observearje. It tichteste alternatyf soe wêze moatte om retrosjale rapporten fan gedrach te sammeljen, mar dizze rapporten soe fan beheind koartereens wêze en dúdlikens genôch. Tabel 2.1 jout oare foarbylden fan stúdzjes dy't gebrûk meitsje fan in altyd op dat boarne om in unferwachts evenemint te studearjen.
Unferwachts evenemint | Altyd op gegevensboarne | Citation |
---|---|---|
Bewurkje Gezibeweging yn Turkije | Budak and Watts (2015) | |
Regelmjittige protesten yn Hong Kong | Zhang (2016) | |
Shootings fan plysje yn New York City | Stop-en-frisk berjochten | Legewie (2016) |
Persoan byinoar by ISIS | Magdy, Darwish, and Weber (2016) | |
11 septimber 2001 oanfalle | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11 septimber 2001 oanfalle | pager-berjochten | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Neist it ûntdekken fan unferwachte eveneminten, altyd op grutte datasjemooglikheden kinne ûndersikers ek meitsje om echte-timings te meitsjen, dy't wichtich wêze kinne yn 'e ynstellings dêr't politike makkers yn regearing of yndustry wolle op reagearje op basis fan situaasje bewustwêzen. Sa kinne bygelyks sosjale mediagegevens brûkt wurde foar it behertigjen fan needdrugs op natuerlike rampen (Castillo 2016) en in ferskaat oan ferskate grutte data boarnen kinne gebrûk meitsje fan echte-tiidskattaten fan 'e ekonomyske aktiviteit (Choi and Varian 2012) .
Yn ôfsluting kinne altyd op datassysteem ûndersikers ynskeakelje om unferwachte eveneminten te studearjen en realisearjende ynformaasje te jaan oan beliedsmakkers. Ik tink lykwols net dat dat altyd op datasysteem suksesfol binne foar it kontrolearjen fan feroaringen oer tige lange tydskriften. Dat is om't in protte grutte datasysystemen hieltyd feroarje - in proses dat ik letter sprekke sil yn it haadstik (seksje 2.3.7).