Altid-på store data muliggør studiet af uventede begivenheder og real-time måling.
Mange store datasystemer er altid-on; de konstant at indsamle data. Dette altid-på karakteristik giver forskere med langsgående data (dvs. data over tid). Bliver altid-on har to vigtige konsekvenser for forskning.
Først altid-on dataindsamling giver forskerne at studere uventede begivenheder på måder, som ikke var mulige tidligere. For eksempel vil forskerne gerne vil læse i Occupy Gezi protester i Tyrkiet i sommeren 2013 typisk fokusere på adfærd demonstranter under arrangementet. Ceren Budak og Duncan Watts (2015) var i stand til at gøre mere ved hjælp af altid-på natur Twitter til at studere Twitter-bruger demonstranter før, under og efter arrangementet. Og, de var i stand til at skabe en sammenligningsgruppe af ikke-deltagere (eller deltagere, der ikke tweet om protesten) før, under og efter arrangementet (Figur 2.1). I alt omfattede deres efterfølgende panel tweets på 30.000 personer over to år. Ved at forstærke de almindeligt anvendte data fra protesterne med denne anden information, Budak og Watts var i stand til at lære meget mere: de var i stand til at vurdere, hvad slags mennesker var mere tilbøjelige til at deltage i de Gezi protester og til at estimere ændringer i holdninger deltagere og ikke-deltagere, både på kort sigt (sammenligning pre-Gezi til under Gezi) og på lang sigt (sammenligning pre-Gezi at bogføre-Gezi).
Det er rigtigt, at nogle af disse skøn kunne have været gjort uden altid-på dataindsamling kilder (f.eks langsigtede estimater af holdningsændring), selv om en sådan dataindsamling for 30.000 mennesker ville have været meget dyrt. Og selv givet et ubegrænset budget, jeg kan ikke tænke på enhver anden metode, der hovedsagelig giver forskerne til at rejse tilbage i tiden og direkte observere deltagerne adfærd i fortiden. Den nærmeste alternativ ville være at indsamle retrospektive rapporter om adfærd, men disse rapporter vil være af begrænset granularitet og tvivlsom nøjagtighed. Tabel 2.1 giver andre eksempler på undersøgelser, der anvender en altid-on datakilde for at studere en uventet begivenhed.
Uventet begivenhed | Altid-på datakilde | Citation |
---|---|---|
Occupy Gezi bevægelse i Tyrkiet | Budak and Watts (2015) | |
Umbrella protester i Hongkong | Zhang (2016) | |
Skyderier af politiet i New York | Stop-and-Frisk rapporter | Legewie (2016) |
Person sammenføjning ISIS | Magdy, Darwish, and Weber (2016) | |
11 September, 2001 angreb | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11 September, 2001 angreb | pager beskeder | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
For det andet, altid-på dataindsamling giver forskerne at producere tidstro målinger, som kan være vigtige i miljøer, hvor de politiske beslutningstagere ønsker at ikke bare lære af eksisterende adfærd, men også reagere på det. For eksempel kan sociale medier data anvendes til at guide reaktioner på naturkatastrofer (Castillo 2016) .
Afslutningsvis altid-på data systemer gør det muligt for forskerne at studere uventede begivenheder og give real-time information til de politiske beslutningstagere. Jeg har imidlertid ikke foreslå, at der altid-på data systemer gør det muligt for forskerne at spore ændringer over lange perioder. Det er fordi mange store datasystemer er under konstant forandring-en proces, der kaldes drift (afsnit 2.3.2.4).