2.3.1.2 Altid-på

Altid-på store data muliggør studiet af uventede begivenheder og real-time måling.

Mange store datasystemer er altid-on; de konstant at indsamle data. Dette altid-på karakteristik giver forskere med langsgående data (dvs. data over tid). Bliver altid-on har to vigtige konsekvenser for forskning.

Først altid-on dataindsamling giver forskerne at studere uventede begivenheder på måder, som ikke var mulige tidligere. For eksempel vil forskerne gerne vil læse i Occupy Gezi protester i Tyrkiet i sommeren 2013 typisk fokusere på adfærd demonstranter under arrangementet. Ceren Budak og Duncan Watts (2015) var i stand til at gøre mere ved hjælp af altid-på natur Twitter til at studere Twitter-bruger demonstranter før, under og efter arrangementet. Og, de var i stand til at skabe en sammenligningsgruppe af ikke-deltagere (eller deltagere, der ikke tweet om protesten) før, under og efter arrangementet (Figur 2.1). I alt omfattede deres efterfølgende panel tweets på 30.000 personer over to år. Ved at forstærke de almindeligt anvendte data fra protesterne med denne anden information, Budak og Watts var i stand til at lære meget mere: de var i stand til at vurdere, hvad slags mennesker var mere tilbøjelige til at deltage i de Gezi protester og til at estimere ændringer i holdninger deltagere og ikke-deltagere, både på kort sigt (sammenligning pre-Gezi til under Gezi) og på lang sigt (sammenligning pre-Gezi at bogføre-Gezi).

Figur 2.1: Design, der anvendes af Budak og Watts (2015) for at studere Occupy Gezi protester i Tyrkiet i sommeren 2013. Ved at bruge altid-på naturen af ​​Twitter, skabte forskerne, hvad de kaldte en efterfølgende panel, der omfattede omkring 30.000 personer over to år. I modsætning den typiske undersøgelse, der fokuserede på deltagerne under protesterne, den efterfølgende panel tilføjer 1) data fra deltagerne før og efter begivenheden, og 2) data fra ikke-deltagere før, under og efter arrangementet. Denne berigede datastruktur aktiveret Budak og Watts at vurdere, hvad slags mennesker var mere tilbøjelige til at deltage i de Gezi protester og til at estimere ændringer i holdninger af deltagere og ikke-deltagere, både på kort sigt (sammenligning pre-Gezi til under Gezi) og på længere sigt (sammenligning pre-Gezi at bogføre-Gezi).

Figur 2.1: Design, der anvendes af Budak and Watts (2015) for at studere Occupy Gezi protester i Tyrkiet i sommeren 2013. Ved at bruge altid-på naturen af Twitter, skabte forskerne, hvad de kaldte en efterfølgende panel, der omfattede omkring 30.000 personer over to år. I modsætning den typiske undersøgelse, der fokuserede på deltagerne under protesterne, den efterfølgende panel tilføjer 1) data fra deltagerne før og efter begivenheden, og 2) data fra ikke-deltagere før, under og efter arrangementet. Denne berigede datastruktur aktiveret Budak og Watts at vurdere, hvad slags mennesker var mere tilbøjelige til at deltage i de Gezi protester og til at estimere ændringer i holdninger af deltagere og ikke-deltagere, både på kort sigt (sammenligning pre-Gezi til under Gezi) og på længere sigt (sammenligning pre-Gezi at bogføre-Gezi).

Det er rigtigt, at nogle af disse skøn kunne have været gjort uden altid-på dataindsamling kilder (f.eks langsigtede estimater af holdningsændring), selv om en sådan dataindsamling for 30.000 mennesker ville have været meget dyrt. Og selv givet et ubegrænset budget, jeg kan ikke tænke på enhver anden metode, der hovedsagelig giver forskerne til at rejse tilbage i tiden og direkte observere deltagerne adfærd i fortiden. Den nærmeste alternativ ville være at indsamle retrospektive rapporter om adfærd, men disse rapporter vil være af begrænset granularitet og tvivlsom nøjagtighed. Tabel 2.1 giver andre eksempler på undersøgelser, der anvender en altid-on datakilde for at studere en uventet begivenhed.

Tabel 2.1: Undersøgelser af uventede begivenheder ved hjælp af altid-på store datakilder.
Uventet begivenhed Altid-på datakilde Citation
Occupy Gezi bevægelse i Tyrkiet Twitter Budak and Watts (2015)
Umbrella protester i Hongkong Weibo Zhang (2016)
Skyderier af politiet i New York Stop-and-Frisk rapporter Legewie (2016)
Person sammenføjning ISIS Twitter Magdy, Darwish, and Weber (2016)
11 September, 2001 angreb livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 September, 2001 angreb pager beskeder Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

For det andet, altid-på dataindsamling giver forskerne at producere tidstro målinger, som kan være vigtige i miljøer, hvor de politiske beslutningstagere ønsker at ikke bare lære af eksisterende adfærd, men også reagere på det. For eksempel kan sociale medier data anvendes til at guide reaktioner på naturkatastrofer (Castillo 2016) .

Afslutningsvis altid-på data systemer gør det muligt for forskerne at studere uventede begivenheder og give real-time information til de politiske beslutningstagere. Jeg har imidlertid ikke foreslå, at der altid-på data systemer gør det muligt for forskerne at spore ændringer over lange perioder. Det er fordi mange store datasystemer er under konstant forandring-en proces, der kaldes drift (afsnit 2.3.2.4).