Aina päällä iso data voidaan tutkia odottamattomien tapahtumien ja reaaliaikainen mittaus.
Monet suuret tietojärjestelmät ovat aina päällä; ne ovat jatkuvasti kerätä tietoja. Tämä aina päällä ominaisuus antaa tutkijoille pitkittäisleikkaustiedoista (eli data ajan). Koska aina päällä on kaksi merkittäviä vaikutuksia tutkimukseen.
Ensinnäkin aina kerätyn tiedonkeruun avulla tutkijat voivat tutkia odottamattomia tapahtumia tavalla, joka ei muuten olisi mahdollista. Esimerkiksi tutkijat, jotka ovat kiinnostuneita miehittämään Gezi-mielenosoituksia Turkissa kesällä 2013, keskittyvät tyypillisesti mielenosoittajien käyttäytymiseen tapahtuman aikana. Ceren Budak ja Duncan Watts (2015) pystyivät tekemään enemmän käyttämällä Twitterin jatkuvan luonteen tutkiakseen mielenosoittajia, jotka käyttivät Twitteriä ennen tapahtumaa, sen aikana ja sen jälkeen. Ja he pystyivät luomaan vertailuryhmän, joka ei osallistu osallistumaan ennen tapahtumaa, sen aikana ja sen jälkeen (kuva 2.2). Kaiken kaikkiaan niiden ex-post paneeli sisälsi tweetit 30 000 ihmistä yli kaksi vuotta. Lisättämällä prototyyppejä yleisesti käytetyillä tiedoilla tämän muun tiedon kanssa Budak ja Watts oppivat paljon enemmän: he pystyivät arvioimaan, millaisia ihmisiä todennäköisemmin osallistui Gezi-protesteihin ja arvioimaan muutosten asenteita (vertaamalla pre-Geziä Geziin aikana) ja pitkällä aikavälillä (vertaamalla pre-Gezi ja Gezi-jälkeistä aikaa).
Skeptikko voisi huomauttaa, että jotkin näistä arvioista olisi voitu tehdä ilman aina tietoja kerättäviä lähteitä (esim. Pitkän aikavälin asenteiden muutoksen arvioita) ja tämä on oikein, vaikka tällainen tiedonkeruu 30 000 ihmiselle olisi ollut varsin kallis. Jopa rajatun budjetin ansiosta en voi ajatella mitään muuta menetelmää, joka antaa tutkijoille mahdollisuuden matkustaa ajassa taaksepäin ja tarkkailla suoraan osanottajien käyttäytymistä aiemmin. Lähin vaihtoehto olisi kerätä takautuvia raportteja käyttäytymisestä, mutta nämä raportit olisivat rajatun rakeisuuden ja kyseenalainen tarkkuus. Taulukossa 2.1 on muita esimerkkejä tutkimuksista, joissa käytetään jatkuvasti tietolähdettä odottamattoman tapahtuman tutkimiseen.
Odottamaton tapahtuma | Aina päällä oleva tietolähde | lainaus |
---|---|---|
Tartu Gezi-liikkeeseen Turkissa | Viserrys | Budak and Watts (2015) |
Umbrella protestoi Hongkongissa | Zhang (2016) | |
Poliisitapaukset New Yorkissa | Stop-ja-frisk raportteja | Legewie (2016) |
ISISiin liittyminen | Viserrys | Magdy, Darwish, and Weber (2016) |
11. syyskuuta 2001 hyökkäys | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11. syyskuuta 2001 hyökkäys | hakulaitteen viestejä | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Yhä odottamattomien tapahtumien tutkimisen lisäksi isojen tietojärjestelmien ansiosta tutkijat voivat tuottaa reaaliaikaisia arvioita, jotka voivat olla tärkeitä asetuksissa, joissa päättäjät - hallituksessa tai teollisuudessa - haluavat vastata tilannetietoisuuden perusteella. Esimerkiksi sosiaalisen median tietoja voidaan käyttää ohjaamaan luonnonkatastrofien hätätilanteita (Castillo 2016) ja erilaisia suuria tietolähteitä voidaan tuottaa reaaliaikaisia taloudellisia vaikutuksia koskevia arvioita (Choi and Varian 2012) .
Yhteenvetona tietojärjestelmien avulla tutkijat voivat tutkia odottamattomia tapahtumia ja antaa reaaliaikaista tietoa päätöksentekijöille. En kuitenkaan usko, että jatkuvat tietojärjestelmät sopivat hyvin muutosten seuraamiseen hyvin pitkiä aikoja. Tämä johtuu siitä, että monet suuret tietojärjestelmät ovat jatkuvasti muuttumassa - prosessi, jota kutsun ajelehtimiseksi myöhemmin luvussa 2.3.7.