Aina päällä iso data voidaan tutkia odottamattomien tapahtumien ja reaaliaikainen mittaus.
Monet suuret tietojärjestelmät ovat aina päällä; ne ovat jatkuvasti kerätä tietoja. Tämä aina päällä ominaisuus antaa tutkijoille pitkittäisleikkaustiedoista (eli data ajan). Koska aina päällä on kaksi merkittäviä vaikutuksia tutkimukseen.
Ensinnäkin, aina-tiedonkeruuseen avulla tutkijat voivat tutkia odottamattomia tapahtumia tavoilla, jotka eivät ole olleet mahdollisia aiemmin. Esimerkiksi tutkijat opiskelusta kiinnostuneille Occupy Gezi mielenosoituksia Turkissa kesällä 2013 tyypillisesti keskittyy käyttäytymiseen mielenosoittajat tapahtuman aikana. Ceren Budak ja Duncan Watts (2015) pystyivät tekemään enemmän käyttämällä aina päällä luonteesta viserrys tutkia Twitter käyttävien mielenosoittajia ennen, sen aikana ja sen jälkeen. Ja he pystyivät luomaan vertailuryhmän ei-osallistujat (tai osallistujat, jotka eivät Twittra protesti) ennen, aikana ja jälkeen tapahtuman (Kuva 2.1). Kaikkiaan niiden jälkikäteen paneeli sisältyi tweets 30000 ihmistä yli kaksi vuotta. Kasvattamalla yleisesti käytetty tietoja protestit tämän muun tiedon, Budak ja Watts pystyivät oppia paljon enemmän: he pystyivät arvioimaan millaisia ihmiset olivat todennäköisesti osallistua Gezi protesteja ja arvioida muutoksia asenteissa osallistujia ja ei-osallistujat, sekä lyhyellä aikavälillä (verrataan ennalta Gezi sen aikana Gezi) ja pitkällä aikavälillä (verrataan ennalta Gezi jälkeiseen Gezi).
On totta, että jotkut näistä arvioiden olisi voitu tehdä ilman aina-tiedonkeruuseen lähteistä (esim pitkäaikainen arviot asennemuutosta), vaikka tällainen tiedonkeruu 30000 ihmistä olisivat olleet melko kalliita. Ja jopa antanut rajaton budjetti, en voi ajatella mitään muuta menetelmää, joka olennaisesti mahdollistaa tutkijoiden matkustaa ajassa taaksepäin ja sitä tarkkailla osallistujat olivat aikaisemmin. Lähin vaihtoehto olisi kerätä takautuva raportteja käyttäytymistä, mutta näissä raporteissa ei saavutettaisi kovin rakeisuuden ja kyseenalainen tarkkuutta. Taulukko 2.1 tarjoaa muita esimerkkejä tutkimuksista, jotka käyttävät aina päällä tietolähteen tutkimaan odottamaton tapahtuma.
odottamaton tapahtuma | Aina päällä tietolähteen | lainaus |
---|---|---|
Occupy Gezi liike Turkissa | Viserrys | Budak and Watts (2015) |
Umbrella protestit Hong Kong | Zhang (2016) | |
Ampumista poliisin New Yorkissa | Stop and frisk raportit | Legewie (2016) |
Henkilö tuloaan ISIS | Viserrys | Magdy, Darwish, and Weber (2016) |
11 syyskuu 2001 hyökkäys | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11 syyskuu 2001 hyökkäys | hakulaite viestit | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Toiseksi, aina-tiedonkeruuseen avulla tutkijat voivat tuottaa reaaliaikaista mittauksia, jotka voivat olla tärkeitä olosuhteissa, joissa päättäjät haluavat ei vain oppia nykyisistä käyttäytymisestä, vaan myös vastata siihen. Esimerkiksi sosiaalinen media dataa voidaan käyttää ohjaamaan varautua luonnonkatastrofeihin (Castillo 2016) .
Lopuksi aina päällä tietojärjestelmät tutkijoille mahdollisuus tutkia odottamattomia tapahtumia ja tarjota reaaliaikaista tietoa päätöksentekijöille. En kuitenkaan ehdottaa, että aina käytössä tietojärjestelmät mahdollistavat tutkijoiden seurata muutoksia pitkiä aikoja. Se on, koska monet suuret tietojärjestelmät muuttuvat jatkuvasti-prosessia kutsutaan drift (jakso 2.3.2.4).