Gjithmonë-në të dhënat e mëdha mundëson studimin e ngjarjeve të papritura dhe matjen në kohë reale.
Shumë sisteme të mëdha të të dhënave janë gjithmonë-në; ata janë vazhdimisht mbledhjen e të dhënave. Kjo karakteristikë gjithmonë-në ofron hulumtuesit me të dhënat e gjatësisë (p.sh., të dhënat me kalimin e kohës). Duke qenë gjithmonë-në ka dy implikime të rëndësishme për kërkime.
Së pari, gjithnjë në mbledhjen e të dhënave mundëson hulumtuesit të studiojnë ngjarje të papritura në mënyra që përndryshe nuk do të ishin të mundshme. Për shembull, studiuesit e interesuar për të studiuar protestat e Occupy Gezi në Turqi në verën e vitit 2013 zakonisht do të fokusoheshin në sjelljen e protestuesve gjatë kësaj ngjarjeje. Ceren Budak dhe Duncan Watts (2015) ishin në gjendje të bënin më shumë duke përdorur gjithnjë natën e Twitter për të studiuar protestuesit që përdorën Twitter para, gjatë dhe pas ngjarjes. Dhe, ata ishin në gjendje të krijojnë një grup krahasimi të pjesëmarrësve që nuk janë pjesëmarrës para, gjatë dhe pas ngjarjes (figura 2.2). Në total, paneli i tyre ex-post përfshiu tweets e 30,000 njerëzve gjatë dy viteve. Duke shtuar të dhënat e përdorura zakonisht nga protestat me këtë informacion tjetër, Budak dhe Watts ishin në gjendje të mësonin shumë më tepër: ata ishin në gjendje të vlerësonin se çfarë lloj personash kishin më shumë gjasa të merrnin pjesë në protesta Gezi dhe të vlerësonin ndryshimet në qëndrimet e pjesëmarrësit dhe jo pjesëmarrësit, si në periudhën afatshkurtër (duke krahasuar para-Gezi me gjatë Gezi) dhe në afat të gjatë (duke krahasuar para-Gezi me post-Gezi).
Një skeptik mund të theksojë se disa nga këto vlerësime mund të bëhen pa gjithmonë në burimet e mbledhjes së të dhënave (p.sh. vlerësimet afatgjata të ndryshimit të qëndrimit) dhe kjo është e saktë, megjithëse një mbledhje e tillë e të dhënave për 30,000 njerëz do të ishte mjaft shtrenjtë. Megjithëkëtë, duke pasur parasysh një buxhet të pakufizuar, nuk mund të mendoj për ndonjë metodë tjetër që në thelb i lejon kërkuesit të udhëtojnë prapa në kohë dhe të vëzhgojnë drejtpërdrejt sjelljen e pjesëmarrësve në të kaluarën. Alternativa më e afërt do të ishte mbledhja e raporteve retrospektive të sjelljes, por këto raporte do të ishin me granularitet të kufizuar dhe saktësi të diskutueshme. Tabela 2.1 jep shembuj të tjerë të studimeve që përdorin një burim të të dhënave gjithmonë për të studiuar një ngjarje të papritur.
Ngjarje e papritur | Gjithmonë-në burim të të dhënave | citim |
---|---|---|
Zëni lëvizjen Gezi në Turqi | Cicëroj | Budak and Watts (2015) |
Protestat ombrellë në Hong Kong | Zhang (2016) | |
Shuarja e policisë në qytetin e Nju Jorkut | Raportet Stop-and-frisk | Legewie (2016) |
Personi që bashkohet me ISIS | Cicëroj | Magdy, Darwish, and Weber (2016) |
Sulmi i 11 shtatorit 2001 | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
Sulmi i 11 shtatorit 2001 | mesazhet pager | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Përveç studimit të ngjarjeve të papritura, gjithnjë në sistemet e mëdha të të dhënave u mundësojnë kërkuesve të prodhojnë vlerësime në kohë reale, të cilat mund të jenë të rëndësishme në mjediset ku krijuesit e politikave - në qeveri apo industri - dëshirojnë të përgjigjen në bazë të ndërgjegjësimit në situatë. Për shembull, të dhënat e medias sociale mund të përdoren për të udhëzuar reagimin emergjent ndaj fatkeqësive natyrore (Castillo 2016) dhe mund të përdoren një sërë burimesh të ndryshme të dhënash të prodhuara në vlerësime reale të aktivitetit ekonomik (Choi and Varian 2012) .
Në përfundim, sistemet e të dhënave gjithnjë në dispozicion u mundësojnë kërkuesve të studiojnë ngjarje të papritura dhe të japin informacione në kohë reale për politikëbërësit. Sidoqoftë, nuk mendoj se sistemet e të dhënave gjithmonë të përshtatshme janë të përshtatshme për gjurmimin e ndryshimeve gjatë periudhave shumë të gjata kohore. Kjo është për shkak se shumë sisteme të mëdha të të dhënave janë vazhdimisht në ndryshim-një proces që unë do të thërrasë domethënie më vonë në kapitullin (seksioni 2.3.7).