2.3.1.2 Gjithmonë-on

Gjithmonë-në të dhënat e mëdha mundëson studimin e ngjarjeve të papritura dhe matjen në kohë reale.

Shumë sisteme të mëdha të të dhënave janë gjithmonë-në; ata janë vazhdimisht mbledhjen e të dhënave. Kjo karakteristikë gjithmonë-në ofron hulumtuesit me të dhënat e gjatësisë (p.sh., të dhënat me kalimin e kohës). Duke qenë gjithmonë-në ka dy implikime të rëndësishme për kërkime.

Së pari, gjithmonë-në të dhënat mbledhja mundëson studiuesit për të studiuar ngjarjet e papritura në mënyra që nuk ishin mundur më parë. Për shembull, studiuesit e interesuar në studimin Occupy protestat Gezi në Turqi në verën e vitit 2013 në mënyrë tipike do të fokusohet në sjelljen e protestuesve gjatë ngjarjes. Ceren Budak dhe Duncan Watts (2015) ishin në gjendje të bëjë më shumë duke përdorur natyrën gjithmonë-në e Twitter për të studiuar Twitter-duke protestuesit para, gjatë, dhe pas ngjarjes. Dhe, ata ishin në gjendje për të krijuar një grup krahasim e jo-pjesëmarrësve (ose pjesëmarrësve të cilët nuk cicëroj në lidhje me protestën) para, gjatë dhe pas ngjarjes (Figura 2.1). Në total panel tyre ex-post të përfshira tweets e 30.000 njerëzve mbi dy vjet. Nga rritjes të dhënat e përdorura zakonisht nga protestat me këtë informacion tjetër, Budak dhe Watts ishin në gjendje për të mësuar më shumë: ata ishin në gjendje për të vlerësuar se çfarë lloj i njerëzve janë më të prirë për të marrë pjesë në protestat në Gezi dhe për të vlerësuar ndryshimet në qëndrimet e pjesëmarrësve dhe jo-pjesëmarrësve, si në afat të shkurtër (krahasuar para-Gezi të gjatë Gezi) dhe në afat të gjatë (krahasuar para-Gezi të postoj-Gezi).

Figura 2.1: Hartimi i përdorur nga Budak dhe Watts (2015) për të studiuar Occupy protestat Gezi në Turqi në verën e vitit 2013. Duke përdorur natyrën gjithmonë-në e Twitter, studiuesit krijuar atë që e quajti një panel ex-post që përfshinte lidhje 30.000 njerëzit mbi dy vjet. Në të kundërt studimi tipik që u përqëndrua në pjesëmarrësve gjatë protestave, paneli ex-post shton 1) të dhënat nga pjesëmarrësit para dhe pas ngjarjes dhe 2) të dhënat nga jo-pjesëmarrësve para, gjatë, dhe pas ngjarjes. Kjo strukturë e të dhënave pasuruar aktivizuar Budak dhe Watts për të vlerësuar se çfarë lloj i njerëzve janë më të prirë për të marrë pjesë në protestat në Gezi dhe për të vlerësuar ndryshimet në qëndrimet e pjesëmarrësve dhe jo-pjesëmarrësve, si në afat të shkurtër (krahasuar para-Gezi të gjatë Gezi) dhe në afat të gjatë (krahasuar para-Gezi të postoj-Gezi).

Figura 2.1: Hartimi i përdorur nga Budak and Watts (2015) për të studiuar Occupy protestat Gezi në Turqi në verën e vitit 2013. Duke përdorur natyrën gjithmonë-në e Twitter, studiuesit krijuar atë që e quajti një panel ex-post që përfshinte lidhje 30.000 njerëzit mbi dy vjet. Në të kundërt studimi tipik që u përqëndrua në pjesëmarrësve gjatë protestave, paneli ex-post shton 1) të dhënat nga pjesëmarrësit para dhe pas ngjarjes dhe 2) të dhënat nga jo-pjesëmarrësve para, gjatë, dhe pas ngjarjes. Kjo strukturë e të dhënave pasuruar aktivizuar Budak dhe Watts për të vlerësuar se çfarë lloj i njerëzve janë më të prirë për të marrë pjesë në protestat në Gezi dhe për të vlerësuar ndryshimet në qëndrimet e pjesëmarrësve dhe jo-pjesëmarrësve, si në afat të shkurtër (krahasuar para-Gezi të gjatë Gezi) dhe në afat të gjatë (krahasuar para-Gezi të postoj-Gezi).

Është e vërtetë se disa nga këto vlerësime mund të ishte bërë pa gjithmonë-në burime të mbledhjes së të dhënave (p.sh. vlerësimet afatgjata të ndryshimit të qëndrimit), edhe pse mbledhja e të dhënave të tilla për 30.000 njerëz do të kanë qenë mjaft të shtrenjta. Dhe, duke pasur parasysh edhe një buxhet të pakufizuar, unë nuk mund të mendoj për ndonjë metodë tjetër që në thelb lejon kërkuesit për të udhëtuar prapa në kohë dhe të drejtpërdrejtë të vëzhguar sjelljen e pjesëmarrësve në të kaluarën. Alternativa më e afërt do të jetë për të mbledhur raportet retrospektive e sjelljes, por këto raporte do të jetë i kufizuar granularity dhe saktësi të diskutueshme. Tabela 2.1 jep shembuj të tjerë të studimeve që përdorin një gjithmonë-në burim të të dhënave për të studiuar një ngjarje të papritur.

Tabela 2.1: Studimet e ngjarjeve të papritura duke përdorur gjithmonë-në burime të mëdha të të dhënave.
ngjarje e papritur Gjithmonë-në të dhënat burim Citim
Occupy Gezi lëvizjen në Turqi Cicëroj Budak and Watts (2015)
Protestat ombrellë në Hong Kong Weibo Zhang (2016)
Shtënat e policisë në New York City Stop-and-Frisk raporte Legewie (2016)
Person bashkuar ISIS Cicëroj Magdy, Darwish, and Weber (2016)
September 11, 2001 sulm livejournal.com Cohn, Mehl, and Pennebaker (2004)
September 11, 2001 sulm mesazhet pager Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Së dyti, gjithmonë-në të dhënat mbledhja mundëson studiuesit për të prodhuar matjet në kohë reale, të cilat mund të jenë të rëndësishme në mjediset ku politikëbërësit duan të jo vetëm të mësojnë nga sjelljet ekzistuese, por edhe përgjigjet për atë. Për shembull, të dhënat e mediave sociale mund të përdoret për të udhëhequr përgjigje ndaj katastrofave natyrore (Castillo 2016) .

Në përfundim, gjithmonë-në të dhënat e sistemeve të mundësojë kërkuesit për të studiuar ngjarjet e papritura dhe të sigurojë informacion në kohë reale për politikë-bërësit. Unë nuk e bëri, megjithatë, të propozojë që që gjithmonë-në të dhënat e sistemeve të mundësojë kërkuesit për të ndjekur ndryshimet mbi periudha të gjata kohore. Kjo është për shkak se shumë sisteme të mëdha të të dhënave janë vazhdimisht në ndryshim-një proces të quajtur domethënie (Seksioni 2.3.2.4).