ಯಾವಾಗಲೂ ಆನ್ ದೊಡ್ಡ ದಶಮಾಂಶ ಅನಿರೀಕ್ಷಿತ ಘಟನೆಗಳು ಮತ್ತು ನೈಜ ಸಮಯ ಮಾಪನ ಅಧ್ಯಯನ ಶಕ್ತಗೊಳಿಸುತ್ತದೆ.
ಅನೇಕ ದೊಡ್ಡ ದಶಮಾಂಶ ವ್ಯವಸ್ಥೆಗಳು ಯಾವಾಗಲೂ ಆನ್ ಇವೆ; ಅವರು ನಿರಂತರವಾಗಿ ಡೇಟಾ ಸಂಗ್ರಹಿಸುತ್ತಿದ್ದೇವೆ. ಈ ಯಾವಾಗಲೂ ಆನ್ ವಿಶಿಷ್ಟ ಉದ್ದುದ್ದವಾದ ಡೇಟಾ ಸಂಶೋಧಕರು ಒದಗಿಸುತ್ತದೆ (ಅಂದರೆ, ಕಾಲಾನಂತರದಲ್ಲಿ ಡೇಟಾ). ಯಾವಾಗಲೂ ಆನ್ ಬೀಯಿಂಗ್ ಸಂಶೋಧನೆಗೆ ಎರಡು ಪ್ರಮುಖ ಪರಿಣಾಮಗಳನ್ನು ಹೊಂದಿದೆ.
ಮೊದಲನೆಯದಾಗಿ, ಯಾವಾಗಲೂ ಡೇಟಾ ಸಂಗ್ರಹಣೆ ಸಂಶೋಧಕರು ಅನಿರೀಕ್ಷಿತ ಘಟನೆಗಳನ್ನು ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಸಾಧ್ಯವಾಗದ ರೀತಿಯಲ್ಲಿ ಅಧ್ಯಯನ ಮಾಡಲು ಶಕ್ತಗೊಳಿಸುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, 2013 ರ ಬೇಸಿಗೆಯಲ್ಲಿ ಟರ್ಕಿಯ ಆಕ್ರಮಣಕಾರಿ ಗಜಿ ಪ್ರತಿಭಟನೆಗಳನ್ನು ಅಧ್ಯಯನ ಮಾಡಲು ಸಂಶೋಧಕರು ಉತ್ಸುಕರಾಗಿದ್ದರು, ಈ ಸಂದರ್ಭದಲ್ಲಿ ಸಾಮಾನ್ಯವಾಗಿ ಪ್ರತಿಭಟನಾಕಾರರ ವರ್ತನೆಯನ್ನು ಗಮನಹರಿಸಲಾಗುತ್ತದೆ. ಈ ಘಟನೆಯ ಮುಂಚೆ, ಸಮಯದಲ್ಲಿ ಮತ್ತು ನಂತರ ಟ್ವಿಟ್ಟರ್ ಅನ್ನು ಬಳಸಿದ ಪ್ರತಿಭಟನಾಕಾರರನ್ನು ಅಧ್ಯಯನ ಮಾಡಲು ಟ್ವಿಟರ್ನ ನಿರಂತರ-ಸ್ವಭಾವವನ್ನು ಬಳಸಿಕೊಂಡು ಸೆರೆನ್ ಬುಡಕ್ ಮತ್ತು ಡಂಕನ್ ವಾಟ್ಸ್ (2015) ಹೆಚ್ಚಿನದನ್ನು ಮಾಡಲು ಸಾಧ್ಯವಾಯಿತು. ಮತ್ತು, ಈವೆಂಟ್ (ಫಿಗರ್ 2.2) ಮುಂಚೆ, ಮತ್ತು ನಂತರ, ಭಾಗವಹಿಸದಿರುವವರ ಹೋಲಿಕೆ ಗುಂಪನ್ನು ರಚಿಸಲು ಅವರು ಸಮರ್ಥರಾದರು. ಒಟ್ಟಾರೆಯಾಗಿ, ಅವರ ಮಾಜಿ-ಪೋಸ್ಟ್ ಸಮಿತಿಯು ಎರಡು ವರ್ಷಗಳಲ್ಲಿ 30,000 ಜನರ ಟ್ವೀಟ್ಗಳನ್ನು ಒಳಗೊಂಡಿತ್ತು. ಈ ಇತರ ಮಾಹಿತಿಯೊಂದಿಗೆ ಪ್ರತಿಭಟನೆಗಳಿಂದ ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸುವ ಡೇಟಾವನ್ನು ವೃದ್ಧಿಸುವ ಮೂಲಕ, ಬುಡಕ್ ಮತ್ತು ವಾಟ್ಸ್ಗಳು ಹೆಚ್ಚು ಕಲಿಯಲು ಸಮರ್ಥರಾಗಿದ್ದರು: ಗಜೀ ಪ್ರತಿಭಟನೆಯಲ್ಲಿ ಯಾವ ರೀತಿಯ ಜನರು ಭಾಗವಹಿಸಬಹುದೆಂದು ಅಂದಾಜು ಮಾಡಲು ಮತ್ತು ಅವರ ವರ್ತನೆಗಳು ಭಾಗವಹಿಸುವವರು ಮತ್ತು ಭಾಗವಹಿಸದಿರುವವರು, ಅಲ್ಪಾವಧಿಯಲ್ಲಿ (ಗಝಿ ಸಮಯದಲ್ಲಿ ಪೂರ್ವ-ಗಜಿಗೆ ಹೋಲಿಸುತ್ತಾರೆ) ಮತ್ತು ದೀರ್ಘಾವಧಿಯಲ್ಲಿ (ಪೂರ್ವ-ಗಜಿಗೆ ಪೂರ್ವ-ಗಝಿಗೆ ಹೋಲಿಸುತ್ತಾರೆ).
ಈ ಅಂದಾಜುಗಳೆಲ್ಲವೂ ಯಾವಾಗಲೂ ಡೇಟಾ ಸಂಗ್ರಹ ಮೂಲಗಳಲ್ಲದಿದ್ದರೂ (ಉದಾ., ಧೋರಣೆ ಬದಲಾವಣೆಯ ದೀರ್ಘಕಾಲದ ಅಂದಾಜುಗಳು) ಮಾಡಲಾಗುವುದಿಲ್ಲ ಮತ್ತು ಅದು ಸರಿಯಾಗಿದೆಯೆಂದು 30,000 ಜನರಿಗೆ ಅಂತಹ ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆ ಸಾಕಷ್ಟು ಎಂದು ಆದರೂ ಒಂದು ಸ್ಕೆಪ್ಟಿಕ್ ಸೂಚಿಸಬಹುದು ದುಬಾರಿ. ಅನಿಯಮಿತ ಬಜೆಟ್ ಕೂಡ ನೀಡಿದ್ದರೂ, ಸಂಶೋಧಕರು ಸಮಯವನ್ನು ಹಿಂದಕ್ಕೆ ಪ್ರಯಾಣಿಸಲು ಮತ್ತು ಹಿಂದೆ ಭಾಗವಹಿಸುವವರ ನಡವಳಿಕೆಯನ್ನು ನೇರವಾಗಿ ವೀಕ್ಷಿಸಲು ಅನುವು ಮಾಡಿಕೊಡುವ ಯಾವುದೇ ವಿಧಾನವನ್ನು ನಾನು ಯೋಚಿಸುವುದಿಲ್ಲ. ನಡವಳಿಕೆಯ ಪುನರಾವರ್ತಿತ ವರದಿಗಳನ್ನು ಸಂಗ್ರಹಿಸುವುದು ಹತ್ತಿರದ ಪರ್ಯಾಯವಾಗಿದ್ದು, ಆದರೆ ಈ ವರದಿಗಳು ಸೀಮಿತವಾದ ಕಣ್ಣಿಗೆ ಬೀರುವಿಕೆ ಮತ್ತು ಪ್ರಶ್ನಾರ್ಹ ನಿಖರತೆಯದ್ದಾಗಿರುತ್ತದೆ. ಟೇಬಲ್ 2.1 ಅನಿರೀಕ್ಷಿತ ಘಟನೆಯನ್ನು ಅಧ್ಯಯನ ಮಾಡಲು ಯಾವಾಗಲೂ ಆನ್-ಡಾಟಾ ಮೂಲವನ್ನು ಬಳಸುವ ಅಧ್ಯಯನದ ಇತರ ಉದಾಹರಣೆಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ.
ಅನಿರೀಕ್ಷಿತ ಘಟನೆ | ಯಾವಾಗಲೂ ಡೇಟಾ ಮೂಲ | ಉಲ್ಲೇಖಗಳು |
---|---|---|
ಟರ್ಕಿಯ ಜೀಜಿ ಆಂದೋಲನವನ್ನು ಆಕ್ರಮಿಸಿಕೊಳ್ಳಿ | ಟ್ವಿಟರ್ | Budak and Watts (2015) |
ಹಾಂಗ್ ಕಾಂಗ್ನಲ್ಲಿ ಅಂಬ್ರೆಲಾ ಪ್ರತಿಭಟನೆಗಳು | ವೀಬೊ | Zhang (2016) |
ನ್ಯೂಯಾರ್ಕ್ ನಗರದ ಪೋಲಿಸ್ನ ಹೊಡೆತಗಳು | ಸ್ಟಾಪ್-ಅಂಡ್-ಫ್ರಿಸ್ಕ್ ವರದಿಗಳು | Legewie (2016) |
ವ್ಯಕ್ತಿ ಐಸಿಸ್ಗೆ ಸೇರುತ್ತಾನೆ | ಟ್ವಿಟರ್ | Magdy, Darwish, and Weber (2016) |
ಸೆಪ್ಟೆಂಬರ್ 11, 2001 ದಾಳಿಯ | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
ಸೆಪ್ಟೆಂಬರ್ 11, 2001 ದಾಳಿಯ | ಪೇಜರ್ ಸಂದೇಶಗಳು | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
ಅನಿರೀಕ್ಷಿತ ಈವೆಂಟ್ಗಳನ್ನು ಅಧ್ಯಯನ ಮಾಡುವುದರ ಜೊತೆಗೆ, ಯಾವಾಗಲೂ ದೊಡ್ಡ ದತ್ತಾಂಶ ವ್ಯವಸ್ಥೆಗಳು ನೈಜ ಸಮಯದ ಅಂದಾಜುಗಳನ್ನು ತಯಾರಿಸಲು ಸಂಶೋಧಕರನ್ನು ಸಹ ಸಕ್ರಿಯಗೊಳಿಸುತ್ತವೆ, ಸರ್ಕಾರದ ಅಥವಾ ಉದ್ಯಮದಲ್ಲಿ ನೀತಿ ನಿರ್ಮಾಪಕರು ಸೆಟ್ಟಿಂಗ್ಗಳಲ್ಲಿ ಪ್ರಮುಖವಾದವುಗಳು - ಸನ್ನಿವೇಶದ ಅರಿವಿನ ಆಧಾರದ ಮೇಲೆ ಪ್ರತಿಕ್ರಿಯಿಸಲು ಬಯಸುತ್ತವೆ. ಉದಾಹರಣೆಗೆ, ನೈಸರ್ಗಿಕ ವಿಕೋಪಗಳಿಗೆ (Castillo 2016) ತುರ್ತುಸ್ಥಿತಿ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಮಾರ್ಗದರ್ಶನ ಮಾಡಲು ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮದ ಡೇಟಾವನ್ನು ಬಳಸಬಹುದು ಮತ್ತು ವಿವಿಧ ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳನ್ನು ವಿವಿಧ ಆರ್ಥಿಕ ಚಟುವಟಿಕೆಯ ನೈಜ ಸಮಯದ ಅಂದಾಜುಗಳನ್ನು (Choi and Varian 2012) ಉತ್ಪಾದಿಸಬಹುದು.
ತೀರ್ಮಾನಕ್ಕೆ ಬಂದಾಗ, ದತ್ತಾಂಶ ವ್ಯವಸ್ಥೆಗಳು ಯಾವಾಗಲೂ ಸಂಶೋಧಕರು ಅನಿರೀಕ್ಷಿತ ಘಟನೆಗಳನ್ನು ಅಧ್ಯಯನ ಮಾಡಲು ಮತ್ತು ನೀತಿ ತಯಾರಕರಿಗೆ ನೈಜ-ಸಮಯದ ಮಾಹಿತಿಯನ್ನು ಒದಗಿಸುತ್ತವೆ. ಆದಾಗ್ಯೂ, ಬಹಳ ಸಮಯದ ಮೇಲೆ ಬದಲಾವಣೆಯನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡುವುದಕ್ಕಾಗಿ ಡೇಟಾ ವ್ಯವಸ್ಥೆಗಳು ಯಾವಾಗಲೂ ಸೂಕ್ತವೆಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ. ಅನೇಕ ದೊಡ್ಡ ಡೇಟಾ ವಿಧಾನಗಳು ಎಡೆಬಿಡದೆ ನಾನು ನಂತರ ಅಧ್ಯಾಯ (ವಿಭಾಗ 2.3.7) ರಲ್ಲಿ ಬಂದು ಕರೆ ಮಾಡುತ್ತೇವೆ ಪ್ರಕ್ರಿಯೆ ಒಂದು ಬದಲಾಗುತ್ತಿದೆ ಕಾರಣ ಎಂಬುದು.