ಸಂಶೋಧಕರು ಪ್ರವೇಶಿಸಲು ಕಂಪೆನಿಗಳು ಮತ್ತು ಸರ್ಕಾರಗಳು ನಡೆಸಿದ ಡೇಟಾ ಕಷ್ಟ.
ಮೇ 2014 ರಲ್ಲಿ, ಯುಎಸ್ ನ್ಯಾಷನಲ್ ಸೆಕ್ಯುರಿಟಿ ಏಜೆನ್ಸಿ ಗ್ರಾಮೀಣ ಉತಾಹ್ನಲ್ಲಿ ಒಂದು ಡೇಟಾ ಸೆಂಟರ್ ತೆರೆಯಿತು, ಇದು ವಿಚಿತ್ರವಾದ ಹೆಸರು, ಇಂಟೆಲಿಜೆನ್ಸ್ ಕಮ್ಯೂನಿಟಿವ್ ನ್ಯಾಷನಲ್ ಸೈಬರ್ಸುಕ್ರಿಟಿ ಇನಿಶಿಯೇಟಿವ್ ಡಾಟಾ ಸೆಂಟರ್. ಆದಾಗ್ಯೂ, ಉತಾಹ್ ಡಾಟಾ ಸೆಂಟರ್ ಎಂದು ಕರೆಯಲ್ಪಡುವ ಈ ಡೇಟಾ ಕೇಂದ್ರವು ದಿಗ್ಭ್ರಮೆಗೊಳಿಸುವ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಹೊಂದಿದೆ ಎಂದು ವರದಿಯಾಗಿದೆ. "ಖಾಸಗಿ ಇಮೇಲ್ಗಳು, ಸೆಲ್ ಫೋನ್ ಕರೆಗಳು ಮತ್ತು Google ಹುಡುಕಾಟಗಳ ಸಂಪೂರ್ಣ ವಿಷಯಗಳು, ಹಾಗೆಯೇ ಎಲ್ಲಾ ರೀತಿಯ ವೈಯಕ್ತಿಕ ಡೇಟಾ ಟ್ರೇಲ್ಸ್-ಪಾರ್ಕಿಂಗ್ ರಸೀದಿಗಳು, ಪ್ರಯಾಣದ ವಿವರಗಳು, ಪುಸ್ತಕದ ಅಂಗಡಿ ಖರೀದಿಗಳು ಸೇರಿದಂತೆ ಎಲ್ಲಾ ರೀತಿಯ ಸಂವಹನಗಳನ್ನು ಶೇಖರಿಸಿ, ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ ಎಂದು ಒಂದು ವರದಿಯು ಆರೋಪಿಸಿದೆ. , ಮತ್ತು ಇತರ ಡಿಜಿಟಲ್ 'ಪಾಕೆಟ್ ಲಿಟರ್' " (Bamford 2012) . ದೊಡ್ಡ ಡೇಟಾದಲ್ಲಿ ಸೆರೆಹಿಡಿದ ಮಾಹಿತಿಯ ಹೆಚ್ಚಿನ ಸೂಕ್ಷ್ಮ ಸ್ವರೂಪದ ಬಗ್ಗೆ ಕಳವಳವನ್ನು ಹೆಚ್ಚಿಸುವುದರ ಜೊತೆಗೆ, ಮತ್ತಷ್ಟು ಕೆಳಗೆ ವಿವರಿಸಲಾಗುವುದು, ಉಟಾಹ್ ಡೇಟಾ ಕೇಂದ್ರವು ಶ್ರೀಮಂತ ದತ್ತಾಂಶ ಮೂಲದ ಒಂದು ಉದಾಹರಣೆಯಾಗಿದೆ, ಅದು ಸಂಶೋಧಕರಿಗೆ ಪ್ರವೇಶಿಸಲಾಗುವುದಿಲ್ಲ. ಹೆಚ್ಚು ಸಾಮಾನ್ಯವಾಗಿ, ಉಪಯುಕ್ತವಾದ ದೊಡ್ಡ ಡೇಟಾದ ಹಲವು ಮೂಲಗಳು ಸರ್ಕಾರಗಳು (ಉದಾಹರಣೆಗೆ, ತೆರಿಗೆ ಡೇಟಾ ಮತ್ತು ಶೈಕ್ಷಣಿಕ ಡೇಟಾ) ಅಥವಾ ಕಂಪನಿಗಳಿಂದ ನಿಯಂತ್ರಿಸಲ್ಪಡುತ್ತವೆ (ಉದಾ., ಸರ್ಚ್ ಎಂಜಿನ್ ಮತ್ತು ಫೋನ್ ಕರೆ ಮೆಟಾ-ಡೇಟಾಕ್ಕೆ ಪ್ರಶ್ನೆಗಳು). ಆದ್ದರಿಂದ, ಈ ಡೇಟಾ ಮೂಲಗಳು ಅಸ್ತಿತ್ವದಲ್ಲಿದ್ದರೂ, ಅವರು ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಯ ಉದ್ದೇಶಗಳಿಗಾಗಿ ನಿಷ್ಪ್ರಯೋಜಕರಾಗಿದ್ದಾರೆ ಏಕೆಂದರೆ ಅವು ಪ್ರವೇಶಿಸಲಾಗುವುದಿಲ್ಲ.
ನನ್ನ ಅನುಭವದಲ್ಲಿ, ವಿಶ್ವವಿದ್ಯಾನಿಲಯಗಳಲ್ಲಿರುವ ಅನೇಕ ಸಂಶೋಧಕರು ಈ ಪ್ರವೇಶದ ಮೂಲವನ್ನು ತಪ್ಪಾಗಿ ಅರ್ಥೈಸಿಕೊಳ್ಳುತ್ತಾರೆ. ಈ ಡೇಟಾವನ್ನು ಪ್ರವೇಶಿಸಲಾಗುವುದಿಲ್ಲ ಏಕೆಂದರೆ ಕಂಪನಿಗಳು ಮತ್ತು ಸರ್ಕಾರಗಳಲ್ಲಿರುವ ಜನರು ಮೂರ್ಖತನ, ಸೋಮಾರಿಯಾದವರು ಅಥವಾ ಗಮನದಲ್ಲಿಟ್ಟುಕೊಳ್ಳದವರು. ಬದಲಿಗೆ, ಡೇಟಾ ಪ್ರವೇಶವನ್ನು ತಡೆಯುವ ಗಂಭೀರವಾದ ಕಾನೂನು, ವ್ಯವಹಾರ ಮತ್ತು ನೈತಿಕ ತಡೆಗಳು ಇವೆ. ಉದಾಹರಣೆಗೆ, ವೆಬ್ಸೈಟ್ಗಳಿಗೆ ಕೆಲವು ಸೇವಾ ನಿಯಮಗಳ ಒಪ್ಪಂದಗಳು ಉದ್ಯೋಗಿಗಳು ಅಥವಾ ಸೇವೆಯನ್ನು ಸುಧಾರಿಸಲು ಡೇಟಾವನ್ನು ಮಾತ್ರ ಅನುಮತಿಸುತ್ತವೆ. ಆದ್ದರಿಂದ ಡೇಟಾ ಹಂಚಿಕೆಯ ಕೆಲವು ಪ್ರಕಾರಗಳು ಕಂಪೆನಿಗಳಿಂದ ಕಾನೂನುಬದ್ಧ ಮೊಕದ್ದಮೆಗಳಿಗೆ ಕಂಪನಿಗಳನ್ನು ಬಹಿರಂಗಗೊಳಿಸಬಹುದು. ಡೇಟಾವನ್ನು ಹಂಚಿಕೊಳ್ಳುವಲ್ಲಿ ಭಾಗಿಯಾದ ಕಂಪನಿಗಳಿಗೆ ಗಣನೀಯವಾದ ವ್ಯಾಪಾರ ಅಪಾಯಗಳು ಇವೆ. ವಿಶ್ವವಿದ್ಯಾನಿಲಯದ ಸಂಶೋಧನಾ ಯೋಜನೆಯ ಭಾಗವಾಗಿ ವೈಯಕ್ತಿಕ ಹುಡುಕಾಟ ಡೇಟಾ ಆಕಸ್ಮಿಕವಾಗಿ ಗೂಗಲ್ನಿಂದ ಹೊರಬಂದಾಗ ಹೇಗೆ ಸಾರ್ವಜನಿಕರು ಪ್ರತಿಕ್ರಿಯಿಸುತ್ತಿದ್ದಾರೆ ಎಂಬುದನ್ನು ಊಹಿಸಲು ಪ್ರಯತ್ನಿಸಿ. ಅಂತಹ ಡೇಟಾ ಉಲ್ಲಂಘನೆ, ತೀವ್ರವಾದರೆ, ಕಂಪೆನಿಗೆ ಅಸ್ತಿತ್ವವಾದದ ಅಪಾಯವೂ ಆಗಿರಬಹುದು. ಆದ್ದರಿಂದ ಗೂಗಲ್-ಮತ್ತು ಹೆಚ್ಚಿನ ಕಂಪನಿಗಳು- ಸಂಶೋಧಕರೊಂದಿಗೆ ಡೇಟಾವನ್ನು ಹಂಚಿಕೊಳ್ಳುವ ಬಗ್ಗೆ ಬಹಳ ಅಪಾಯವಿದೆ.
ವಾಸ್ತವವಾಗಿ, ಅಗಾಧ ಪ್ರಮಾಣದ ದತ್ತಾಂಶವನ್ನು ಪ್ರವೇಶಿಸುವ ಸ್ಥಿತಿಯಲ್ಲಿದ್ದ ಎಲ್ಲರೂ ಅಬ್ದುರ್ ಚೌಧರಿಯ ಕಥೆಯನ್ನು ತಿಳಿದಿದ್ದಾರೆ. 2006 ರಲ್ಲಿ, ಅವರು AOL ನಲ್ಲಿ ಸಂಶೋಧನೆಯ ಮುಖ್ಯಸ್ಥರಾಗಿದ್ದಾಗ, ಅವರು 650,000 AOL ಬಳಕೆದಾರರಿಂದ ಅನಾಮಧೇಯ ಹುಡುಕಾಟ ಪ್ರಶ್ನೆಗಳಾಗಿದ್ದನ್ನು ಸಂಶೋಧನಾ ಸಮುದಾಯಕ್ಕೆ ಉದ್ದೇಶಪೂರ್ವಕವಾಗಿ ಬಿಡುಗಡೆ ಮಾಡಿದರು. ನಾನು ಹೇಳುವಂತೆಯೇ, ಚೌಧರಿ ಮತ್ತು AOL ನಲ್ಲಿನ ಸಂಶೋಧಕರು ಉತ್ತಮ ಉದ್ದೇಶಗಳನ್ನು ಹೊಂದಿದ್ದರು, ಮತ್ತು ಅವರು ಡೇಟಾವನ್ನು ಅನಾಮಧೇಯಗೊಳಿಸಿದ್ದಾರೆ ಎಂದು ಅವರು ಭಾವಿಸಿದರು. ಆದರೆ ಅವರು ತಪ್ಪು. ಸಂಶೋಧಕರು ಅಂದಾಜಿಸಿದಂತೆ ಅಕ್ಷಾಂಶ ಅನಾಮಧೇಯವಾಗಿರಲಿಲ್ಲ ಎಂದು ತ್ವರಿತವಾಗಿ ಕಂಡುಹಿಡಿಯಲಾಯಿತು, ಮತ್ತು ನ್ಯೂ ಯಾರ್ಕ್ ಟೈಮ್ಸ್ನ ವರದಿಗಾರರು ಯಾರಾದರೊಬ್ಬರು (Barbaro and Zeller 2006) ಸುಲಭವಾಗಿ (Barbaro and Zeller 2006) ಗುರುತಿಸಲು ಸಾಧ್ಯವಾಯಿತು. ಈ ಸಮಸ್ಯೆಗಳನ್ನು ಒಮ್ಮೆ ಪತ್ತೆಹಚ್ಚಿದ ನಂತರ, ಚೌಧರಿ AOL ನ ವೆಬ್ಸೈಟ್ನಿಂದ ಡೇಟಾವನ್ನು ತೆಗೆದುಹಾಕಿದರು, ಆದರೆ ಇದು ತುಂಬಾ ತಡವಾಗಿತ್ತು. ಡೇಟಾವನ್ನು ಇತರ ವೆಬ್ಸೈಟ್ಗಳಲ್ಲಿ ಮರುಪಡೆಯಲಾಗಿದೆ, ಮತ್ತು ನೀವು ಈ ಪುಸ್ತಕವನ್ನು ಓದುವಾಗ ಅದು ಇನ್ನೂ ಲಭ್ಯವಿರುತ್ತದೆ. ಚೌಧರಿ ಅವರನ್ನು ವಜಾ ಮಾಡಲಾಯಿತು ಮತ್ತು ಎಒಎಲ್ನ ಮುಖ್ಯ ತಂತ್ರಜ್ಞಾನ ಅಧಿಕಾರಿ ರಾಜೀನಾಮೆ ನೀಡಿದರು (Hafner 2006) . ಈ ಉದಾಹರಣೆಯು ತೋರಿಸಿದಂತೆ, ಡೇಟಾ ಪ್ರವೇಶವನ್ನು ಸುಲಭಗೊಳಿಸಲು ಕಂಪೆನಿಗಳ ಒಳಗಿನ ನಿರ್ದಿಷ್ಟ ವ್ಯಕ್ತಿಗಳಿಗೆ ಅನುಕೂಲಗಳು ಬಹಳ ಚಿಕ್ಕದಾಗಿದೆ ಮತ್ತು ಕೆಟ್ಟ ಸಂದರ್ಭವು ಭೀಕರವಾಗಿದೆ.
ಆದರೆ, ಸಾರ್ವಜನಿಕರಿಗೆ ಪ್ರವೇಶಿಸಲಾಗದ ಡೇಟಾವನ್ನು ಸಂಶೋಧಕರು ಕೆಲವೊಮ್ಮೆ ಪ್ರವೇಶಿಸಬಹುದು. ಕೆಲವು ಸರ್ಕಾರಗಳು ಪ್ರವೇಶಕ್ಕಾಗಿ ಅರ್ಜಿ ಸಲ್ಲಿಸಲು ಸಂಶೋಧಕರು ಅನುಸರಿಸಬಹುದಾದ ಕಾರ್ಯವಿಧಾನಗಳನ್ನು ಹೊಂದಿವೆ, ಮತ್ತು ಈ ಅಧ್ಯಾಯದ ಪ್ರದರ್ಶನದಲ್ಲಿ ನಂತರದ ಉದಾಹರಣೆಗಳಲ್ಲಿ, ಸಂಶೋಧಕರು ಸಾಂದರ್ಭಿಕವಾಗಿ ಕಾರ್ಪೊರೇಟ್ ಡೇಟಾವನ್ನು ಪ್ರವೇಶಿಸಬಹುದು. ಉದಾಹರಣೆಗೆ, Einav et al. (2015) ಆನ್ಲೈನ್ ಹರಾಜುಗಳನ್ನು ಅಧ್ಯಯನ ಮಾಡಲು ಇಬೇನಲ್ಲಿ ಸಂಶೋಧಕರ ಜೊತೆ ಸಹಭಾಗಿತ್ವದಲ್ಲಿದ್ದರು. ಅಧ್ಯಾಯದಲ್ಲಿ ಈ ಸಹಕಾರದಿಂದ ಬಂದ ಸಂಶೋಧನೆಯ ಬಗ್ಗೆ ನಾನು ಹೆಚ್ಚು ಮಾತನಾಡುತ್ತೇನೆ, ಆದರೆ ನಾನು ಈಗ ಅದನ್ನು ಉಲ್ಲೇಖಿಸುತ್ತೇನೆ ಏಕೆಂದರೆ ನಾನು ಯಶಸ್ವಿ ಪಾಲುದಾರಿಕೆಗಳಲ್ಲಿ ನಾನು ನೋಡುವ ಎಲ್ಲಾ ನಾಲ್ಕು ಪದಾರ್ಥಗಳನ್ನು ಹೊಂದಿದ್ದೇನೆ: ಸಂಶೋಧಕ ಆಸಕ್ತಿ, ಸಂಶೋಧಕ ಸಾಮರ್ಥ್ಯ, ಕಂಪನಿ ಆಸಕ್ತಿ ಮತ್ತು ಕಂಪನಿಯ ಸಾಮರ್ಥ್ಯ . ಸಂಶೋಧಕರು ಅಥವಾ ಪಾಲುದಾರರು ಕಂಪೆನಿ ಅಥವಾ ಸರ್ಕಾರಿ-ಈ ಅಂಶಗಳಲ್ಲೊಂದರಲ್ಲಿ ಕೊರತೆಯಿರುವ ಕಾರಣದಿಂದಾಗಿ ನಾನು ಅನೇಕ ಸಂಭವನೀಯ ಸಹಯೋಗಗಳನ್ನು ವಿಫಲಗೊಳಿಸಿದೆ ಎಂದು ನೋಡಿದೆ.
ವ್ಯವಹಾರದೊಂದಿಗೆ ಪಾಲುದಾರಿಕೆಯನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು ಅಥವಾ ನಿರ್ಬಂಧಿತ ಸರ್ಕಾರದ ಡೇಟಾವನ್ನು ಪ್ರವೇಶಿಸಲು ನೀವು ಸಮರ್ಥರಾಗಿದ್ದರೂ, ನಿಮಗಾಗಿ ಕೆಲವು ಪರಿಣಾಮಗಳು ಇವೆ. ಮೊದಲಿಗೆ, ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಇತರ ಸಂಶೋಧಕರೊಂದಿಗೆ ಹಂಚಿಕೊಳ್ಳಲು ನಿಮಗೆ ಸಾಧ್ಯವಾಗುವುದಿಲ್ಲ, ಇದರರ್ಥ ಇತರ ಸಂಶೋಧಕರು ನಿಮ್ಮ ಫಲಿತಾಂಶಗಳನ್ನು ಪರಿಶೀಲಿಸಲು ಮತ್ತು ವಿಸ್ತರಿಸಲು ಸಾಧ್ಯವಾಗುವುದಿಲ್ಲ. ಎರಡನೆಯದು, ನೀವು ಕೇಳಬಹುದಾದ ಪ್ರಶ್ನೆಗಳು ಸೀಮಿತವಾಗಬಹುದು; ಕಂಪನಿಗಳು ಕೆಟ್ಟದಾಗಿ ಕಾಣುವಂತೆ ಮಾಡುವ ಸಂಶೋಧನೆಗಳನ್ನು ಅನುಮತಿಸಲು ಅಸಂಭವವಾಗಿದೆ. ಅಂತಿಮವಾಗಿ, ಈ ಪಾಲುದಾರಿಕೆಗಳು ಆಸಕ್ತಿಯ ಸಂಘರ್ಷದ ಕನಿಷ್ಠ ರೂಪವನ್ನು ರಚಿಸಬಹುದು, ಅಲ್ಲಿ ನಿಮ್ಮ ಫಲಿತಾಂಶಗಳು ನಿಮ್ಮ ಪಾಲುದಾರಿಕೆಗಳಿಂದ ಪ್ರಭಾವಿತವಾಗಿವೆ ಎಂದು ಜನರು ಭಾವಿಸಬಹುದು. ಈ ಎಲ್ಲಾ ಡೌನ್ ಸೈಡ್ಗಳನ್ನು ಉದ್ದೇಶಿಸಿ ಮಾಡಬಹುದು, ಆದರೆ ಎಲ್ಲರಿಗೂ ಪ್ರವೇಶಿಸದೆ ಇರುವ ಡೇಟಾದೊಂದಿಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುವುದರಿಂದ ಎರಡೂ ಅಪ್ಸೈಡ್ಗಳು ಮತ್ತು ಡೌನ್ಸೈಡ್ಗಳು ಇವೆ ಎಂಬುದು ಸ್ಪಷ್ಟವಾಗುತ್ತದೆ.
ಸಂಕ್ಷಿಪ್ತವಾಗಿ, ಸಂಶೋಧಕರಿಗೆ ಸಾಕಷ್ಟು ದೊಡ್ಡ ಡೇಟಾವನ್ನು ಪ್ರವೇಶಿಸಲಾಗುವುದಿಲ್ಲ. ಡೇಟಾ ಪ್ರವೇಶವನ್ನು ತಡೆಗಟ್ಟುವ ಗಂಭೀರವಾದ ಕಾನೂನು, ವ್ಯಾಪಾರ ಮತ್ತು ನೈತಿಕ ತಡೆಗಳು ಇವೆ, ಮತ್ತು ತಾಂತ್ರಿಕ ನಿರ್ಬಂಧಗಳು ಇರುವುದರಿಂದ ಈ ಅಡೆತಡೆಗಳು ದೂರವಿರುವುದಿಲ್ಲ ಏಕೆಂದರೆ ಅವುಗಳು ತಾಂತ್ರಿಕ ನಿರ್ಬಂಧಗಳಿಲ್ಲ. ಕೆಲವು ರಾಷ್ಟ್ರೀಯ ಸರ್ಕಾರಗಳು ಕೆಲವು ಡೇಟಾಸೆಟ್ಗಳಿಗೆ ಡೇಟಾ ಪ್ರವೇಶವನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುವ ಕಾರ್ಯವಿಧಾನಗಳನ್ನು ಸ್ಥಾಪಿಸಿವೆ, ಆದರೆ ಈ ಪ್ರಕ್ರಿಯೆಯು ವಿಶೇಷವಾಗಿ ರಾಜ್ಯ ಮತ್ತು ಸ್ಥಳೀಯ ಹಂತಗಳಲ್ಲಿ ತಾತ್ಕಾಲಿಕವಾಗಿರುತ್ತದೆ. ಅಲ್ಲದೆ, ಕೆಲವು ಸಂದರ್ಭಗಳಲ್ಲಿ, ಸಂಶೋಧಕರು ಡೇಟಾ ಪ್ರವೇಶವನ್ನು ಪಡೆಯಲು ಕಂಪನಿಗಳೊಂದಿಗೆ ಪಾಲುದಾರರಾಗಬಹುದು, ಆದರೆ ಇದು ಸಂಶೋಧಕರು ಮತ್ತು ಕಂಪನಿಗಳಿಗೆ ವಿವಿಧ ಸಮಸ್ಯೆಗಳನ್ನು ರಚಿಸಬಹುದು.