ಬಿಗ್ ಡೇಟಾ ಮೂಲಗಳು ಎಲ್ಲೆಡೆ ಇವೆ, ಆದರೆ ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಗೆ ಅವುಗಳನ್ನು ಬಳಸಿ ಟ್ರಿಕಿ ಆಗಿರಬಹುದು. ನನ್ನ ಅನುಭವದಲ್ಲಿ, ಡೇಟಾಗೆ "ಯಾವುದೇ ಉಚಿತ ಊಟದ" ನಿಯಮದಂತೆ ಇದೆ: ನೀವು ಸಾಕಷ್ಟು ಕೆಲಸವನ್ನು ಸಂಗ್ರಹಿಸದಿದ್ದರೆ, ನೀವು ಬಹುಶಃ ಹೆಚ್ಚಿನ ಕೆಲಸವನ್ನು ಅದರ ಬಗ್ಗೆ ಯೋಚಿಸಬೇಕು ಮತ್ತು ಅದನ್ನು ವಿಶ್ಲೇಷಿಸುವುದು.
ಇಂದು ಮತ್ತು ಸಾಧ್ಯವಿರುವ ನಾಳೆ ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳು 10 ಗುಣಲಕ್ಷಣಗಳನ್ನು ಹೊಂದಿವೆ. ಇವುಗಳಲ್ಲಿ ಮೂರು ಸಾಮಾನ್ಯವಾಗಿ (ಆದರೆ ಯಾವಾಗಲೂ ಅಲ್ಲ) ಸಂಶೋಧನೆಗಾಗಿ ಸಹಾಯಕವಾಗಿವೆ: ದೊಡ್ಡ, ಯಾವಾಗಲೂ, ಮತ್ತು nonreactive. ಸಂಶೋಧನೆಗಾಗಿ ಏಳು ಸಾಮಾನ್ಯವಾಗಿ (ಆದರೆ ಯಾವಾಗಲೂ ಅಲ್ಲ) ಸಮಸ್ಯಾತ್ಮಕವಾಗಿವೆ: ಅಪೂರ್ಣ, ಪ್ರವೇಶಿಸಲಾಗದ, ಪ್ರತಿನಿಧಿಸದ, ತೇಲುತ್ತವೆ, ಕ್ರಮಾವಳಿಗಳು ಗೊಂದಲಕ್ಕೊಳಗಾದ, ಕೊಳಕು ಮತ್ತು ಸೂಕ್ಷ್ಮ. ಈ ಅನೇಕ ಗುಣಲಕ್ಷಣಗಳು ಅಂತಿಮವಾಗಿ ಉದ್ಭವಿಸುತ್ತವೆ ಏಕೆಂದರೆ ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಯ ಉದ್ದೇಶಕ್ಕಾಗಿ ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳು ರಚಿಸಲ್ಪಟ್ಟಿಲ್ಲ.
ಈ ಅಧ್ಯಾಯದಲ್ಲಿನ ಕಲ್ಪನೆಗಳ ಆಧಾರದ ಮೇಲೆ, ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಗಾಗಿ ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳು ಹೆಚ್ಚು ಮೌಲ್ಯಯುತವಾದ ಮೂರು ಪ್ರಮುಖ ಮಾರ್ಗಗಳಿವೆ ಎಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ. ಮೊದಲಿಗೆ, ಸ್ಪರ್ಧಾತ್ಮಕ ಸೈದ್ಧಾಂತಿಕ ಭವಿಷ್ಯಗಳ ನಡುವೆ ನಿರ್ಧರಿಸಲು ಅವರು ಸಂಶೋಧಕರನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಬಹುದು. Farber (2015) (ನ್ಯೂಯಾರ್ಕ್ ಟ್ಯಾಕ್ಸಿ ಚಾಲಕರು) ಮತ್ತು King, Pan, and Roberts (2013) (ಚೀನಾದಲ್ಲಿ ಸೆನ್ಸಾರ್ಶಿಪ್ King, Pan, and Roberts (2013) ಈ ರೀತಿಯ ಕೆಲಸದ ಉದಾಹರಣೆಗಳಾಗಿವೆ. ಎರಡನೆಯದಾಗಿ, ದೊಡ್ಡ ದತ್ತಾಂಶ ಮೂಲಗಳು ನೀತಿಸಂಹಿತೆ ಮೂಲಕ ನೀತಿಗಾಗಿ ಸುಧಾರಿತ ಮಾಪನವನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಬಹುದು. ಈ ರೀತಿಯ ಕೆಲಸದ ಉದಾಹರಣೆ Ginsberg et al. (2009) (ಗೂಗಲ್ ಫ್ಲೂ ಟ್ರೆಂಡ್ಸ್). ಅಂತಿಮವಾಗಿ, ಪ್ರಯೋಗಗಳನ್ನು ನಡೆಸದೆ ಸಂಶೋಧಕರು ಕಾರಣ ಅಂದಾಜು ಮಾಡಲು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳು ಸಹಾಯ ಮಾಡಬಹುದು. Mas and Moretti (2009) (ಉತ್ಪಾದಕತೆಯ ಮೇಲೆ ಪೀರ್ ಪರಿಣಾಮಗಳು) ಮತ್ತು Einav et al. (2015) ಈ ರೀತಿಯ ಕೆಲಸದ ಉದಾಹರಣೆಗಳಾಗಿವೆ Einav et al. (2015) (ಇಬೇನಲ್ಲಿ ಹರಾಜಿನಲ್ಲಿ ಬೆಲೆ ಪ್ರಾರಂಭವಾಗುವ ಪರಿಣಾಮ). ಆದಾಗ್ಯೂ, ಈ ಪ್ರತಿಯೊಂದು ವಿಧಾನಗಳು ಸಂಶೋಧಕರಿಗೆ ಅಂದಾಜು ಮಾಡಲು ಅಗತ್ಯವಿರುವ ಒಂದು ಪ್ರಮಾಣದ ವ್ಯಾಖ್ಯಾನ ಅಥವಾ ಸ್ಪರ್ಧಾತ್ಮಕ ಭವಿಷ್ಯಸೂಚಕಗಳನ್ನು ಮಾಡುವ ಎರಡು ಸಿದ್ಧಾಂತಗಳಂತಹ ಡೇಟಾವನ್ನು ಬಹಳಷ್ಟು ತರಲು ಅಗತ್ಯವಾಗಿರುತ್ತದೆ. ಹಾಗಾಗಿ, ಆಸಕ್ತಿಕರ ಮತ್ತು ಪ್ರಮುಖ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಬಹುದಾದ ಸಂಶೋಧಕರಿಗೆ ಸಹಾಯ ಮಾಡುವ ದೊಡ್ಡ ದತ್ತಾಂಶ ಮೂಲಗಳ ಬಗ್ಗೆ ಯೋಚಿಸುವುದು ಉತ್ತಮ ಮಾರ್ಗವಾಗಿದೆ ಎಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ.
ತೀರ್ಮಾನಕ್ಕೆ ಬರುವ ಮೊದಲು, ದತ್ತಾಂಶ ಮತ್ತು ಸಿದ್ಧಾಂತದ ನಡುವಿನ ಸಂಬಂಧದ ಮೇಲೆ ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳು ಪ್ರಮುಖ ಪರಿಣಾಮವನ್ನು ಬೀರಬಹುದೆಂದು ಪರಿಗಣಿಸುವ ಮೌಲ್ಯವಿದೆ ಎಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ. ಇಲ್ಲಿಯವರೆಗೆ, ಈ ಅಧ್ಯಾಯವು ಸಿದ್ಧಾಂತ-ಚಾಲಿತ ಪ್ರಾಯೋಗಿಕ ಸಂಶೋಧನೆಯ ವಿಧಾನವನ್ನು ತೆಗೆದುಕೊಂಡಿದೆ. ಆದರೆ ದೊಡ್ಡ ದತ್ತಾಂಶ ಮೂಲಗಳು ಸಂಶೋಧಕರನ್ನು ಪ್ರಾಯೋಗಿಕವಾಗಿ ಸಿದ್ಧಾಂತಗೊಳಿಸುವುದನ್ನು ಮಾಡಲು ಶಕ್ತಗೊಳಿಸುತ್ತವೆ. ಅಂದರೆ, ಪ್ರಾಯೋಗಿಕ ಸಂಗತಿಗಳು, ಮಾದರಿಗಳು ಮತ್ತು ಒಗಟುಗಳ ಎಚ್ಚರಿಕೆಯ ಸಂಗ್ರಹಣೆಯ ಮೂಲಕ ಸಂಶೋಧಕರು ಹೊಸ ಸಿದ್ಧಾಂತಗಳನ್ನು ರಚಿಸಬಹುದು. ಈ ಪರ್ಯಾಯ, ಸಿದ್ಧಾಂತಕ್ಕೆ ಸಂಬಂಧಿಸಿದ ಡೇಟಾ-ಮೊದಲ ವಿಧಾನವು ಹೊಸದು ಅಲ್ಲ, ಮತ್ತು ಬಾರ್ನೆ ಗ್ಲೇಸರ್ ಮತ್ತು ಅನ್ಸೆಲ್ಮ್ ಸ್ಟ್ರಾಸ್ರಿಂದ (1967) ಆಧಾರವಾಗಿರುವ ಸಿದ್ಧಾಂತಕ್ಕಾಗಿ ಅವರ ಕರೆಗೆ ಇದು ಅತ್ಯಂತ ಬಲವಾಗಿ ವ್ಯಕ್ತಪಡಿಸಿತು. ಆದಾಗ್ಯೂ, ಈ ಡೇಟಾ-ಮೊದಲ ವಿಧಾನವು "ಸಿದ್ಧಾಂತದ ಅಂತ್ಯ" ಎಂದು ಅರ್ಥವಲ್ಲ, ಏಕೆಂದರೆ ಡಿಜಿಟಲ್ ವಯಸ್ಸಿನಲ್ಲಿ (Anderson 2008) ಸಂಶೋಧನೆಯ ಸುತ್ತ ಕೆಲವು ಪತ್ರಿಕೋದ್ಯಮಗಳಲ್ಲಿ ಹಕ್ಕು ಸಾಧಿಸಲಾಗಿದೆ. ದತ್ತಾಂಶ ಪರಿಸರವು ಬದಲಾಗುತ್ತಾ ಹೋದಂತೆ, ದತ್ತಾಂಶ ಮತ್ತು ಸಿದ್ಧಾಂತದ ನಡುವಿನ ಸಂಬಂಧದಲ್ಲಿ ಮರುಸಮತೋಲನವನ್ನು ನಾವು ನಿರೀಕ್ಷಿಸಬೇಕು. ಡೇಟಾ ಸಂಗ್ರಹಣೆಯು ದುಬಾರಿಯಾಗಿದ್ದ ಜಗತ್ತಿನಲ್ಲಿ, ಸಿದ್ಧಾಂತಗಳು ಸೂಚಿಸುವ ಡೇಟಾವನ್ನು ಮಾತ್ರ ಹೆಚ್ಚು ಉಪಯುಕ್ತವೆಂದು ಸಂಗ್ರಹಿಸುವುದು ಅರ್ಥಪೂರ್ಣವಾಗಿದೆ. ಆದರೆ, ಅಗಾಧ ಪ್ರಮಾಣದ ಡೇಟಾವನ್ನು ಈಗಾಗಲೇ ಉಚಿತವಾಗಿ ಲಭ್ಯವಿರುವ ಜಗತ್ತಿನಲ್ಲಿ, ಡೇಟಾ-ಮೊದಲ ವಿಧಾನವನ್ನು ಸಹ ಪ್ರಯತ್ನಿಸಲು ಅರ್ಥಪೂರ್ಣವಾಗಿದೆ (Goldberg 2015) .
ನಾನು ಈ ಅಧ್ಯಾಯದಲ್ಲಿ ತೋರಿಸಿರುವಂತೆ, ಜನರನ್ನು ನೋಡುವ ಮೂಲಕ ಸಂಶೋಧಕರು ಬಹಳಷ್ಟು ಕಲಿಯಬಹುದು. ಮುಂದಿನ ಮೂರು ಅಧ್ಯಾಯಗಳಲ್ಲಿ, ನಾವು ನಮ್ಮ ಡೇಟಾ ಸಂಗ್ರಹಣೆಗೆ ಅನುಗುಣವಾಗಿ ಮತ್ತು ನೇರವಾಗಿ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳುವ ಮೂಲಕ (ಅಧ್ಯಾಯ 3), ಚಾಲನೆಯಲ್ಲಿರುವ ಪ್ರಯೋಗಗಳನ್ನು (ಅಧ್ಯಾಯ 4), ಮತ್ತು ಅವುಗಳನ್ನು ಒಳಗೊಳ್ಳುವ ಮೂಲಕ ನಾವು ಇನ್ನಷ್ಟು ಹೆಚ್ಚು ಮತ್ತು ವಿಭಿನ್ನ ವಿಷಯಗಳನ್ನು ಹೇಗೆ ಕಲಿಯಬಹುದೆಂದು ವಿವರಿಸುತ್ತೇನೆ. ಸಂಶೋಧನಾ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ ನೇರವಾಗಿ (ಅಧ್ಯಾಯ 5).