ನೀವು ಉತ್ತಮ ಮಾಹಿತಿಯೊಂದಿಗೆ ಒಂದು ಒಳ್ಳೆಯ ಪ್ರಶ್ನೆ ಒಗ್ಗೂಡಿ ಸಾಮಾನ್ಯ ಎಣಿಕೆಯ ಆಸಕ್ತಿದಾಯಕ ಮಾಡಬಹುದು.
ಇದು ಅತ್ಯಾಧುನಿಕ-ಧ್ವನಿಯ ಭಾಷೆಯಲ್ಲಿ ಸಂಯೋಜಿಸಲ್ಪಟ್ಟಿದೆಯಾದರೂ, ಬಹಳಷ್ಟು ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಗಳು ನಿಜವಾಗಿಯೂ ವಿಷಯಗಳನ್ನು ಎಣಿಸುತ್ತಿದೆ. ದೊಡ್ಡ ಡೇಟಾದ ವಯಸ್ಸಿನಲ್ಲಿ, ಸಂಶೋಧಕರು ಎಂದಿಗಿಂತಲೂ ಹೆಚ್ಚಿನದನ್ನು ಲೆಕ್ಕ ಮಾಡಬಹುದು, ಆದರೆ ಅವರು ಅಷ್ಟೇನೂ ಲೆಕ್ಕವಿಲ್ಲದಷ್ಟು ಲೆಕ್ಕ ಹಾಕಬೇಕೆಂದು ಅರ್ಥವಲ್ಲ. ಬದಲಿಗೆ, ಸಂಶೋಧಕರು ಕೇಳಬೇಕು: ಯಾವ ವಿಷಯಗಳು ಮೌಲ್ಯಯುತ ಎಣಿಕೆಯಿವೆ? ಇದು ಸಂಪೂರ್ಣ ವ್ಯಕ್ತಿನಿಷ್ಠ ವಿಷಯದಂತೆ ಕಾಣಿಸಬಹುದು, ಆದರೆ ಕೆಲವು ಸಾಮಾನ್ಯ ಮಾದರಿಗಳಿವೆ.
ಅನೇಕ ವೇಳೆ ವಿದ್ಯಾರ್ಥಿಗಳು ತಮ್ಮ ಎಣಿಕೆಯ ಸಂಶೋಧನೆಯನ್ನು ಪ್ರೇರೇಪಿಸುವ ಮೂಲಕ ಪ್ರೇರೇಪಿಸುತ್ತಾರೆ: ನಾನು ಯಾರೂ ಮೊದಲು ಎಣಿಸಲಿಲ್ಲ ಎಂದು ನಾನು ಎಣಿಸುತ್ತೇನೆ. ಉದಾಹರಣೆಗೆ, ಅನೇಕ ಜನರು ವಲಸಿಗರನ್ನು ಅಧ್ಯಯನ ಮಾಡಿದ್ದಾರೆ ಮತ್ತು ಅನೇಕ ಜನರು ಅವಳಿಗಳನ್ನು ಅಧ್ಯಯನ ಮಾಡಿದ್ದಾರೆ ಎಂದು ವಿದ್ಯಾರ್ಥಿ ಹೇಳಬಹುದು, ಆದರೆ ಯಾರೂ ವಲಸೆಗಾರ ಅವಳಿಗಳನ್ನು ಅಧ್ಯಯನ ಮಾಡಿದ್ದಾರೆ. ನನ್ನ ಅನುಭವದಲ್ಲಿ ನಾನು ಅನುಪಸ್ಥಿತಿಯಲ್ಲಿ ಪ್ರೇರೇಪಿಸುವ ಈ ತಂತ್ರವು ಸಾಮಾನ್ಯವಾಗಿ ಉತ್ತಮ ಸಂಶೋಧನೆಗೆ ಕಾರಣವಾಗುವುದಿಲ್ಲ. ಅನುಪಸ್ಥಿತಿಯಿಂದ ಪ್ರೇರಣೆ ಅಲ್ಲಿ ಒಂದು ರಂಧ್ರವಿದೆ ಎಂದು ಹೇಳುವುದು, ಮತ್ತು ಅದನ್ನು ತುಂಬಲು ನಾನು ತುಂಬಾ ಕಷ್ಟಪಟ್ಟು ಕೆಲಸ ಮಾಡುತ್ತೇನೆ. ಆದರೆ ಪ್ರತಿ ರಂಧ್ರವೂ ತುಂಬಬೇಕಿಲ್ಲ.
ಅನುಪಸ್ಥಿತಿಯಿಂದ ಪ್ರೇರೇಪಿಸುವ ಬದಲು, ಮುಖ್ಯವಾದ ಅಥವಾ ಆಸಕ್ತಿದಾಯಕವಾದ (ಅಥವಾ ಆದರ್ಶಪ್ರಾಯವಾಗಿ) ಸಂಶೋಧನಾ ಪ್ರಶ್ನೆಗಳನ್ನು ಹುಡುಕುವುದು ಉತ್ತಮ ಕಾರ್ಯತಂತ್ರ ಎಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ. ಈ ಎರಡೂ ಪದಗಳು ವ್ಯಾಖ್ಯಾನಿಸಲು ಸ್ವಲ್ಪ ಕಷ್ಟ, ಆದರೆ ಪ್ರಮುಖ ಸಂಶೋಧನೆಯ ಬಗ್ಗೆ ಯೋಚಿಸುವ ಒಂದು ಮಾರ್ಗವೆಂದರೆ ಅದು ನೀತಿ ನಿರ್ಮಾಪಕರು ಮಾಡಿದ ಪ್ರಮುಖ ನಿರ್ಧಾರಕ್ಕೆ ಕೆಲವು ಅಳೆಯಬಹುದಾದ ಪ್ರಭಾವ ಅಥವಾ ಫೀಡ್ಗಳನ್ನು ಹೊಂದಿದೆ. ಉದಾಹರಣೆಗೆ, ನಿರುದ್ಯೋಗ ದರವನ್ನು ಅಳೆಯುವುದು ಪ್ರಮುಖವಾಗಿದೆ ಏಕೆಂದರೆ ಇದು ನೀತಿ ನಿರ್ಧಾರಗಳನ್ನು ನಡೆಸುವ ಆರ್ಥಿಕತೆಯ ಸೂಚಕವಾಗಿದೆ. ಸಾಮಾನ್ಯವಾಗಿ, ಸಂಶೋಧಕರು ಮುಖ್ಯವಾದುದು ಒಂದು ಒಳ್ಳೆಯ ಅರ್ಥವನ್ನು ಹೊಂದಿದ್ದಾರೆಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ. ಆದ್ದರಿಂದ, ಈ ವಿಭಾಗದ ಉಳಿದ ಭಾಗದಲ್ಲಿ, ನಾನು ಎಣಿಕೆಯು ಆಸಕ್ತಿದಾಯಕವಾಗಿದೆ ಎಂದು ಭಾವಿಸುವ ಎರಡು ಉದಾಹರಣೆಗಳನ್ನು ನಾನು ನೀಡುತ್ತೇನೆ. ಪ್ರತಿ ಸಂದರ್ಭದಲ್ಲಿ, ಸಂಶೋಧಕರು ಅಸ್ಪಷ್ಟವಾಗಿ ಲೆಕ್ಕ ಹಾಕುತ್ತಿರಲಿಲ್ಲ; ಬದಲಿಗೆ, ಅವರು ಸಾಮಾಜಿಕ ವ್ಯವಸ್ಥೆಗಳು ಕಾರ್ಯನಿರ್ವಹಿಸುವ ಬಗ್ಗೆ ಹೆಚ್ಚು ಸಾಮಾನ್ಯ ವಿಚಾರಗಳನ್ನು ಪ್ರಮುಖ ಒಳನೋಟಗಳನ್ನು ಬಹಿರಂಗಪಡಿಸಿದ ನಿರ್ದಿಷ್ಟ ಸೆಟ್ಟಿಂಗ್ಗಳಲ್ಲಿ ಎಣಿಸುವ ಮಾಡಲಾಯಿತು. ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಈ ನಿರ್ದಿಷ್ಟ ಎಣಿಕೆಯ ವ್ಯಾಯಾಮವನ್ನು ಆಸಕ್ತಿದಾಯಕವಾಗಿಸುವುದರಲ್ಲಿ ಬಹಳಷ್ಟು ಮಾಹಿತಿಯು ಸ್ವತಃ ಅಲ್ಲ, ಇದು ಹೆಚ್ಚು ಸಾಮಾನ್ಯವಾದ ವಿಚಾರಗಳಿಂದ ಬರುತ್ತದೆ.
ಎಣಿಸುವ ಸರಳ ಶಕ್ತಿಯ ಒಂದು ಉದಾಹರಣೆಯೆಂದರೆ ಹೆನ್ರಿ ಫಾರ್ಬರ್ (2015) ನ್ಯೂಯಾರ್ಕ್ ನಗರದ ಟ್ಯಾಕ್ಸಿ ಡ್ರೈವರ್ಗಳ ನಡವಳಿಕೆಯ ಅಧ್ಯಯನ. ಈ ಗುಂಪನ್ನು ಅಂತರ್ಗತವಾಗಿ ಆಸಕ್ತಿದಾಯಕವಾಗಿ ಧ್ವನಿಸದಿದ್ದರೂ, ಇದು ಕಾರ್ಮಿಕ ಅರ್ಥಶಾಸ್ತ್ರದಲ್ಲಿ ಎರಡು ಸ್ಪರ್ಧಾತ್ಮಕ ಸಿದ್ಧಾಂತಗಳನ್ನು ಪರೀಕ್ಷಿಸಲು ಒಂದು ಕಾರ್ಯತಂತ್ರದ ಸಂಶೋಧನಾ ತಾಣವಾಗಿದೆ . ಫಾರ್ಬರ್ ಸಂಶೋಧನೆಯ ಉದ್ದೇಶಗಳಿಗಾಗಿ, ಟ್ಯಾಕ್ಸಿ ಡ್ರೈವರ್ಗಳ ಕೆಲಸದ ವಾತಾವರಣದ ಬಗ್ಗೆ ಎರಡು ಪ್ರಮುಖ ಲಕ್ಷಣಗಳಿವೆ: (1) ತಮ್ಮ ಗಂಟೆಯ ವೇತನವು ದಿನದಿಂದ ದಿನಕ್ಕೆ ಏರಿಳಿತಗೊಳ್ಳುತ್ತದೆ, ಹವಾಮಾನದಂತಹ ಅಂಶಗಳ ಆಧಾರದ ಮೇಲೆ, ಮತ್ತು (2) ಅವರು ಗಂಟೆಗಳ ಸಂಖ್ಯೆ ಕೆಲಸವು ತಮ್ಮ ನಿರ್ಧಾರಗಳನ್ನು ಆಧರಿಸಿ ಪ್ರತಿ ದಿನವೂ ಏರುಪೇರು ಮಾಡಬಹುದು. ಈ ವೈಶಿಷ್ಟ್ಯಗಳು ಕೆಲಸದ ಗಂಟೆಗಳು ಮತ್ತು ಗಂಟೆಗಳ ನಡುವಿನ ಸಂಬಂಧದ ಕುತೂಹಲಕಾರಿ ಪ್ರಶ್ನೆಗೆ ಕಾರಣವಾಗುತ್ತವೆ. ಟ್ಯಾಕ್ಸಿ ಚಾಲಕರು ಹೆಚ್ಚಿನ ಗಂಟೆಗಳ ವೇತನವನ್ನು ಹೊಂದಿರುವ ದಿನಗಳಲ್ಲಿ ಹೆಚ್ಚು ಕೆಲಸ ಮಾಡುತ್ತಾರೆ ಎಂದು ಅರ್ಥಶಾಸ್ತ್ರದಲ್ಲಿ ನವಶಾಸ್ತ್ರೀಯ ಮಾದರಿಗಳು ಊಹಿಸುತ್ತವೆ. ಪರ್ಯಾಯವಾಗಿ, ವರ್ತನೆಯ ಅರ್ಥಶಾಸ್ತ್ರದ ಮಾದರಿಗಳು ನಿಖರವಾಗಿ ವಿರುದ್ಧವಾಗಿ ಊಹಿಸುತ್ತವೆ. ಚಾಲಕರು ಒಂದು ನಿರ್ದಿಷ್ಟ ಆದಾಯ ಗುರಿಯನ್ನು ಹೊಂದಿದರೆ-ದಿನಕ್ಕೆ $ 100 ಎಂದು ಹೇಳಿದರೆ-ಮತ್ತು ಗುರಿಯನ್ನು ತಲುಪುವವರೆಗೂ ಕೆಲಸ ಮಾಡುತ್ತಾರೆ, ನಂತರ ಚಾಲಕಗಳು ಅವರು ಹೆಚ್ಚು ಗಳಿಸುತ್ತಿರುವುದರಿಂದ ಕಡಿಮೆ ಗಂಟೆಗಳ ಕಾಲ ಕೆಲಸ ಮಾಡುತ್ತಾರೆ. ಉದಾಹರಣೆಗೆ, ನೀವು ಗುರಿಯನ್ನು ಗಳಿಸಿದವರಾಗಿದ್ದರೆ, ನೀವು ಉತ್ತಮ ದಿನ (ಗಂಟೆಗೆ $ 25) ಮತ್ತು ಕೆಟ್ಟ ದಿನಕ್ಕೆ ಐದು ಗಂಟೆಗಳ (ಗಂಟೆಗೆ $ 20) ನಾಲ್ಕು ಗಂಟೆಗಳ ಕೆಲಸವನ್ನು ಕೊನೆಗೊಳಿಸಬಹುದು. ಆದ್ದರಿಂದ, ಚಾಲಕರು ಹೆಚ್ಚಿನ ಗಂಟೆಗಳ ವೇತನಗಳನ್ನು (ನಿಯೋಕ್ಲಾಸಿಕಲ್ ಮಾದರಿಗಳಿಂದ ಭವಿಷ್ಯ) ಅಥವಾ ಕಡಿಮೆ ಗಂಟೆಯ ವೇತನದೊಂದಿಗೆ (ವರ್ತನೆಯ ಆರ್ಥಿಕ ಮಾದರಿಗಳಿಂದ ಭವಿಷ್ಯ ನುಡಿದಂತೆ) ದಿನಗಳಲ್ಲಿ ಹೆಚ್ಚು ಗಂಟೆಗಳ ಕೆಲಸ ಮಾಡುತ್ತಾರೆ?
ಈ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರಿಸಲು Farber 2009 ರಿಂದ 2013 ರವರೆಗೆ ನ್ಯೂಯಾರ್ಕ್ ಸಿಟಿ ಕ್ಯಾಬ್ಗಳು ತೆಗೆದುಕೊಂಡ ಪ್ರತಿಯೊಂದು ಟ್ಯಾಕ್ಸಿ ಪ್ರವಾಸದಲ್ಲೂ ಡೇಟಾವನ್ನು ಪಡೆದುಕೊಂಡಿದೆ, ಅದು ಈಗ ಸಾರ್ವಜನಿಕವಾಗಿ ಲಭ್ಯವಿದೆ. ಈ ಡೇಟಾವನ್ನು ಎಲೆಕ್ಟ್ರಾನಿಕ್ ಮೀಟರ್ಗಳು ಸಂಗ್ರಹಿಸಿದವು-ಪ್ರತಿ ಪ್ರವಾಸದ ಬಗ್ಗೆ ಮಾಹಿತಿಯನ್ನು ಒಳಗೊಂಡಿರುವ ಟ್ಯಾಕ್ಸಿಗಳಿಗೆ ಸಿಟಿ ಅಗತ್ಯವಿದೆ: ಆರಂಭದ ಸಮಯ, ಸ್ಥಳವನ್ನು ಪ್ರಾರಂಭಿಸಿ, ಕೊನೆಯ ಸಮಯ, ಅಂತ್ಯದ ಸ್ಥಳ, ಶುಲ್ಕ, ಮತ್ತು ತುದಿ (ತುದಿಗೆ ಕ್ರೆಡಿಟ್ ಕಾರ್ಡ್ನೊಂದಿಗೆ ಪಾವತಿಸಿದರೆ) . ಈ ಟ್ಯಾಕ್ಸಿ ಮೀಟರ್ ಡೇಟಾವನ್ನು ಬಳಸುವುದರಿಂದ, ವೇತನಗಳು ಹೆಚ್ಚಾಗುವಾಗ ಹೆಚ್ಚಿನ ಚಾಲಕರು ದಿನಗಳಲ್ಲಿ ಹೆಚ್ಚು ಕೆಲಸ ಮಾಡುತ್ತಾರೆ ಎಂದು ಫಾರರ್ ಕಂಡುಕೊಂಡಿದ್ದಾರೆ, ಇದು ನಿಯೋಕ್ಲಾಸಿಕಲ್ ಸಿದ್ಧಾಂತದೊಂದಿಗೆ ಸಮಂಜಸವಾಗಿದೆ.
ಈ ಪ್ರಮುಖ ಶೋಧನೆಗೆ ಹೆಚ್ಚುವರಿಯಾಗಿ, ವೈವಿಧ್ಯತೆ ಮತ್ತು ಡೈನಾಮಿಕ್ಸ್ಗಳ ಉತ್ತಮ ತಿಳುವಳಿಕೆಗಾಗಿ ಫಾರ್ಬರ್ನ ಮಾಹಿತಿಯ ಗಾತ್ರವನ್ನು ಬಳಸಲು ಸಾಧ್ಯವಾಯಿತು. ಕಾಲಾನಂತರದಲ್ಲಿ, ಹೊಸ ಚಾಲಕರು ಕ್ರಮೇಣ ಉನ್ನತ-ವೇತನದ ದಿನಗಳಲ್ಲಿ ಹೆಚ್ಚು ಗಂಟೆಗಳವರೆಗೆ ಕೆಲಸ ಮಾಡಲು ಕಲಿಯುತ್ತಾರೆ (ಉದಾಹರಣೆಗೆ, ಅವರು ನವಶಾಸ್ತ್ರೀಯ ಮಾದರಿಯಂತೆ ಭವಿಷ್ಯ ನುಡಿಸಲು ಕಲಿಯುತ್ತಾರೆ). ಮತ್ತು ಟಾರ್ಗೆ ಚಾಲಕರು ಎಂದು ಬಿಟ್ಟುಬಿಡುವ ಸಾಧ್ಯತೆ ಹೆಚ್ಚು ಗುರಿಯನ್ನು ಗಳಿಸುವಂತಹ ಹೊಸ ವರ್ತಕರು. ಈ ಎರಡೂ ಸೂಕ್ಷ್ಮ ಸಂಶೋಧನೆಗಳು, ಪ್ರಸ್ತುತ ಚಾಲಕರ ಗಮನಿಸಿದ ನಡವಳಿಕೆಯನ್ನು ವಿವರಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ, ಏಕೆಂದರೆ ಡೇಟಾಸಮೂಹದ ಗಾತ್ರದ ಕಾರಣ ಮಾತ್ರ ಸಾಧ್ಯ. ಅಲ್ಪ ಕಾಲದ ಅವಧಿಯಲ್ಲಿ ಸಣ್ಣ ಸಂಖ್ಯೆಯ ಟ್ಯಾಕ್ಸಿ ಚಾಲಕರು (Camerer et al. 1997) ಕಾಗದದ ಟ್ರಿಪ್ ಹಾಳೆಗಳನ್ನು ಬಳಸಿದ ಹಿಂದಿನ ಅಧ್ಯಯನಗಳು ಪತ್ತೆಹಚ್ಚಲು ಅಸಾಧ್ಯ.
ಫಾರ್ಬರ್ ಅವರ ಅಧ್ಯಯನವು ಒಂದು ದೊಡ್ಡ ದತ್ತಾಂಶ ಮೂಲವನ್ನು ಬಳಸಿಕೊಂಡು ಒಂದು ಸಂಶೋಧನೆಗೆ ಅತ್ಯುತ್ತಮ-ಸನ್ನಿವೇಶದಲ್ಲಿ ನಿಕಟವಾಗಿತ್ತು, ಏಕೆಂದರೆ ನಗರದ ಮೂಲಕ ಸಂಗ್ರಹಿಸಲ್ಪಟ್ಟ ಡೇಟಾವು ಫಾರ್ಬರ್ ಸಂಗ್ರಹಿಸಿದ ದತ್ತಾಂಶಕ್ಕೆ ಬಹಳ ಸಮೀಪದಲ್ಲಿದೆ (ಒಂದು ವ್ಯತ್ಯಾಸವೆಂದರೆ ಫಾರ್ಬರ್ ಒಟ್ಟು ದತ್ತಾಂಶವನ್ನು ಬಯಸುತ್ತಿದ್ದರು ಎಂದು ವೇತನ-ದರಗಳು ಮತ್ತು ಸುಳಿವುಗಳು-ಆದರೆ ನಗರದ ದತ್ತಾಂಶವು ಕ್ರೆಡಿಟ್ ಕಾರ್ಡ್ನಿಂದ ಪಾವತಿಸಿದ ಸಲಹೆಗಳನ್ನು ಮಾತ್ರ ಒಳಗೊಂಡಿದೆ). ಹೇಗಾದರೂ, ಕೇವಲ ಡೇಟಾ ಸಾಕಷ್ಟು ಇರಲಿಲ್ಲ. ಫಾರ್ಬರ್ನ ಸಂಶೋಧನೆಗೆ ಕೀಲಿಯು ಈ ನಿರ್ದಿಷ್ಟ ಸೆಟ್ಟಿಂಗ್ಗೆ ಮೀರಿದ ದೊಡ್ಡ ಪರಿಣಾಮಗಳನ್ನು ಹೊಂದಿರುವ ಒಂದು ಪ್ರಶ್ನೆಗೆ ಒಂದು ಕುತೂಹಲಕಾರಿ ಪ್ರಶ್ನೆಯಾಗಿದೆ.
ಚೀನೀ ಸರ್ಕಾರದ ಆನ್ಲೈನ್ ಸೆನ್ಸಾರ್ಶಿಪ್ನಲ್ಲಿ ಗ್ಯಾರಿ ಕಿಂಗ್, ಜೆನ್ನಿಫರ್ ಪ್ಯಾನ್ ಮತ್ತು ಮೊಲ್ಲಿ ರಾಬರ್ಟ್ಸ್ (2013) ಸಂಶೋಧನೆಯಿಂದ ವಿಷಯಗಳ ಎಣಿಕೆಯ ಎರಡನೇ ಉದಾಹರಣೆ ಬರುತ್ತದೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಆದಾಗ್ಯೂ, ಸಂಶೋಧಕರು ತಮ್ಮದೇ ಆದ ದೊಡ್ಡ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಬೇಕಾಗಿತ್ತು ಮತ್ತು ಅವರ ಡೇಟಾ ಅಪೂರ್ಣವಾಗಿರುವುದನ್ನು ಅವರು ಎದುರಿಸಬೇಕಾಯಿತು.
ಚೀನಾದಲ್ಲಿ ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮದ ಪೋಸ್ಟ್ಗಳು ಅಗಾಧವಾದ ರಾಜ್ಯ ಉಪಕರಣದಿಂದ ಸೆನ್ಸಾರ್ ಮಾಡಲ್ಪಟ್ಟಿವೆ, ಸಾವಿರಾರು ಜನರು ಸೇರಿವೆ ಎಂದು ಭಾವಿಸಲಾಗಿದೆ ಎಂದು ರಾಜ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಪ್ರೇರೇಪಿಸಿದರು. ಆದಾಗ್ಯೂ, ಸಂಶೋಧಕರು ಮತ್ತು ಪ್ರಜೆಗಳಿಗೆ, ಈ ಸೆನ್ಸಾರ್ಗಳು ಯಾವ ವಿಷಯವನ್ನು ಅಳಿಸಬೇಕೆಂಬುದನ್ನು ನಿರ್ಧರಿಸುವ ಬಗ್ಗೆ ಸ್ವಲ್ಪ ಅರ್ಥವಿಲ್ಲ. ಚೀನಾ ವಿದ್ವಾಂಸರು ವಾಸ್ತವವಾಗಿ ಯಾವ ರೀತಿಯ ಪೋಸ್ಟ್ಗಳನ್ನು ಅಳಿಸಬಹುದೆಂದು ವಿರೋಧಿಸುವ ನಿರೀಕ್ಷೆಗಳನ್ನು ಎದುರಿಸುತ್ತಾರೆ. ರಾಜ್ಯದ ಬಗ್ಗೆ ಟೀಕೆಗೊಳಗಾದ ಪೋಸ್ಟ್ಗಳಲ್ಲಿ ಸೆನ್ಸಾರ್ಗಳು ಕೇಂದ್ರೀಕರಿಸುತ್ತವೆ ಎಂದು ಕೆಲವರು ಭಾವಿಸುತ್ತಾರೆ, ಆದರೆ ಇತರರು ಪ್ರತಿಭಟನೆಗಳಂತಹ ಸಾಮೂಹಿಕ ನಡವಳಿಕೆಯನ್ನು ಪ್ರೋತ್ಸಾಹಿಸುವ ಪೋಸ್ಟ್ಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತಾರೆ ಎಂದು ಭಾವಿಸುತ್ತಾರೆ. ಈ ನಿರೀಕ್ಷೆಗಳಲ್ಲಿ ಯಾವುದು ಕಂಡುಬರುತ್ತದೆ ಎನ್ನುವುದು ಕಂಡುಕೊಂಡಿದ್ದು, ಸಂಶೋಧಕರು ಚೀನಾ ಮತ್ತು ಸೆನ್ಸಾರ್ಶಿಪ್ನಲ್ಲಿ ತೊಡಗಿಸುವ ಇತರ ಸರ್ವಾಧಿಕಾರಿ ಸರ್ಕಾರಗಳನ್ನು ಹೇಗೆ ಅರ್ಥೈಸಿಕೊಳ್ಳುತ್ತಾರೆ ಎಂಬುವುದಕ್ಕೆ ಸಂಬಂಧಿಸಿದ ಪರಿಣಾಮಗಳನ್ನು ಹೊಂದಿದೆ. ಆದ್ದರಿಂದ, ರಾಜ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಪ್ರಕಟಿಸಿದ ಪೋಸ್ಟ್ಗಳನ್ನು ಹೋಲಿಸಲು ಬಯಸಿದರು ಮತ್ತು ತರುವಾಯ ಪ್ರಕಟಿಸಿದ ಮತ್ತು ಎಂದಿಗೂ ಅಳಿಸದೆ ಇರುವ ಪೋಸ್ಟ್ಗಳನ್ನು ಅಳಿಸಿಹಾಕಿದರು.
ಈ ಪೋಸ್ಟ್ಗಳನ್ನು ಸಂಗ್ರಹಿಸುವ ಸಂಬಂಧಿತ ಪೋಸ್ಟ್ಗಳು ವಿವಿಧ ಪುಟ ಚೌಕಟ್ಟಿನಲ್ಲಿ ಹುಡುಕುವುದು, ಮತ್ತು ನಂತರ ತರುವಾಯದಲ್ಲಿ ತೆಗೆದುಹಾಕಲಾಯಿತು ಇದು ನೋಡಲು ಈ ಪೋಸ್ಟ್ಗಳನ್ನು ಪುನರಾವಲೋಕಿಸುವ 1,000 ಹೆಚ್ಚು ಚೀನೀ ಸಾಮಾಜಿಕ ವೆಬ್ಸೈಟ್ಗಳಿಂದ-ಪ್ರತಿ ಕ್ರಾಲ್ ಅದ್ಭುತ ಇಂಜಿನಿಯರಿಂಗ್ ಸಾಧನೆಯನ್ನು ಒಳಗೊಂಡಿತ್ತು. ದೊಡ್ಡ ಪ್ರಮಾಣದ ವೆಬ್ ಸಂಚಾರ ಸಂಬಂಧಿಸಿದ ಸಾಮಾನ್ಯ ಎಂಜಿನಿಯರಿಂಗ್ ಸಮಸ್ಯೆಗಳನ್ನು ಜೊತೆಗೆ, ಈ ಯೋಜನೆಯ ಅನೇಕ ಸೆನ್ಸಾರ್ ಕಂಬಗಳಿವೆ ಕಡಿಮೆ 24 ಗಂಟೆಗಳ ಕೆಳಗೆ ತೆಗೆದುಕೊಂಡ ಕಾರಣ ಇದು ಅತ್ಯಂತ ವೇಗದ ಎಂದು ಅಗತ್ಯವಿದೆ ಎಂದು ಸೇರಿಸಲಾಗಿದೆ ಸವಾಲು ಹೊಂದಿತ್ತು. ಅರ್ಥಾತ್, ನಿಧಾನಗತಿಯ ಕ್ರಾಲರ್ ಆ ಸೆನ್ಸಾರ್ ಮಾಡಲಾಯಿತು ಪೋಸ್ಟ್ಗಳ ನಮ್ಮ ತಪ್ಪಿಸಿಕೊಂಡು. ಇದಲ್ಲದೆ, ತೆವಳುವ ಘಟಕಗಳು ಸಾಮಾಜಿಕ ವೆಬ್ಸೈಟ್ಗಳಿಂದ ಅಧ್ಯಯನ ಪ್ರತಿಕ್ರಿಯೆಯಾಗಿ ತಮ್ಮ ನೀತಿಗಳನ್ನು ಬದಲಾಯಿಸಲು ಪ್ರವೇಶವನ್ನು ನಿರ್ಬಂಧಿಸಲು ಅಥವಾ ಆಗದಂತೆ ಪತ್ತೆ evading ಸಂದರ್ಭದಲ್ಲಿ ಈ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹ ಮಾಡಲೇಬೇಕಿತ್ತು.
ಈ ಬೃಹತ್ ಎಂಜಿನಿಯರಿಂಗ್ ಕಾರ್ಯ ಪೂರ್ಣಗೊಂಡ ಸಮಯದ ವೇಳೆಗೆ, ರಾಜ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು 85 ವಿಭಿನ್ನ ಸೂಚ್ಯಂಕದ ವಿಷಯಗಳಲ್ಲಿ ಸುಮಾರು 11 ಮಿಲಿಯನ್ ಪೋಸ್ಟ್ಗಳನ್ನು ಪಡೆದರು, ಪ್ರತಿಯೊಂದೂ ಒಂದು ಸಂವೇದನೆಯ ಮಟ್ಟವನ್ನು ಹೊಂದಿದವು. ಉದಾಹರಣೆಗೆ, ಹೆಚ್ಚಿನ ಸೂಕ್ಷ್ಮತೆಯ ವಿಷಯವೆಂದರೆ ವೈ ವೈವೆ, ಭಿನ್ನಮತೀಯ ಕಲಾವಿದ; ಮಧ್ಯಮ ಸೂಕ್ಷ್ಮತೆಯ ಒಂದು ವಿಷಯವು ಚೀನೀ ಕರೆನ್ಸಿಯ ಮೆಚ್ಚುಗೆ ಮತ್ತು ಮೌಲ್ಯಮಾಪನವಾಗಿದೆ, ಮತ್ತು ಕಡಿಮೆ ಸಂವೇದನೆಯ ವಿಷಯವೆಂದರೆ ವಿಶ್ವಕಪ್. ಈ 11 ಮಿಲಿಯನ್ ಪೋಸ್ಟ್ಗಳಲ್ಲಿ ಸುಮಾರು 2 ಮಿಲಿಯನ್ ಜನರು ಸೆನ್ಸಾರ್ ಮಾಡಿದ್ದರು. ಸ್ವಲ್ಪಮಟ್ಟಿಗೆ ಆಶ್ಚರ್ಯಕರವಾಗಿ, ಹೆಚ್ಚು ಸೂಕ್ಷ್ಮ ವಿಷಯಗಳ ಮೇಲೆ ಪೋಸ್ಟ್ಗಳು ಮಧ್ಯಮ ಮತ್ತು ಕಡಿಮೆ ಸಂವೇದನಾ ವಿಷಯಗಳ ಮೇಲೆ ಪೋಸ್ಟ್ಗಳಿಗಿಂತ ಸ್ವಲ್ಪ ಹೆಚ್ಚಾಗಿ ಸೆನ್ಸಾರ್ ಮಾಡಲಾಗಿದೆಯೆಂದು ಕಿಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಕಂಡುಕೊಂಡಿದ್ದಾರೆ. ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಚೀನಾದ ಸೆನ್ಸಾರ್ಗಳು ಒಂದು ಪೋಸ್ಟ್ ಅನ್ನು ಸೆನ್ಸಾರ್ ಮಾಡುವ ಸಾಧ್ಯತೆಯಿದೆ, ಅದು ಐ ವೈವೈಯನ್ನು ವರ್ಲ್ಡ್ ಕಪ್ ಅನ್ನು ಉಲ್ಲೇಖಿಸುವ ಪೋಸ್ಟ್ ಎಂದು ಉಲ್ಲೇಖಿಸುತ್ತದೆ. ಸೂಕ್ಷ್ಮ ವಿಷಯಗಳ ಮೇಲಿನ ಎಲ್ಲಾ ಪೋಸ್ಟ್ಗಳನ್ನು ಸರ್ಕಾರವು ಸೆನ್ಸಾರ್ ಮಾಡಿದೆ ಎಂಬ ಕಲ್ಪನೆಯನ್ನು ಈ ಶೋಧನೆಗಳು ಬೆಂಬಲಿಸುವುದಿಲ್ಲ.
ವಿಷಯದ ಮೂಲಕ ಸೆನ್ಸಾರ್ಶಿಪ್ ದರವನ್ನು ಈ ಸರಳ ಲೆಕ್ಕಾಚಾರದಲ್ಲಿ ತಪ್ಪುದಾರಿಗೆಳೆಯುವ ಸಾಧ್ಯತೆಯಿದೆ. ಉದಾಹರಣೆಗೆ, ಸರ್ಕಾರವು ಐ ವೆಯಿವೆಯ ಬೆಂಬಲದ ಪೋಸ್ಟ್ಗಳನ್ನು ಸೆನ್ಸಾರ್ ಮಾಡಬಹುದು, ಆದರೆ ಅವರನ್ನು ಟೀಕಿಸುವ ಪೋಸ್ಟ್ಗಳನ್ನು ಬಿಡಿ. ಪೋಸ್ಟ್ಗಳ ನಡುವೆ ಹೆಚ್ಚು ಜಾಗರೂಕತೆಯಿಂದ ಗುರುತಿಸಲು, ಪ್ರತಿ ಪೋಸ್ಟ್ನ ಭಾವನೆಗಳನ್ನು ಅಳೆಯಲು ಸಂಶೋಧಕರು ಅಗತ್ಯವಿದೆ. ದುರದೃಷ್ಟವಶಾತ್, ಹೆಚ್ಚಿನ ಕೆಲಸದ ಹೊರತಾಗಿಯೂ, ಮೊದಲೇ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ನಿಘಂಟನ್ನು ಬಳಸಿಕೊಂಡು ಸಂಪೂರ್ಣವಾಗಿ ಸ್ವಯಂಚಾಲಿತ ವಿಧಾನಗಳ ಭಾವನೆ ಪತ್ತೆಹಚ್ಚುವಿಕೆಯು ಅನೇಕ ಸಂದರ್ಭಗಳಲ್ಲಿ ಇನ್ನೂ ಉತ್ತಮವಾಗುವುದಿಲ್ಲ (ವಿಭಾಗ 2.3.9 ರಲ್ಲಿ ವಿವರಿಸಿದ ಭಾವನಾತ್ಮಕ ಟೈಮ್ಲೈನ್ ಅನ್ನು ರಚಿಸುವ ಸಮಸ್ಯೆಗಳಿಗೆ ಮತ್ತೆ ಯೋಚಿಸಿ). ಆದ್ದರಿಂದ, ಕಿಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ತಮ್ಮ 11 ಮಿಲಿಯನ್ ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮದ ಪೋಸ್ಟ್ಗಳನ್ನು ಅವರು (1) ರಾಜ್ಯವನ್ನು ನಿರ್ಣಾಯಕವಾಗಿ (2) ರಾಜ್ಯದ ಬೆಂಬಲಿಗರಾಗಿದ್ದಾರೆ, ಅಥವಾ (3) ಈವೆಂಟ್ಗಳ ಬಗ್ಗೆ ಅಪ್ರಸ್ತುತ ಅಥವಾ ವಾಸ್ತವಿಕ ವರದಿಗಳು ಎಂಬುದರ ಕುರಿತು ಲೇಬಲ್ ಮಾಡಲು ದಾರಿ ಬೇಕಾಗಿದ್ದಾರೆ. ಇದು ಬೃಹತ್ ಕೆಲಸದಂತೆ ಧ್ವನಿಸುತ್ತದೆ, ಆದರೆ ಅವುಗಳು ದತ್ತಾಂಶ ವಿಜ್ಞಾನದಲ್ಲಿ ಸಾಮಾನ್ಯವಾಗಿ ಕಂಡುಬರುವ ಶಕ್ತಿಯುತ ಟ್ರಿಕ್ ಬಳಸಿ ಪರಿಹರಿಸುತ್ತವೆ ಆದರೆ ಸಾಮಾಜಿಕ ವಿಜ್ಞಾನದಲ್ಲಿ ತುಲನಾತ್ಮಕವಾಗಿ ವಿರಳವಾಗಿದೆ: ಮೇಲ್ವಿಚಾರಣೆಯ ಕಲಿಕೆ ; ಚಿತ್ರ 2.5 ನೋಡಿ.
ಮೊದಲನೆಯದಾಗಿ, ಪ್ರಿಪ್ರೊಸೆಸಿಂಗ್ ಎಂದು ಕರೆಯಲ್ಪಡುವ ಹಂತದಲ್ಲಿ, ಸಂಶೋಧಕರು ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮದ ಪೋಸ್ಟ್ಗಳನ್ನು ಡಾಕ್ಯುಮೆಂಟ್-ಟರ್ಮಿನಲ್ ಮ್ಯಾಟ್ರಿಕ್ಸ್ ಆಗಿ ಮಾರ್ಪಡಿಸಿದರು, ಅಲ್ಲಿ ಪ್ರತಿಯೊಂದು ದಸ್ತಾವೇಜು ಮತ್ತು ಒಂದು ಕಾಲಮ್ ಅನ್ನು ಪೋಸ್ಟ್ನಲ್ಲಿ ನಿರ್ದಿಷ್ಟ ಪದ (ಉದಾ, ಪ್ರತಿಭಟನೆ ಅಥವಾ ಸಂಚಾರ) . ನಂತರ, ಸಂಶೋಧನಾ ಸಹಾಯಕರು ಒಂದು ಗುಂಪು ಪೋಸ್ಟ್ಗಳ ಮಾದರಿ ಭಾವನೆ ಕೈಯಿಂದ ಲೇಬಲ್. ನಂತರ, ಅವರು ಈ ಕೈ-ಲೇಬಲ್ ಡೇಟಾವನ್ನು ಯಂತ್ರದ ಕಲಿಕೆ ಮಾದರಿಯನ್ನು ಸೃಷ್ಟಿಸಿದರು, ಅದರ ಲಕ್ಷಣಗಳ ಆಧಾರದ ಮೇಲೆ ಪೋಸ್ಟ್ನ ಭಾವನೆಗಳನ್ನು ನಿರ್ಣಯಿಸಬಹುದು. ಅಂತಿಮವಾಗಿ, ಅವರು 11 ಮಿಲಿಯನ್ ಪೋಸ್ಟ್ಗಳ ಭಾವನೆಗಳನ್ನು ಅಂದಾಜು ಮಾಡಲು ಈ ಮಾದರಿಯನ್ನು ಬಳಸಿದರು.
ಹೀಗಾಗಿ, ಕೈಯಾರೆ 11 ಮಿಲಿಯನ್ ಪೋಸ್ಟ್ಗಳನ್ನು ಓದುವ ಮತ್ತು ಲೇಬಲ್ ಮಾಡುವ ಬದಲು, ಲಾಜಿಸ್ಟ್ಲಿ ಅಸಾಧ್ಯ-ಕಿಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಸಣ್ಣ ಸಂಖ್ಯೆಯ ಪೋಸ್ಟ್ಗಳನ್ನು ಹಸ್ತಚಾಲಿತವಾಗಿ ಲೇಬಲ್ ಮಾಡಿದರು ಮತ್ತು ನಂತರ ಎಲ್ಲಾ ಪೋಸ್ಟ್ಗಳ ಭಾವನೆಗಳನ್ನು ಅಂದಾಜು ಮಾಡಲು ಮೇಲ್ವಿಚಾರಣೆ ಕಲಿಕೆ ಬಳಸುತ್ತಾರೆ. ಈ ವಿಶ್ಲೇಷಣೆಯನ್ನು ಪೂರ್ಣಗೊಳಿಸಿದ ನಂತರ, ಅವರು ಸ್ವಲ್ಪ ಆಶ್ಚರ್ಯಕರವಾಗಿ ಅಳಿಸಲ್ಪಟ್ಟ ಒಂದು ಪೋಸ್ಟ್ನ ಸಂಭವನೀಯತೆಯು ರಾಜ್ಯವನ್ನು ನಿರ್ಣಾಯಕವಾಗಿತ್ತು ಅಥವಾ ರಾಜ್ಯದ ಬೆಂಬಲಿಗರೇ ಎಂಬುದರ ಬಗ್ಗೆ ಸಂಬಂಧವಿಲ್ಲ ಎಂದು ತೀರ್ಮಾನಿಸಲು ಸಾಧ್ಯವಾಯಿತು.
ಅಂತಿಮವಾಗಿ, ರಾಜ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಕೇವಲ ಮೂರು ವಿಧದ ಪೋಸ್ಟ್ಗಳನ್ನು ನಿಯಮಿತವಾಗಿ ಸೆನ್ಸಾರ್ ಮಾಡಲಾಗಿದೆಯೆಂದು ಕಂಡುಹಿಡಿದಿದ್ದಾರೆ: ಅಶ್ಲೀಲತೆ, ಸೆನ್ಸಾರ್ಗಳ ಟೀಕೆ ಮತ್ತು ಸಾಮೂಹಿಕ ಕ್ರಿಯಾಶೀಲ ವಿಭವವನ್ನು ಹೊಂದಿರುವವರು (ಅಂದರೆ, ದೊಡ್ಡ-ಪ್ರಮಾಣದ ಪ್ರತಿಭಟನೆಗೆ ಕಾರಣವಾಗುವ ಸಾಧ್ಯತೆ). ಅಳಿಸಲ್ಪಟ್ಟ ಪೋಸ್ಟ್ಗಳು ಮತ್ತು ಅಳಿಸದೆ ಇರುವ ಪೋಸ್ಟ್ಗಳನ್ನು ಗಮನಿಸುವುದರ ಮೂಲಕ, ಕಿಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಸೆನ್ಸಾರ್ಗಳು ನೋಡುವ ಮೂಲಕ ಮತ್ತು ಎಣಿಕೆ ಮಾಡುವ ಮೂಲಕ ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತಾರೆ ಎಂಬುದನ್ನು ತಿಳಿದುಕೊಳ್ಳಲು ಸಾಧ್ಯವಾಯಿತು. ಇದಲ್ಲದೆ, ಈ ಪುಸ್ತಕದುದ್ದಕ್ಕೂ ನಡೆಯುವ ಒಂದು ಥೀಮ್ನ ಪೂರ್ವಭಾವಿಯಾಗಿ, ಅವರು ಕೆಲವು ಫಲಿತಾಂಶಗಳನ್ನು ಕೈಯಿಂದಲೇ ಲೇಬಲ್ ಮಾಡಿದರು ಮತ್ತು ಉಳಿದವುಗಳನ್ನು ಲೇಬಲ್ ಮಾಡಲು ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸುತ್ತಿದ್ದಾರೆ ಎಂಬ ಮೇಲ್ವಿಚಾರಣಾ ಕಲಿಕೆಯ ವಿಧಾನವು ಡಿಜಿಟಲ್ ಯುಗದಲ್ಲಿ ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಯಲ್ಲಿ ಸಾಮಾನ್ಯವಾಗಿದೆ. . 3 ನೇ ಅಧ್ಯಾಯಗಳಲ್ಲಿ 3 (ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳುವುದು) ಮತ್ತು 5 (ಸಮೂಹ ಸಹಕಾರವನ್ನು ರಚಿಸುವುದು) ನಲ್ಲಿ ಚಿತ್ರ 2.5 ಕ್ಕೆ ಹೋಲುವ ಚಿತ್ರಗಳನ್ನು ನೀವು ನೋಡುತ್ತೀರಿ; ಇದು ಬಹು ಅಧ್ಯಾಯಗಳಲ್ಲಿ ಕಂಡುಬರುವ ಕೆಲವು ವಿಚಾರಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ.
ಈ ಉದಾಹರಣೆಗಳು-ನ್ಯೂಯಾರ್ಕ್ನಲ್ಲಿನ ಟ್ಯಾಕ್ಸಿ ಡ್ರೈವರ್ಗಳ ವರ್ತನೆಯ ವರ್ತನೆ ಮತ್ತು ಚೀನೀ ಸರ್ಕಾರದ ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮ ಸೆನ್ಸಾರ್ಶಿಪ್ ನಡವಳಿಕೆಯಿಂದ-ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳ ಸರಳ ಎಣಿಕೆಯು ಕೆಲವು ಸಂದರ್ಭಗಳಲ್ಲಿ, ಆಸಕ್ತಿದಾಯಕ ಮತ್ತು ಪ್ರಮುಖ ಸಂಶೋಧನೆಗೆ ಕಾರಣವಾಗಬಹುದು ಎಂದು ತೋರಿಸುತ್ತದೆ. ಎರಡೂ ಸಂದರ್ಭಗಳಲ್ಲಿ, ಆದಾಗ್ಯೂ, ಸಂಶೋಧಕರು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಕ್ಕೆ ಆಸಕ್ತಿದಾಯಕ ಪ್ರಶ್ನೆಗಳನ್ನು ತರಬೇಕಾಯಿತು; ಸ್ವತಃ ಡೇಟಾ ಸಾಕಷ್ಟು ಸಾಕಾಗಲಿಲ್ಲ.