ಅನೇಕ ಜನರಿಂದ ದೊಡ್ಡ ಡೇಟಾ ಮೂಲದೊಂದಿಗೆ ಕೆಲವು ಜನರಿಂದ ಸಮೀಕ್ಷೆ ಡೇಟಾವನ್ನು ಸಂಯೋಜಿಸಲು ಭವಿಷ್ಯಸೂಚಕ ಮಾದರಿಯನ್ನು ಬಳಸಿಕೊಂಡು ಕೇಳುವಂತೆ ವರ್ಧಿಸಲಾಗಿದೆ.
ಸಮೀಕ್ಷೆ ಮತ್ತು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳನ್ನು ಸಂಯೋಜಿಸುವ ಒಂದು ವಿಭಿನ್ನ ಮಾರ್ಗವೆಂದರೆ ನಾನು ವರ್ಧಿಸುವ ಕೇಳುವ ಪ್ರಕ್ರಿಯೆ. ವಿಸ್ತಾರವಾಗಿ ಕೇಳುವಲ್ಲಿ, ಅಂದಾಜುಗಳನ್ನು ಪ್ರಮಾಣದಲ್ಲಿ ಅಥವಾ ಗ್ರಾನುಲಾರಿಟಿಯಲ್ಲಿ ಉತ್ಪತ್ತಿ ಮಾಡಲು ಒಂದು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲದೊಂದಿಗೆ ಸಣ್ಣ ಪ್ರಮಾಣದ ಸಮೀಕ್ಷೆಯ ಡೇಟಾವನ್ನು ಸಂಯೋಜಿಸಲು ಒಂದು ಸಂಶೋಧಕನು ಭವಿಷ್ಯಸೂಚಕ ಮಾದರಿಯನ್ನು ಬಳಸುತ್ತಾನೆ, ಅದು ಪ್ರತ್ಯೇಕವಾಗಿ ಡೇಟಾ ಮೂಲದೊಂದಿಗೆ ಸಾಧ್ಯವಿರುವುದಿಲ್ಲ. ವರ್ಧಿತ ಕೇಳುವಿಕೆಯ ಒಂದು ಪ್ರಮುಖ ಉದಾಹರಣೆಯೆಂದರೆ ಜೋಶುವಾ ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ ಅವರ ಕೆಲಸ, ಬಡ ದೇಶಗಳಲ್ಲಿ ಅಭಿವೃದ್ಧಿಗೆ ಮಾರ್ಗದರ್ಶನ ಮಾಡುವಂತಹ ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಲು ಬಯಸಿದವರು. ಹಿಂದೆ, ಈ ರೀತಿಯ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವ ಸಂಶೋಧಕರು ಸಾಮಾನ್ಯವಾಗಿ ಎರಡು ವಿಧಾನಗಳಲ್ಲಿ ಒಂದನ್ನು ತೆಗೆದುಕೊಳ್ಳಬೇಕಾಯಿತು: ಮಾದರಿ ಸಮೀಕ್ಷೆಗಳು ಅಥವಾ ಜನಗಣತಿಗಳು. ಮಾದರಿ ಸಮೀಕ್ಷೆಗಳು, ಅಲ್ಲಿ ಸಂಶೋಧಕರು ಸಣ್ಣ ಸಂಖ್ಯೆಯ ಜನರನ್ನು ಸಂದರ್ಶಿಸುತ್ತಿದ್ದಾರೆ, ಹೊಂದಿಕೊಳ್ಳುವ, ಸಕಾಲಿಕ, ಮತ್ತು ತುಲನಾತ್ಮಕವಾಗಿ ಅಗ್ಗದವಾಗಬಹುದು. ಆದಾಗ್ಯೂ, ಈ ಸಮೀಕ್ಷೆಗಳು, ಅವು ಮಾದರಿಯನ್ನು ಆಧರಿಸಿರುವುದರಿಂದ, ಅವುಗಳ ನಿರ್ಣಯದಲ್ಲಿ ಸಾಮಾನ್ಯವಾಗಿ ಸೀಮಿತವಾಗಿವೆ. ಮಾದರಿಯ ಸಮೀಕ್ಷೆಯೊಂದಿಗೆ, ನಿರ್ದಿಷ್ಟ ಭೌಗೋಳಿಕ ಪ್ರದೇಶಗಳ ಬಗ್ಗೆ ಅಥವಾ ನಿರ್ದಿಷ್ಟ ಜನಸಂಖ್ಯಾ ಗುಂಪುಗಳ ಬಗ್ಗೆ ಅಂದಾಜು ಮಾಡಲು ಕಷ್ಟವಾಗುತ್ತದೆ. ಮತ್ತೊಂದೆಡೆ, ಜನಗಣತಿ ಪ್ರತಿಯೊಬ್ಬರಿಗೂ ಸಂದರ್ಶಿಸಲು ಪ್ರಯತ್ನಿಸುತ್ತದೆ, ಆದ್ದರಿಂದ ಅವುಗಳನ್ನು ಸಣ್ಣ ಭೌಗೋಳಿಕ ಪ್ರದೇಶಗಳು ಅಥವಾ ಜನಸಂಖ್ಯಾ ಗುಂಪುಗಳಿಗೆ ಅಂದಾಜುಗಳನ್ನು ತಯಾರಿಸಲು ಬಳಸಬಹುದು. ಆದರೆ ಜನಗಣತಿಗಳು ಸಾಮಾನ್ಯವಾಗಿ ದುಬಾರಿ, ಕಿರಿದಾದ ಗಮನದಲ್ಲಿದೆ (ಅವುಗಳು ಕೇವಲ ಒಂದು ಸಣ್ಣ ಸಂಖ್ಯೆಯ ಪ್ರಶ್ನೆಗಳನ್ನು ಮಾತ್ರ ಒಳಗೊಂಡಿರುತ್ತವೆ) ಮತ್ತು ಸಕಾಲಿಕವಾಗಿಲ್ಲ (ಪ್ರತಿ 10 ವರ್ಷಗಳಿಗೊಮ್ಮೆ ಅವು ನಿಗದಿತ ವೇಳಾಪಟ್ಟಿಗಳಲ್ಲಿ ಸಂಭವಿಸುತ್ತವೆ) (Kish 1979) . ಮಾದರಿ ಸಮೀಕ್ಷೆಗಳು ಅಥವಾ ಜನಗಣತಿಗಳೊಂದಿಗೆ ಅಂಟಿಕೊಂಡಿರುವುದಕ್ಕಿಂತ ಹೆಚ್ಚಾಗಿ, ಎರಡೂ ಸಂಶೋಧಕರ ಅತ್ಯುತ್ತಮ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಸಂಯೋಜಿಸಬಹುದೆಂದು ಊಹಿಸಿ. ಸಂಶೋಧಕರು ಪ್ರತಿದಿನ ಪ್ರತಿ ವ್ಯಕ್ತಿಗೆ ಪ್ರತಿ ಪ್ರಶ್ನೆ ಕೇಳಿದರೆ ಊಹಿಸಿಕೊಳ್ಳಿ. ನಿಸ್ಸಂಶಯವಾಗಿ, ಈ ಸರ್ವತ್ರ, ಯಾವಾಗಲೂ ಆನ್ ಸಮೀಕ್ಷೆಯು ಒಂದು ಸಾಮಾಜಿಕ ವಿಜ್ಞಾನದ ಫ್ಯಾಂಟಸಿಯಾಗಿದೆ. ಆದರೆ ಅನೇಕ ಜನರಿಂದ ಡಿಜಿಟಲ್ ಕುರುಹುಗಳನ್ನು ಹೊಂದಿರುವ ಸಣ್ಣ ಸಂಖ್ಯೆಯ ಜನರಿಂದ ಸಮೀಕ್ಷೆಯ ಪ್ರಶ್ನೆಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸುವ ಮೂಲಕ ನಾವು ಅಂದಾಜು ಮಾಡಲು ಆರಂಭಿಸಬಹುದು ಎಂದು ಕಾಣುತ್ತದೆ.
ರುವಾಂಡಾದ ಅತಿದೊಡ್ಡ ಮೊಬೈಲ್ ಫೋನ್ ಪೂರೈಕೆದಾರರೊಂದಿಗೆ ಪಾಲುದಾರಿಕೆಯಲ್ಲಿ ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ನ ಸಂಶೋಧನೆಯು ಪ್ರಾರಂಭವಾಯಿತು, ಮತ್ತು ಕಂಪನಿಯು 2005 ಮತ್ತು 2009 ರ ನಡುವೆ ಸುಮಾರು 1.5 ದಶಲಕ್ಷ ಗ್ರಾಹಕರ ಅನಾಮಧೇಯ ವ್ಯವಹಾರ ದಾಖಲೆಗಳನ್ನು ಒದಗಿಸಿತು. ಈ ದಾಖಲೆಗಳು ಪ್ರತಿ ಕರೆ ಮತ್ತು ಪಠ್ಯ ಸಂದೇಶಗಳಾದ ಪ್ರಾರಂಭ ಸಮಯ, ಕಾಲಾವಧಿ , ಮತ್ತು ಕಾಲರ್ ಮತ್ತು ರಿಸೀವರ್ನ ಅಂದಾಜು ಭೌಗೋಳಿಕ ಸ್ಥಳ. ನಾನು ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ವಿಷಯಗಳ ಬಗ್ಗೆ ಮಾತನಾಡುವ ಮೊದಲು, ಈ ಮೊದಲ ಹಂತವು ಅನೇಕ ಸಂಶೋಧಕರಿಗೆ ಕಠಿಣವಾದದ್ದು ಎಂದು ತೋರಿಸುತ್ತದೆ. ನಾನು ಅಧ್ಯಾಯ 2 ರಲ್ಲಿ ವಿವರಿಸಿದಂತೆ, ಸಂಶೋಧಕರಿಗೆ ಹೆಚ್ಚಿನ ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳು ಪ್ರವೇಶಿಸುವುದಿಲ್ಲ . ನಿರ್ದಿಷ್ಟವಾಗಿ ಟೆಲಿಫೋನ್ ಮೆಟಾ-ಡೇಟಾವು ನಿರ್ದಿಷ್ಟವಾಗಿ ಪ್ರವೇಶಿಸಲಾಗುವುದಿಲ್ಲ ಏಕೆಂದರೆ ಇದು ಅನಾಮಧೇಯಗೊಳಿಸುವಿಕೆಯು ಅಸಾಧ್ಯವಾಗಿದೆ ಮತ್ತು ಭಾಗವಹಿಸುವವರು ಸೂಕ್ಷ್ಮವಾದ (Mayer, Mutchler, and Mitchell 2016; Landau 2016) ಎಂದು ಪರಿಗಣಿಸುವ ಮಾಹಿತಿಯನ್ನು ಇದು ಬಹುತೇಕವಾಗಿ ಒಳಗೊಂಡಿದೆ. ಈ ನಿರ್ದಿಷ್ಟ ಪ್ರಕರಣದಲ್ಲಿ, ಸಂಶೋಧಕರು ಡೇಟಾವನ್ನು ರಕ್ಷಿಸಲು ಜಾಗರೂಕರಾಗಿದ್ದರು ಮತ್ತು ಅವರ ಕೆಲಸವನ್ನು ಮೂರನೇ ವ್ಯಕ್ತಿಯಿಂದ ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡಲಾಯಿತು (ಅಂದರೆ, ಅವರ IRB). ಅಧ್ಯಾಯ 6 ರಲ್ಲಿ ನಾನು ಈ ನೈತಿಕ ಸಮಸ್ಯೆಗಳಿಗೆ ಹೆಚ್ಚು ವಿವರವಾಗಿ ಹಿಂತಿರುಗುತ್ತೇನೆ.
ಸಂಪತ್ತಿನ ಮತ್ತು ಯೋಗಕ್ಷೇಮವನ್ನು ಅಳೆಯುವಲ್ಲಿ ಬ್ಲುಮೆನ್ ಸ್ಟಾಕ್ ಆಸಕ್ತಿ ಹೊಂದಿದ್ದರು. ಆದರೆ ಈ ಲಕ್ಷಣಗಳು ನೇರವಾಗಿ ಕರೆ ದಾಖಲೆಗಳಲ್ಲಿರುವುದಿಲ್ಲ. ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಈ ಸಂಶೋಧನೆಗಾಗಿ ಈ ಕರೆ ದಾಖಲೆಗಳು ಅಪೂರ್ಣವಾಗಿವೆ -ದೊಡ್ಡ ಅಧ್ಯಾಯಗಳ ಸಾಮಾನ್ಯ ಲಕ್ಷಣವೆಂದರೆ ಅಧ್ಯಾಯ 2 ರಲ್ಲಿ ವಿವರವಾಗಿ ಚರ್ಚಿಸಲಾಗಿದೆ. ಆದರೆ, ಕರೆ ದಾಖಲೆಗಳು ಬಹುಶಃ ಸಂಪತ್ತಿನ ಬಗ್ಗೆ ಮಾಹಿತಿಯನ್ನು ಒದಗಿಸುವಂತಹ ಕೆಲವು ಮಾಹಿತಿಯನ್ನು ಹೊಂದಿರಬಹುದು ಎಂದು ತೋರುತ್ತದೆ. ಯೋಗಕ್ಷೇಮ. ಈ ಸಾಧ್ಯತೆಯಿಂದಾಗಿ, ಬ್ಲುಮೆನ್ ಸ್ಟ್ಯಾಕ್ ಅವರ ಕರೆ ರೆಕಾರ್ಡ್ಗಳ ಆಧಾರದ ಮೇಲೆ ಸಮೀಕ್ಷೆಗೆ ಯಾರಾದರೊಬ್ಬರು ಪ್ರತಿಕ್ರಿಯಿಸುವರು ಎಂಬುದನ್ನು ಊಹಿಸಲು ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು ಸಾಧ್ಯವೇ ಎಂದು ಕೇಳಿದರು. ಇದು ಸಾಧ್ಯವಾದರೆ, ಎಲ್ಲಾ 1.5 ದಶಲಕ್ಷ ಗ್ರಾಹಕರ ಸಮೀಕ್ಷೆಯ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಊಹಿಸಲು ಬ್ಲುಮೆನ್ ಸ್ಟಾಕ್ ಈ ಮಾದರಿಯನ್ನು ಬಳಸಬಹುದಾಗಿತ್ತು.
ಅಂತಹ ಒಂದು ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸಲು ಮತ್ತು ತರಬೇತಿ ನೀಡುವ ಸಲುವಾಗಿ, ಕಿಗಾಲಿ ಇನ್ಸ್ಟಿಟ್ಯೂಟ್ ಆಫ್ ಸೈನ್ಸ್ ಅಂಡ್ ಟೆಕ್ನಾಲಜಿಯಿಂದ ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ ಮತ್ತು ಸಂಶೋಧನಾ ಸಹಾಯಕರು ಸುಮಾರು ಸಾವಿರ ಗ್ರಾಹಕರ ಯಾದೃಚ್ಛಿಕ ಮಾದರಿ ಎಂದು ಕರೆದರು. ಯೋಜನೆಯ ಗುರಿಗಳು ಪಾಲ್ಗೊಳ್ಳುವವರಿಗೆ ವಿವರಿಸಿದರು, ಕರೆ ದಾಖಲೆಗಳಿಗೆ ಸಮೀಕ್ಷೆಯ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಲಿಂಕ್ ಮಾಡಲು ಅವರ ಒಪ್ಪಿಗೆಯನ್ನು ಕೇಳಿದರು, ಮತ್ತು ನಂತರ ಅವರ ಸಂಪತ್ತನ್ನು ಮತ್ತು ಯೋಗಕ್ಷೇಮವನ್ನು ಅಳೆಯಲು ಅವರಿಗೆ ಹಲವಾರು ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಿದರು, ರೇಡಿಯೋ? "ಮತ್ತು" ನೀವು ಬೈಸಿಕಲ್ ಹೊಂದಿದ್ದೀರಾ? "(ಭಾಗಶಃ ಪಟ್ಟಿಗಾಗಿ ಚಿತ್ರ 3.14 ಅನ್ನು ನೋಡಿ). ಸಮೀಕ್ಷೆಯ ಎಲ್ಲ ಭಾಗವಹಿಸುವವರು ಆರ್ಥಿಕವಾಗಿ ಪರಿಹಾರ ನೀಡಿದರು.
ಮುಂದೆ, ಯಂತ್ರ ಕಲಿಕೆಯಲ್ಲಿ ಬ್ಲುಮೆನ್ ಸ್ಟ್ಯಾಕ್ ಎರಡು-ಹಂತದ ವಿಧಾನವನ್ನು ಬಳಸಿದ: ವೈಶಿಷ್ಟ್ಯದ ಎಂಜಿನಿಯರಿಂಗ್ ನಂತರ ಮೇಲ್ವಿಚಾರಣಾ ಕಲಿಕೆ. ಮೊದಲನೆಯದಾಗಿ, ಎಂಜಿನಿಯರಿಂಗ್ ಹಂತದಲ್ಲಿ, ಸಂದರ್ಶಿಸಲ್ಪಟ್ಟ ಪ್ರತಿಯೊಬ್ಬರಿಗೂ, ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ ಕರೆ ದಾಖಲೆಗಳನ್ನು ಪ್ರತಿ ವ್ಯಕ್ತಿಯ ಗುಣಲಕ್ಷಣಗಳನ್ನಾಗಿ ಪರಿವರ್ತಿಸಿದರು; ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಈ ಗುಣಲಕ್ಷಣಗಳನ್ನು "ಲಕ್ಷಣಗಳು" ಎಂದು ಕರೆದುಕೊಳ್ಳಬಹುದು ಮತ್ತು ಸಾಮಾಜಿಕ ವಿಜ್ಞಾನಿಗಳು ಅವುಗಳನ್ನು "ಅಸ್ಥಿರ" ಎಂದು ಕರೆಯುತ್ತಾರೆ. ಉದಾಹರಣೆಗೆ, ಪ್ರತಿ ವ್ಯಕ್ತಿಗೆ, ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ ಚಟುವಟಿಕೆಗಳ ಒಟ್ಟು ಸಂಖ್ಯೆಯನ್ನು ಲೆಕ್ಕ ಹಾಕಲಾಗುತ್ತದೆ, ಒಬ್ಬ ವ್ಯಕ್ತಿಯು ಸಂಪರ್ಕ ಹೊಂದಿದ ವಿಭಿನ್ನ ಜನರ ಸಂಖ್ಯೆ ಪ್ರಸಾರ ಸಮಯಕ್ಕೆ ಖರ್ಚು ಮಾಡಿದ ಹಣ, ಮತ್ತು ಹೀಗೆ. ವಿಮರ್ಶಾತ್ಮಕವಾಗಿ, ಒಳ್ಳೆಯ ವೈಶಿಷ್ಟ್ಯದ ಎಂಜಿನಿಯರಿಂಗ್ ಸಂಶೋಧನೆಯ ಸೆಟ್ಟಿಂಗ್ಗಳ ಜ್ಞಾನದ ಅಗತ್ಯವಿರುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ದೇಶೀಯ ಮತ್ತು ಅಂತರಾಷ್ಟ್ರೀಯ ಕರೆಗಳ ನಡುವೆ ವ್ಯತ್ಯಾಸವನ್ನು ಮುಖ್ಯವಾದುದಾದರೆ (ಅಂತರರಾಷ್ಟ್ರೀಯವಾಗಿ ಶ್ರೀಮಂತರಾಗಿ ಕರೆಸಿಕೊಳ್ಳುವ ಜನರನ್ನು ನಾವು ನಿರೀಕ್ಷಿಸಬಹುದು), ನಂತರ ಅದನ್ನು ಎಂಜಿನಿಯರಿಂಗ್ ಹಂತದ ವೈಶಿಷ್ಟ್ಯವಾಗಿ ಮಾಡಬೇಕು. ರುವಾಂಡಾ ಬಗ್ಗೆ ಸ್ವಲ್ಪ ತಿಳಿವಳಿಕೆಯಿರುವ ಸಂಶೋಧಕರು ಈ ವೈಶಿಷ್ಟ್ಯವನ್ನು ಒಳಗೊಂಡಿರುವುದಿಲ್ಲ ಮತ್ತು ನಂತರ ಮಾದರಿಯ ಊಹಿಸುವ ಕಾರ್ಯಕ್ಷಮತೆಗಳು ಹಾನಿಯಾಗುತ್ತದೆ.
ಮುಂದೆ, ಮೇಲ್ವಿಚಾರಣೆಯ ಕಲಿಕೆಯ ಹಂತದಲ್ಲಿ, ಬ್ಲುಮೆನ್ ಸ್ಟ್ಯಾಕ್ ತಮ್ಮ ವೈಶಿಷ್ಟ್ಯಗಳ ಆಧಾರದ ಮೇಲೆ ಪ್ರತಿ ವ್ಯಕ್ತಿಗೆ ಸಮೀಕ್ಷೆಯ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಊಹಿಸಲು ಒಂದು ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸಿದರು. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ ಲಾಜಿಸ್ಟಿಕ್ ರಿಗ್ರೆಷನ್ ಅನ್ನು ಬಳಸಿದನು, ಆದರೆ ಅವನು ಬೇರೆ ಬೇರೆ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಅಥವಾ ಯಂತ್ರ ಕಲಿಕೆಯ ವಿಧಾನಗಳನ್ನು ಬಳಸಬಹುದಿತ್ತು.
ಹಾಗಾಗಿ ಅದು ಎಷ್ಟು ಚೆನ್ನಾಗಿ ಕೆಲಸ ಮಾಡಿದೆ? ಕಾಲ್ ರೆಕಾರ್ಡ್ಸ್ನಿಂದ ಪಡೆದ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಬಳಸಿಕೊಂಡು "ನೀವು ರೇಡಿಯೊವನ್ನು ಹೊಂದಿದ್ದೀರಾ?" ಮತ್ತು "ನೀವು ಬೈಸಿಕಲ್ ಅನ್ನು ಹೊಂದಿದ್ದೀರಾ?" ಎಂಬಂತಹ ಸಮೀಕ್ಷೆಯ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಗಳನ್ನು ಊಹಿಸಲು ಬ್ಲುಮೆನ್ ಸ್ಟ್ಯಾಕ್ಗೆ ಸಾಧ್ಯವಿದೆಯೇ? ತನ್ನ ಭವಿಷ್ಯಸೂಚಕ ಮಾದರಿಯ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುವ ಸಲುವಾಗಿ, ಬ್ಲುಮೆನ್ ಸ್ಟ್ಯಾಕ್ ಅಡ್ಡ-ಕ್ರಮಬದ್ಧಗೊಳಿಸುವಿಕೆಯನ್ನು ಬಳಸಿದನು, ಇದು ಸಾಮಾನ್ಯವಾಗಿ ಡಾಟಾ ಸೈನ್ಸ್ನಲ್ಲಿ ಬಳಸಲ್ಪಟ್ಟ ತಂತ್ರವಾಗಿದ್ದು, ಸಾಮಾಜಿಕ ವಿಜ್ಞಾನದಲ್ಲಿ ವಿರಳವಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ. ಮಾದರಿಯ ಮುನ್ಸೂಚನೆಯ ಕಾರ್ಯಕ್ಷಮತೆಯ ನ್ಯಾಯೋಚಿತ ಮೌಲ್ಯಮಾಪನವನ್ನು ತರಬೇತಿ ಮತ್ತು ಅದನ್ನು ವಿವಿಧ ಉಪವಿಭಾಗಗಳ ಮೇಲೆ ಪರೀಕ್ಷಿಸುವ ಮೂಲಕ ಒದಗಿಸುವುದು ಅಡ್ಡ-ಕ್ರಮಬದ್ಧಗೊಳಿಸುವಿಕೆಯ ಗುರಿಯಾಗಿದೆ. ನಿರ್ದಿಷ್ಟವಾಗಿ ಹೇಳುವುದಾದರೆ, ಬ್ಲುಮೆನ್ ಸ್ಟ್ಯಾಕ್ ತನ್ನ ಡೇಟಾವನ್ನು 100 ಜನರ ಪ್ರತಿ 10 ಭಾಗಗಳಾಗಿ ವಿಭಜಿಸುತ್ತಾನೆ. ನಂತರ, ಅವರು ತಮ್ಮ ಮಾದರಿಯನ್ನು ತರಬೇತು ಮಾಡಲು ಒಂಬತ್ತು ತುಂಡುಗಳನ್ನು ಬಳಸಿದರು, ಮತ್ತು ತರಬೇತಿ ಪಡೆದ ಮಾದರಿಯ ಭವಿಷ್ಯಸೂಚಕ ಪ್ರದರ್ಶನವನ್ನು ಉಳಿದ ಚಂಕ್ನಲ್ಲಿ ಮೌಲ್ಯಮಾಪನ ಮಾಡಲಾಯಿತು. ಅವರು ಈ ಪ್ರಕ್ರಿಯೆಯನ್ನು 10 ಬಾರಿ ಪುನರಾವರ್ತಿತ ಮಾಡಿದರು - ಪ್ರತಿ ಚಂಕ್ ಮಾಹಿತಿಯು ಮೌಲ್ಯಮಾಪನ ಡೇಟಾವಾಗಿ ಒಂದು ತಿರುವು ಪಡೆದುಕೊಂಡಿತು ಮತ್ತು ಫಲಿತಾಂಶಗಳನ್ನು ಸರಾಸರಿ ಮಾಡಿತು.
ಕೆಲವು ಗುಣಲಕ್ಷಣಗಳಿಗೆ ಭವಿಷ್ಯವಾಣಿಗಳ ನಿಖರತೆ ಹೆಚ್ಚಿದೆ (ಚಿತ್ರ 3.14); ಉದಾಹರಣೆಗೆ, ಯಾರಾದರೂ ಒಂದು ರೇಡಿಯೊವನ್ನು ಹೊಂದಿದ್ದಲ್ಲಿ ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ 97.6% ನಿಖರತೆಗಳೊಂದಿಗೆ ಊಹಿಸಬಹುದು. ಇದು ಪ್ರಭಾವಶಾಲಿಯಾಗಿರಬಹುದು, ಆದರೆ ಒಂದು ಸರಳ ಪರ್ಯಾಯ ವಿರುದ್ಧ ಸಂಕೀರ್ಣ ಭವಿಷ್ಯ ವಿಧಾನವನ್ನು ಹೋಲಿಸುವುದು ಯಾವಾಗಲೂ ಮುಖ್ಯವಾಗಿದೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಪ್ರತಿಯೊಬ್ಬರೂ ಸಾಮಾನ್ಯ ಉತ್ತರವನ್ನು ನೀಡುವರು ಎಂಬುದನ್ನು ಊಹಿಸಲು ಒಂದು ಸರಳ ಪರ್ಯಾಯವಾಗಿದೆ. ಉದಾಹರಣೆಗೆ, ಪ್ರತಿಕ್ರಿಯಿಸಿದವರಲ್ಲಿ 97.3% ನಷ್ಟು ಜನರು ರೇಡಿಯೋವನ್ನು ಹೊಂದುತ್ತಾರೆಂದು ವರದಿ ಮಾಡಿದ್ದಾರೆ ಹಾಗಾಗಿ ಪ್ರತಿಯೊಬ್ಬರೂ ರೇಡಿಯೋವನ್ನು ಹೊಂದುವುದಾಗಿ ವರದಿ ಮಾಡುತ್ತಾರೆಂದು ಅವರು 97.3% ನಷ್ಟು ನಿಖರತೆಯನ್ನು ಹೊಂದಿದ್ದಾರೆ ಎಂದು ಭವಿಷ್ಯ ನುಡಿದಿದ್ದರೆ, ಅವರ ಸಂಕೀರ್ಣ ಕಾರ್ಯವಿಧಾನದ (97.6% ನಿಖರತೆ) . ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಎಲ್ಲಾ ಅಲಂಕಾರಿಕ ದತ್ತಾಂಶ ಮತ್ತು ಮಾದರಿಗಳು ಮುನ್ಸೂಚನೆಯ ನಿಖರತೆಗೆ 97.3% ರಿಂದ 97.6% ರಷ್ಟಿದೆ. ಆದಾಗ್ಯೂ, "ನೀವು ಬೈಸಿಕಲ್ ಅನ್ನು ಹೊಂದಿದ್ದೀರಾ?" ಎಂಬ ಇತರ ಪ್ರಶ್ನೆಗಳಿಗೆ, ಭವಿಷ್ಯವಾಣಿಗಳು 54.4% ರಿಂದ 67.6% ಗೆ ಸುಧಾರಣೆಯಾಗಿವೆ. ಹೆಚ್ಚು ಸಾಮಾನ್ಯವಾಗಿ, ಚಿತ್ರ 3.15 ಕೆಲವು ಲಕ್ಷಣಗಳಿಗೆ ಬ್ಲುಮೆನ್ ಸ್ಟಾಕ್ ಸರಳ ಬೇಸ್ಲೈನ್ ಭವಿಷ್ಯವನ್ನು ಹೆಚ್ಚಿಸುವುದಕ್ಕಿಂತ ಹೆಚ್ಚು ಸುಧಾರಿಸಲಿಲ್ಲ, ಆದರೆ ಇತರ ಗುಣಲಕ್ಷಣಗಳಿಗೆ ಸ್ವಲ್ಪ ಸುಧಾರಣೆ ಕಂಡುಬಂದಿದೆ ಎಂದು ತೋರಿಸುತ್ತದೆ. ಈ ಫಲಿತಾಂಶಗಳಲ್ಲಿ ಕೇವಲ ನೋಡುತ್ತಿರುವುದು, ಆದರೆ, ಈ ವಿಧಾನವು ವಿಶೇಷವಾಗಿ ಭರವಸೆಯಿದೆ ಎಂದು ನೀವು ಭಾವಿಸಬಾರದು.
ಆದಾಗ್ಯೂ, ಕೇವಲ ಒಂದು ವರ್ಷದ ನಂತರ, ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ ಮತ್ತು ಇಬ್ಬರು ಸಹೋದ್ಯೋಗಿಗಳು-ಗೇಬ್ರಿಯಲ್ ಕ್ಯಾಡಮುರೊ ಮತ್ತು ರಾಬರ್ಟ್ ಸೈನ್ಸ್ನಲ್ಲಿ ಪ್ರಕಟವಾದ ಉತ್ತಮ ಫಲಿತಾಂಶಗಳೊಂದಿಗೆ (Blumenstock, Cadamuro, and On 2015) . ಈ ಸುಧಾರಣೆಗೆ ಎರಡು ಪ್ರಮುಖ ತಾಂತ್ರಿಕ ಕಾರಣಗಳಿವೆ: (1) ಅವರು ಹೆಚ್ಚು ಸಂಕೀರ್ಣವಾದ ವಿಧಾನಗಳನ್ನು ಬಳಸಿದ್ದಾರೆ (ಅಂದರೆ, ಎಂಜಿನಿಯರಿಂಗ್ ವೈಶಿಷ್ಟ್ಯತೆಗೆ ಹೊಸ ವಿಧಾನ ಮತ್ತು ವೈಶಿಷ್ಟ್ಯಗಳಿಂದ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಊಹಿಸಲು ಹೆಚ್ಚು ಅತ್ಯಾಧುನಿಕ ಮಾದರಿ) ಮತ್ತು (2) ವೈಯಕ್ತಿಕ ಪ್ರತಿಕ್ರಿಯೆಗೆ ನಿರ್ಣಯಿಸಲು ಪ್ರಯತ್ನಿಸುವ ಬದಲು ಸಮೀಕ್ಷೆ ಪ್ರಶ್ನೆಗಳು (ಉದಾ, "ನೀವು ಒಂದು ರೇಡಿಯೊವನ್ನು ಹೊಂದಿದ್ದೀರಾ?"), ಅವರು ಸಂಯುಕ್ತ ಸಂಪತ್ತಿನ ಸೂಚಿಯನ್ನು ನಿರ್ಣಯಿಸಲು ಪ್ರಯತ್ನಿಸಿದರು. ಈ ತಾಂತ್ರಿಕ ಸುಧಾರಣೆಗಳು ತಮ್ಮ ಮಾದರಿಯಲ್ಲಿ ಜನರಿಗೆ ಸಂಪತ್ತನ್ನು ಊಹಿಸಲು ಕರೆ ದಾಖಲೆಗಳನ್ನು ಬಳಸುವ ಒಂದು ಸಮಂಜಸವಾದ ಕೆಲಸವನ್ನು ಮಾಡಬಲ್ಲವು.
ಮಾದರಿಯಲ್ಲಿ ಜನರ ಸಂಪತ್ತನ್ನು ಊಹಿಸಿ, ಸಂಶೋಧನೆಯ ಅಂತಿಮ ಗುರಿಯಲ್ಲ. ಅಭಿವೃದ್ಧಿಶೀಲ ದೇಶಗಳಲ್ಲಿನ ಬಡತನದ ನಿಖರವಾದ, ಉನ್ನತ-ನಿರ್ಣಯದ ಅಂದಾಜುಗಳನ್ನು ತಯಾರಿಸಲು ಮಾದರಿ ಸಮೀಕ್ಷೆಗಳು ಮತ್ತು ಜನಗಣತಿಗಳ ಕೆಲವು ಉತ್ತಮ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಸಂಯೋಜಿಸುವುದು ಅಂತಿಮ ಗುರಿ ಎಂದು ನೆನಪಿಡಿ. ಈ ಗುರಿಯನ್ನು ಸಾಧಿಸುವ ಅವರ ಸಾಮರ್ಥ್ಯವನ್ನು ನಿರ್ಣಯಿಸಲು, ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ತಮ್ಮ 1.5 ಮಿಲಿಯನ್ ಜನರನ್ನು ಕರೆ ರೆಕಾರ್ಡ್ಗಳ ಸಂಪತ್ತನ್ನು ಊಹಿಸಲು ಅವರ ಮಾದರಿ ಮತ್ತು ಅವರ ಡೇಟಾವನ್ನು ಬಳಸಿದರು. ಮತ್ತು ಅವರು ಪ್ರತಿ ವ್ಯಕ್ತಿಯ ನಿವಾಸ ಸ್ಥಳದ ಅಂದಾಜು ಸ್ಥಳವನ್ನು ಅಂದಾಜು ಮಾಡಲು ಕರೆ ದಾಖಲೆಗಳಲ್ಲಿ ಹುದುಗಿರುವ ಜಿಯೋಸ್ಪೇಷಿಯಲ್ ಮಾಹಿತಿಯನ್ನು (ಡೇಟಾವನ್ನು ಪ್ರತಿ ಕರೆಗೆ ಹತ್ತಿರದ ಕೋಶದ ಗೋಪುರಗಳ ಸ್ಥಳವನ್ನು ಒಳಗೊಂಡಿದೆ ಎಂದು ನೆನಪಿಸಿಕೊಳ್ಳುತ್ತಾರೆ) (ಚಿತ್ರ 3.17). ಈ ಎರಡು ಅಂದಾಜುಗಳನ್ನು ಒಟ್ಟಿಗೆ ಸೇರಿಸುವುದರ ಮೂಲಕ, ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಚಂದಾದಾರರ ಸಂಪತ್ತಿನ ಭೌಗೋಳಿಕ ಹಂಚಿಕೆಯನ್ನು ಅತೀ ಸೂಕ್ಷ್ಮ ಪ್ರಾದೇಶಿಕ ಕಣಜತೆಗಳಲ್ಲಿ ಅಂದಾಜಿಸಿದ್ದಾರೆ. ಉದಾಹರಣೆಗೆ, ಅವರು ರುವಾಂಡಾದ 2,148 ಜೀವಕೋಶಗಳಲ್ಲಿನ ಸರಾಸರಿ ಸಂಪತ್ತನ್ನು (ದೇಶದ ಅತ್ಯಂತ ಚಿಕ್ಕ ಆಡಳಿತಾತ್ಮಕ ಘಟಕ) ಅಂದಾಜು ಮಾಡಬಹುದು.
ಈ ಪ್ರದೇಶಗಳಲ್ಲಿ ಈ ಅಂದಾಜುಗಳು ಬಡತನದ ನಿಜವಾದ ಮಟ್ಟಕ್ಕೆ ಹೇಗೆ ಸರಿಹೊಂದಿದವು? ನಾನು ಆ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರಿಸುವ ಮೊದಲು, ಸಂದೇಹ ಉಂಟುಮಾಡಲು ಬಹಳಷ್ಟು ಕಾರಣಗಳಿವೆ ಎಂಬ ಅಂಶವನ್ನು ನಾನು ಒತ್ತಿ ಹೇಳುತ್ತೇನೆ. ಉದಾಹರಣೆಗೆ, ವೈಯಕ್ತಿಕ ಮಟ್ಟದಲ್ಲಿ ಮುನ್ನೋಟಗಳನ್ನು ಮಾಡುವ ಸಾಮರ್ಥ್ಯವು ಬಹಳ ಶಬ್ದವಾಗಿದೆ (ಚಿತ್ರ 3.17). ಮತ್ತು ಹೆಚ್ಚು ಮುಖ್ಯವಾಗಿ, ಮೊಬೈಲ್ ಫೋನ್ಗಳಿಲ್ಲದ ಜನರು ಮೊಬೈಲ್ ಫೋನ್ಗಳಿಲ್ಲದ ಜನರು ವ್ಯವಸ್ಥಿತವಾಗಿ ವಿಭಿನ್ನವಾಗಿರಬಹುದು. ಹೀಗಾಗಿ, ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ನಾನು ಮೊದಲೇ ವಿವರಿಸಿದ 1936 ಲಿಟರರಿ ಡೈಜೆಸ್ಟ್ ಸಮೀಕ್ಷೆಯ ಪಕ್ಷಪಾತದ ಕವರೇಜ್ ದೋಷಗಳಿಂದ ಬಲಿಯಾಗಬಹುದು .
ತಮ್ಮ ಅಂದಾಜಿನ ಗುಣಮಟ್ಟವನ್ನು ಪಡೆಯಲು, ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಅವರನ್ನು ಬೇರೆ ಯಾವುದೋ ಹೋಲಿಸಲು ಅಗತ್ಯವಿದೆ. ಅದೃಷ್ಟವಶಾತ್, ತಮ್ಮ ಅಧ್ಯಯನದ ಸಮಯದಲ್ಲಿಯೇ, ಸಂಶೋಧಕರ ಮತ್ತೊಂದು ಗುಂಪು ರುವಾಂಡಾದಲ್ಲಿ ಹೆಚ್ಚು ಸಾಂಪ್ರದಾಯಿಕ ಸಾಮಾಜಿಕ ಸಮೀಕ್ಷೆಯನ್ನು ನಡೆಸುತ್ತಿದ್ದರು. ವ್ಯಾಪಕವಾಗಿ ಗೌರವಾನ್ವಿತ ಜನಸಂಖ್ಯಾ ಮತ್ತು ಆರೋಗ್ಯ ಸಮೀಕ್ಷೆ ಕಾರ್ಯಕ್ರಮದ ಭಾಗವಾಗಿರುವ ಈ ಇತರ ಸಮೀಕ್ಷೆಯು ದೊಡ್ಡ ಬಜೆಟ್ ಅನ್ನು ಹೊಂದಿದ್ದು, ಉನ್ನತ ಗುಣಮಟ್ಟದ, ಸಾಂಪ್ರದಾಯಿಕ ವಿಧಾನಗಳನ್ನು ಬಳಸಿದೆ. ಆದ್ದರಿಂದ, ಜನಸಂಖ್ಯಾ ಮತ್ತು ಆರೋಗ್ಯ ಸಮೀಕ್ಷೆಯ ಅಂದಾಜುಗಳು ಗೋಲ್ಡ್ ಸ್ಟ್ಯಾಂಡರ್ಡ್ ಅಂದಾಜುಗಳನ್ನು ಸಮಂಜಸವಾಗಿ ಪರಿಗಣಿಸಬಹುದು. ಎರಡು ಅಂದಾಜುಗಳನ್ನು ಹೋಲಿಸಿದಾಗ, ಅವು ತುಂಬಾ ಹೋಲುತ್ತವೆ (ಚಿತ್ರ 3.17). ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಕರೆ ದಾಖಲೆಗಳೊಂದಿಗೆ ಸಣ್ಣ ಪ್ರಮಾಣದ ಸಮೀಕ್ಷೆಯ ಡೇಟಾವನ್ನು ಒಟ್ಟುಗೂಡಿಸಿ, ಬ್ಲುಮೆನ್ ಸ್ಟ್ಯಾಕ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಚಿನ್ನದ-ಪ್ರಮಾಣಿತ ವಿಧಾನಗಳಿಂದ ಹೋಲಿಸಬಹುದಾದ ಅಂದಾಜುಗಳನ್ನು ತಯಾರಿಸಲು ಸಾಧ್ಯವಾಯಿತು.
ಒಂದು ಸ್ಕೆಪ್ಟಿಕ್ ಈ ಫಲಿತಾಂಶಗಳನ್ನು ನಿರಾಶೆ ಎಂದು ನೋಡಬಹುದಾಗಿದೆ. ದೊಡ್ಡ ಡೇಟಾ ಮತ್ತು ಯಂತ್ರ ಕಲಿಕೆಗಳನ್ನು ಬಳಸಿಕೊಂಡು, ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಈಗಾಗಲೇ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ವಿಧಾನಗಳಿಂದ ಹೆಚ್ಚು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಮಾಡಬಹುದಾದ ಅಂದಾಜುಗಳನ್ನು ಉತ್ಪಾದಿಸಲು ಸಮರ್ಥರಾಗಿದ್ದಾರೆ ಎಂದು ಹೇಳುವುದು ಒಂದು ಮಾರ್ಗವಾಗಿದೆ. ಆದರೆ ಎರಡು ಕಾರಣಗಳಿಗಾಗಿ ಈ ಅಧ್ಯಯನದ ಕುರಿತು ಯೋಚಿಸುವುದು ಸರಿಯಾದ ಮಾರ್ಗ ಎಂದು ನಾನು ಯೋಚಿಸುವುದಿಲ್ಲ. ಮೊದಲಿಗೆ, ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳಿಂದ ಅಂದಾಜುಗಳು 10 ಪಟ್ಟು ವೇಗವಾಗಿ ಮತ್ತು 50 ಪಟ್ಟು ಅಗ್ಗವಾಗಿದ್ದವು (ವೇರಿಯಬಲ್ ಖರ್ಚಿನ ವಿಷಯದಲ್ಲಿ ವೆಚ್ಚವನ್ನು ಅಳೆಯಲಾಗುತ್ತದೆ). ಈ ಅಧ್ಯಾಯದಲ್ಲಿ ನಾನು ಮೊದಲೇ ವಾದಿಸಿದಂತೆ, ಸಂಶೋಧಕರು ತಮ್ಮ ಗಂಡಾಂತರದಲ್ಲಿ ವೆಚ್ಚವನ್ನು ನಿರ್ಲಕ್ಷಿಸುತ್ತಾರೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಉದಾಹರಣೆಗೆ, ವೆಚ್ಚದಲ್ಲಿ ನಾಟಕೀಯ ಇಳಿಕೆಯು ಪ್ರತೀ ಕೆಲವು ವರ್ಷಗಳಿಗಿಂತ ಹೆಚ್ಚು ರನ್ ಆಗುವುದಕ್ಕಿಂತ ಹೆಚ್ಚಾಗಿ-ಜನಸಂಖ್ಯಾ ಮತ್ತು ಆರೋಗ್ಯ ಸಮೀಕ್ಷೆಗಳಿಗೆ ಮಾನದಂಡವಾಗಿದೆ-ಈ ರೀತಿಯ ಸಮೀಕ್ಷೆಯು ಪ್ರತಿ ತಿಂಗಳು ನಡೆಸಲ್ಪಡಬಹುದು, ಇದು ಸಂಶೋಧಕರು ಮತ್ತು ನೀತಿಗೆ ಹಲವಾರು ಪ್ರಯೋಜನಗಳನ್ನು ನೀಡುತ್ತದೆ ತಯಾರಕರು. ಸ್ಕೆಪ್ಟಿಕ್ ದೃಷ್ಟಿಕೋನವನ್ನು ತೆಗೆದುಕೊಳ್ಳಬಾರದೆಂಬ ಎರಡನೇ ಕಾರಣವೆಂದರೆ ಈ ಅಧ್ಯಯನದ ಮೂಲಭೂತ ಪಾಕವಿಧಾನವನ್ನು ವಿವಿಧ ಸಂಶೋಧನಾ ಸನ್ನಿವೇಶಗಳಿಗೆ ಅನುಗುಣವಾಗಿ ಒದಗಿಸಬಹುದು. ಈ ಪಾಕವಿಧಾನವು ಕೇವಲ ಎರಡು ಅಂಶಗಳು ಮತ್ತು ಎರಡು ಹಂತಗಳನ್ನು ಹೊಂದಿದೆ. ಪದಾರ್ಥಗಳು (1) ವಿಶಾಲವಾದ ಆದರೆ ತೆಳ್ಳಗಿನ ದೊಡ್ಡ ಡೇಟಾ ಮೂಲವಾಗಿದ್ದು (ಅಂದರೆ, ಅದು ಪ್ರತಿಯೊಬ್ಬ ವ್ಯಕ್ತಿಯ ಬಗ್ಗೆ ಅಗತ್ಯವಿರುವ ಮಾಹಿತಿಯಲ್ಲ) ಮತ್ತು (2) ಕಿರಿದಾದ ಆದರೆ ದಪ್ಪವಾದ ಸಮೀಕ್ಷೆ (ಅಂದರೆ, ಇದು ಕೇವಲ ಕೆಲವು ಜನರು, ಆದರೆ ಆ ವ್ಯಕ್ತಿಗಳ ಬಗ್ಗೆ ನಿಮಗೆ ಅಗತ್ಯವಿರುವ ಮಾಹಿತಿ ಇದೆ). ಈ ಪದಾರ್ಥಗಳನ್ನು ನಂತರ ಎರಡು ಹಂತಗಳಲ್ಲಿ ಸೇರಿಸಬಹುದು. ಮೊದಲಿಗೆ, ಎರಡೂ ಡೇಟಾ ಮೂಲಗಳಲ್ಲಿನ ಜನರಿಗೆ, ಸಮೀಕ್ಷೆಯ ಉತ್ತರಗಳನ್ನು ಊಹಿಸಲು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲವನ್ನು ಬಳಸುವ ಒಂದು ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸಿ. ಮುಂದೆ, ದೊಡ್ಡ ದತ್ತಾಂಶ ಮೂಲದಲ್ಲಿ ಪ್ರತಿಯೊಬ್ಬರ ಸಮೀಕ್ಷೆಯ ಉತ್ತರಗಳನ್ನು ಊಹಿಸಲು ಆ ಮಾದರಿಯನ್ನು ಬಳಸಿ. ಹೀಗಾಗಿ, ನೀವು ಸಾಕಷ್ಟು ಜನರನ್ನು ಕೇಳಬೇಕೆಂದು ಕೆಲವು ಪ್ರಶ್ನೆಗಳು ಇದ್ದಲ್ಲಿ, ನೀವು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲವನ್ನು ಕಾಳಜಿವಹಿಸದಿದ್ದರೂ , ಅವರ ಉತ್ತರವನ್ನು ಊಹಿಸಲು ಬಳಸಬಹುದಾದಂತಹ ದೊಡ್ಡ ಡೇಟಾ ಮೂಲವನ್ನು ನೋಡಿ . ಅಂದರೆ, ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಕರೆ ದಾಖಲೆಗಳನ್ನು ಅಂತರ್ಗತವಾಗಿ ಕಾಳಜಿ ಮಾಡಲಿಲ್ಲ; ಅವರು ಕರೆ ರೆಕಾರ್ಡ್ಗಳ ಬಗ್ಗೆ ಮಾತ್ರ ಕಾಳಜಿಯನ್ನು ಹೊಂದಿದ್ದರು, ಏಕೆಂದರೆ ಅವರು ಸಮೀಕ್ಷೆ ಉತ್ತರಗಳನ್ನು ಅವರು ಕಾಳಜಿವಹಿಸುವ ಬಗ್ಗೆ ಊಹಿಸಲು ಬಳಸಬಹುದು. ದೊಡ್ಡದಾದ ಡೇಟಾ ಮೂಲದಲ್ಲಿನ ಈ ವಿಶಿಷ್ಟ-ಪರೋಕ್ಷ ಆಸಕ್ತಿಯು-ನಾನು ಮೊದಲೇ ವಿವರಿಸಿದ ಎಂಬೆಡೆಡ್ ಕೇಳುವಿಕೆಯಿಂದ ವಿಭಿನ್ನವಾಗಿ ಕೇಳುತ್ತದೆ.
ಅಂತಿಮ ಹಂತದಲ್ಲಿ, ಬ್ಲುಮೆನ್ಸ್ಟಾಕ್ ಅವರ ವರ್ಧಿತ ಸಮೀಕ್ಷೆ ಸಂಯೋಜಿತ ಸಮೀಕ್ಷೆಯ ದತ್ತಾಂಶವು ಅಂದಾಜುಗಳನ್ನು ಉತ್ಪತ್ತಿ ಮಾಡಲು ಒಂದು ದೊಡ್ಡ ದತ್ತಾಂಶ ಮೂಲದೊಂದಿಗೆ ಚಿನ್ನದ-ಮಾನದಂಡ ಸಮೀಕ್ಷೆಯಿಂದ ಹೋಲಿಸಬಹುದು. ವರ್ಧಿತ ಕೇಳುವ ಮತ್ತು ಸಾಂಪ್ರದಾಯಿಕ ಸಮೀಕ್ಷೆ ವಿಧಾನಗಳ ನಡುವಿನ ಕೆಲವು ವ್ಯಾಪಾರ-ವಿನಿಮಯಗಳನ್ನು ಈ ನಿರ್ದಿಷ್ಟ ಉದಾಹರಣೆಯು ಸ್ಪಷ್ಟಪಡಿಸುತ್ತದೆ. ವರ್ಧಿತ ಕೇಳುವ ಅಂದಾಜುಗಳು ಹೆಚ್ಚು ಸಕಾಲಿಕವಾಗಿದ್ದು, ಗಣನೀಯವಾಗಿ ಅಗ್ಗವಾಗಿದ್ದವು ಮತ್ತು ಹೆಚ್ಚು ಕಣಜವಾಗಿರುತ್ತವೆ. ಆದರೆ ಮತ್ತೊಂದೆಡೆ, ಈ ರೀತಿಯ ವರ್ತನೆಯ ಕೇಳುವಿಕೆಯು ಇನ್ನೂ ಬಲವಾದ ಸೈದ್ಧಾಂತಿಕ ಆಧಾರವಾಗಿಲ್ಲ. ಈ ಏಕೈಕ ಉದಾಹರಣೆ ಈ ವಿಧಾನವು ಯಾವಾಗ ಕೆಲಸ ಮಾಡುತ್ತದೆ ಮತ್ತು ಯಾವಾಗ ಆಗುವುದಿಲ್ಲ ಮತ್ತು ಈ ವಿಧಾನವನ್ನು ಬಳಸಿದ ಸಂಶೋಧಕರು ವಿಶೇಷವಾಗಿ ಯಾರು ಒಳಗೊಂಡಿರುವ ಕಾರಣದಿಂದಾಗಬಹುದಾದ ಸಂಭವನೀಯ ಪಕ್ಷಪಾತಗಳ ಬಗ್ಗೆ ಕಾಳಜಿಯನ್ನು ಹೊಂದಿರಬೇಕು-ಮತ್ತು ಅವರ ದೊಡ್ಡ ಡೇಟಾ ಮೂಲದಲ್ಲಿ ಸೇರಿಸಲಾಗಿಲ್ಲ ಎಂಬುದನ್ನು ತೋರಿಸುವುದಿಲ್ಲ. ಇದಲ್ಲದೆ, ವರ್ಧಿತ ಕೇಳುವಿಕೆಯ ವಿಧಾನವು ಇನ್ನೂ ಅಂದಾಜುಗಳ ಬಗ್ಗೆ ಅನಿಶ್ಚಿತತೆಯನ್ನು ಪರಿಮಾಣಿಸಲು ಉತ್ತಮ ಮಾರ್ಗಗಳನ್ನು ಹೊಂದಿಲ್ಲ. ಅದೃಷ್ಟವಶಾತ್, ವರ್ಧಿಸುತ್ತಿರುವ ಕೇಳುವಿಕೆಯು ಅಂಕಿಅಂಶಗಳಲ್ಲಿ ಮೂರು ದೊಡ್ಡ ಪ್ರದೇಶಗಳಿಗೆ-ಸಣ್ಣ-ಪ್ರದೇಶದ ಅಂದಾಜು (Rao and Molina 2015) , ಶಾಸನ (Rubin 2004) , ಮತ್ತು ಮಾದರಿಯ-ಆಧರಿತವಾದ ನಂತರದ ಶ್ರೇಣೀಕರಣದ (ಇದು ಸ್ವತಃ ಶ್ರೀ. ಪಿ. ನಾನು ಮೊದಲೇ ಅಧ್ಯಾಯದಲ್ಲಿ ವಿವರಿಸಿದ ವಿಧಾನ) (Little 1993) . ಈ ಆಳವಾದ ಸಂಪರ್ಕಗಳ ಕಾರಣದಿಂದಾಗಿ, ವರ್ಧಿಸಿದ ಕೇಳುವಿಕೆಯ ಅನೇಕ ವಿಧಾನಗಳ ಆಧಾರದ ಮೇಲೆ ಶೀಘ್ರದಲ್ಲೇ ಸುಧಾರಣೆಯಾಗುತ್ತದೆ ಎಂದು ನಾನು ನಿರೀಕ್ಷಿಸುತ್ತೇನೆ.
ಅಂತಿಮವಾಗಿ, ಬ್ಲುಮೆನ್ ಸ್ಟ್ಯಾಕ್ನ ಮೊದಲ ಮತ್ತು ಎರಡನೆಯ ಪ್ರಯತ್ನಗಳನ್ನು ಹೋಲಿಸಿದಾಗ ಡಿಜಿಟಲ್-ವಯಸ್ಸಿನ ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಯ ಬಗ್ಗೆ ಪ್ರಮುಖ ಪಾಠವನ್ನು ವಿವರಿಸುತ್ತದೆ: ಆರಂಭವು ಅಂತ್ಯವಲ್ಲ. ಅಂದರೆ, ಹಲವು ಬಾರಿ, ಮೊದಲ ವಿಧಾನವು ಉತ್ತಮವಲ್ಲ, ಆದರೆ ಸಂಶೋಧಕರು ಕೆಲಸ ಮುಂದುವರಿದರೆ, ವಿಷಯಗಳನ್ನು ಉತ್ತಮವಾಗಿ ಪಡೆಯಬಹುದು. ಹೆಚ್ಚು ಸಾಮಾನ್ಯವಾಗಿ, ಡಿಜಿಟಲ್ ಯುಗದಲ್ಲಿ ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಗೆ ಹೊಸ ವಿಧಾನಗಳನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುವಾಗ, ಎರಡು ವಿಭಿನ್ನ ಮೌಲ್ಯಮಾಪನಗಳನ್ನು ಮಾಡಲು ಮುಖ್ಯವಾಗಿದೆ: (1) ಇದೀಗ ಇದು ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ? ಮತ್ತು (2) ಭವಿಷ್ಯದಲ್ಲಿ ಭೂದೃಶ್ಯದ ಬದಲಾವಣೆಗಳು ಮತ್ತು ಸಂಶೋಧಕರು ಈ ಸಮಸ್ಯೆಯ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಗಮನವನ್ನು ಇಟ್ಟುಕೊಂಡಾಗ ಇದು ಎಷ್ಟು ಚೆನ್ನಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತದೆ? ಸಂಶೋಧಕರನ್ನು ಮೊದಲ ರೀತಿಯ ಮೌಲ್ಯಮಾಪನ ಮಾಡಲು ತರಬೇತಿ ನೀಡಲಾಗಿದ್ದರೂ, ಎರಡನೆಯದು ಹೆಚ್ಚು ಮುಖ್ಯವಾಗಿದೆ.