ಡಿಜಿಟಲ್ ಯುಗ ಸಂಭವನೀಯತೆ ಸಂಭವನೀಯತೆಯನ್ನು ಪ್ರಾಯೋಗಿಕವಾಗಿ ಮಾಡುವುದು ಮತ್ತು ಸಂಭವನೀಯತೆಯ ಸಂಭಾವ್ಯತೆಗಾಗಿ ಹೊಸ ಅವಕಾಶಗಳನ್ನು ರಚಿಸುತ್ತಿದೆ.
ಮಾದರಿ ಇತಿಹಾಸದಲ್ಲಿ, ಎರಡು ಸ್ಪರ್ಧಾತ್ಮಕ ವಿಧಾನಗಳಿವೆ: ಸಂಭವನೀಯ ಮಾದರಿ ವಿಧಾನಗಳು ಮತ್ತು ಸಂಭವನೀಯತೆ ಮಾದರಿ ವಿಧಾನಗಳು. ಸಂಪ್ರದಾಯದ ಆರಂಭಿಕ ಮಾದರಿಗಳಲ್ಲಿ ಎರಡೂ ವಿಧಾನಗಳನ್ನು ಬಳಸಲಾಗಿದ್ದರೂ, ಸಂಭವನೀಯತೆಯ ಮಾದರಿಗಳು ಪ್ರಾಬಲ್ಯ ಸಾಧಿಸಿವೆ, ಮತ್ತು ಸಂಭವನೀಯತೆ-ಸಂಭವನೀಯತೆಯ ಸಂಭಾವ್ಯತೆಗಳನ್ನು ಹೆಚ್ಚಿನ ಸಂಶಯದೊಂದಿಗೆ ವೀಕ್ಷಿಸಲು ಅನೇಕ ಸಾಮಾಜಿಕ ಸಂಶೋಧಕರು ಕಲಿಸಲಾಗುತ್ತದೆ. ಹಾಗಿದ್ದರೂ, ನಾನು ಕೆಳಕಂಡಂತೆ ವರ್ಣಿಸುವಂತೆ, ಡಿಜಿಟಲ್ ಯುಗದಿಂದ ಮಾಡಲ್ಪಟ್ಟ ಬದಲಾವಣೆಗಳು ಅಂದರೆ ಸಂಭವನೀಯತೆ-ಸಂಭವನೀಯತೆಯನ್ನು ಮರುಪರಿಶೀಲಿಸಲು ಸಂಶೋಧಕರು ಸಮಯ ಎಂದು ಅರ್ಥ. ನಿರ್ದಿಷ್ಟವಾಗಿ, ಸಂಭವನೀಯತೆ ಮಾದರಿ ಆಚರಣೆಯಲ್ಲಿ ಮಾಡಲು ಶ್ರಮಿಸುತ್ತಿದೆ, ಮತ್ತು ಸಂಭವನೀಯತೆಯ ಸಂಭಾವ್ಯತೆಯು ವೇಗವಾಗಿ, ಅಗ್ಗದ ಮತ್ತು ಉತ್ತಮಗೊಳ್ಳುತ್ತಿದೆ. ವೇಗವಾದ ಮತ್ತು ಅಗ್ಗದ ಸಮೀಕ್ಷೆಗಳು ತಮ್ಮಲ್ಲಿಯೇ ಅಂತ್ಯಗೊಳ್ಳುವುದಿಲ್ಲ: ಅವು ಹೆಚ್ಚು ಆಗಾಗ್ಗೆ ಸಮೀಕ್ಷೆಗಳು ಮತ್ತು ದೊಡ್ಡ ಮಾದರಿ ಗಾತ್ರಗಳಂತಹ ಹೊಸ ಅವಕಾಶಗಳನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತವೆ. ಉದಾಹರಣೆಗೆ, ಸಂಭವನೀಯತೆ ಅಲ್ಲದ ವಿಧಾನಗಳನ್ನು ಬಳಸುವುದರ ಮೂಲಕ ಸಹಕಾರಿ ಕಾಂಗ್ರೆಷನಲ್ ಚುನಾವಣಾ ಅಧ್ಯಯನ (CCES) ಸಂಭವನೀಯತೆ ಮಾದರಿಗಳನ್ನು ಬಳಸುವ ಹಿಂದಿನ ಅಧ್ಯಯನಗಳಿಗಿಂತ ಸರಿಸುಮಾರಾಗಿ 10 ಪಟ್ಟು ಹೆಚ್ಚು ಪಾಲ್ಗೊಳ್ಳುವವರನ್ನು ಹೊಂದಿದೆ. ಈ ದೊಡ್ಡ ಮಾದರಿ ಉಪ ಸಂಶೋಧಕರು ಮತ್ತು ಸಾಮಾಜಿಕ ಸನ್ನಿವೇಶಗಳಲ್ಲಿ ವರ್ತನೆಗಳು ಮತ್ತು ನಡವಳಿಕೆಯ ಬದಲಾವಣೆಯನ್ನು ಅಧ್ಯಯನ ಮಾಡಲು ರಾಜಕೀಯ ಸಂಶೋಧಕರನ್ನು ಶಕ್ತಗೊಳಿಸುತ್ತದೆ. ಇದಲ್ಲದೆ, ಈ ಹೆಚ್ಚುವರಿ ಪ್ರಮಾಣದ (Ansolabehere and Rivers 2013) ಅಂದಾಜುಗಳ ಗುಣಮಟ್ಟದಲ್ಲಿ ಕಡಿಮೆಯಾಯಿತು (Ansolabehere and Rivers 2013) .
ಪ್ರಸ್ತುತ, ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಯಲ್ಲಿ ಸ್ಯಾಂಪ್ಲಿಂಗ್ಗೆ ಪ್ರಬಲವಾದ ವಿಧಾನವೆಂದರೆ ಸಂಭವನೀಯತೆ ಮಾದರಿ . ಸಂಭವನೀಯತೆಯ ಮಾದರಿಗಳಲ್ಲಿ, ಗುರಿಯ ಜನಸಂಖ್ಯೆಯ ಎಲ್ಲ ಸದಸ್ಯರು ಮಾದರಿ, ಸಂಭವನೀಯ ಸಂಭವನೀಯತೆಯನ್ನು ಹೊಂದಿರುತ್ತಾರೆ ಮತ್ತು ಸಮೀಕ್ಷೆಗೆ ಪ್ರತಿಕ್ರಿಯಿಸುವ ಎಲ್ಲ ಜನರನ್ನು ಸಮೀಕ್ಷೆಗೆ ಪ್ರತಿಕ್ರಿಯಿಸುತ್ತಾರೆ. ಈ ಪರಿಸ್ಥಿತಿಗಳು ಪೂರೈಸಿದಾಗ, ಗುಣಾತ್ಮಕ ಗಣಿತ ಫಲಿತಾಂಶಗಳು ಗುರಿಯ ಜನಸಂಖ್ಯೆಯ ಬಗ್ಗೆ ಅನುಮಾನಗಳನ್ನು ಮಾಡಲು ಮಾದರಿಯನ್ನು ಬಳಸುವ ಸಂಶೋಧಕರ ಸಾಮರ್ಥ್ಯದ ಬಗ್ಗೆ ಸಮರ್ಥ ಗ್ಯಾರಂಟಿಗಳನ್ನು ನೀಡುತ್ತವೆ.
ವಾಸ್ತವ ಜಗತ್ತಿನಲ್ಲಿ, ಈ ಗಣಿತಶಾಸ್ತ್ರದ ಫಲಿತಾಂಶಗಳನ್ನು ಆಧರಿಸಿರುವ ನಿಯಮಗಳು ವಿರಳವಾಗಿ ಭೇಟಿಯಾಗುತ್ತವೆ. ಉದಾಹರಣೆಗೆ, ಅನೇಕ ವೇಳೆ ಕವರೇಜ್ ದೋಷಗಳು ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಗಳಿಲ್ಲ. ಈ ಸಮಸ್ಯೆಗಳಿಂದಾಗಿ, ಸಂಶೋಧಕರು ತಮ್ಮ ಮಾದರಿಯಿಂದ ತಮ್ಮ ಗುರಿಯ ಜನಸಂಖ್ಯೆಗೆ ನಿರ್ಣಯವನ್ನು ಮಾಡಲು ಹಲವಾರು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಹೊಂದಾಣಿಕೆಗಳನ್ನು ಬಳಸಬೇಕಾಗುತ್ತದೆ. ಹೀಗಾಗಿ, ಸಿದ್ಧಾಂತದಲ್ಲಿ ಸಂಭವನೀಯತೆಯ ಮಾದರಿಗಳ ನಡುವೆ ವ್ಯತ್ಯಾಸವನ್ನು ಕಂಡುಹಿಡಿಯುವುದು ಮುಖ್ಯವಾಗಿದೆ, ಇದು ಬಲವಾದ ಸೈದ್ಧಾಂತಿಕ ಭರವಸೆಗಳನ್ನು ಮತ್ತು ಆಚರಣೆಯಲ್ಲಿ ಸಂಭವನೀಯತೆ ಮಾದರಿಗಳನ್ನು ಹೊಂದಿದೆ , ಇದು ಅಂತಹ ಯಾವುದೇ ಗ್ಯಾರಂಟಿಗಳನ್ನು ನೀಡುತ್ತದೆ ಮತ್ತು ವಿವಿಧ ಅಂಕಿಅಂಶಗಳ ಹೊಂದಾಣಿಕೆಗಳನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ.
ಕಾಲಾನಂತರದಲ್ಲಿ, ಆಚರಣೆಯಲ್ಲಿ ಸಿದ್ಧಾಂತ ಮತ್ತು ಸಂಭವನೀಯತೆಯ ಮಾದರಿಗಳ ಸಂಭವನೀಯತೆಯ ನಡುವಿನ ವ್ಯತ್ಯಾಸಗಳು ಹೆಚ್ಚುತ್ತಿವೆ. ಉದಾಹರಣೆಗೆ, ಉತ್ತಮ ಗುಣಮಟ್ಟದ, ದುಬಾರಿ ಸಮೀಕ್ಷೆಗಳಲ್ಲಿ (ಫಿಗರ್ 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) ಸಹ ನಿರಾಧಾರ ದರಗಳು ಸ್ಥಿರವಾಗಿ ಹೆಚ್ಚುತ್ತಿವೆ. ವಾಣಿಜ್ಯ ದೂರವಾಣಿ ಸಮೀಕ್ಷೆಗಳಲ್ಲಿ ಪ್ರತಿಕ್ರಿಯೆ ಪಡೆಯುವ ದರಗಳು ತುಂಬಾ ಹೆಚ್ಚಿವೆ - ಕೆಲವೊಮ್ಮೆ 90% ರಷ್ಟು (Kohut et al. 2012) . ನಾನ್ಪ್ರೊಸ್ಪೇಸ್ನಲ್ಲಿನ ಈ ಹೆಚ್ಚಳವು ಅಂದಾಜಿನ ಗುಣಮಟ್ಟವನ್ನು ಭೀತಿಗೊಳಿಸುತ್ತದೆ ಏಕೆಂದರೆ ಅಂದಾಜುಗಳು ಸಂಶೋಧಕರು ನಾನ್ ರೆಸ್ಪಾನ್ಸ್ಗಾಗಿ ಸರಿಹೊಂದಿಸಲು ಬಳಸುವ ಅಂಕಿಅಂಶಗಳ ಮಾದರಿಗಳನ್ನು ಅವಲಂಬಿಸಿವೆ. ಇದಲ್ಲದೆ, ಸಮೀಕ್ಷೆಯ ಸಂಶೋಧಕರು ಹೆಚ್ಚಿನ ಪ್ರತಿಕ್ರಿಯೆ ದರಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಹೆಚ್ಚಿನ ದುಬಾರಿ ಪ್ರಯತ್ನಗಳನ್ನು ಮಾಡಿದ್ದರೂ ಗುಣಮಟ್ಟದಲ್ಲಿ ಈ ಪ್ರಮಾಣವು ಕುಸಿದಿದೆ. ಕೆಲವು ಜನರಿಗೆ ಗುಣಮಟ್ಟದ ಕುಸಿತ ಮತ್ತು ಹೆಚ್ಚುತ್ತಿರುವ ವೆಚ್ಚದ ಅವಳಿ ಪ್ರವೃತ್ತಿಗಳು ಸಮೀಕ್ಷೆಯ ಸಂಶೋಧನೆಯ ಅಡಿಪಾಯವನ್ನು (National Research Council 2013) ಬೆದರಿಕೆಗೊಳಿಸುತ್ತವೆ ಎಂದು ಭಯಪಡುತ್ತಾರೆ.
ಸಂಭವನೀಯತೆಯನ್ನು ನಮೂನೆ ವಿಧಾನಗಳಲ್ಲಿ ಬೆಳೆಯುತ್ತಿದ್ದ ತೊಂದರೆಗಳನ್ನು ಕಂಡುಬಂದಿದೆ ಎಂದು ಅದೇ ಸಮಯದಲ್ಲಿ, ಸಹ ಅಲ್ಲದ ಸಂಭವನೀಯತೆಯನ್ನು ನಮೂನೆ ವಿಧಾನಗಳಲ್ಲಿ ರಲ್ಲಿ ಅದ್ಭುತ ಬೆಳವಣಿಗೆಗಳನ್ನು ಬಂದಿದೆ. ಸಂಭವನೀಯತೆ-ಅಲ್ಲದ ಸಂಭಾವ್ಯ ವಿಧಾನಗಳ ವೈವಿಧ್ಯಮಯ ಶೈಲಿಗಳಿವೆ, ಆದರೆ ಅವುಗಳು ಸಾಮಾನ್ಯವಾದ ಒಂದು ವಿಷಯವೆಂದರೆ ಸಂಭವನೀಯತೆ ಮಾದರಿ (Baker et al. 2013) ನ ಗಣಿತದ ಚೌಕಟ್ಟಿನಲ್ಲಿ ಸುಲಭವಾಗಿ ಹೊಂದಿಕೊಳ್ಳುವುದಿಲ್ಲ. ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಸಂಭವನೀಯತೆ-ಅಲ್ಲದ ಸಂಭಾವ್ಯ ವಿಧಾನಗಳಲ್ಲಿ ಪ್ರತಿಯೊಬ್ಬರೂ ಸೇರ್ಪಡೆಯಾಗುವುದರಲ್ಲಿ ತಿಳಿದಿಲ್ಲದ ಮತ್ತು ಸಂಭವನೀಯ ಸಂಭವನೀಯತೆಯನ್ನು ಹೊಂದಿರುವುದಿಲ್ಲ. ಸಂಭವನೀಯತೆಯ ಸಂಭಾವ್ಯ ವಿಧಾನಗಳು ಸಾಮಾಜಿಕ ಸಂಶೋಧಕರಲ್ಲಿ ಭೀಕರವಾದ ಖ್ಯಾತಿಯನ್ನು ಹೊಂದಿವೆ ಮತ್ತು ಅವರು ಸಾಹಿತ್ಯದ ಡೈಜೆಸ್ಟ್ ವೈಫಲ್ಯ (ಹಿಂದಿನ ಚರ್ಚಿಸಲಾಗಿದೆ) ಮತ್ತು "ಡೀವಿ ಡಿಫೀಟ್ಸ್ ಟ್ರೂಮನ್" ನಂತಹ ಸಮೀಕ್ಷೆಯ ಸಂಶೋಧಕರ ಅತ್ಯಂತ ನಾಟಕೀಯ ವೈಫಲ್ಯಗಳನ್ನು ಹೊಂದಿದ್ದಾರೆ. 1948 ರ ಅಧ್ಯಕ್ಷೀಯ ಚುನಾವಣೆಗಳು (ಚಿತ್ರ 3.6).
ಡಿಜಿಟಲ್ ಯುಗಕ್ಕೆ ನಿರ್ದಿಷ್ಟವಾಗಿ ಸೂಕ್ತವಾದ ಒಂದು ಅಲ್ಲದ ಸಂಭವನೀಯತೆಯ ಮಾದರಿ ಆನ್ಲೈನ್ ಪ್ಯಾನೆಲ್ಗಳ ಬಳಕೆಯಾಗಿದೆ. ಆನ್ಲೈನ್ ಫಲಕಗಳನ್ನು ಬಳಸುವ ಸಂಶೋಧಕರು ಕೆಲವು ಪ್ಯಾನೆಲ್ ಪೂರೈಕೆದಾರರು-ಸಾಮಾನ್ಯವಾಗಿ ಕಂಪನಿ, ಸರ್ಕಾರ ಅಥವಾ ವಿಶ್ವವಿದ್ಯಾನಿಲಯವನ್ನು ಅವಲಂಬಿಸಿರುತ್ತಾರೆ-ಸಮೀಕ್ಷೆಗಳಿಗೆ ಪ್ರತಿಕ್ರಿಯಿಸುವಂತೆ ಒಪ್ಪಿಕೊಳ್ಳುವ ದೊಡ್ಡ, ವಿಭಿನ್ನ ಗುಂಪಿನ ಜನರನ್ನು ನಿರ್ಮಿಸಲು. ಆನ್ಲೈನ್ ಬ್ಯಾನರ್ ಜಾಹೀರಾತುಗಳಂತಹ ವಿವಿಧ ಆಡ್-ಹಾಕ್ ವಿಧಾನಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಈ ಪ್ಯಾನೆಲ್ ಪಾಲ್ಗೊಳ್ಳುವವರು ಹೆಚ್ಚಾಗಿ ನೇಮಕಗೊಳ್ಳುತ್ತಾರೆ. ನಂತರ, ಒಂದು ಸಂಶೋಧಕರು ಅಪೇಕ್ಷಿತ ಗುಣಲಕ್ಷಣಗಳೊಂದಿಗೆ ಪ್ರತಿವಾದಿಗಳ ಮಾದರಿ ಪ್ರವೇಶಕ್ಕಾಗಿ ಫಲಕ ಒದಗಿಸುವವರಿಗೆ ಪಾವತಿಸಬಹುದು (ಉದಾಹರಣೆಗೆ, ವಯಸ್ಕರ ರಾಷ್ಟ್ರೀಯ ಪ್ರತಿನಿಧಿ). ಈ ಆನ್ಲೈನ್ ಫಲಕಗಳು ಅಲ್ಲದ ಸಂಭವನೀಯತೆ ವಿಧಾನಗಳು ಏಕೆಂದರೆ ಪ್ರತಿಯೊಬ್ಬರೂ ಸೇರ್ಪಡೆಯಾಗದಿರುವುದನ್ನು ತಿಳಿದಿಲ್ಲ, ನಾನ್ಸರ್ಹೋ ಸಂಭವನೀಯತೆಯನ್ನು ಹೊಂದಿರುವುದಿಲ್ಲ. ಸಂಭವನೀಯತೆ ಆನ್ಲೈನ್ ಫಲಕಗಳನ್ನು ಈಗಾಗಲೇ ಸಾಮಾಜಿಕ ಸಂಶೋಧಕರು ಬಳಸುತ್ತಿದ್ದರೂ (ಉದಾ., ಸಿ.ಸಿ.ಇ.ಎಸ್), ಅವುಗಳಿಂದ ಬರುವ ಅಂದಾಜುಗಳ ಗುಣಮಟ್ಟ ಬಗ್ಗೆ ಇನ್ನೂ ಚರ್ಚೆಗಳಿವೆ (Callegaro et al. 2014) .
ಈ ಚರ್ಚೆಯ ಹೊರತಾಗಿಯೂ, ಸಾಮಾಜಿಕ ಸಂಶೋಧಕರು ಅಲ್ಲದ ಸಂಭವನೀಯತೆಯ ಮಾದರಿಗಳನ್ನು ಮರುಪರಿಶೀಲಿಸುವ ಸಮಯ ಏಕೆ ಎರಡು ಕಾರಣಗಳಿವೆ ಎಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ. ಮೊದಲನೆಯದಾಗಿ, ಡಿಜಿಟಲ್ ಯುಗದಲ್ಲಿ ಸಂಭವನೀಯತೆ-ಅಲ್ಲದ ಮಾದರಿಗಳ ಸಂಗ್ರಹ ಮತ್ತು ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ ಅನೇಕ ಬೆಳವಣಿಗೆಗಳು ಕಂಡುಬಂದಿದೆ. ಈ ಹೊಸ ವಿಧಾನಗಳು ಹಿಂದೆ ಸಮಸ್ಯೆಗಳನ್ನು ಉಂಟುಮಾಡಿದ ವಿಧಾನಗಳಿಂದ ಸಾಕಷ್ಟು ವಿಭಿನ್ನವಾಗಿವೆ, ಇದು "ಸಂಭವನೀಯತೆ-ಅಲ್ಲದ ಸಂಭವನೀಯ 2.0 ರಹಿತ" ಎಂದು ಯೋಚಿಸಲು ಇದು ಸಮಂಜಸವೆಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ. ಸಂಭವನೀಯತೆ ಮಾದರಿಗಳನ್ನು ಸಂಶೋಧಕರು ಏಕೆ ಮರುಪರಿಶೀಲಿಸಬೇಕು ಎಂಬುದಕ್ಕೆ ಎರಡನೇ ಕಾರಣವೆಂದರೆ ಸಂಭವನೀಯತೆ ಮಾದರಿ ಅಭ್ಯಾಸ ಹೆಚ್ಚು ಕಷ್ಟಕರವಾಗುತ್ತದೆ. ಪ್ರತಿಕ್ರಿಯೆಯಲ್ಲದ ಹೆಚ್ಚಿನ ದರಗಳು ಇದ್ದಾಗ-ಈಗ ನೈಜ ಸಮೀಕ್ಷೆಗಳಲ್ಲಿ ಇರುವುದರಿಂದ- ಪ್ರತಿಸ್ಪಂದಕರಿಗೆ ಸೇರ್ಪಡೆಗೊಳ್ಳುವ ವಾಸ್ತವಿಕ ಸಂಭವನೀಯತೆಗಳು ತಿಳಿದಿಲ್ಲ, ಹೀಗಾಗಿ ಸಂಭವನೀಯತೆ ಮಾದರಿಗಳು ಮತ್ತು ಸಂಭವನೀಯತೆ ಮಾದರಿಗಳು ಅನೇಕ ಸಂಶೋಧಕರು ನಂಬುವಷ್ಟು ಭಿನ್ನವಾಗಿರುವುದಿಲ್ಲ.
ನಾನು ಮೊದಲೇ ಹೇಳಿದಂತೆ, ಸಮೀಕ್ಷೆ ಸಂಶೋಧನೆಯ ಆರಂಭಿಕ ದಿನಗಳಲ್ಲಿ ಕೆಲವು ಮುಜುಗರದ ವೈಫಲ್ಯಗಳಲ್ಲಿ ಅವರ ಪಾತ್ರದ ಕಾರಣದಿಂದಾಗಿ, ಸಂಭಾವ್ಯತೆ-ಅಲ್ಲದ ಸಂಭವನೀಯತೆಗಳನ್ನು ಅನೇಕ ಸಾಮಾಜಿಕ ಸಂಶೋಧಕರು ತೀವ್ರ ಸಂಶಯದಿಂದ ನೋಡುತ್ತಾರೆ. ಸಂಭಾವ್ಯತೆ-ಅಲ್ಲದ ಸಂಭವನೀಯತೆಗಳೊಂದಿಗೆ ನಾವು ಎಷ್ಟು ದೂರದಲ್ಲಿದ್ದೇವೆ ಎನ್ನುವುದರ ಬಗ್ಗೆ ಸ್ಪಷ್ಟವಾದ ಉದಾಹರಣೆಯೆಂದರೆ, ವೆಯಿ ವಾಂಗ್, ಡೇವಿಡ್ ರಾಥ್ಸ್ಚೈಲ್ಡ್, ಶರದ್ ಗೋಯೆಲ್ ಮತ್ತು ಆಂಡ್ರ್ಯೂ ಗೆಲ್ಮನ್ (2015) ರ ಸಂಶೋಧನೆಯು 2012 ರ ಯುಎಸ್ ಚುನಾವಣೆಯ ಫಲಿತಾಂಶವನ್ನು ಒಂದು ಸಂಭವನೀಯತೆಯ ಮಾದರಿ ಅಮೆರಿಕಾದ ಎಕ್ಸ್ಬಾಕ್ಸ್ ಬಳಕೆದಾರರು- ಅಮೇರಿಕನ್ನರ ನಿರ್ಣಾಯಕ ಮಾದರಿಯ ಮಾದರಿ. ಸಂಶೋಧಕರು ಎಕ್ಸ್ಬಾಕ್ಸ್ ಗೇಮಿಂಗ್ ಸಿಸ್ಟಮ್ನಿಂದ ಪ್ರತಿಕ್ರಿಯಿಸಿದವರು ಮತ್ತು ನೀವು ನಿರೀಕ್ಷಿಸುವಂತೆ, ಎಕ್ಸ್ಬಾಕ್ಸ್ ಮಾದರಿಯು ಪುರುಷ ಮತ್ತು ಓರೆಯಾದ ಯುವಕರನ್ನು ಓರೆಯಾಗಿತ್ತು: 18 ರಿಂದ 29 ವರ್ಷ ವಯಸ್ಸಿನವರು ಮತದಾರರ 19% ರಷ್ಟು ಆದರೆ ಎಕ್ಸ್ಬಾಕ್ಸ್ ಮಾದರಿಯಲ್ಲಿ 65%, ಮತ್ತು ಪುರುಷರು ಮತದಾರರ ಪೈಕಿ 47% ರಷ್ಟು ಮತಗಳನ್ನು ಮಾಡುತ್ತಾರೆ ಆದರೆ 93% ಎಕ್ಸ್ಬಾಕ್ಸ್ ಮಾದರಿ (ಚಿತ್ರ 3.7). ಈ ಬಲವಾದ ಜನಸಂಖ್ಯಾ ಪಕ್ಷಪಾತಗಳ ಕಾರಣ, ಕಚ್ಚಾ ಎಕ್ಸ್ಬಾಕ್ಸ್ ಡೇಟಾವು ಚುನಾವಣಾ ಆದಾಯದ ಕಳಪೆ ಸೂಚಕವಾಗಿದೆ. ಇದು ಬರಾಕ್ ಒಬಾಮಾ ಮೇಲೆ ಮಿಟ್ ರೊಮ್ನಿಗೆ ಒಂದು ಬಲವಾದ ಗೆಲುವು ಎಂದು ಊಹಿಸಲಾಗಿದೆ. ಮತ್ತೊಮ್ಮೆ, ಕಚ್ಚಾ, ಸರಿಪಡಿಸಲಾಗದ ಸಂಭಾವ್ಯ ಅಲ್ಲದ ಸಂಭವನೀಯತೆ ಮಾದರಿಗಳ ಅಪಾಯಗಳಿಗೆ ಇದು ಮತ್ತೊಂದು ಉದಾಹರಣೆಯಾಗಿದೆ ಮತ್ತು ಲಿಟರರಿ ಡೈಜೆಸ್ಟ್ ವೈಫಲ್ಯವನ್ನು ನೆನಪಿಸುತ್ತದೆ.
ಆದಾಗ್ಯೂ, ವಾಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಈ ಸಮಸ್ಯೆಗಳ ಬಗ್ಗೆ ಅರಿತುಕೊಂಡರು ಮತ್ತು ಅಂದಾಜು ಮಾಡುವಾಗ ಅವರ ಯಾದೃಚ್ಛಿಕ ಮಾದರಿ ಪ್ರಕ್ರಿಯೆಗಾಗಿ ಹೊಂದಿಕೊಳ್ಳಲು ಪ್ರಯತ್ನಿಸಿದರು. ನಿರ್ದಿಷ್ಟವಾಗಿ, ಅವರು ನಂತರದ ಶ್ರೇಣೀಕರಣವನ್ನು ಬಳಸಿದರು, ಕವರೇಜ್ ದೋಷಗಳು ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಯಲ್ಲದ ಸಂಭವನೀಯತೆ ಮಾದರಿಗಳನ್ನು ಸರಿಹೊಂದಿಸಲು ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲಾಗುವ ತಂತ್ರ.
ಮಾದರಿಯಿಂದ ಬರುವ ಅಂದಾಜಿನ ಸುಧಾರಣೆಗೆ ಸಹಾಯ ಮಾಡಲು ಉದ್ದೇಶಿತ ಜನಸಂಖ್ಯೆಯ ಬಗ್ಗೆ ಸಹಾಯಕ ಮಾಹಿತಿಯನ್ನು ಬಳಸುವುದು ಪೋಸ್ಟ್-ಸ್ತರೀಕರಣದ ಮುಖ್ಯ ಉದ್ದೇಶವಾಗಿದೆ. ತಮ್ಮ ಸಂಭವನೀಯತೆಯ ಮಾದರಿಗಳಿಂದ ಅಂದಾಜು ಮಾಡಲು ಪೋಸ್ಟ್-ಸ್ಲ್ಯಾಟಿಫಿಕೇಷನ್ ಅನ್ನು ಬಳಸುವಾಗ, ವಾಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿ ಜನರನ್ನು ವಿವಿಧ ಗುಂಪುಗಳಾಗಿ ಕತ್ತರಿಸಿ, ಪ್ರತಿ ಗುಂಪಿನಲ್ಲಿಯೂ ಒಬಾಮಾಗೆ ಬೆಂಬಲವನ್ನು ಅಂದಾಜು ಮಾಡಿದರು ಮತ್ತು ಒಟ್ಟಾರೆ ಅಂದಾಜು ಮಾಡಲು ಗುಂಪಿನ ಅಂದಾಜಿನ ಸರಾಸರಿ ತೂಕವನ್ನು ತೆಗೆದುಕೊಂಡರು. ಉದಾಹರಣೆಗೆ, ಅವರು ಜನರನ್ನು ಎರಡು ಗುಂಪುಗಳಾಗಿ (ಪುರುಷರು ಮತ್ತು ಮಹಿಳೆಯರು) ವಿಭಜಿಸಿರಬಹುದು, ಪುರುಷರು ಮತ್ತು ಮಹಿಳೆಯರಲ್ಲಿ ಒಬಾಮಾಗೆ ಬೆಂಬಲವನ್ನು ಅಂದಾಜಿಸಲಾಗಿದೆ, ಮತ್ತು ನಂತರ ಮಹಿಳೆಯರಿಗೆ ಮಾಡುವ ವಾಸ್ತವದ ಕಾರಣದಿಂದಾಗಿ ಒಬಾಮಾಗೆ ಒಟ್ಟಾರೆ ಬೆಂಬಲವನ್ನು ಅಂದಾಜು ಮಾಡುತ್ತಾರೆ. 53% ಮತದಾರರು ಮತ್ತು ಪುರುಷರು 47%. ಸ್ಥೂಲವಾಗಿ, ಪೋಸ್ಟ್-ಸ್ಟ್ರ್ಯಾಟಿಫಿಕೇಷನ್ ಸಮೂಹಗಳ ಗಾತ್ರದ ಬಗ್ಗೆ ಸಹಾಯಕ ಮಾಹಿತಿಯನ್ನು ತರುವ ಮೂಲಕ ಅಸಮತೋಲಿತ ಮಾದರಿಗೆ ಸರಿಯಾಗಿ ಸಹಾಯ ಮಾಡುತ್ತದೆ.
ಪೋಸ್ಟ್-ಸ್ಟೆಟಿಫಿಕೇಷನ್ ಮಾಡುವಿಕೆಯು ಸರಿಯಾದ ಗುಂಪುಗಳನ್ನು ರಚಿಸುವುದು. ಜನಸಂಖ್ಯೆಯನ್ನು ಏಕರೂಪದ ಗುಂಪುಗಳಾಗಿ ಕೊಯ್ಯಲು ಸಾಧ್ಯವಾದರೆ ಪ್ರತಿ ಗುಂಪು ಪ್ರತಿಯೊಬ್ಬರಿಗೂ ಪ್ರತಿಕ್ರಿಯೆ ಒಲವು ಒಂದೇ ಆಗಿರುತ್ತದೆ, ನಂತರದ-ಶ್ರೇಣೀಕರಣವು ಪಕ್ಷಪಾತವಿಲ್ಲದ ಅಂದಾಜುಗಳನ್ನು ಉತ್ಪತ್ತಿ ಮಾಡುತ್ತದೆ. ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಎಲ್ಲಾ ಪುರುಷರಿಗೆ ಪ್ರತಿಕ್ರಿಯೆ ಒಲವು ಇದ್ದರೆ ಮತ್ತು ಎಲ್ಲಾ ಮಹಿಳೆಯರಿಗೆ ಅದೇ ಪ್ರತಿಕ್ರಿಯೆ ಒಲವು ಇದ್ದರೆ ಲಿಂಗದಿಂದ ಪೋಸ್ಟ್-ಸ್ಟ್ರ್ಯಾಟಿಫೈಯಿಂಗ್ ಪಕ್ಷಪಾತವಿಲ್ಲದ ಅಂದಾಜುಗಳನ್ನು ಉತ್ಪತ್ತಿ ಮಾಡುತ್ತದೆ. ಈ ಕಲ್ಪನೆಯನ್ನು ಏಕ-ಪ್ರತಿಸ್ಪಂದನಗಳು-ಗುಂಪಿನೊಳಗಿನ ಊಹೆಯೆಂದು ಕರೆಯುತ್ತಾರೆ, ಮತ್ತು ಈ ಅಧ್ಯಾಯದ ಅಂತ್ಯದಲ್ಲಿ ಗಣಿತದ ಟಿಪ್ಪಣಿಗಳಲ್ಲಿ ನಾನು ಸ್ವಲ್ಪ ಹೆಚ್ಚು ವಿವರಿಸುತ್ತೇನೆ.
ಸಹಜವಾಗಿ, ಎಲ್ಲಾ ಪುರುಷರಿಗೂ ಮತ್ತು ಎಲ್ಲ ಮಹಿಳೆಯರಿಗೂ ಪ್ರತಿಕ್ರಿಯೆ ಒಲವುಗಳು ಒಂದೇ ಆಗಿರಬಹುದು ಎಂಬುದು ಅಸಂಭವವಾಗಿದೆ. ಆದರೆ, ಸಮೂಹಗಳ ಸಂಖ್ಯೆ ಹೆಚ್ಚಾದಂತೆ ಗುಂಪುಗಳೊಳಗಿನ ಏಕರೂಪ-ಪ್ರತಿಕ್ರಿಯೆ-ಒಲವುಗಳು ಹೆಚ್ಚು ಪ್ರಾಮಾಣಿಕವಾಗಿ ಕಂಡುಬರುತ್ತವೆ. ಸರಿಸುಮಾರು, ನೀವು ಹೆಚ್ಚು ಗುಂಪುಗಳನ್ನು ರಚಿಸಿದರೆ ಜನಸಂಖ್ಯೆಯನ್ನು ಏಕರೂಪ ಗುಂಪುಗಳಾಗಿ ಕತ್ತರಿಸುವುದು ಸುಲಭವಾಗಿರುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ಎಲ್ಲಾ ಮಹಿಳೆಯರಿಗೆ ಒಂದೇ ರೀತಿಯ ಪ್ರತಿಕ್ರಿಯೆಯ ಪ್ರವೃತ್ತಿಯಿದೆ ಎಂದು ಹೇಳುವುದು ಅಸಾಧ್ಯವೆಂದು ತೋರುತ್ತದೆ, ಆದರೆ 18-29 ವಯಸ್ಸಿನ ಎಲ್ಲಾ ಮಹಿಳೆಯರಿಗೆ ಒಂದೇ ರೀತಿಯ ಪ್ರತಿಕ್ರಿಯೆಯ ಒಲವು ಕಂಡುಬರುತ್ತದೆ, ಕಾಲೇಜಿನಿಂದ ಪದವೀಧರರಾಗಿರುವವರು ಮತ್ತು ಕ್ಯಾಲಿಫೋರ್ನಿಯಾದವರು ಯಾರು . ಆದ್ದರಿಂದ, ನಂತರದ ಶ್ರೇಣೀಕರಣದಲ್ಲಿ ಬಳಸಲಾಗುವ ಗುಂಪುಗಳ ಸಂಖ್ಯೆಯು ದೊಡ್ಡದಾಗಿರುತ್ತದೆ, ವಿಧಾನವನ್ನು ಬೆಂಬಲಿಸುವ ಊಹೆಗಳನ್ನು ಹೆಚ್ಚು ಸಮಂಜಸವಾಗಿ ಮಾರ್ಪಡಿಸುತ್ತದೆ. ಈ ಸಂಗತಿಯಿಂದಾಗಿ, ಸಂಶೋಧಕರು ಹೆಚ್ಚಾಗಿ ಪೋಸ್ಟ್-ಸ್ಟ್ರ್ಯಾಟಿಫಿಕೇಷನ್ಗಾಗಿ ಹಲವಾರು ಸಂಖ್ಯೆಯ ಗುಂಪುಗಳನ್ನು ರಚಿಸಲು ಬಯಸುತ್ತಾರೆ. ಆದಾಗ್ಯೂ, ಗುಂಪುಗಳ ಸಂಖ್ಯೆ ಹೆಚ್ಚಾದಂತೆ, ಸಂಶೋಧಕರು ವಿಭಿನ್ನ ಸಮಸ್ಯೆಗೆ ಒಳಗಾಗುತ್ತಾರೆ: ಡೇಟಾ ವಿರಳತೆ. ಪ್ರತಿ ಗುಂಪಿನಲ್ಲಿ ಕೇವಲ ಒಂದು ಸಣ್ಣ ಸಂಖ್ಯೆಯ ಜನರು ಮಾತ್ರ ಇದ್ದಲ್ಲಿ, ಅಂದಾಜುಗಳು ಹೆಚ್ಚು ಅನಿಶ್ಚಿತವಾಗುತ್ತವೆ ಮತ್ತು ವಿಪರೀತ ಪ್ರಕರಣದಲ್ಲಿ ಯಾವುದೇ ಪ್ರತಿಕ್ರಿಯೆಯಿಲ್ಲದ ಗುಂಪೊಂದು ಅಲ್ಲಿರುತ್ತದೆ, ನಂತರದ-ಶ್ರೇಣೀಕರಣವು ಸಂಪೂರ್ಣವಾಗಿ ವಿಭಜನೆಗೊಳ್ಳುತ್ತದೆ.
ಗುಂಪುಗಳ ಊಹೆಯೊಳಗೆ ಏಕರೂಪದ ಪ್ರತಿಕ್ರಿಯೆ-ಒಲವು ಮತ್ತು ಪ್ರತಿ ಗುಂಪಿನಲ್ಲಿ ಸಮಂಜಸವಾದ ಮಾದರಿ ಗಾತ್ರದ ಬೇಡಿಕೆಗಳ ನಡುವಿನ ಈ ಅಂತರ್ಗತ ಉದ್ವೇಗದಿಂದ ಎರಡು ಮಾರ್ಗಗಳಿವೆ. ಮೊದಲಿಗೆ, ಸಂಶೋಧಕರು ದೊಡ್ಡದಾದ, ಹೆಚ್ಚು ವೈವಿಧ್ಯಮಯ ಮಾದರಿಯನ್ನು ಸಂಗ್ರಹಿಸಬಹುದು, ಇದು ಪ್ರತಿ ಗುಂಪಿನಲ್ಲಿ ಸಮಂಜಸ ಮಾದರಿ ಗಾತ್ರವನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಎರಡನೆಯದಾಗಿ, ಗುಂಪುಗಳೊಳಗೆ ಅಂದಾಜು ಮಾಡಲು ಅವರು ಹೆಚ್ಚು ಸಂಕೀರ್ಣವಾದ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮಾದರಿಯನ್ನು ಬಳಸಬಹುದು. ಮತ್ತು ವಾಸ್ತವವಾಗಿ, ಕೆಲವೊಮ್ಮೆ ಸಂಶೋಧಕರು ಎರಡೂ ಮಾಡುತ್ತಾರೆ, ಏಕೆಂದರೆ ವಾಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಎಕ್ಸ್ಬಾಕ್ಸ್ನಿಂದ ಪ್ರತಿಕ್ರಿಯಿಸಿದವರು ತಮ್ಮ ಚುನಾವಣೆಯ ಅಧ್ಯಯನವನ್ನು ಮಾಡಿದರು.
ಅವರು ಗಣಕ-ನಿರ್ವಹಣೆಯ ಸಂದರ್ಶನಗಳೊಂದಿಗೆ ಸಂಭವನೀಯತೆ-ಸಂಭಾವ್ಯ ಮಾದರಿ ವಿಧಾನವನ್ನು ಬಳಸುತ್ತಿದ್ದರೆ (ನಾನು ವಿಭಾಗ 3.5 ರಲ್ಲಿ ಕಂಪ್ಯೂಟರ್-ನಿರ್ವಹಣೆಯ ಸಂದರ್ಶನಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚು ಮಾತನಾಡುತ್ತೇನೆ), ವಾಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳಿಗೆ ಅಗ್ಗದ ಡೇಟಾ ಸಂಗ್ರಹಣೆ ಇತ್ತು, ಇದು 345,858 ಅನನ್ಯ ಭಾಗವಹಿಸುವವರ , ಚುನಾವಣಾ ಮತದಾನದ ಗುಣಮಟ್ಟದಿಂದ ಭಾರೀ ಸಂಖ್ಯೆಯಿದೆ. ಈ ಬೃಹತ್ ಮಾದರಿ ಗಾತ್ರವು ಪೋಸ್ಟ್-ಸ್ತರೀಕರಣ ಗುಂಪುಗಳ ಒಂದು ದೊಡ್ಡ ಸಂಖ್ಯೆಯನ್ನು ರೂಪಿಸಲು ಸಾಧ್ಯವಾಗಿಸಿತು. ನಂತರದ ಶ್ರೇಣೀಕರಣವು ಸಾಮಾನ್ಯವಾಗಿ ನೂರಾರು ಗುಂಪುಗಳಾಗಿ ಜನರನ್ನು ಕತ್ತರಿಸುವುದನ್ನು ಒಳಗೊಂಡಿದೆ, ವಾಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಲಿಂಗವನ್ನು (2 ವಿಭಾಗಗಳು), ಓಟದ (4 ವಿಭಾಗಗಳು), ವಯಸ್ಸು (4 ವಿಭಾಗಗಳು), ಶಿಕ್ಷಣ (4 ವಿಭಾಗಗಳು), ರಾಜ್ಯದಿಂದ 176,256 ಗುಂಪುಗಳನ್ನು ವಿಂಗಡಿಸಲಾಗಿದೆ (51 ವಿಭಾಗಗಳು), ಪಾರ್ಟಿ ಐಡಿ (3 ವಿಭಾಗಗಳು), ಸಿದ್ಧಾಂತ (3 ವಿಭಾಗಗಳು) ಮತ್ತು 2008 ಮತ (3 ವಿಭಾಗಗಳು). ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಕಡಿಮೆ-ವೆಚ್ಚದ ದತ್ತಾಂಶ ಸಂಗ್ರಹದಿಂದ ಸಕ್ರಿಯಗೊಳಿಸಲ್ಪಟ್ಟ ಅವರ ದೊಡ್ಡ ಗಾತ್ರದ ಗಾತ್ರವು, ಅವರ ಅಂದಾಜು ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ ಇನ್ನಷ್ಟು ತೋರಿಕೆಯ ಕಲ್ಪನೆಯನ್ನು ಮಾಡಲು ಅವುಗಳನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಿತು.
345,858 ವಿಶಿಷ್ಟ ಪಾಲ್ಗೊಳ್ಳುವವರೊಂದಿಗೆ ಸಹ, ವಾಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳಿಗೆ ಬಹುತೇಕ ಪ್ರತಿಕ್ರಿಯೆ ಇಲ್ಲದಿರುವ ಹಲವು ಗುಂಪುಗಳು ಇನ್ನೂ ಇದ್ದವು. ಆದ್ದರಿಂದ, ಅವರು ಪ್ರತಿ ಗುಂಪಿನಲ್ಲಿನ ಬೆಂಬಲವನ್ನು ಅಂದಾಜು ಮಾಡಲು ಬಹುಮಟ್ಟದ ಹಿಂಜರಿಕೆಯನ್ನು ಕರೆಯುವ ವಿಧಾನವನ್ನು ಬಳಸಿದರು. ಮೂಲಭೂತವಾಗಿ, ಒಂದು ನಿರ್ದಿಷ್ಟ ಗುಂಪಿನೊಳಗೆ ಒಬಾಮಾಗೆ ಬೆಂಬಲವನ್ನು ಅಂದಾಜು ಮಾಡಲು, ಬಹುಮಟ್ಟಿನ ಹಿಂಜರಿತವು ಅನೇಕ ನಿಕಟ ಸಂಬಂಧಿ ಗುಂಪುಗಳಿಂದ ಮಾಹಿತಿಯನ್ನು ಸಂಗ್ರಹಿಸಿದೆ. ಉದಾಹರಣೆಗೆ, ಕಾಲೇಜು ಪದವೀಧರರಾದ 18 ಮತ್ತು 29 ವರ್ಷ ವಯಸ್ಸಿನ ಮಹಿಳಾ ಹಿಸ್ಪಾನಿಕ್ಸ್ ನಡುವೆ ಒಬಾಮಾಗೆ ಬೆಂಬಲವನ್ನು ಅಂದಾಜು ಮಾಡುವ ಪ್ರಯತ್ನವನ್ನು ಕಲ್ಪಿಸಿಕೊಳ್ಳಿ, ಅವರು ಮಧ್ಯಮವರ್ತಿಗಳಾಗಿ ಸ್ವಯಂ-ಗುರುತಿಸಿಕೊಳ್ಳುವ ಡೆಮೋಕ್ರಾಟ್ಗಳನ್ನು ನೋಂದಾಯಿಸಿದ್ದಾರೆ ಮತ್ತು 2008 ರಲ್ಲಿ ಒಬಾಮಾಗೆ ಮತ ಚಲಾಯಿಸಿದ್ದಾರೆ. , ನಿರ್ದಿಷ್ಟ ಗುಂಪು, ಮತ್ತು ಈ ಗುಣಲಕ್ಷಣಗಳೊಂದಿಗೆ ಮಾದರಿಯಲ್ಲಿ ಯಾರೂ ಇಲ್ಲ ಎಂದು ಸಾಧ್ಯವಿದೆ. ಆದ್ದರಿಂದ, ಈ ಗುಂಪಿನ ಕುರಿತಾದ ಅಂದಾಜುಗಳನ್ನು ಮಾಡಲು, ಬಹುಮಟ್ಟದ ಹಿಂಜರಿಕೆಯನ್ನು ಒಂದೇ ರೀತಿಯ ಗುಂಪುಗಳಲ್ಲಿ ಜನರಿಂದ ಅಂದಾಜು ಮಾಡುವ ಮೂಲಕ ಒಟ್ಟಾರೆ ಪೂಲ್ಗೆ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮಾದರಿಯನ್ನು ಬಳಸುತ್ತದೆ.
ಆದ್ದರಿಂದ, ವಾಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಬಹುಮಟ್ಟಿನ ಹಿಂಜರಿಕೆಯನ್ನು ಮತ್ತು ನಂತರದ ಶ್ರೇಣೀಕರಣವನ್ನು ಸಂಯೋಜಿಸಿದ ಒಂದು ವಿಧಾನವನ್ನು ಬಳಸಿದರು, ಆದ್ದರಿಂದ ಅವರು ತಮ್ಮ ಕಾರ್ಯತಂತ್ರದ ನಂತರದ ಶ್ರೇಣೀಕರಣದೊಂದಿಗೆ ಬಹುಮಟ್ಟಿನ ಹಿಂಜರಿಕೆಯನ್ನು ಅಥವಾ ಹೆಚ್ಚು ಪ್ರೀತಿಯಿಂದ "ಶ್ರೀ. ಪಿ. "ವಾಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಮಿಸ್ಟರ್ ಪಿ ಅನ್ನು ಉಪಯೋಗಿಸಿದಾಗ ಎಕ್ಸ್ಬಾಕ್ಸ್ ಅಲ್ಲದ ಸಂಭವನೀಯತೆಯ ಮಾದರಿಯಿಂದ ಅಂದಾಜು ಮಾಡಲು, 2012 ರ ಚುನಾವಣೆಯಲ್ಲಿ (ಒಂಬತ್ತು 3.8) ಒಬಾಮ ಸ್ವೀಕರಿಸಿದ ಒಟ್ಟಾರೆ ಬೆಂಬಲಕ್ಕೆ ಅವರು ಅಂದಾಜು ಮಾಡಿದರು. ವಾಸ್ತವವಾಗಿ ಅವರ ಅಂದಾಜುಗಳು ಸಾಂಪ್ರದಾಯಿಕ ಸಾರ್ವಜನಿಕ ಅಭಿಪ್ರಾಯ ಸಂಗ್ರಹದ ಒಟ್ಟಾರೆಗಿಂತ ನಿಖರವಾಗಿರುತ್ತವೆ. ಹೀಗಾಗಿ, ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಹೊಂದಾಣಿಕೆಗಳು-ನಿರ್ದಿಷ್ಟವಾಗಿ Mr. P.-ಸಂಭವನೀಯತೆ ಡೇಟಾದಲ್ಲಿ ಪೂರ್ವಗ್ರಹಗಳನ್ನು ಸರಿಪಡಿಸುವ ಒಳ್ಳೆಯ ಕೆಲಸವನ್ನು ತೋರುತ್ತದೆ; ಅಸಮಂಜಸವಾದ ಎಕ್ಸ್ಬಾಕ್ಸ್ ಡೇಟಾದಿಂದ ಅಂದಾಜುಗಳನ್ನು ನೋಡಿದಾಗ ಸ್ಪಷ್ಟವಾಗಿ ಗೋಚರಿಸಿದ ದ್ವೇಷಗಳು.
ವಾಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳ ಅಧ್ಯಯನದಿಂದ ಎರಡು ಪ್ರಮುಖ ಪಾಠಗಳಿವೆ. ಮೊದಲಿಗೆ, ಸರಿಪಡಿಸಲಾಗದ ಸಂಭವನೀಯತೆಯ ಮಾದರಿಗಳು ಕೆಟ್ಟ ಅಂದಾಜುಗಳಿಗೆ ಕಾರಣವಾಗಬಹುದು; ಇದು ಅನೇಕ ಸಂಶೋಧಕರು ಮೊದಲು ಕೇಳಿರುವ ಒಂದು ಪಾಠ. ಆದಾಗ್ಯೂ, ಎರಡನೇ ಪಾಠ, ಅಲ್ಲದ ಸಂಭವನೀಯತೆ ಮಾದರಿಗಳು, ಸರಿಯಾಗಿ ವಿಶ್ಲೇಷಿಸಿದಾಗ, ವಾಸ್ತವವಾಗಿ ಉತ್ತಮ ಅಂದಾಜುಗಳನ್ನು ಉತ್ಪಾದಿಸಬಹುದು; ಅಲ್ಲದ ಸಂಭವನೀಯತೆ ಮಾದರಿಗಳು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಲಿಟರರಿ ಡೈಜೆಸ್ಟ್ ಅಧ್ವಾನಗಳು ರೀತಿಯ ದಾರಿ ಇಲ್ಲ.
ಸಂಭವನೀಯತೆ ಮಾದರಿ ವಿಧಾನ ಮತ್ತು ಒಂದು ಸಂಭವನೀಯತೆ ಮಾದರಿ ವಿಧಾನವನ್ನು ಬಳಸುವುದರ ನಡುವೆ ನೀವು ನಿರ್ಧರಿಸಲು ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೆ, ನೀವು ಕಠಿಣ ಆಯ್ಕೆ ಎದುರಿಸಬೇಕಾಗುತ್ತದೆ. ಕೆಲವೊಮ್ಮೆ ಸಂಶೋಧಕರು ತ್ವರಿತ ಮತ್ತು ಗಡುಸಾದ ನಿಯಮವನ್ನು ಬಯಸುತ್ತಾರೆ (ಉದಾಹರಣೆಗೆ, ಯಾವಾಗಲೂ ಸಂಭವನೀಯತೆ ಮಾದರಿ ವಿಧಾನಗಳನ್ನು ಬಳಸುತ್ತಾರೆ), ಆದರೆ ಅಂತಹ ಒಂದು ನಿಯಮವನ್ನು ಒದಗಿಸುವುದು ಕಷ್ಟಕರವಾಗಿದೆ. ಆಚರಣೆಯಲ್ಲಿ ಸಂಭವನೀಯತೆ ಮಾದರಿ ವಿಧಾನಗಳ ನಡುವೆ ಸಂಶೋಧಕರು ಕಠಿಣ ಆಯ್ಕೆಗಳನ್ನು ಎದುರಿಸುತ್ತಾರೆ-ಇದು ಹೆಚ್ಚು ದುಬಾರಿ ಮತ್ತು ಸೈದ್ಧಾಂತಿಕ ಫಲಿತಾಂಶದಿಂದ ಅವುಗಳ ಬಳಕೆ ಮತ್ತು ಸಂಭವನೀಯತೆಯ ಮಾದರಿ ವಿಧಾನಗಳನ್ನು ಕಡಿಮೆಗೊಳಿಸುವ ಮತ್ತು ಕಡಿಮೆ ವೇಗದಲ್ಲಿರುತ್ತವೆ, ಆದರೆ ಕಡಿಮೆ ಪರಿಚಿತ ಮತ್ತು ಹೆಚ್ಚು ವೈವಿಧ್ಯಮಯವಾಗಿದೆ. ಆದಾಗ್ಯೂ, ನೀವು ಅಲ್ಲದ ಸಂಭವನೀಯತೆ ಮಾದರಿಗಳು ಅಥವಾ ಪ್ರತಿನಿಧಿಸದ ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳೊಂದಿಗೆ (ಅಧ್ಯಾಯ 2 ಕ್ಕೆ ಮತ್ತೆ ಯೋಚಿಸಿ) ಕೆಲಸ ಮಾಡಲು ಬಲವಂತವಾಗಿ, ನಂತರದ-ಶ್ರೇಣೀಕರಣದ ಮತ್ತು ಅಂದಾಜುಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಅಂದಾಜು ಮಾಡಿರುವುದಕ್ಕೆ ನಂಬುವ ಒಂದು ಬಲವಾದ ಕಾರಣವೆಂದರೆ, ಸಂಬಂಧಿತ ತಂತ್ರಜ್ಞಾನಗಳು ಅಸಮಂಜಸವಾದ, ಕಚ್ಚಾ ಅಂದಾಜುಗಳಿಗಿಂತ ಉತ್ತಮವಾಗಿರುತ್ತವೆ.