ದೊಡ್ಡ ದಶಮಾಂಶ ಮೂಲಗಳು ಜಂಕ್ ಮತ್ತು ಸ್ಪ್ಯಾಮ್ ಲೋಡ್ ಮಾಡಬಹುದು.
ಕೆಲವು ಸಂಶೋಧಕರು ದೊಡ್ಡ ದಶಮಾಂಶ ಮೂಲಗಳು ವಿಶೇಷವಾಗಿ ಆನ್ಲೈನ್ ಮೂಲಗಳಿಂದ ಆ, ಅವು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ ಏಕೆಂದರೆ ಮೂಲರೂಪ ನಂಬಿದ್ದಾರೆ. ವಾಸ್ತವವಾಗಿ, ದೊಡ್ಡ ದಶಮಾಂಶ ಮೂಲಗಳು ಕೆಲಸ ಮಾಡಿದ ಜನರು ಆಗಾಗ್ಗೆ ಕೊಳಕು ತಿಳಿದಿದೆ. ಅವರು ಆಗಾಗ್ಗೆ ಸಂಶೋಧಕರಿಗೆ ಈ ವಿನ್ಯಾಸವು ಆಸಕ್ತಿ ನಿಜವಾದ ಕ್ರಿಯೆಗಳು ಬಿಂಬಿಸುವ ದತ್ತಾಂಶ ಸೇರಿವೆ, ಆಗಿದೆ. ಸಾಮಾನ್ಯವಾಗಿ ಹೇಗೆ ಕಡಿಮೆ ಅರ್ಥಮಾಡಿಕೊಂಡರು 1) ಅವರು ಸಂಶೋಧಕರು ಸಂಶೋಧಕರು ಮತ್ತು 2) ಸಂಶೋಧಕರು ದಾಖಲಿಸಿದವರು: ಅನೇಕ ಸಮಾಜ ವಿಜ್ಞಾನಿಗಳು ಈಗಾಗಲೇ ಎರಡು ಕಾರಣಗಳಿಗಾಗಿ ಹೆಚ್ಚು ಕಷ್ಟ ದೊಡ್ಡ ಪ್ರಮಾಣದ ಸಾಮಾಜಿಕ ಸಮೀಕ್ಷೆ ಅಕ್ಷಾಂಶ ಸ್ವಚ್ಛಗೊಳಿಸುವ, ಆದರೆ ದೊಡ್ಡ ದಶಮಾಂಶ ಮೂಲಗಳು ಸ್ವಚ್ಛಗೊಳಿಸುವ ಪ್ರಕ್ರಿಯೆ ತಿಳಿದಿದೆ ಅವರು ರಚಿಸಲಾಯಿತು.
ಕೊಳಕು ಡಿಜಿಟಲ್ ಟ್ರೇಸ್ ಡೇಟಾ ಅಪಾಯಗಳ ಮೂಲಕ ಬ್ಯಾಕ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು 'ವಿವರಿಸಲಾಗಿದೆ (2010) ಸೆಪ್ಟೆಂಬರ್ 11, ದಾಳಿಗಳಿಗೆ ಭಾವನಾತ್ಮಕ ಪ್ರತಿಕ್ರಿಯೆ 2001 ಸಂಶೋಧಕರು ಸಾಮಾನ್ಯವಾಗಿ ತಿಂಗಳ ಅಥವಾ ವರ್ಷಗಳ ಸಂಗ್ರಹಿಸಿದ ರೆಟ್ರೋಸ್ಪೆಕ್ಟಿವ್ ದಶಮಾಂಶ ಬಳಸಿಕೊಂಡು ದುರಂತ ಘಟನೆಗಳು ಪ್ರತಿಕ್ರಿಯೆಯಾಗಿ ಅಧ್ಯಯನ ಅಧ್ಯಯನ. ಆದರೆ, ಬ್ಯಾಕ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು 85,000 ಅಮೆರಿಕನ್ ಒಂದು ಯಾವಾಗಲೂ ಆನ್ ಡಿಜಿಟಲ್ ಕುರುಹುಗಳು-timestamped ಮೂಲ, ಸ್ವಯಂಚಾಲಿತವಾಗಿ ರೆಕಾರ್ಡ್ ಸಂದೇಶಗಳನ್ನು ಕಂಡು ಪೇಜರ್ ಗಳು ಮತ್ತು ಈ ಹೆಚ್ಚು ಸೂಕ್ಷ್ಮ ಕಾಲಾವಧಿ ಮೇಲೆ ಭಾವನಾತ್ಮಕ ಪ್ರತಿಕ್ರಿಯೆ ಅಧ್ಯಯನ ಸಂಶೋಧಕರು ಸಕ್ರಿಯಗೊಳಿಸಲಾಗಿದೆ. ಬ್ಯಾಕ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು (1) ದುಃಖ ಸಂಬಂಧಿಸಿದ ಪದಗಳ ಶೇಕಡಾವಾರು ಪೇಜರ್ ಸಂದೇಶಗಳನ್ನು ಭಾವನಾತ್ಮಕ ವಿಷಯ ಕೋಡಿಂಗ್ ಮೂಲಕ ಸೆಪ್ಟೆಂಬರ್ 11 ಒಂದು ನಿಮಿಷ ಮೂಲಕ ನಿಮಿಷ ಭಾವನಾತ್ಮಕ ಟೈಮ್ಲೈನ್ ದಾಖಲಿಸಿದವರು (ಉದಾ, ಅಳುವುದು, ದುಃಖ) (, (2) ಆತಂಕ ಉದಾ ಚಿಂತೆ, ಭಯದಿಂದ) ಮತ್ತು (3) ಕೋಪ (ಉದಾ, ದ್ವೇಷ, ವಿಮರ್ಶಾತ್ಮಕ). ಅವರು ದುಃಖ ಮತ್ತು ಆತಂಕ ಪ್ರಬಲ ಮಾದರಿ ಇಲ್ಲದೆ ದಿನವಿಡೀ ಏರುಪೇರಾಯಿತು ಕಂಡುಕೊಂಡರು, ಆದರೆ ಕೋಪದಲ್ಲಿ ಹೊಡೆಯುವ ಹೆಚ್ಚಳ ದಿನವಿಡೀ ಎಂದು. ಪ್ರಮಾಣಿತ ವಿಧಾನಗಳನ್ನು ಅನುಸರಿಸಿ ಅನಿರೀಕ್ಷಿತ ಘಟನೆ ತಕ್ಷಣ ಇಂತಹ ಹೆಚ್ಚಿನ ರೆಸಲ್ಯೂಶನ್ ಟೈಮ್ಲೈನ್ ಅಸಾಧ್ಯ ಎಂದು: ಈ ಸಂಶೋಧನೆ ಯಾವಾಗಲೂ ಆನ್ ದಶಮಾಂಶ ಮೂಲಗಳ ವಿದ್ಯುತ್ ಅದ್ಭುತ ವಿವರಣೆ ತೋರುತ್ತದೆ.
ಕೇವಲ ಒಂದು ವರ್ಷದ ನಂತರ, ಆದಾಗ್ಯೂ, ಸಿಂಥಿಯಾ Pury (2011) ಮಾಹಿತಿ ಹೆಚ್ಚು ಎಚ್ಚರಿಕೆಯಿಂದ ನೋಡುತ್ತಿದ್ದರು. ಅವರು ಬಹುಶಃ ಕೋಪಗೊಂಡ ಸಂದೇಶಗಳನ್ನು ದೊಡ್ಡ ಸಿಂಗಲ್ ಪೇಜರ್ ರಚಿತವಾದ ಮತ್ತು ಅವರು ಎಲ್ಲಾ ಒಂದೇ ಎಂದು ಕಂಡುಹಿಡಿದರು. ಇಲ್ಲಿ ಆ ಬಹುಶಃ ಕೋಪಗೊಂಡ ಸಂದೇಶಗಳನ್ನು ಹೇಳಿದರು ಇಲ್ಲಿದೆ:
"ರೀಬೂಟ್ ಎನ್ಟಿ ಯಂತ್ರ [ಹೆಸರು] ಕ್ಯಾಬಿನೆಟ್ [ಹೆಸರು] [ಸ್ಥಳ] ನಲ್ಲಿ: ನಿರ್ಣಾಯಕ: [ದಿನಾಂಕ ಮತ್ತು ಸಮಯ]"
ಅವರು ಸಾಮಾನ್ಯವಾಗಿ ಕೋಪದ ಸೂಚಿಸುತ್ತದೆ ಆದರೆ ಈ ಸಂದರ್ಭದಲ್ಲಿ ಮಾಡುವುದಿಲ್ಲ ಇದು ಪದ "ವಿಮರ್ಶಾತ್ಮಕ" ಒಳಗೊಂಡಿತ್ತು ಏಕೆಂದರೆ ಈ ಸಂದೇಶಗಳನ್ನು ಕೋಪಗೊಂಡ ಹೆಸರಿಸಿತು. ಈ ಒಂದೇ ಸ್ವಯಂಚಾಲಿತ ಪೇಜರ್ ರಚಿತವಾದ ಸಂದೇಶಗಳನ್ನು ತೆಗೆದು ಸಂಪೂರ್ಣವಾಗಿ ದಿನ (ಚಿತ್ರ 2.2) ಅವಧಿಯಲ್ಲಿ ಕೋಪ ಗೋಚರಿಸಿತು ಹೆಚ್ಚಳ ನಿವಾರಿಸುತ್ತದೆ. ಅರ್ಥಾತ್, ಮುಖ್ಯ ಪರಿಣಾಮವಾಗಿ Back, Küfner, and Egloff (2010) ಒಂದು ಪೇಜರ್ ಒಂದು ಕಲಾಕೃತಿ ಆಗಿತ್ತು. ಈ ಉದಾಹರಣೆಯಲ್ಲಿ ವಿವರಿಸುವಂತೆ, ತುಲನಾತ್ಮಕವಾಗಿ ಸಂಕೀರ್ಣ ಮತ್ತು ಗೊಂದಲಮಯ ದತ್ತಾಂಶದ ಸರಳ ವಿಶ್ಲೇಷಣೆ ಗಂಭೀರವಾಗಿ ತಪ್ಪು ಹೋಗಲು ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿದೆ.
ಅನುದ್ದೇಶಪೂರ್ವಕವಾಗಿ ಅಂತಹ ಒಂದು ಗದ್ದಲದ ರಿಂದ ರಚಿತವಾಗುತ್ತದೆ ಕೊಳಕು ಡೇಟಾ ಪೇಜರ್ ಅನ್ನು ಸಮಂಜಸವಾದ ಎಚ್ಚರಿಕೆಯಿಂದ ಸಂಶೋಧಕ ಪತ್ತೆ ಆದರೆ, ಉದ್ದೇಶಪೂರ್ವಕ ಸ್ಪ್ಯಾಮರ್ ಆಕರ್ಷಿಸುವ ಕೆಲವು ಆನ್ಲೈನ್ ವ್ಯವಸ್ಥೆಗಳನ್ನು. ಈ ಸ್ಪ್ಯಾಮರ್ ಸಕ್ರಿಯವಾಗಿ ನಕಲಿ ದಶಮಾಂಶ ಸೃಷ್ಟಿಸಲು, ಮತ್ತು ತಮ್ಮ ಸ್ಪಾಮಿಂಗ್ ಮರೆಮಾಚುವ ಇರಿಸಿಕೊಳ್ಳಲು ತುಂಬಾ ಹಾರ್ಡ್ ಲಾಭ ಕೆಲಸ ಪ್ರೇರಣೆ. ಉದಾಹರಣೆಗೆ, ಟ್ವಿಟರ್ ರಾಜಕೀಯ ಚಟುವಟಿಕೆ ಕೆಲವು ರಾಜಕೀಯ ಕಾರಣಗಳು ಉದ್ದೇಶಪೂರ್ವಕವಾಗಿ ಅವರು ನಿಜವಾದ ಹೆಚ್ಚು ಜನಪ್ರಿಯ ಕಾಣುವಂತೆ ಮಾಡಲಾಗುತ್ತದೆ ಆ ಕನಿಷ್ಠ ಕೆಲವು ಸಮಂಜಸವಾಗಿ ಅತ್ಯಾಧುನಿಕ ಸ್ಪ್ಯಾಮ್, ಸೇರಿವೆ ತೋರುತ್ತದೆ (Ratkiewicz et al. 2011) . ಡೇಟಾ ಕೆಲಸ ಸಂಶೋಧಕರು ಉದ್ದೇಶಪೂರ್ವಕ ಸ್ಪ್ಯಾಮ್ ಹೊಂದಿರಬಹುದು ಅವರು ಪತ್ತೆ ಮತ್ತು ಸಂಬಂಧಿತ ಸ್ಪ್ಯಾಮ್ ತೆಗೆದು ಹಾಕಿದ್ದೇವೆ ಎಂದು ತಮ್ಮ ಪ್ರೇಕ್ಷಕರನ್ನು ಮನವೊಲಿಸುವಲ್ಲಿ ಸವಾಲನ್ನು ಎದುರಿಸಬೇಕಾಗುತ್ತದೆ.
ಅಂತಿಮವಾಗಿ, ಪರಿಗಣಿಸುವ ಕೊಳಕು ಡೇಟಾ ನಿಮ್ಮ ಸಂಶೋಧನೆ ಪ್ರಶ್ನೆಗಳನ್ನು ಸೂಕ್ಷ್ಮ ರೀತಿಯಲ್ಲಿ ಅವಲಂಬಿಸುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ವಿಕಿಪೀಡಿಯ ಹೆಚ್ಚು ಸಂಪಾದನೆಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತ ಬಾಟ್ಗಳನ್ನು ರಚಿಸಲಾಗಿದೆ (Geiger 2014) . ನೀವು ವಿಕಿಪೀಡಿಯ ಪರಿಸರ ಆಸಕ್ತಿ ಇದ್ದರೆ, ನಂತರ ಈ ಬಾಟ್ಗಳನ್ನು ಮುಖ್ಯ. ಆದರೆ, ನೀವು ಮಾನವರು ವಿಕಿಪೀಡಿಯ ಕೊಡುಗೆ ಹೇಗೆ ಆಸಕ್ತಿ ವೇಳೆ, ಈ ಬಾಟ್ಗಳನ್ನು ಮಾಡಿದ ಈ ಸಂಪಾದನೆಗಳನ್ನು ಹೊರಗಿಡಬೇಕು.
ವಂಚನೆಗೊಳಗಾಗುವುದಿಲ್ಲ ತಪ್ಪಿಸಲು ಉತ್ತಮ ರೀತಿಯಲ್ಲಿ ಕೊಳಕು ಡೇಟಾ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಸರಳ ಚೆದುರಿದ ಪ್ಲಾಟ್ಗಳು ಮಾಡುವ, ಸರಳ ಪರಿಶೋಧನಾತ್ಮಕ ವಿಶ್ಲೇಷಣೆ ಮಾಡಲು ರಚಿಸಲಾಯಿತು ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಅದಕ್ಕೆ.