ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳಲ್ಲಿನ ಮಾಪನವು ವರ್ತನೆಯನ್ನು ಬದಲಿಸುವ ಸಾಧ್ಯತೆಯಿದೆ.
ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಯ ಒಂದು ಸವಾಲು ಎಂಬುದು ಜನರು ಸಂಶೋಧಕರ ಗಮನಕ್ಕೆ ಬಂದರೆ ಅವರು ತಮ್ಮ ವರ್ತನೆಯನ್ನು ಬದಲಾಯಿಸಬಹುದು ಎಂಬುದು. ಸಾಮಾಜಿಕ ವಿಜ್ಞಾನಿಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಈ ಪ್ರತಿಕ್ರಿಯಾತ್ಮಕತೆಯನ್ನು (Webb et al. 1966) . ಉದಾಹರಣೆಗೆ, ಕ್ಷೇತ್ರ ಅಧ್ಯಯನಗಳು ಹೆಚ್ಚಾಗಿ ಪ್ರಯೋಗಾಲಯ ಅಧ್ಯಯನಗಳಲ್ಲಿ ಹೆಚ್ಚು ಉದಾರವಾಗಿರಬಹುದು ಏಕೆಂದರೆ (Levitt and List 2007a) ಅವರು ಅವನ್ನು ಗಮನಿಸುತ್ತಿದ್ದಾರೆ (Levitt and List 2007a) . ಅನೇಕ ಸಂಶೋಧಕರು ಭರವಸೆಯಿರುವ ದೊಡ್ಡ ಡೇಟಾದ ಒಂದು ಅಂಶವೆಂದರೆ ಭಾಗವಹಿಸುವವರು ಸಾಮಾನ್ಯವಾಗಿ ತಮ್ಮ ಡೇಟಾವನ್ನು ಸೆರೆಹಿಡಿಯಲಾಗುತ್ತಿದ್ದಾರೆ ಅಥವಾ ಅವರು ಈ ಡೇಟಾ ಸಂಗ್ರಹಣೆಗೆ ಎಷ್ಟು ಒಗ್ಗಿಕೊಂಡಿರುತ್ತಾರೆ ಎಂಬುದು ಅವರ ಅರಿವು ಇಲ್ಲ. ಭಾಗವಹಿಸುವವರು ನಿಷ್ಪರಿಣಾಮಕಾರಿಯಾದ ಕಾರಣ, ಆದ್ದರಿಂದ, ದೊಡ್ಡ ಡೇಟಾದ ಅನೇಕ ಮೂಲಗಳನ್ನು ಹಿಂದೆಂದೂ ನಿಖರ ಅಳತೆಗೆ ಅನುಗುಣವಾಗಿಲ್ಲದ ವರ್ತನೆಯನ್ನು ಅಧ್ಯಯನ ಮಾಡಲು ಬಳಸಬಹುದು. ಉದಾಹರಣೆಗೆ, Stephens-Davidowitz (2014) ಯುನೈಟೆಡ್ ಸ್ಟೇಟ್ಸ್ನ ವಿವಿಧ ಪ್ರದೇಶಗಳಲ್ಲಿ ವರ್ಣಭೇದ ನೀತಿಯನ್ನು ಅಳೆಯಲು ಸರ್ಚ್ ಎಂಜಿನ್ ಪ್ರಶ್ನೆಗಳಲ್ಲಿ ಜನಾಂಗೀಯ ಪದಗಳ ಪ್ರಭುತ್ವವನ್ನು ಬಳಸಿಕೊಂಡರು. ಸಮೀಕ್ಷೆಗಳು ಮುಂತಾದ ಇತರ ವಿಧಾನಗಳನ್ನು ಬಳಸುವುದು ಕಷ್ಟಕರವಾದ ಹುಡುಕಾಟ ಡೇಟಾ ಸಕ್ರಿಯಗೊಳಿಸಲಾದ ಅಳತೆಗಳ ಸ್ವಭಾವವಿಲ್ಲದ ಮತ್ತು ದೊಡ್ಡದು (ವಿಭಾಗ 2.3.1 ಅನ್ನು ನೋಡಿ).
ಆದಾಗ್ಯೂ, ಈ ಡೇಟಾವು ಹೇಗಾದರೂ ಜನರ ನಡವಳಿಕೆಯ ಅಥವಾ ವರ್ತನೆಗಳ ನೇರ ಪ್ರತಿಬಿಂಬವಾಗಿದೆಯೆ ಎಂದು ನಿಷ್ಪಕ್ಷಪಾತವು ಖಾತರಿಪಡಿಸುವುದಿಲ್ಲ. ಉದಾಹರಣೆಗೆ, ಒಬ್ಬ ಸಂದರ್ಶಕ-ಆಧಾರಿತ ಅಧ್ಯಯನದಲ್ಲಿ ಪ್ರತಿಕ್ರಿಯಿಸಿದವರು, "ನನಗೆ ಸಮಸ್ಯೆಗಳಿಲ್ಲ, ನಾನು ಅವರನ್ನು ಫೇಸ್ಬುಕ್ನಲ್ಲಿ (Newman et al. 2011) " (Newman et al. 2011) . ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಕೆಲವು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳು ನಿಷ್ಪರಿಣಾಮಕಾರಿಯಾಗಿದ್ದರೂ ಸಹ, ಅವು ಯಾವಾಗಲೂ ಸಾಮಾಜಿಕ ಉದ್ದೇಶಪೂರ್ವಕವಾದ ಪಕ್ಷಪಾತದಿಂದ ಮುಕ್ತವಾಗಿರುವುದಿಲ್ಲ, ಜನರು ತಮ್ಮನ್ನು ತಾವು ಸಾಧ್ಯವಾದಷ್ಟು ಉತ್ತಮ ರೀತಿಯಲ್ಲಿ ಪ್ರಸ್ತುತಪಡಿಸಲು ಬಯಸುವ ಪ್ರವೃತ್ತಿ. ಮತ್ತಷ್ಟು, ನಾನು ನಂತರ ಅಧ್ಯಾಯದಲ್ಲಿ ವಿವರಿಸಲು ಎಂದು, ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳು ವಶಪಡಿಸಿಕೊಂಡಿತು ನಡವಳಿಕೆಯನ್ನು ಕೆಲವೊಮ್ಮೆ ವೇದಿಕೆ ಮಾಲೀಕರು ಗುರಿಗಳನ್ನು ಪ್ರಭಾವ ಇದೆ, ನಾನು ಅಲ್ಗಾರಿದಮ್ ಗೊಂದಲ ಕರೆ ಮಾಡುತ್ತೇವೆ ಸಮಸ್ಯೆಯನ್ನು. ಅಂತಿಮವಾಗಿ, ನಿಷ್ಪರಿಣಾಮಕಾರಿಯು ಸಂಶೋಧನೆಗೆ ಪ್ರಯೋಜನಕಾರಿಯಾಗಿದೆ, ಜನರ ಸಮ್ಮತಿಯಿಲ್ಲದೆ ಅವರ ಒಪ್ಪಿಗೆಯಿಲ್ಲದೆ ಜಾಗೃತಿ ಮೂಡಿಸುತ್ತದೆ ಮತ್ತು ನಾನು 6 ನೇ ಅಧ್ಯಾಯದಲ್ಲಿ ವಿವರವಾಗಿ ವಿವರಿಸುವ ನೈತಿಕ ಕಾಳಜಿಯನ್ನು ಹುಟ್ಟುಹಾಕುತ್ತದೆ.
ನಾನು ವಿವರಿಸಿದ ಮೂರು ಗುಣಲಕ್ಷಣಗಳು - ದೊಡ್ಡ, ಯಾವಾಗಲೂ, ಮತ್ತು nonreactive- ಸಾಮಾನ್ಯವಾಗಿ, ಆದರೆ ಯಾವಾಗಲೂ ಅಲ್ಲ, ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಗೆ ಪ್ರಯೋಜನಕಾರಿ. ಮುಂದೆ, ನಾನು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳ ಏಳು ಗುಣಲಕ್ಷಣಗಳನ್ನು-ಅಪೂರ್ಣ, ಪ್ರವೇಶಿಸಲಾಗದ, ಪ್ರತಿನಿಧಿ, ತೇಲುತ್ತವೆ, ಕ್ರಮಾನುಗುಣವಾಗಿ ಗೊಂದಲಕ್ಕೊಳಗಾದ, ಕೊಳಕು ಮತ್ತು ಸಂವೇದನಾಶೀಲತೆಗೆ ತಿರುಗುತ್ತೇನೆ-ಸಾಮಾನ್ಯವಾಗಿ ಯಾವಾಗಲೂ, ಸಂಶೋಧನೆಗೆ ಸಮಸ್ಯೆಗಳನ್ನುಂಟುಮಾಡುತ್ತದೆ.