[ , ಅಲ್ಗಾರಿದಮ್ ಗೊಂದಲವು ಗೂಗಲ್ ಫ್ಲೂ ಟ್ರೆಂಡ್ಸ್ನ ಸಮಸ್ಯೆಯಾಗಿದೆ. Lazer et al. (2014) ಕಾಗದವನ್ನು ಓದಿ Lazer et al. (2014) , ಮತ್ತು ಸಮಸ್ಯೆಯನ್ನು ವಿವರಿಸುವ ಮತ್ತು ಎಂಜಿನಿಯರ್ಗೆ ಸಣ್ಣ, ಸ್ಪಷ್ಟವಾದ ಇಮೇಲ್ ಅನ್ನು ಬರೆಯಿರಿ ಮತ್ತು ಹೇಗೆ ಅದನ್ನು ಬಗೆಹರಿಸಬೇಕೆಂಬ ಕಲ್ಪನೆಯನ್ನು ನೀಡುತ್ತದೆ.
[ ] Bollen, Mao, and Zeng (2011) ಟ್ವಿಟ್ಟರ್ನಿಂದ ಡೇಟಾವನ್ನು ಸ್ಟಾಕ್ ಮಾರ್ಕೆಟ್ ಅನ್ನು ಊಹಿಸಲು ಬಳಸಿಕೊಳ್ಳುತ್ತಾರೆ ಎಂದು ಹೇಳುತ್ತದೆ. ಈ ಶೋಧನೆಯು ಹೆಡ್ಜ್ ಫಂಡ್-ಡರ್ವೆಂಟ್ ಕ್ಯಾಪಿಟಲ್ ಮಾರ್ಕೆಟ್ಸ್ ಸೃಷ್ಟಿಗೆ ಕಾರಣವಾಯಿತು - ಟ್ವಿಟ್ಟರ್ (Jordan 2010) ನಿಂದ ಸಂಗ್ರಹಿಸಿದ ಡೇಟಾವನ್ನು ಆಧರಿಸಿ ಷೇರು ಮಾರುಕಟ್ಟೆಯಲ್ಲಿ ಬಂಡವಾಳ ಹೂಡಲು. ಆ ಹಣದಲ್ಲಿ ನಿಮ್ಮ ಹಣವನ್ನು ಹಾಕುವ ಮೊದಲು ನೀವು ಯಾವ ಸಾಕ್ಷಿಯನ್ನು ನೋಡಲು ಬಯಸುತ್ತೀರಿ?
[ ಕೆಲವು ಸಾರ್ವಜನಿಕ ಆರೋಗ್ಯ ವಕೀಲರು ಇ-ಸಿಗರೆಟ್ಗಳನ್ನು ಧೂಮಪಾನ ನಿಷೇಧಕ್ಕೆ ಪರಿಣಾಮಕಾರಿಯಾದ ಚಿಕಿತ್ಸೆಯೆಂದು ಪರಿಗಣಿಸಿದಾಗ, ಹೆಚ್ಚಿನವರು ನಿಕೋಟಿನ್ನ ಉನ್ನತ ಮಟ್ಟದ ಅಪಾಯಗಳ ಬಗ್ಗೆ ಎಚ್ಚರಿಸುತ್ತಾರೆ. ಇ-ಸಿಗರೆಟ್-ಸಂಬಂಧಿತ ಟ್ವಿಟರ್ ಪೋಸ್ಟ್ಗಳನ್ನು ಸಂಗ್ರಹಿಸಿ ಸೆಂಟಿಮೆಂಟ್ ವಿಶ್ಲೇಷಣೆಯನ್ನು ನಡೆಸುವ ಮೂಲಕ ಇ-ಸಿಗರೇಟ್ ಕಡೆಗೆ ಸಾರ್ವಜನಿಕ ಅಭಿಪ್ರಾಯವನ್ನು ಅಧ್ಯಯನ ಮಾಡಲು ಸಂಶೋಧಕರು ನಿರ್ಧರಿಸುತ್ತಾರೆ ಎಂದು ಊಹಿಸಿಕೊಳ್ಳಿ.
[ ] 2009 ರ ನವೆಂಬರ್ನಲ್ಲಿ, "ಏನು ನಡೆಯುತ್ತಿದೆ?" (Https://blog.twitter.com/2009/whats-happening) ಗೆ "ವಾಟ್ ಇಸ್ ಡೂಯಿಂಗ್?" ನಿಂದ ಟ್ವೀಟ್ ಬಾಕ್ಸ್ನಲ್ಲಿ ಟ್ವಿಟರ್ ಪ್ರಶ್ನೆಯನ್ನು ಬದಲಾಯಿಸಿತು.
[ ] "Retweets" ಅನ್ನು ಹೆಚ್ಚಾಗಿ ಟ್ವಿಟರ್ನಲ್ಲಿ ಪ್ರಭಾವದ ಪ್ರಭಾವ ಮತ್ತು ಹರಡುವಿಕೆಯನ್ನು ಅಳೆಯಲು ಬಳಸಲಾಗುತ್ತದೆ. ಆರಂಭದಲ್ಲಿ, ಬಳಕೆದಾರರಿಗೆ ಅವರು ಇಷ್ಟಪಟ್ಟ ಟ್ವೀಟ್ ಅನ್ನು ನಕಲಿಸಿ ಮತ್ತು ಅಂಟಿಸಬೇಕು, ಅವನ / ಅವಳ ಹ್ಯಾಂಡಲ್ನೊಂದಿಗೆ ಮೂಲ ಲೇಖಕನನ್ನು ಟ್ಯಾಗ್ ಮಾಡಬೇಕಾಗಿತ್ತು, ಮತ್ತು ಅದನ್ನು ರಿಟ್ವೀಟ್ ಎಂದು ಸೂಚಿಸಲು ಟ್ವೀಟ್ಗೆ ಮೊದಲು "ಆರ್ಟಿ" ಎಂದು ಹಸ್ತಚಾಲಿತವಾಗಿ ಟೈಪ್ ಮಾಡಿ. ನಂತರ, 2009 ರಲ್ಲಿ, ಟ್ವಿಟರ್ "ರಿಟ್ವೀಟ್" ಗುಂಡಿಯನ್ನು ಸೇರಿಸಿತು. ಜೂನ್ 2016 ರಲ್ಲಿ, ಟ್ವಿಟರ್ ಬಳಕೆದಾರರು ತಮ್ಮ ಟ್ವೀಟ್ಗಳನ್ನು ಮರುಪಡೆಯಲು ಸಾಧ್ಯವಾಯಿತು (https://twitter.com/twitter/status/742749353689780224). ನಿಮ್ಮ ಸಂಶೋಧನೆಯಲ್ಲಿ "retweets" ಅನ್ನು ನೀವು ಹೇಗೆ ಬಳಸುತ್ತೀರಿ ಎಂಬುದನ್ನು ಈ ಬದಲಾವಣೆಗಳು ಪರಿಣಾಮ ಬೀರಬೇಕೆಂದು ನೀವು ಯೋಚಿಸುತ್ತೀರಾ? ಏಕೆ ಅಥವಾ ಏಕೆ ಅಲ್ಲ?
[ , , , ವ್ಯಾಪಕವಾಗಿ ಚರ್ಚಿಸಿದ ಕಾಗದದಲ್ಲಿ, ಮೈಕೆಲ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು (2011) ದೀರ್ಘಕಾಲದ ಸಾಂಸ್ಕೃತಿಕ ಪ್ರವೃತ್ತಿಯನ್ನು ಗುರುತಿಸುವ ಪ್ರಯತ್ನದಲ್ಲಿ ಐದು ದಶಲಕ್ಷಕ್ಕೂ ಹೆಚ್ಚಿನ ಡಿಜಿಟೈಜ್ ಪುಸ್ತಕಗಳ ವಿಷಯವನ್ನು ವಿಶ್ಲೇಷಿಸಿದ್ದಾರೆ. ಅವರು ಬಳಸಿದ ಡೇಟಾವನ್ನು ಈಗ Google NGrams ಡೇಟಾಬೇಸ್ ಎಂದು ಬಿಡುಗಡೆ ಮಾಡಲಾಗಿದೆ, ಆದ್ದರಿಂದ ನಾವು ಅವರ ಕೆಲವು ಕೆಲಸವನ್ನು ಪುನರಾವರ್ತಿಸಲು ಮತ್ತು ವಿಸ್ತರಿಸಲು ಡೇಟಾವನ್ನು ಬಳಸಬಹುದು.
ಕಾಗದದ ಅನೇಕ ಫಲಿತಾಂಶಗಳಲ್ಲಿ ಒಂದಾದ ಮೈಕೆಲ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ನಾವು ವೇಗವಾಗಿ ಮತ್ತು ವೇಗವಾಗಿ ಮರೆಯುತ್ತೇವೆ ಎಂದು ವಾದಿಸಿದರು. ಒಂದು ನಿರ್ದಿಷ್ಟ ವರ್ಷಕ್ಕೆ, "1883" ಎಂದು 1875 ಮತ್ತು 1975 ರ ನಡುವೆ ಪ್ರತಿ ವರ್ಷ ಪ್ರಕಟವಾದ 1-ಗ್ರಾಂಗಳ ಅನುಪಾತವನ್ನು "1883" ಎಂದು ಅವರು ಹೇಳುತ್ತಾರೆ. ಈ ಅನುಪಾತವು ಆ ವರ್ಷದಲ್ಲಿ ಸಂಭವಿಸಿದ ಘಟನೆಗಳ ಆಸಕ್ತಿಯ ಒಂದು ಅಳತೆ ಎಂದು ಅವರು ವಾದಿಸಿದರು. ತಮ್ಮ ಚಿತ್ರದಲ್ಲಿ 3 ಎ, ಅವರು ಮೂರು ವರ್ಷಗಳವರೆಗೆ ಬಳಕೆಯ ಪಥವನ್ನು ಯೋಜಿಸಿದ್ದಾರೆ: 1883, 1910, ಮತ್ತು 1950. ಈ ಮೂರು ವರ್ಷಗಳು ಸಾಮಾನ್ಯ ಮಾದರಿಯನ್ನು ಹಂಚಿಕೊಳ್ಳುತ್ತವೆ: ಆ ವರ್ಷಕ್ಕಿಂತ ಕಡಿಮೆ ಬಳಕೆ, ನಂತರ ಒಂದು ಸ್ಪೈಕ್, ನಂತರ ಕೊಳೆತ. ಮುಂದೆ, ಪ್ರತಿ ವರ್ಷವೂ ಕೊಳೆತ ಪ್ರಮಾಣವನ್ನು ಪ್ರಮಾಣೀಕರಿಸಲು, ಮೈಕೆಲ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಪ್ರತಿ ವರ್ಷವೂ "ವರ್ಷಕ್ಕೊಮ್ಮೆ" 1875 ಮತ್ತು 1975 ರ ನಡುವೆ "ಅರೆ-ಜೀವಿತಾವಧಿಯನ್ನು" ಲೆಕ್ಕಾಚಾರ ಮಾಡಿದರು. ಅವರ ಚಿತ್ರ 3a (ಒಳಹೊಕ್ಕು) ಯಲ್ಲಿ, ವರ್ಷವು ಕಡಿಮೆಯಾಗುತ್ತಿದೆ, ಮತ್ತು ಇದರರ್ಥ ನಾವು ಹಿಂದಿನದನ್ನು ವೇಗವಾಗಿ ಮತ್ತು ವೇಗವಾಗಿ ಮರೆಯುತ್ತಿದ್ದೇವೆ ಎಂದು ಅವರು ವಾದಿಸಿದ್ದಾರೆ. ಅವರು ಇಂಗ್ಲಿಷ್ ಭಾಷೆ ಕಾರ್ಪಸ್ನ ಆವೃತ್ತಿ 1 ಅನ್ನು ಬಳಸಿದರು, ಆದರೆ ತರುವಾಯ ಗೂಗಲ್ ಕಾರ್ಪಸ್ನ ಎರಡನೆಯ ಆವೃತ್ತಿಯನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದೆ. ನೀವು ಕೋಡಿಂಗ್ ಪ್ರಾರಂಭಿಸುವ ಮೊದಲು ಪ್ರಶ್ನೆಯ ಎಲ್ಲಾ ಭಾಗಗಳನ್ನು ಓದಿ.
ಈ ಚಟುವಟಿಕೆಯು ನೀವು ಮರುಬಳಕೆಯ ಕೋಡ್ ಅನ್ನು ಅಭ್ಯಾಸ ಮಾಡುವುದು, ಫಲಿತಾಂಶಗಳನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುವುದು ಮತ್ತು ಡೇಟಾ ಸುತ್ತುವರಿಯುವಿಕೆ (ವಿಚಿತ್ರವಾದ ಫೈಲ್ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವುದು ಮತ್ತು ಕಳೆದುಹೋದ ಡೇಟಾವನ್ನು ನಿರ್ವಹಿಸುವುದು). ಈ ಚಟುವಟಿಕೆಯು ನಿಮಗೆ ಶ್ರೀಮಂತ ಮತ್ತು ಆಸಕ್ತಿದಾಯಕ ಡೇಟಾಸಮೂಹದೊಂದಿಗೆ ಚಾಲನೆಗೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
Google Books NGRM ವೀಕ್ಷಕ ವೆಬ್ಸೈಟ್ನಿಂದ ಕಚ್ಚಾ ಡೇಟಾವನ್ನು ಪಡೆಯಿರಿ. ನಿರ್ದಿಷ್ಟವಾಗಿ, ನೀವು ಜುಲೈ 1, 2012 ರಂದು ಬಿಡುಗಡೆಯಾದ ಇಂಗ್ಲಿಷ್ ಭಾಷೆ ಕಾರ್ಪಸ್ ನ ಆವೃತ್ತಿ 2 ಅನ್ನು ಬಳಸಬೇಕು. ಸಂಕ್ಷೇಪಿಸದ ಈ ಫೈಲ್ 1.4 ಜಿಬಿ ಆಗಿದೆ.
Michel et al. (2011) ಚಿತ್ರದ 3a ನ ಮುಖ್ಯ ಭಾಗವನ್ನು ಪುನಃ ಪಡೆದುಕೊಳ್ಳಿ Michel et al. (2011) . ಈ ಸಂಖ್ಯೆಯನ್ನು ಪುನಃ ಮಾಡಲು, ನೀವು ಎರಡು ಫೈಲ್ಗಳನ್ನು ಮಾಡಬೇಕಾಗುತ್ತದೆ: ನೀವು ಭಾಗ (ಎ) ಮತ್ತು "ಒಟ್ಟು ಎಣಿಕೆಗಳು" ಫೈಲ್ನಲ್ಲಿ ಡೌನ್ಲೋಡ್ ಮಾಡಿದ ಒಂದು, ನೀವು ಕಚ್ಚಾ ಎಣಿಕೆಗಳನ್ನು ಪ್ರಮಾಣದಲ್ಲಿ ಪರಿವರ್ತಿಸಲು ಬಳಸಿಕೊಳ್ಳಬಹುದು. ಒಟ್ಟು ಎಣಿಕೆಗಳ ಫೈಲ್ ಅನ್ನು ರಚಿಸುವ ಒಂದು ರಚನೆಯನ್ನು ಹೊಂದಿದೆ ಎಂದು ಗಮನಿಸಿ. NGram ಡೇಟಾದ ಆವೃತ್ತಿ 2 Michel et al. (2011) ಪ್ರಸ್ತುತಪಡಿಸಿದಂತೆಯೇ ಇದೇ ರೀತಿಯ ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡುತ್ತದೆ Michel et al. (2011) , ಆವೃತ್ತಿ 1 ಡೇಟಾವನ್ನು ಆಧರಿಸಿವೆ?
ಈಗ ನಿಮ್ಮ ಗ್ರಾಫ್ ಅನ್ನು ಎನ್ಜಿಆರ್ಮ್ ವೀಕ್ಷಕರಿಂದ ರಚಿಸಲಾದ ಗ್ರಾಫ್ ವಿರುದ್ಧ ಪರಿಶೀಲಿಸಿ.
ಫಿಗರ್ 3 ಎ (ಮುಖ್ಯ ವ್ಯಕ್ತಿ) ಅನ್ನು ಮರುಸೃಷ್ಟಿಸಿ, ಆದರೆ \(y\) -ಆಕ್ಸಿಸ್ ಅನ್ನು ಕಚ್ಚಾ ಉಲ್ಲೇಖದ ಎಣಿಕೆಯನ್ನಾಗಿ (ಉಲ್ಲೇಖಗಳ ದರವಲ್ಲ \(y\) ಬದಲಿಸಿ.
(ಬಿ) ಮತ್ತು (ಡಿ) ನಡುವಿನ ವ್ಯತ್ಯಾಸವು ಮಿಚೆಲ್ ಮತ್ತು ಇತರರ ಫಲಿತಾಂಶಗಳನ್ನು ಮರು ಪರೀಕ್ಷಿಸಲು ನಿಮ್ಮನ್ನು ದಾರಿ ಮಾಡಿಕೊಡುತ್ತದೆ. (2011). ಏಕೆ ಅಥವಾ ಏಕೆ ಅಲ್ಲ?
ಈಗ, ಉಲ್ಲೇಖಗಳ ಅನುಪಾತವನ್ನು ಬಳಸಿಕೊಂಡು, ಫಿಗರ್ 3a ನ ಒಳಭಾಗವನ್ನು ಪುನರಾವರ್ತಿಸಿ. ಅಂದರೆ, 1875 ಮತ್ತು 1975 ರ ನಡುವೆ ಪ್ರತಿ ವರ್ಷವೂ ಆ ವರ್ಷದ ಅರ್ಧ-ಅವಧಿಯನ್ನು ಲೆಕ್ಕಹಾಕುತ್ತದೆ. ಅರ್ಧ-ಜೀವನವನ್ನು ಅರ್ಧದಷ್ಟು ಅದರ ಮೌಲ್ಯದ ಮೌಲ್ಯವನ್ನು ತಲುಪುವ ಮುನ್ನವೇ ಹಾದುಹೋಗುವ ವರ್ಷಗಳ ಸಂಖ್ಯೆ ಎಂದು ವ್ಯಾಖ್ಯಾನಿಸಲಾಗಿದೆ. Michel et al. (2011) ಗಮನಿಸಿ Michel et al. (2011) ಅರ್ಧದಷ್ಟು ಜೀವಿತಾವಧಿಯನ್ನು ನೋಡಿಕೊಳ್ಳುವ ಭಾಗವನ್ನು III.6 ಪೋಷಕ ಆನ್ಲೈನ್ ಮಾಹಿತಿಯ ಅಂದಾಜು ಮಾಡಲು ಸಂಕೀರ್ಣವಾದ ಏನನ್ನಾದರೂ ಮಾಡುತ್ತಾರೆ-ಆದರೆ ಎರಡೂ ಮಾರ್ಗಗಳು ಇದೇ ರೀತಿಯ ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡುತ್ತವೆ ಎಂದು ಅವರು ಹೇಳುತ್ತಾರೆ. NGram ಡೇಟಾದ ಆವೃತ್ತಿ 2 Michel et al. (2011) ಪ್ರಸ್ತುತಪಡಿಸಿದಂತೆಯೇ ಇದೇ ರೀತಿಯ ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡುತ್ತದೆ Michel et al. (2011) , ಆವೃತ್ತಿ 1 ಡೇಟಾವನ್ನು ಆಧರಿಸಿವೆ? (ಸುಳಿವು: ಇಲ್ಲದಿದ್ದರೆ ಆಶ್ಚರ್ಯಪಡಬೇಡ.)
ವಿಶೇಷವಾಗಿ ತ್ವರಿತವಾಗಿ ಅಥವಾ ನಿರ್ದಿಷ್ಟವಾಗಿ ನಿಧಾನವಾಗಿ ಮರೆತುಹೋದ ವರ್ಷಗಳಿಂದ ಹೊರಹೊಮ್ಮಿದ ಯಾವುದೇ ವರ್ಷಗಳಿವೆಯೇ? ಆ ಮಾದರಿಯ ಸಂಭವನೀಯ ಕಾರಣಗಳನ್ನು ಸಂಕ್ಷಿಪ್ತವಾಗಿ ಊಹಿಸಿ ಮತ್ತು ಹೊರಗಿನವರನ್ನು ನೀವು ಹೇಗೆ ಗುರುತಿಸಿದ್ದೀರಿ ಎಂಬುದನ್ನು ವಿವರಿಸಿ.
ಈಗ ಚೀನೀ, ಫ್ರೆಂಚ್, ಜರ್ಮನ್, ಹೀಬ್ರೂ, ಇಟಾಲಿಯನ್, ರಷ್ಯನ್ ಮತ್ತು ಸ್ಪ್ಯಾನಿಷ್ ಭಾಷೆಗಳಲ್ಲಿ NGrams ಡೇಟಾದ ಆವೃತ್ತಿಯ 2 ನೇ ಆವೃತ್ತಿಗೆ ಈ ಫಲಿತಾಂಶವನ್ನು ಪುನರಾವರ್ತಿಸಿ.
ಎಲ್ಲಾ ಭಾಷೆಗಳಾದ್ಯಂತ ಹೋಲಿಸಿದರೆ, ವಿಶೇಷವಾಗಿ ವರ್ಷಗಳಲ್ಲಿ ಅಥವಾ ನಿರ್ದಿಷ್ಟವಾಗಿ ನಿಧಾನವಾಗಿ ಮರೆತುಹೋದಂತಹ ವರ್ಷಗಳಲ್ಲಿ ಹೊರಗಿನವರಾಗಿದ್ದ ಯಾವುದೇ ವರ್ಷಗಳು ಇದ್ದವು? ಆ ಮಾದರಿಯ ಸಂಭವನೀಯ ಕಾರಣಗಳನ್ನು ಸಂಕ್ಷಿಪ್ತವಾಗಿ ಊಹಿಸಿ.
[ , , , ] ಜೂನ್ 2013 ರಲ್ಲಿ NSA / PRISM ಕಣ್ಗಾವಲು (ಅಂದರೆ, ಸ್ನೋಡೆನ್ ಬಹಿರಂಗಪಡಿಸುವಿಕೆಗಳು) ಬಗ್ಗೆ ವ್ಯಾಪಕ ಪ್ರಚಾರವು ಖಾಸಗಿ ಮಾಹಿತಿಯ ಬಗ್ಗೆ ವಿಕಿಪೀಡಿಯಾದ ಲೇಖನಗಳಿಗೆ ಸಂಚಾರದಲ್ಲಿ ತೀಕ್ಷ್ಣವಾದ ಮತ್ತು ಹಠಾತ್ ಇಳಿಕೆಯೊಂದಿಗೆ ಸಂಬಂಧ ಹೊಂದಿದೆಯೆ ಎಂದು Penney (2016) ಸಂಶೋಧಿಸಿದ್ದಾರೆ. ಹಾಗಿದ್ದಲ್ಲಿ, ನಡವಳಿಕೆಯ ಈ ಬದಲಾವಣೆಯು ಸಾಮೂಹಿಕ ಕಣ್ಗಾವಲುಗಳಿಂದ ಉಂಟಾಗುವ ಚಳಿಯ ಪರಿಣಾಮದೊಂದಿಗೆ ಸ್ಥಿರವಾಗಿರುತ್ತದೆ. Penney (2016) ವಿಧಾನವನ್ನು ಕೆಲವೊಮ್ಮೆ ಅಡಚಣೆಯಾಗುವ ಸಮಯ ಸರಣಿಯ ವಿನ್ಯಾಸ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ, ಮತ್ತು ಇದು ವಿಭಾಗ 2.4.3 ರಲ್ಲಿ ವಿವರಿಸಿದ ವಿಧಾನಗಳಿಗೆ ಸಂಬಂಧಿಸಿದೆ.
ವಿಷಯದ ಕೀವರ್ಡ್ಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲು, ಪೆನ್ನಿ ಯುಎಸ್ ಡಿಪಾರ್ಟ್ಮೆಂಟ್ ಆಫ್ ಹೋಮ್ಲ್ಯಾಂಡ್ ಸೆಕ್ಯುರಿಟಿ ಬಳಸಿದ ಪಟ್ಟಿಯನ್ನು ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮದ ಮೇಲ್ವಿಚಾರಣೆ ಮತ್ತು ಮೇಲ್ವಿಚಾರಣೆಗಾಗಿ ಉಲ್ಲೇಖಿಸುತ್ತಾನೆ. ಡಿಎಚ್ಎಸ್ ಪಟ್ಟಿ ಕೆಲವು ಶೋಧ ಪದಗಳನ್ನು "ಆರೋಗ್ಯ ಕಾಳಜಿ", "ಇನ್ಫ್ರಾಸ್ಟ್ರಕ್ಚರ್ ಸೆಕ್ಯುರಿಟಿ," ಮತ್ತು "ಭಯೋತ್ಪಾದನೆ" ಎಂಬ ವಿಚಾರಗಳ ವ್ಯಾಪ್ತಿಯಲ್ಲಿ ವರ್ಗೀಕರಿಸುತ್ತದೆ. ಅಧ್ಯಯನದ ಗುಂಪಿಗೆ ಪೆನ್ನಿಯು "ಭಯೋತ್ಪಾದನೆ" ಗೆ ಸಂಬಂಧಿಸಿದ 48 ಪದಗಳನ್ನು ಬಳಸಿದನು (ಅನುಬಂಧ ಟೇಬಲ್ 8 ನೋಡಿ ). ನಂತರ ಅವರು 2012 ರ ಜನವರಿ ತಿಂಗಳ ಪ್ರಾರಂಭದಿಂದ ಆಗಸ್ಟ್ 2014 ರ ಅಂತ್ಯದವರೆಗೆ 32 ತಿಂಗಳ ಅವಧಿಯ ಅನುಗುಣವಾದ 48 ವಿಕಿಪೀಡಿಯಾ ಲೇಖನಗಳಿಗೆ ಮಾಸಿಕ ಆಧಾರದ ಮೇಲೆ ವಿಕಿಪೀಡಿಯಾದ ಲೇಖನದ ವೀಕ್ಷಣೆ ಎಣಿಕೆಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸಿದರು. ಅವರ ವಾದವನ್ನು ಬಲಪಡಿಸಲು, ಅವರು ಹಲವಾರು ಹೋಲಿಕೆ ಗುಂಪುಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಿದರು ಇತರ ವಿಷಯಗಳ ಬಗ್ಗೆ ಲೇಖನ ವೀಕ್ಷಣೆಗಳು.
ಈಗ, ನೀವು Penney (2016) ಅನ್ನು ಪುನರಾವರ್ತಿಸಲು ಮತ್ತು ವಿಸ್ತರಿಸಲಿದ್ದೀರಿ. ಈ ಚಟುವಟಿಕೆಗಾಗಿ ನೀವು ಅಗತ್ಯವಿರುವ ಎಲ್ಲಾ ಕಚ್ಚಾ ಡೇಟಾವು ವಿಕಿಪೀಡಿಯಾದಿಂದ ಲಭ್ಯವಿದೆ. ಅಥವಾ ನೀವು ಇದನ್ನು ಆರ್-ಪ್ಯಾಕೇಜ್ ವಿಕಿಪೀಡಿಯಟ್ರೆಂಡ್ (Meissner and R Core Team 2016) . ನಿಮ್ಮ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ನೀವು ಬರೆಯುವಾಗ, ನೀವು ಬಳಸಿದ ಡೇಟಾ ಮೂಲವನ್ನು ಗಮನಿಸಿ. (ಇದೇ ಚಟುವಟಿಕೆಯು ಅಧ್ಯಾಯ 6 ರಲ್ಲಿ ಕಾಣಿಸಿಕೊಳ್ಳುತ್ತದೆ ಎಂಬುದನ್ನು ನೆನಪಿಡಿ.) ಈ ಚಟುವಟಿಕೆಯು ಅಕ್ಷಾಂಶ wrangling ಮತ್ತು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳಲ್ಲಿ ನೈಸರ್ಗಿಕ ಪ್ರಯೋಗಗಳ ಬಗ್ಗೆ ಆಲೋಚನೆ ನೀವು ಅಭ್ಯಾಸ ನೀಡುತ್ತದೆ. ಭವಿಷ್ಯದ ಯೋಜನೆಗಳಿಗೆ ಇದು ನಿಮಗೆ ಆಸಕ್ತಿದಾಯಕ ಮತ್ತು ಆಸಕ್ತಿದಾಯಕ ಡೇಟಾ ಮೂಲದೊಂದಿಗೆ ಚಾಲನೆಗೊಳ್ಳುತ್ತದೆ.
[ ] Efrati (2016) ಗೌಪ್ಯ ಮಾಹಿತಿಯ ಆಧಾರದ ಮೇಲೆ, ಫೇಸ್ಬುಕ್ನಲ್ಲಿ "ಒಟ್ಟು ಹಂಚಿಕೆ" ವರ್ಷಕ್ಕಿಂತ ಸುಮಾರು 5.5% ನಷ್ಟು ಇಳಿದಿದೆ ಎಂದು ವರದಿ ಮಾಡಿದೆ, ಆದರೆ "ಮೂಲ ಪ್ರಸಾರ ಹಂಚಿಕೆ" ವರ್ಷಕ್ಕೆ 21% ಕಡಿಮೆಯಾಗಿದೆ. ಈ ಕುಸಿತ 30 ವರ್ಷಕ್ಕಿಂತ ಕಡಿಮೆ ವಯಸ್ಸಿನ ಫೇಸ್ಬುಕ್ ಬಳಕೆದಾರರೊಂದಿಗೆ ತೀವ್ರವಾಗಿ ತೀವ್ರವಾಗಿತ್ತು. ವರದಿ ಎರಡು ಅಂಶಗಳಿಗೆ ಅವನತಿಯಾಗಿದೆ ಎಂದು ಹೇಳಿದೆ. ಜನರು ಫೇಸ್ಬುಕ್ನಲ್ಲಿರುವ "ಸ್ನೇಹಿತರ" ಸಂಖ್ಯೆಯಲ್ಲಿನ ಬೆಳವಣಿಗೆಯು ಒಂದು. ಮತ್ತೊಂದೆಡೆ, ಕೆಲವು ಹಂಚಿಕೆ ಚಟುವಟಿಕೆಗಳು ಸಂದೇಶ ಕಳುಹಿಸುವಿಕೆಗೆ ಮತ್ತು ಸ್ನ್ಯಾಪ್ಚಾಟ್ನಂತಹ ಪ್ರತಿಸ್ಪರ್ಧಿಗಳಿಗೆ ಸ್ಥಳಾಂತರಗೊಂಡಿದೆ. "ಪೋಸ್ಟ್ ದಿಸ್" ವೈಶಿಷ್ಟ್ಯದ ಮೂಲ ಪೋಸ್ಟ್ಗಳ ಆವರ್ತಕ ಜ್ಞಾಪನೆಗಳನ್ನು ಹೊಂದಿರುವ ನ್ಯೂಸ್ ಫೀಡ್ ಅಲ್ಗಾರಿದಮ್ ಟ್ವೀಕ್ಗಳು ಸೇರಿದಂತೆ, ಮೂಲ ಪೋಸ್ಟ್ಗಳನ್ನು ಹೆಚ್ಚು ಪ್ರಮುಖವಾದವುಗಳೊಂದಿಗೆ ಹಂಚಿಕೊಳ್ಳುವಿಕೆಯನ್ನು ಫೇಸ್ಬುಕ್ ಹೆಚ್ಚಿಸಲು ಹಲವಾರು ತಂತ್ರಗಳನ್ನು ಬಹಿರಂಗಪಡಿಸಿತು. ಯಾವ ಪರಿಣಾಮಗಳು, ಯಾವುದಾದರೂ ವೇಳೆ, ಈ ಶೋಧನೆಗಳು ಫೇಸ್ಬುಕ್ ಅನ್ನು ಡೇಟಾ ಮೂಲವಾಗಿ ಬಳಸಲು ಬಯಸುವ ಸಂಶೋಧಕರಿಗೆ ಏನು?
[ ] ಸಮಾಜಶಾಸ್ತ್ರಜ್ಞ ಮತ್ತು ಇತಿಹಾಸಕಾರರ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೇನು? ಗೋಲ್ಡ್ ಥಾರ್ಪ್ (1991) ಪ್ರಕಾರ, ಮುಖ್ಯ ವ್ಯತ್ಯಾಸವು ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆಯ ಮೇಲೆ ನಿಯಂತ್ರಣ ಹೊಂದಿದೆ. ಇತಿಹಾಸಕಾರರು ಅವಶೇಷಗಳನ್ನು ಬಳಸಲು ಒತ್ತಾಯಿಸಲ್ಪಡುತ್ತಾರೆ, ಆದರೆ ಸಮಾಜಶಾಸ್ತ್ರಜ್ಞರು ತಮ್ಮ ದತ್ತಾಂಶ ಸಂಗ್ರಹವನ್ನು ನಿರ್ದಿಷ್ಟ ಉದ್ದೇಶಗಳಿಗೆ ತಕ್ಕಂತೆ ಮಾಡಬಹುದು. Goldthorpe (1991) ಓದಿ. ಕಸ್ಟಮೈಡ್ ಮತ್ತು ರೆಡಿಮೇಡ್ಗಳ ಕಲ್ಪನೆಗೆ ಸಂಬಂಧಿಸಿದ ಸಮಾಜಶಾಸ್ತ್ರ ಮತ್ತು ಇತಿಹಾಸದ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೇನು?
[ ] ಇದು ಹಿಂದಿನ quesiton ನಲ್ಲಿ ನಿರ್ಮಿಸುತ್ತದೆ. Goldthorpe (1991) ನಿಕಿ ಹಾರ್ಟ್ (1994) ಯಿಂದ ಕೂಡಿದ ಹಲವಾರು ವಿಮರ್ಶಾತ್ಮಕ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಸೆಳೆದಿದೆ, ಅದು ತಕ್ಕಂತೆ ಡೇಟಾವನ್ನು ಮಾಡಿದ ಗೋಲ್ಡ್ ಥಾರ್ಪ್ನ ಭಕ್ತಿಗೆ ಸವಾಲೆಸೆಯಿತು. ತಕ್ಕಂತೆ ತಯಾರಿಸಿದ ದತ್ತಾಂಶಗಳ ಸಂಭಾವ್ಯ ಮಿತಿಗಳನ್ನು ಸ್ಪಷ್ಟಪಡಿಸಲು, 1960 ರ ದಶಕದ ಮಧ್ಯಭಾಗದಲ್ಲಿ ಗೋಲ್ಡ್ಥಾರ್ಪ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ನಡೆಸಿದ ಸಾಮಾಜಿಕ ವರ್ಗ ಮತ್ತು ಮತದಾನ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಅಳೆಯುವ ದೊಡ್ಡ ಸಮೀಕ್ಷೆಯಾದ ಶ್ರೀಮಂತ ವರ್ಕರ್ ಪ್ರಾಜೆಕ್ಟ್ ಅನ್ನು ಹಾರ್ಟ್ ವಿವರಿಸಿದ್ದಾನೆ. ಕಂಡುಹಿಡಿದ ಮಾಹಿತಿಯ ಆಧಾರದ ಮೇಲೆ ವಿನ್ಯಾಸಗೊಳಿಸಿದ ಡೇಟಾವನ್ನು ಒಲವು ಮಾಡಿದ ವಿದ್ವಾಂಸರಿಂದ ನಿರೀಕ್ಷಿಸಬಹುದು ಎಂದು, ಶ್ರೀಮಂತ ವರ್ಕರ್ ಪ್ರಾಜೆಕ್ಟ್ ಇತ್ತೀಚೆಗೆ ಪ್ರಸ್ತಾವಿತ ಸಿದ್ಧಾಂತವನ್ನು ಉದ್ದೇಶಿಸಿ, ಸಾಮಾಜಿಕ ವರ್ಗದ ಭವಿಷ್ಯದ ಬಗ್ಗೆ ಜೀವನಮಟ್ಟ ಹೆಚ್ಚುತ್ತಿರುವ ಯುಗದಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗಿದೆ. ಆದರೆ, ಗೊಲ್ಥಾರ್ಪ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಮಹಿಳೆಯರ ಮತದಾನದ ವರ್ತನೆಯ ಬಗ್ಗೆ ಮಾಹಿತಿಯನ್ನು ಸಂಗ್ರಹಿಸಲು "ಮರೆತಿದ್ದಾರೆ". ನಿಕಿ ಹಾರ್ಟ್ (1994) ಇಡೀ ಸಂಚಿಕೆಯನ್ನು ಹೇಗೆ ಸಂಕ್ಷಿಪ್ತಗೊಳಿಸಿದ್ದಾನೆ ಎಂಬುದು ಇಲ್ಲಿ ಇಲ್ಲಿದೆ:
"... ಹೇಳುವುದಾದರೆ, ಮಹಿಳೆಯನ್ನು ಬಿಟ್ಟುಬಿಡಲಾಗಿದೆ ಎಂಬ ತೀರ್ಮಾನವನ್ನು ತಪ್ಪಿಸಲು ಇದು ಕಷ್ಟಕರವಾಗಿದೆ ಏಕೆಂದರೆ ಈ 'ಟೈಲರ್ ಮಾಡಿದ' ದತ್ತಾಂಶವು ಸ್ತ್ರೀ ಅನುಭವವನ್ನು ಹೊರತುಪಡಿಸಿದ ಒಂದು ಮಾದರಿಯ ತರ್ಕದಿಂದ ಸೀಮಿತವಾಗಿದೆ. ಪುರುಷ ಪ್ರಜ್ಞೆಯಂತೆ ವರ್ತನೆಯ ಅರಿವಿನ ಮತ್ತು ಸೈದ್ಧಾಂತಿಕ ದೃಷ್ಟಿಕೋನದಿಂದ ಸೈದ್ಧಾಂತಿಕ ದೃಷ್ಟಿಕೋನವನ್ನು ನಡೆಸಿದ ..., ಗೋಲ್ಡ್ಥಾರ್ಪ್ ಮತ್ತು ಅವರ ಸಹೋದ್ಯೋಗಿಗಳು ಪ್ರಾಯೋಗಿಕ ರುಜುವಾತುಗಳ ಒಂದು ಗುಂಪನ್ನು ನಿರ್ಮಿಸಿದರು ಮತ್ತು ಇದು ಅವರ ಸ್ವಂತ ಸೈದ್ಧಾಂತಿಕ ಊಹೆಗಳನ್ನು ಬೆಳೆಸಿದರು ಮತ್ತು ಅವುಗಳನ್ನು ಸಮರ್ಪಕ ಮಾನ್ಯ ಪರೀಕ್ಷೆಗೆ ಒಳಪಡಿಸಿದರು. "
ಹಾರ್ಟ್ ಮುಂದುವರೆಯಿತು:
"ಶ್ರೀಮಂತ ಕೆಲಸಗಾರ ಪ್ರಾಜೆಕ್ಟ್ನ ಪ್ರಾಯೋಗಿಕ ಸಂಶೋಧನೆಗಳು ಮಧ್ಯ ಶತಮಾನದ ಸಮಾಜಶಾಸ್ತ್ರದ ಪುರುಷ ಜಾಹಿರಾತುಗಳ ಮೌಲ್ಯಗಳನ್ನು ನಮಗೆ ತಿಳಿಸುತ್ತವೆ, ಅವುಗಳು ಶ್ರೇಣೀಕರಣ, ರಾಜಕೀಯ ಮತ್ತು ವಸ್ತು ಜೀವನದ ಪ್ರಕ್ರಿಯೆಗಳನ್ನು ತಿಳಿಸುತ್ತವೆ."
ಹೇಳಿಮಾಡಿಸಿದ ಡೇಟಾ ಸಂಗ್ರಹಣೆಯಲ್ಲಿ ಡೇಟಾ ಸಂಗ್ರಹಕಾರರ ಒಳಸೇರಿಸಿದ ಪಕ್ಷಪಾತವನ್ನು ಹೊಂದಿರುವ ಇತರ ಉದಾಹರಣೆಗಳನ್ನು ನೀವು ಆಲೋಚಿಸುತ್ತೀರಾ? ಕ್ರಮಾವಳಿಯು ಹೇಗೆ ಗೊಂದಲಕ್ಕೊಳಗಾಗುತ್ತದೆ? ಸಂಶೋಧಕರು readymades ಬಳಸಬೇಕಾದರೆ ಮತ್ತು ಅವರು custommades ಬಳಸಬೇಕಾದ ಸಂದರ್ಭದಲ್ಲಿ ಇದು ಯಾವ ಪರಿಣಾಮಗಳನ್ನು ಹೊಂದಿರಬಹುದು?
[ ] ಈ ಅಧ್ಯಾಯದಲ್ಲಿ, ಕಂಪೆನಿಗಳು ಮತ್ತು ಸರ್ಕಾರಗಳು ರಚಿಸಿದ ಆಡಳಿತಾತ್ಮಕ ದಾಖಲೆಗಳೊಂದಿಗೆ ಸಂಶೋಧಕರಿಂದ ಸಂಗ್ರಹಿಸಿದ ಡೇಟಾವನ್ನು ನಾನು ವ್ಯತಿರಿಕ್ತವಾಗಿದೆ. ಕೆಲವರು ಈ ಆಡಳಿತಾತ್ಮಕ ದಾಖಲೆಗಳನ್ನು "ಡೇಟಾವನ್ನು ಕಂಡುಹಿಡಿದಿದ್ದಾರೆ" ಎಂದು ಕರೆಯುತ್ತಾರೆ, ಅವು "ವಿನ್ಯಾಸಗೊಳಿಸಿದ ಡೇಟಾ" ಕ್ಕೆ ವಿರುದ್ಧವಾಗಿರುತ್ತವೆ. ಆಡಳಿತಾತ್ಮಕ ದಾಖಲೆಗಳನ್ನು ಸಂಶೋಧಕರು ಕಂಡುಕೊಂಡಿದ್ದಾರೆ ಎಂಬುದು ನಿಜ, ಆದರೆ ಅವುಗಳು ಹೆಚ್ಚು ವಿನ್ಯಾಸಗೊಳಿಸಲ್ಪಟ್ಟಿವೆ. ಉದಾಹರಣೆಗೆ, ಆಧುನಿಕ ಟೆಕ್ ಕಂಪೆನಿಗಳು ತಮ್ಮ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವ ಮತ್ತು ನಿರ್ವಹಿಸಲು ತುಂಬಾ ಕಠಿಣವಾಗಿದೆ. ಹೀಗಾಗಿ, ಈ ಆಡಳಿತಾತ್ಮಕ ದಾಖಲೆಗಳು ಎರಡೂ ಕಂಡುಬರುತ್ತವೆ ಮತ್ತು ವಿನ್ಯಾಸಗೊಳಿಸಲ್ಪಟ್ಟಿವೆ, ಅದು ನಿಮ್ಮ ದೃಷ್ಟಿಕೋನವನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ (ಚಿತ್ರ 2.12).
ಡೇಟಾ ಮೂಲದ ಒಂದು ಉದಾಹರಣೆಯನ್ನು ಒದಗಿಸಿ ಅಲ್ಲಿ ಸಂಶೋಧನೆಗಾಗಿ ಆ ಮೂಲವನ್ನು ಬಳಸುವಾಗ ಅದನ್ನು ಕಂಡುಹಿಡಿದಿದೆ ಮತ್ತು ವಿನ್ಯಾಸಗೊಳಿಸಿದಂತೆ ಸಹಾಯಕವಾಗುತ್ತದೆ.
[ ಡಿಜಿಟಲ್ ಸಿಸ್ಟಮ್ ಒಂದು "ಸಲಕರಣೆ" ಅಥವಾ "ಅಧ್ಯಯನದ ವಸ್ತು" ಎಂಬುದರ ಆಧಾರದ ಮೇಲೆ ಎರಡು ವಿಶಾಲ ವರ್ಗಗಳಾಗಿ ಕ್ರಿಶ್ಚಿಯನ್ ಸ್ಯಾಂಡ್ವಿಗ್ ಮತ್ತು ಎಸ್ಝೆರ್ ಹರ್ಗಿಟೈ (2015) ಎಂಬ ಚಿಂತನಶೀಲ ಪ್ರಬಂಧದಲ್ಲಿ ವಿಭಜನೆಯಾಗುತ್ತದೆ. ಮೊದಲ ರೀತಿಯ ಉದಾಹರಣೆ - ವ್ಯವಸ್ಥೆ ಎಲ್ಲಿದೆ ಒಂದು ಸಲಕರಣೆ-ಇದು ಬೆಂಟ್ಸ್ಸನ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು (2011) ನಡೆಸಿದ ಸಂಶೋಧನೆಯಾಗಿದ್ದು, 2010 ರಲ್ಲಿ ಹೈಟಿಯಲ್ಲಿನ ಭೂಕಂಪನದ ನಂತರ ವಲಸೆಯನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಮೊಬೈಲ್-ಫೋನ್ ಡೇಟಾವನ್ನು ಬಳಸಿಕೊಳ್ಳುತ್ತದೆ. ಎರಡನೇ ವಿಧದ ಒಂದು ಉದಾಹರಣೆ-ವ್ಯವಸ್ಥೆಯ ಅಧ್ಯಯನವು-ಜೆನ್ಸನ್ ಸಂಶೋಧನೆ (2007) ಕೇರಳದ ಮೊಬೈಲ್ ಫೋನ್ಗಳನ್ನು ಪರಿಚಯಿಸುವ ಬಗ್ಗೆ ಭಾರತವು ಮೀನುಗಳಿಗೆ ಮಾರುಕಟ್ಟೆಯ ಕಾರ್ಯಚಟುವಟಿಕೆಗೆ ಪರಿಣಾಮ ಬೀರಿತು. ಈ ವ್ಯತ್ಯಾಸವು ಸಹಾಯಕವಾಗಿದೆಯೆಂದು ನಾನು ಕಂಡುಕೊಳ್ಳುತ್ತಿದ್ದೇನೆ ಏಕೆಂದರೆ ಡಿಜಿಟಲ್ ಡೇಟಾ ಮೂಲಗಳನ್ನು ಬಳಸುವ ಅಧ್ಯಯನಗಳು ಅದೇ ರೀತಿಯ ಡೇಟಾ ಮೂಲವನ್ನು ಬಳಸುತ್ತಿದ್ದರೂ ವಿಭಿನ್ನ ಗುರಿಗಳನ್ನು ಹೊಂದಬಹುದು ಎಂದು ಸ್ಪಷ್ಟಪಡಿಸುತ್ತದೆ. ಈ ಭಿನ್ನತೆಯನ್ನು ಮತ್ತಷ್ಟು ಸ್ಪಷ್ಟಪಡಿಸುವ ಸಲುವಾಗಿ, ನೀವು ನೋಡಿದ ನಾಲ್ಕು ಅಧ್ಯಯನಗಳನ್ನು ವಿವರಿಸಿ: ಎರಡು ಉಪಕರಣಗಳನ್ನು ಡಿಜಿಟಲ್ ಸಾಧನವನ್ನು ಬಳಸುತ್ತಾರೆ ಮತ್ತು ಎರಡು ಅಧ್ಯಯನ ವಿಧಾನವನ್ನು ಡಿಜಿಟಲ್ ವ್ಯವಸ್ಥೆಯನ್ನು ಬಳಸುತ್ತಾರೆ. ನೀವು ಬಯಸಿದರೆ ಈ ಅಧ್ಯಾಯದ ಉದಾಹರಣೆಗಳನ್ನು ನೀವು ಬಳಸಬಹುದು.