[ , ] ඇල්ගොරිතමය ව්යාකූලත්වය Google Flu Trends සමඟ ගැටළුවක් විය. Lazer et al. (2014) සහ, ගැටළුව පැහැදිලි කරමින් ගූගල්හි ඉංජිනේරුවෙකුට කෙටි හා පැහැදිලි ඊ-තැපෑලක් ලියන්න. එය නිවැරදි කිරීම පිළිබඳ අදහසක් ඉදිරිපත් කරන්න.
[ ] Bollen, Mao, and Zeng (2011) පවසන්නේ, ට්විටර් වලින් දත්ත කොටස් වෙලඳපොල අනාවැකි කිරීමට භාවිතා කළ හැකි බවයි. මෙම සොයා ගැනීම, ට්වෙන්ට් ප්රාග්ධන වෙළඳපලක් නිර්මාණය කිරීම සඳහා හේතු විය. ට්විටර් (Jordan 2010) විසින් එකතු කරන ලද දත්ත මත පදනම්ව කොටස් වෙළඳ පළට ආයෝජනය කිරීමට හේතු විය. එම අරමුදලේ මුදල් තැන්පත් කිරීමට පෙර ඔබට දැකීමට අවශ්ය කුමන සාධක මොනවාද?
[ ] සමහර මහජන සෞඛ්ය උපදේශකයන් ඊ-සිගරැට් දුම්පානය සඳහා සාර්ථක ආධාරයක් ලෙස සලකනු ලබන අතර අනෙක් අයගේ විභව්ය අවදානම් පිළිබඳව අනතුරු ඇඟවෙයි. ඊ-සිගරැට් ආශ්රිත ට්විටර් පණිවිඩ එකතු කිරීම සහ මනෝගතිය විශ්ලේෂණය කිරීම මගින් පර්යේෂකයෙක් ඊ-සිගරට් වලට මහජන මතය අධ්යයනය කිරීමට තීරණය කරයි කියා සිතන්න.
[ ] 2009 නොවැම්බරයේදී, ට්විටර් ටීට් එකේ ප්රශ්නය "ඔබ කරන්නේ කුමක්ද?" සිට ප්රශ්නය "මොකක්ද වෙන්නේ?" (Https://blog.twitter.com/2009/whats-happening) ටැප් ප්රශ්නය වෙනස් කලේය.
[ ] "රට්ටි" බොහෝ විට ට්විටර් මත බලපෑම හා පැතිරීම මැනීම සඳහා භාවිතා වේ. මුලදී, පරිශීලකයන්ට තමන් කැමති ටීවී පිටපත් කර ඇලවීම, ඔහුගේ / ඇයගේ හැසිරීම සමඟ මුල් කර්තෘගේ ටැග්, ටී ටී ට කලින් ටයිටයට ටයිප් කරන්න. ඊටපස්සේ 2009 දී ට්විටර් රිවීවට් බොත්තමක් එකතු කළා. 2016 ජූනි මාසයේදී, ට්විටර් විසින් පරිශීලකයන්ට ඔවුන්ගේම නිවුස් ටිවිටර් කිරීමට හැකි විය (https://twitter.com/twitter/status/742749353689780224). ඔබ ඔබේ පර්යේෂණවලදී "ට්විටර්" භාවිතා කරන ආකාරය වෙනස් විය යුතු බව ඔබ සිතනවාද? ඇයි, නැත්නම් ඇයි?
[ , , , ] පුළුල් ලෙස සාකච්ඡා කළ පත්රිකාවක් තුළ, මිචෙල් සහ සගයන් (2011) දිගුකාලීන සංස්කෘතික ප්රවණතා හඳුනා ගැනීමට උත්සාහ කළ මිලියනයකට වඩා වැඩි සංඛ්යාත පොත්පත් අන්තර්ගතය විශ්ලේෂණය කර ඇත. ඔවුන් භාවිතා කළ දත්ත දැන් Google NGrams දත්ත කට්ටලය ලෙස නිකුත් කර ඇති අතර, එම නිසා ඒවායේ කාර්යයන් නැවත සකස් කිරීම සහ ඒවායේ දිගු කිරීම සඳහා දත්ත භාවිතා කළ හැකිය.
කඩදාසියේ බොහෝ ප්රතිඵලයක් වශයෙන් මිෂෙල් හා සගයන් තර්ක කලේ අප වේගවත් හා වේගවත් බව අමතක කරමිනි. එක් වර්ෂයක් සඳහා "1883" යනුවෙන් පවසනුයේ 1875 සහ 1975 අතරතුර 1883 දී ප්රකාශයට පත් කරන ලද ග්රෑම් 1 ක ග්රෑම් ගණනකි. එම අනුපාතය එම වර්ෂයේ සිදු වූ සිදුවීම් පිළිබඳව උනන්දුවක් දක්වන බව ඔවුහු තර්ක කළහ. ඔවුන්ගේ රූපයේ 3a හි දී ඔවුන් අවුරුදු 1883, 1910 සහ 1950 යන වසර සඳහා භාවිතා කරන මාර්ගයන් කුමන්ත්රණය කළහ. මෙම අවුරුදු තුනේ පොදු රටාවක් දක්නට ලැබේ. එම වසරට පෙර ස්වල්පයක් භාවිතා කිරීම, ඉන් පසුව ස්පයික්, පසුව ක්ෂය වීම. මීලඟට, සෑම වර්ෂයකම ක්ෂය වීමේ අනුපාතය ගණනය කිරීම සඳහා මිශෙල් සහ සගයන් 1875 සිට 1975 දක්වා කාලය තුළ "අර්ධ ආයු කාලය" ගණනය කරන ලදී. වසර අඩු වෙමින් පවතින අතර, එයින් අදහස් වන්නේ අතීතය වේගයෙන් හා වේගවත් කිරීම අමතක කර දැමීම බවය. ඔවුන් ඉංග්රීසි භාෂාවේ කර්තෘවරයෙකුගේ 1 වන අනුවාදය භාවිතා කර තිබුණත්, පසුව ගූගල් විසින් එහි කර්තෘගේ දෙවන සංස්කරණය නිකුත් කර ඇත. ඔබ කේතය ආරම්භ කිරීමට පෙර ප්රශ්නයේ සියලු කොටස් කියවන්න.
මෙම ක්රියාකාරකම් ඔබට නැවත භාවිත කළ හැකි කේත ලිවීම, ප්රතිඵලය පරිවර්ථනය සහ දත්ත බිඳවැටීම (අපහසු ලිපිගොනු සමග වැඩ කිරීම සහ නැති දත්ත හසුරුවාලීම වැනි ක්රියාකාරකම් මගින් ඔබට ලියනු ලැබේ). මෙම ක්රියාකාරකම් මගින් පොහොසත් හා සිත්ගන්නා දත්ත සමුදායක් ඇතිව ක්රියාකරනු ඇත.
Google Books NGram Viewer වෙබ් අඩවියෙන් අමු දත්ත ලබා ගන්න. විශේෂයෙන්, ඔබ 2012 ජුලි මස 1 වන දින නිකුත් කරන ලද ඉංග්රීසි භාෂාවේ 2 වන අනුවාදය භාවිතා කළ යුතුය.
Michel et al. (2011) අල්කා 3a හි රූපයේ ප්රධාන කොටස නැවත සකස් කරන්න Michel et al. (2011) . මෙම අගය ප්රතිනිෂ්පාදනය කිරීම සඳහා, ඔබට ගොනු දෙකක් අවශ්ය වනු ඇත: අමුත්තන් ගණන සමානුපාතික බවට පරිවර්තනය කිරීමට භාවිතා කළ හැකි කොටස (අ) සහ "සම්පූර්ණ ගණනය කිරීම්" ගොනුව, ඔබ විසින් බාගන ලද. සම්පූර්ණ ගණනය කිරීමේ ලිපිගොනුට කියවීමට අපහසු වන ව්යුහයක් ඇති බව සැලකිල්ලට ගන්න. NGram දත්ත අනුවාදය 2 Michel et al. (2011) විසින් ඉදිරිපත් කරන ලද ඒවාට සමාන ප්රතිඵල ඉදිරිපත් කරයි Michel et al. (2011) , 1 අනුවාදය මත පදනම්ව?
දැන් NGram Viewer විසින් නිර්මාණය කරන ලද ප්රස්ථාරයට එරෙහිව ඔබේ ප්රස්ථාරය පරීක්ෂා කරන්න.
රූපය 3a (ප්රධාන චරිතය) ප්රතිස්ථාපනය කරන්න, නමුත් \(y\) -axis වෙනස් කිරීම නොකළ සංඛ්යා ලෙස සඳහන් කරන්න.
(B) සහ (d) අතර වෙනස මයිෙකොල් සහ අල් හි ප්රතිපලයන් නැවත ඇගයීමට ලක් කරයි. (2011). ඇයි, නැත්නම් ඇයි?
දැන්, සඳහන් කිරීම්වල ප්රතිශතයක් භාවිතා කිරීම, රූපය 3a හි ඇති කැක්කුම ප්රතිස්ථාපනය කරන්න. එනම්, වර්ෂ 1875 සහ 1975 අතර සෑම අවුරුද්දකම අර්ධ ආයු කාලය ගණනය කරන්න. අර්ධ ආයුකාලය අර්ථ දැක්වීමේ ප්රතිශතය එහි උපරිම වටිනාකමෙන් අඩකට පෙරාතුව ගත වන වසර ගණන විය. Michel et al. (2011) උපකාරක ඔන්ලයින් තොරතුරු වල අර්ධ ජීවනය-බලන්න III.6 තොරතුරු තක්සේරු කිරීම සඳහා වඩාත් සංකීර්ණ දෙයක් කරයි. නමුත් ප්රවේශයන් දෙකම සමාන ප්රතිඵල නිෂ්පාදනය කරයි. NGram දත්ත 2 අනුවාදය Michel et al. (2011) විසින් ඉදිරිපත් කරන ලද ඒවාට සමාන ප්රතිඵල ඉදිරිපත් කරයි Michel et al. (2011) , 1 අනුවාදය මත පදනම්ව? (ඉඟිය: එය පුදුම නොවන්න).
විශේෂයෙන් ක්ෂණිකව හෝ විශේෂයෙන් සෙමෙන් අමතක වූ වසරක් වැනි වූ වසර ගණනාවක් තිබුණාද? එම රටාව සඳහා විය හැකි හේතු පිළිබඳව කෙටියෙන් විමසන්න.
මෙම ප්රතිඵලය චීන, ප්රංශ, ජර්මානු, හෙබ්රෙව්, ඉතාලි, රුසියානු සහ ස්පාඤ්ඤ භාෂාවල NGrams 2 අනුවාදය සඳහා ප්රතිඵලය ප්රතිනිෂ්පාදනය කරන්න.
සෑම භාෂාවක් ම සැසඳීම, විශේෂයෙන් ක්ෂණිකව හෝ විශේෂයෙන් සෙමෙන් අමතක වූ වසර, වැනි වසර ගණනක් විය. එම රටාවට ඇති විය හැකි හේතු ගැන කෙටියෙන් කල්පනා කර බලන්න.
[ , , , ] 2013 ජූනි මාසයේදී NSA / PRISM surveillance (එනම්, ස්නෝඩන් හෙළිදරව් කිරීම්) පිළිබඳ පුලුල්ව ප්රචාරය කරන ලද ප්රචාරක Penney (2016) ගවේෂණාත්මක මාතෘකාවන් පිළිබඳව මතු කරන මාතෘකා පිළිබඳ විකිපීඩියා ලිපිවල තියුණු හා හදිසි අඩුවීමක් සමඟ සම්බන්ධ විය. එසේ නම්, හැසිරීම්වල මෙම වෙනස, මහජන සුපරීක්ෂාකාරීත්වය නිසා ඇතිවන භයංකර බලපෑමක් සමග අනුකූල වේ. Penney (2016) හි ප්රවේශය සමහර අවස්ථාවලදී බාධාකාරී කාල ශ්රේණි නිර්මාණයක් ලෙස හැඳින්වේ. එය 2.4.3 හි විස්තර කර ඇති ප්රවේශයන් සමඟ සම්බන්ධ වේ.
මාතෘකාවෙහි මාතෘකා තෝරාගැනීම සඳහා, පෝනි විසින් සමාජ මාධ්ය නිරීක්ෂණය සහ අධීක්ෂණය සඳහා එක්සත් ජනපදයේ අභ්යන්තර ආරක්ෂක දෙපාර්තමේන්තුව භාවිතා කරන ලැයිස්තුවට යොමු කර ඇත. ඩීඑච්එච් ලැයිස්තුව ඇතැම් ගැටලු විවිධ මාතෘකා ගණනාවක් වර්ගීකරණය කරයි, එනම් "සෞඛ්ය සැලකිල්ල", "යටිතල පහසුකම් සුරක්ෂිතභාවය" සහ "ත්රස්තවාදය" ලෙස කාණ්ඩගත කර ඇත. අධ්යයන කණ්ඩායම සඳහා, "ත්රස්තවාදය" ට අදාළ වන මූලධර්ම 48 භාවිතා කරන ලදි (උපග්රන්ථය වගුව 8 ). පසුව ඔහු ජනවාරි මාසයේ සිට 2012 අගෝස්තු මස අවසානයේ සිට අගෝස්තු මස අවසානයේ සිට මාස 32 ක් පුරා විකාශනය කරන ලද 48 විකිපීඩියා ලිපි සඳහා මාසිකව විකිපීඩියා ලිපි දර්ශන ගණනය කිරීම් එකතු කළේය. වෙනත් මාතෘකා පිළිබඳ ලිපි බලන්න.
දැන්, ඔබ Penney (2016) නැවත උත්පාදනය කිරීමට සහ ව්යාප්ත කිරීමට යන්නේ. මෙම ක්රියාකාරිත්වය සඳහා ඔබට අවශ්ය සියලු තොරතුරැ විකිපීඩියාවෙන් ලබාගත හැකිය. නැත්නම් ඔබට R-පැකේජය wikipediatrend වෙතින් ලබා ගත හැකිය (Meissner and R Core Team 2016) . ඔබ ඔබේ ප්රතිචාර ලිවූ විට, ඔබ භාවිතා කළ දත්ත ප්රභවය සලකා බලන්න. (මෙම ක්රියාමාර්ගයෙහිම 6 වන පරිච්ඡේදයෙහිද දක්නට ලැබේ.) මෙම දත්තයන් මගින් දත්ත එක්රැස් කිරීම සහ විශාල දත්ත මූලාශ්රවල ස්වාභාවික අත්හදා බැලීම් ගැන සිතීමෙහි නිරත වනු ඇත. අනාගත ව්යාපෘතීන් සඳහා විභවයෙන් ප්රයෝජනවත් දත්ත මූලාශ්රයක් සමඟ ඔබ ගෙන යනවා.
[ ] Efrati (2016) විසින් රහසිගත තොරතුරු මත පදනම් වූ ෆේස්බුක් මත මුළු බෙදාගැනීම වසරකට 5.5% කින් අඩු වී ඇති අතර "මුල් විකාශ හුවමාරුව" වසරකට 21% කින් අඩු විය. වයස අවුරුදු 30 ට අඩු වූ ෆේස්බුක් භාවිතා කරන්නන්ගේ මෙම අඩුවීම විශේෂිතය. මෙම සාධකය සාධක දෙකක් පහත වැටීමට හේතු වේ. එක් එක් පුද්ගලයා ෆේස්බුක් මත "මිතුරන්" සංඛ්යාව වර්ධනය වේ. අනෙක් දෙය සමහර හුවමාරු ක්රියාකාරිත්වය ස්නාපට් වැනි පණිවුඩ වෙත හා තරඟකරුවන් වෙත මාරු කර ඇත. ෆේස්බුක් විසින් ෆේස්බුක් උත්සාහ දරා ඇත. මෙම ෆේස්බුක් වෙබ් අඩවියේ තවත් පෝස්ටරයක් පළ කර ඇති ප්රවෘත්ති සටහන් ඇල්ගොරිතම ටීක්ස් ඇතුළු මුල්ම පෝස්ටර්, "මෙම දිනය" විශේෂාංගය සමග මුල් ලිපි පළ කිරීමත් සමඟම ෆේස්බුක් උත්සාහ දරා ඇත. දත්ත එක් මූලාශ්රයක් ලෙස ෆේස්බුක් භාවිතා කිරීමට කැමති පර්යේෂකයන් සඳහා මෙම සොයාගැනීම් තිබේ නම්, කුමන ඇඟවුම් තිබේද?
[ සමාජ විද්යාඥයෙකු හා ඉතිහාසඥයෙක් අතර ඇති වෙනස කුමක්ද? Goldthorpe (1991) , ප්රධාන වෙනස්කම් දත්ත එක්රැස් කිරීම පාලනය කිරීමයි. ඉතිහාසඥයින්ට සර්වඥ ධාතුන් වහන්සේලා භාවිතා කිරීමට බල කෙරී ඇතත්, සිය දත්ත එක්රැස් කිරීම සඳහා නිශ්චිත අරමුනට සකස් කළ හැකිය. Goldthorpe (1991) කියවන්න. සමාජ විද්යාව හා ඉතිහාසය අතර ඇති වෙනස කොතරම් සංතෘප්තිය හා නිමි භාණ්ඩ පිළිබඳ අදහස කුමක්ද?
[ ] මෙය පෙර ඇති quesiton මත ගොඩ නගයි. Goldthorpe (1991) විසින් නික්ටි හර්ට් (1994) වලින් එකක් ඇතුළු විවේචනාත්මක ප්රතිචාර කීපයක්ම ලියා ගත් අතර එය සකස් කළ දත්ත වලට Goldthorpe ගේ භක්තිය අභියෝගයට ලක් කළේය. සකස් කරන ලද දත්තවල විභව්ය සීමාවන් පැහැදිළි කිරීම සඳහා හාර්ට් 1960 ගණන්වල මැද භාගයේ දී ගෝල්ටර්ෙප්ප් සහ සගයන් විසින් පවත්වන ලද සමාජ පන්තිය අතර ඇති සම්බන්ධය මැන බැලීම සඳහා වන විශාල සමීක්ෂණයක්, ධනවත් සේවක ව්යාපෘතිය විස්තර කරයි. සොයාගත් දත්තවලට අනුව නිර්මාණය කරන ලද දත්තවලට අනුග්රහය දක්වන විද්වතකයෙකුගෙන් අපේක්ෂා කළ හැකි පරිදි, ධනවත් වැඩපිලිවෙල ව්යාපෘතිය වැඩිදියුණු කරන ලද ජීවන තත්වයන් තුළ සමාජ පංතියේ අනාගතය පිළිබඳ මෑත යෝජිත සිද්ධාන්තයට ගැලපෙන පරිදි සකස් කරන ලද දත්ත එකතු කරන ලදි. එහෙත්, ගෝල්ඩ්ටෝප් සහ සගයෝ කෙසේ හෝ ගැහැනුන්ගේ ඡන්ද හැසිරීම් පිළිබඳ තොරතුරු රැස් කිරීමට සමහර විට "අමතක" විය. මෙහි දැක්වෙන්නේ නික්ටි හාර්ට් (1994) මුළු සිද්ධියම සාරාංශගත කර ඇති ආකාරය:
"... මෙම සකස් කරන ලද දත්ත කට්ටලය ස්ත්රීන් අත්හැර දැමූ නිගමනය මග හැරීම දුෂ්කර වීම වැළැක්වීමට අපහසු විය. කාන්තා අත්දැකීම්වලින් බැහැර වූ සමානාත්මක තර්කනයකින් එය සීමා විය. පන්ති විඥානයේ න්යායික දර්ශනය හා පුරුෂ භක්තියේ ක්රියාකාරිත්වයේ න්යායික දෘෂ්ටියකින් හා ක්රියාකලාපය මගින්, ගෝල්ටර්ටෝප් සහ ඔහුගේ සගයන් විසින් අනුමාන කරන ලද පරිපූර්ණ සාධනීය පරීක්ෂණයකින් හෙළිදරව් නොකරන ඔවුන්ගේම න්යායික උපකල්පන පෝෂණය කොට පෝෂණය කළ ආනුභූතික සාධක සමූහයකි.
හර්ට් දිගටම
"ධනවත් සේවක ව්යාපෘතියේ ප්රායෝගික සොයාගැනීම් මැද භාගයේ සමාජ විද්යාවේ මාස්කුලීය සාරධර්ම පිලිබඳව වැඩි විස්තර සපයන්නේ, භේද භින්න කිරීමේ ක්රියාවලිය, දේශපාලනය හා භෞතික ජීවිතය පිලිබඳ කියාවලට සවිස්තරාත්මකව පවසමිනි."
ගැලපෙන දත්ත එක්රැස් කිරීම සඳහා එකතු කරන ලද දත්ත එකතුකරන්නෙකුගේ අනුපිලිවෙලට අනුමාන කළ හැකි වෙනත් උදාහරණ ඔබට සිතිය හැකිද? මෙය Algorithmic ව්යාකූලත්වයට සැසඳෙන්නේ කෙසේද? පර්යේෂකයන් නිහතමානීව භාවිතා කළ යුත්තේ කවදාද සහ ඒවා භාවිතා කළ යුත්තේ කවදාද?
[ ] මෙම පරිච්ඡේදයේ දී, සමාගම් හා ආන්ඩු විසින් නිර්මාණය කරන ලද පරිපාලන වාර්තා සමග පර්යේෂකයන් සඳහා එකතු කරන ලද දත්ත මා විසින් වෙනස් කර ඇත. සමහර අය මෙම පරිපාලන වාර්තාවලට "සොයාගත් දත්ත" ලෙස හැඳින්වේ. ඒවා "සැලසුම් කරන ලද දත්ත" සමඟ සැසඳිය යුතුය. පර්යේෂකයන් විසින් පරිපාලන වාර්තා සොයාගෙන ඇති නමුත් සත්ය වශයෙන්ම ඒවා නිර්මාණය කර ඇත. උදාහරණයක් ලෙස, නවීන තාක්ෂණ සමාගම් ඔවුන්ගේ දත්ත එකතු කිරීමට සහ කුරුමාලි කිරීමට ඉතා අපහසු කාර්යයක්. මේ අනුව, මෙම පරිපාලන වාර්තා සොයාගෙන නිර්මාණය කර ඇති අතර, එය ඔබේ ඉදිරිදර්ශනය මත රඳා පවතී (රූපය 2.12).
දත්ත මූලාශ්රය පිළිබඳ සොයා බැලීමේදී සොයාගත් හා සැලසුම් කරන ලද දෙකම දැක බලා ගැනීම සඳහා එම දත්ත මූලාශ්රය භාවිතා කිරීමේදී ප්රයෝජනවත් වේ.
[ ] කල්පනාකාරී රචනයක, කිර්තිස් සැන්ඩ්විග් සහ එෂ්ටර් හර්ගිට්ටයි (2015) ඩිජිටල් පද්ධතිය "මෙවලමක්" හෝ "අධ්යයනය කිරීමේ පරමාර්ථයක්" යන්න මත පදනම්ව පුළුල් පරාස දෙකකට ඩිජිටල් පර්යේෂණ බෙදා වෙන් කරන ලදි. පළමු ක්රමය සඳහා උදාහරණයක් - ක Bengtsson හා හිතවතුන් විසින් පර්යේෂණ මෙවලමක්-වේ (2011) 2010 දී හයිටි භූමිකම්පාවෙන් දෙවන ආකාරයේ-මෙම පද්ධතිය ජෙන්සන් විසින් අධ්යයනය-වේ පර්යේෂණ වස්තුවක් උදාහරණයක් පසු සංක්රමණය නිරීක්ෂණය කිරීමට ජංගම දුරකථනය දත්ත භාවිතා මත (2007) ඉන්දියාව) කේරල පුරා ජංගම දුරකථන හඳුන්වා දීමෙන් මාළු වෙළඳපොළේ ක්රියාකාරීත්වය බලපෑවේ කෙසේද යන්න පිළිබඳව. ඩිජිටල් දත්ත ප්රභවයන් භාවිතා කරන අධ්යයන එකම ආකාරයේ දත්ත මූලාශ්රයක් භාවිතා වුවද ඒවායේ විවිධ ඉලක්ක තිබිය හැකිය. මෙම වෙනස පැහැදිලි කිරීමට නම්, ඔබ දැක ඇති අධ්යයන හතරක් විස්තර කරන්න: මෙලෙස ඩිජිටල් පද්ධතියක් උපකරණයක් ලෙස භාවිතා කරන අතර, අධ්යයන විෂයයක් ලෙස ඩිජිටල් පද්ධතියක් භාවිතා කරන දෙදෙනෙක්. ඔබට අවශ්ය නම් මෙම පරිච්ඡේදයෙන් ඔබට නිදසුන් භාවිතා කළ හැකිය.