[ ، ] د الګوریتمیم اعتراف د ګوګل پلونو رجحانات کې ستونځه وه. د Lazer et al. (2014) لخوا کاغذ ولولئ Lazer et al. (2014) ، او په ګوګل کې د انجنیر لپاره لنډ، واضح بریښنالیک ولیکئ ستونزه یې تشریح کړه او څنګه یې د حل کولو یوه مفکوره وړاندې کړه.
[ Bollen, Mao, and Zeng (2011) ادعا کوي چې د ټویټر ډاټا د سټاک مارکيټ وړاندیز کولو لپاره کارول کیدی شي. دا موندنه د هجګ فنډ - Derwent Capital Markets رامنځته کولو المل شو - د ټرانسپورټ (Jordan 2010) څخه راټول شویو ارقامو پر اساس د سټاک مارکيټ کې پانګونې لپاره. په دې بودیجه کې ستاسو پیسو د لګولو دمخه څه ثبوت غواړئ؟
[ په داسې حال کې چې د عامه روغتیا مدافعین د ایک سګرټ په پام کې نیولو سره د سګرټو د سګرټ کولو لپاره اغیزمن مرستې کوي، نور نور د احتمالي خطرونو لکه د نیکوتین لوړ کچې په اړه خبرداری ورکوي. تصور وکړئ چې یو څیړونکی پریکړه کوي چې د e-cigarettes-related ټویټر پوسټونو راټولولو او د احساساتو شننې ترسره کولو له لارې د سګرټیک په لور د عامه نظر مطالعه وکړي.
[ ] د 2009 کال په نوامبر کې، ټویټر په ټیک باکس کې پوښتنې "څه شی کوئ؟" ته "څه کیږي؟" (https://blog.twitter.com/2009/whats-happening).
[ ] "توقیف" اکثرا د ټویټر په اثر او نفوذ د نفوذ اندازه کولو لپاره کارول کیږي. په پیل کې، کاروونکي باید د ټیټ کاپی او پیټ کړئ دوی خوښوي، اصلي لیکوال د خپل لاس سره لیډوي، او په دستی ډول د "RT" ټیکټ مخکې له دې چې دا ټکي وښيي چې دا دا یو ځل بیا تکرار دی. بیا، په 2009 کې، ټویټر د "تکرار" تڼۍ زیاته کړه. د جون په میاشت کې، ټویټر د کاروونکو لپاره دا امکان لري چې خپل ټایټونه وپیژني (https://twitter.com/twitter/status/742749353689780224). ایا تاسو فکر کوئ چې دا بدلونونه باید تاثیر وکړي چې تاسو په خپل څیړنه کې "تیری" څنګه کاروئ؟ ولې ولې نه؟
[ ، ، ، ] په یوه پراخ بحث شوې مقالې کې، میلیک او همکارانو (2011) د اوږد مهاله کلتوري رجحانونو د پیژندلو په هڅه کې له پنځو میلیونو ډیرو ډیرو شویو کتابونو محتويات تحلیل کړل. هغه معلومات چې دوی یې کارولي اوس د ګوګل ګرام ډاټاسټ په توګه خوشې شوي، او له همدې امله موږ کولی شو معلوماتو څخه کار واخلو څو د دوی ځینې کارونه تکرار او پراخ کړو.
د کاغذ په ډیری پایلو کې، میلیک او همکارانو په دې ټینګار وکړ چې موږ چټک او چټک هیر کوو. د یو ځانګړي کال لپاره، "1883"، "دوی هر کال د 1875 او 1975 کلونو ترمنځ خپاره شوي 1 ګرام وزن په ګوته کړی چې" 1883 "وو. دوی دلیل درلود چې دا تناسب د پیښو هغه دلچسپي ده چې په هغه کال کې پیښ شوي. د دوی په 3a شمیره کې، دوی د دریو کلونو لپاره د کارونې تجربې په نښه کړې: 1883، 1910، او 1950. دا درې کاله یو عام شکل لري: له دې کال دمخه لږ کارول، وروسته سپک، او بیا پرېکړې. بله، د هرکال لپاره د ماتې اندازه ارزولو لپاره، میلیک او همکارانو د 1875 او 1975 کلونو ترمنځ د هر کال "نیم ژوند" حساب کړی. د دوی شمیره 3a (Inset) کې، دوی وښوده چې د هرې نیمایي ژوند کال کم شوی، او دوی استدلال وکړ چې دا پدې مانا ده چې موږ تیره چټکه او چټکه هیر کوو. دوی د انګلیسي ژبې ژبې نسخه کارولې، مګر وروسته بیا Google د قول اردو دوهم نسخه خپور کړ. مهرباني وکړئ مخکې له دې چې تاسو کود کوډ پیل کړئ د پوښتنې ټولې برخې ولولی.
دا فعالیت به تاسو ته د لیکلو وړ قابل کوډ لیکلو، د پایلو تشریح کولو، او د معلوماتو لیږدول تمرین وکړي (لکه د خرابو فایلونو سره کار کول او د ورک شوو معلوماتو اداره کول). دا فعالیت به تاسو سره د یو بډای او زړه پورې ډاټاټیسټ سره مرسته او چلولو کې هم مرسته وکړي.
د Google Books گرام ناظر ویب پاڼه څخه خام ډاټا ترلاسه کړئ. په ځانګړې توګه، تاسو باید د انګلیسي ژبې قول اردو نسخه 2 کاروئ، کوم چې د 2012 د جوالی په 1 خپور شو. ناڅاپي، دا فایل 1.4GB دی.
د Michel et al. (2011) 3a انځور 3a برخه برخه وخورئ Michel et al. (2011) . د دې شمیرې د بیا راټولولو لپاره، تاسو دوه دوسیې ته اړتیا لرئ: هغه یو چې تاسو په (الف) او د "ټول حسابونو" فایل کې ډک کړئ، کوم چې تاسو کولی شئ خام حساب په تناسب بدل کړئ. په ياد ولرئ چې د ټول شمېرنې فايل يوه جوړښت لري چې ښايي دا په لوست کې سخته ستونزمنه کړي. ايا د ګرامر ډاټا د نسخه 2 ورته Michel et al. (2011) وړاندې شوي هغو ته ورته نتيجې وړاندې کوي Michel et al. (2011) ، کوم چې د نسخه د معلوماتو ډاټا پر بنسټ دي؟
اوس د ګراف په وړاندې خپل ګراف وګورئ د ګرامر ناظر لخوا جوړ شوی.
د یادونې شمیره 3a (اصلي څېره)، مګر د \(y\) -کسسونو بدلولو لپاره د خام شمیرې شمیرې (د بیان شرح نه).
ایا د (ب) او (d) تر منځ توپیر تاسو ته د مشیر ایت او د هرې پایلې بیاکتنه کولو لپاره الرښوونه کوي. (2011). ولې ولې نه؟
اوس، د ماخذونو تناسب په کارولو سره، د 3a شمیره حرف تشریح کړئ. دا د هر کال لپاره د 1875 او 1975 کلونو ترمنځ، د کال نیمايي ژوند محاسبه کوي. نیمایي ژوند د هغو کلونو شمیرل کیږي چې مخکې له دې چې د متن تناسب یې د لوړو لوړو ارزښتونو ته رسیږي تیر شي. په یاد ولرئ چې Michel et al. (2011) د آنلاین معلوماتو ملاتړ کولو دریمې برخې وګورئ برخه III.6 اټکل کولو لپاره یو څه نور پیچلي کوي - مګر دوی ادعا کوي چې دواړه طریقې ورته پایلې تولیدوي. ایا د ګرام ډاټا نسخه 2 ورته ورته پایلې وړاندې کوي چې Michel et al. (2011) ، کوم چې د نسخه د معلوماتو ډاټا پر بنسټ دي؟ (اشاره: که حیران نه وي نو حیرانتیا مه کوئ.)
ایا هلته کوم کلونه موجود وو چې سالکاران وو لکه کلونه چې په چټکۍ سره یا په خاصه توګه ورو ورو ایستل شوي؟ په لنډه توګه د دې ډول نمونو لپاره د ممکنه دلیلونو په اړه تشریح کړئ او تشریح کړئ چې تاسو څنګه تخصیص پیژني.
اوس دا نتیجه د چین، فرانسوی، آلمان، عبراني، ایټالوی، روسی او اسپانیې کې د نگرامس ډاټاونو نسخه 2 نسخه.
په ټولو ژبو کې پرتله کول، ایا هغه کلونه وې چې پخوانی وو، لکه لکه کلونه چې په چټکۍ سره یا په ځانګړي ډول ورو ورو ورو ایستل شوي؟ په لنډه توګه د دې نمونې لپاره د ممکنه دلیلونو په اړه وضاحت وکړئ.
[ ، ، ، ] Penney (2016) د 2013 کال په جون کې د NSA / PRISM سروې (لکه سنوډن خبرونه) په اړه پراخې تبلیغات د نیکمرغه اندیښنو لوړولو په اړه د ويکيپېډيا مضمونونو ته د ترافيکو په وړاندې د چټک او ناڅاپي کمښت سره تړاو درلود. که داسې وي، په چلند کې دا بدلون به د مسایلو اغیزې سره مساوي وي چې د ډله ایزو څارنې څخه پایله ولري. د Penney (2016) تګلاره ځینې وختونه د مداخلې وخت لړۍ ډیزاین بلل کیږي، او دا هغه هغه کړنو پورې تړاو لري چې په 2.4.3 برخه کې بیان شوي.
د موضوع کلیدي غوره کولو لپاره، پیني د ټولنیزو رسنیو د څارلو او څارنې لپاره د متحده ایاالتو د کورني امنیت ریاست لخوا کارول شوی لیست ته راجع شوی. د DHS لست د ځینو مسلو په اړه د ځینې محاکمې ځینې شرایط په ګوته کوي، لکه "د روغتیا اندېښنه،" "زیربنا امنیت،" او "ترهګريزم." د مطالعې ډلې لپاره، پیننی 48 ټکي غوره کړي چې "تروریزم" پورې تړاو لري) ضمیمه جدول 8 وګورئ ). هغه د ويکيپېډيا مجموعي مقاله د 48 ويکيپېډيا مقالو مقالو لپاره د مياشتې په 32 مياشتنۍ دوره کې، د 2012 کال د اګست تر پايه پورې د 2012 کال د اګست تر پايه پورې د 32 مياشتو په موده کې په مياشتنۍ توګه حسابوي. د هغه د استحکام لپاره، د نورو موضوعاتو مقالو نظریات.
اوس تاسو به د Penney (2016) پراخولو او پراخولو ته روان شئ. هغه ټولې خامې ډاټا چې تاسو یې د دې فعالیت لپاره اړتیا لرئ د ويکيپېډيا لخوا موجود دي. یا تاسو کولی شئ د R-pack پیکج ویکپپیټریټر (Meissner and R Core Team 2016) . کله چې تاسو خپل ځوابونه ولیکئ، مهرباني وکړئ په یاد ولرئ چې د کومې سرچینې سرچینې مو کارولې. (یادونه وکړئ چې دا فعالیت هم په شپږم څپرکی کې لیدل کیږي.) دا فعالیت به تاسو د ارقامو سره سم کولو او د سترو ارقامو سرچینو کې د طبیعي تجربو په اړه فکر وکړئ. دا به تاسو ته د راتلونکو پروژو لپاره د احتمال سره په زړه پورې ډاټا سرچینې سره پرمخ وړل کیږي.
[ ] Efrati (2016) د محرم معلوماتو پراساس راپور ورکړ چې د فیس بوک په اړه "ټول شریکولو" په کال کې 5.5٪ کمښت راغلی، پداسې حال کې چې "اصلي خپرونې" په کال کې 21٪ کمه وه. دا کمښت په ځانګړي ډول د فېسبوک کاروونکو سره د 30 کلونو کم عمر درلود. راپور کمښت دوه عوامل ته منسوب کړی. یو د فیسبوک په اړه د "ملګرو" د خلکو په شمیر کې وده ده. بله دا ده چې د شریکولو ځینې فعالیتونه پیغامونه او سیاقانو ته لکه Snapchat ته لیږدول شوي. راپور دا هم روښانه کړه چې ډیری تاکتیکونه فیس بوک هڅه کړې چې د شریکولو لپاره وده ورکړي، په شمول د نیوز فیډ الګوریتم ټیککس شامل دي چې اصلي پوستې نور مهم او همدارنګه د "دې ورځې" ځانګړتیا سره اصلي پوستونو وختي یاددښتونکي جوړوي. کومې اغیزې، که وي، نو دا موندنې د څیړونکو لپاره دي چې غواړی د فېسبوس څخه د معلوماتو سرچینې په توګه کار واخلي؟
[ د ټولنپوهنه او تاریخ پوه تر مینځ توپیر څه شی دی؟ د Goldthorpe (1991) وینا، اصلي توپیر د معلوماتو راټولولو په اړه کنټرول دی. تاريخپوهان مجبور دي چې د هستوګنې کار واخلي، پداسې حال کې چې ټولنپوهنه کوالى شي د خپلو معلوماتو د راټولولو ځانګړتياوو ته چمتو کړي. د Goldthorpe (1991) لوستل Goldthorpe (1991) . د ټولنیزو او تاریخي اړیکو تر مینځ توپیر څه دی؟
[ ] دا په تیرو وختونو کې جوړوي. Goldthorpe (1991) یو شمیر مهمې ځوابونه راپارولي دي، په شمول د نیک هارت (1994) ، چې د ډیزاین شویو معلوماتو لپاره د ګوتوورتوراپي ویناوو ننګونې کړې. د درملو شویو معلوماتو احتمالي محدودیتونو روښانه کولو لپاره، هارت د کارموندنې کاري کاري پروژه بیان کړه، یوه لوی سروې یې وښودله چې د ټولنیز ټولګي او رایې تر مینځ اړیکه اندازه کړي چې د 1960 او 1960 کلونو په منځ کې د ګورډورتورپ او همکارانو لخوا ترسره کیده. لکه څنګه چې کیدای شي د یو پوهان څخه تمه ولري چې د موندلو معلوماتو په اړه ډیزاین شوي ډاټا یې منلې، د کار کاري کاري پروژه هغه معلومات را ټول کړي چې د وروستي وړاندیز شوي نظرپوښتنې په اړه د ټولنیز ټولنیز راتلونکي په اړه د ژوند معیارونو زیاتولو په اړه حل کولو لپاره برابر شوي. مګر، گولتورتور او همکاران یو څه "میرمن" وو چې د ښځو د رایې ورکولو د چلند په اړه معلومات راټول کړي. دلته دا ده چې نکسي هارت (1994) د ټولیزې لنډیز لنډیز:
"... دا دومره ستونزمنه خبره ده چې د پایلې څخه مخنیوی وشي چې میرمنې لیرې شوي ځکه چې دا خیاط جوړ شوی ډاټاټیس د یو ولایتي منطق له خوا محدود و چې ښځینه تجربه یې بې برخې کړه. د ټولګي د شعور نظریاتي لید او د نارینه تبلیغاتو په څیر عمل ...، گولتورتور او د هغه همکارانو د تجربو یو داسې ځانګړتیاوې رامینځته کړې چې د مناسبتیا یو باوري ازموینې ته یې د دوی پر ځای خپل نظریاتي مفکورې پیاوړې کړې. "
هارت دوام لري:
"د کارموندګر کاري کار تجربه موندنې موږ د منځنۍ پیړۍ ټولنیزولوژی د مذکور ارزښتونو په اړه د نورو معلوماتو په پرتله د سټراټیشن، سیاست او مادي ژوند پروسو ته خبر ورکوو."
آیا تاسو کولی شئ د نورو مثالونو په اړه فکر وکړو چېرته چې د درجی جوړ شوی ارقامو راټولول د معلوماتو ډایرکټور په اساس جوړ شوی دی؟ دا د الګوریتمیک اعتراف څنګه پرتله کوي؟ کومې اغیزې ممکن دا وي چې کله څیړونکي د ریډیمیم کارولو څخه کار واخیستل شي او کله چې دوی د ماین پاکۍ کارول وکاروي؟
[ په دې څپرکی کې، ما د هغو څیړونکو له خوا راټول شوي معلومات چې د شرکتونو او حکومتونو لخوا رامینځته شوي اداري ریکارډونو سره راغونډ شوي دي. ځینې خلک دا اداري ریکارډونه "موندلي ډاټا،" چې دوی یې "ډیزاین شوي ډاټا" سره توپیر لري. دا سمه ده چې اداري ریکارډین د څیړونکو لخوا موندلي، مګر دوی هم ډیزاین شوي دي. د بیلګې په توګه، د عصري تخنیک شرکتونه د دوی معلوماتو راټولولو او جریان لپاره خورا سخت کار کوي. لدې کبله، دا اداري ریکارډونه دواړه وموندل شوي او ډیزاین شوي، دا یوازې ستاسو په نظر پورې اړه لري) 2.12 شمیره (.
د معلوماتو سرچینې بیلګه وړاندې کړئ چیرې چې وګورئ دواړه وموندل شي او ډیزاین یې د تحقیق لپاره د دې سرچینې سرچینې کارولو کې ګټور وي.
[ په یوه مفکوره مضمون کې، کریسټینډ سینڈویګ او اسزر حرګتی (2015) ډیرو پراخو کټګوریو ویشلي دي چې ایا دا ډیجیټل سیسټم د "وسیله" یا "د مطالعې اعتراض" دی که نه. یوه وسیله د څیړنې پلټنه د بنسټسن او د همکارانو (2011) لخوا په 2010 کې د زلزلې وروسته د مهاجرت د تعقیب لپاره د ګرځنده تلیفون معلوماتو کارولو لپاره کارول کیږي. د دویم ډول مثال چېرته چې سیسټم د مطالعې اعتراض دی - د جینسن څیړنه ده. (2007) کې د موبایل تلیفونونو معرفي کولو څرنګوالی، څرنګه چې کیلي په مارکېټ کې د مارکيټ فعالیت په اغیزناکه توګه اغیزمن کړ. زه دا توپیر ګټور وموم ځکه چې دا د ډیجیټل ډاټا سرچینو کارولو سره روښانه څیړنه کولی شي مختلف توپیرونه ولري حتی که دوی ورته ورته سرچینې کاروي. د دې توپیر د روښانه کولو لپاره، څلور مطالعې چې تاسو یې لیدلي دي بیان کړئ: دوه هغه چې د یوې وسیلې په توګه ډیجیټل سیسټم کاروي او دوه یې د مطالعې د اعتراض په توګه د ډیجیټل سیسټم کاروي. تاسو کولی شئ د دې فصل څخه مثالونه وکاروئ که تاسو وغواړئ.