Big معلوماتي سرچینو سره بی ګټی او سپم کېدلی.
ځینې څیړونکي پدې باور دي چې د ډیټابیس سرچینې، په ځانګړې توګه د انلاین سرچینې، مخکینۍ دي ځکه چې دوی په اتوماتيک ډول راټول شوي. په واقعیت کې، هغه خلک چې د لویو معلوماتو سرچینو سره کار کاوه پوهیږي چې دوی ډیری وخت خراب وي . دا هغه مهال دي چې هغه معلومات پکې شامل دي چې د څیړونکو لپاره د ګټو اصلي فعالیتونه منعکس نه کوي. ډیری ټولنیز ساینس پوهان له پخوا څخه د ټولنیزې سروې ډیټا پاکولو پروسې سره واقف دي، مګر د سترو معلوماتو سرچینې پاکول خورا ګران کار دي. زما په اند د دې ستونزې وروستنۍ سرچینه دا ده چې د دغو سترو معلوماتو سرچینې هیڅکله هم د څیړنې لپاره کارول شوي نه و، او له دې امله دوی ندي راغونډ شوي، ذخیره شوي او مستند شوي چې د ډاټا پاکولو اسانتیاوې برابروي.
د گندی ډیجیټل ټریس معلوماتو خطرونه د Back او همکارانو لخوا (2010) د 2001 کال سپتامبر 11، 11 د احساساتي غبرګون مطالعه کوي، کوم چې ما په لنډ ډول په څپرکی کې یادونه وکړه. څیړونکي عموما د اخلاقي پیښو په وړاندې غبرګون مطالعه کوي چې د وروستي معلوماتو په کارولو سره د میاشتو یا حتی کلونو څخه راټول شوي. مګر، شاګردان او ملګري د ډیجیټل ټاټوبونو تل سرچینه وموندله - د وخت په وخت کې د 85،000 امریکايي پټرونو څخه په وختونو وختونو ثبت شوي پیغامونه - او دا یې توانیدلي چې په خورا ښه وخت کې احساساتي ځواب مطالعه کړي. دوی د سپتمبر د 11 دقیقې احساساتي مهال ویش جوړ کړ چې د پوست پیغامونو احساساتي محتوا د کود (1 (غمیزې) د مثال په توګه، "ژړل" او "غم" (2 (اندیښنې) د مثال په توګه "اندیښنه" او "ډار")، او (3) غوسه (د مثال په توګه، "نفرت" او "نازک"). دوی وموندل چې خپګان او اندیښنې په ټوله ورځ د پیاوړتیا پرته پرته له مینځه ځي، مګر دا په ټوله ورځ په قهر کې ډیره لوړه کچه وه. دا څیړنه د تل د ډاټا سرچینو ځواک د حیرانتیا وړ انځور ښکاري: که چیرې د دوديز معلوماتو سرچینې کارول شوي وي، نو دا به ناممکن وي چې د غیر متوقعه پیښې په اړه د چټک غبرګون د دې ډول لوړ قرارداد وخت نیسي.
یوازې یو کال وروسته، سنتیا پووري (2011) د ډیټا په اړه په احتیاط سره ولیدل. هغه معلومه کړه چې د پام وړ غصه شوي پیغامونه د یوې پیښې لخوا رامینځ ته شوي او دوی ټول ورته ورته وو. دلته دا هغه څه دي چې په غوسه شوي ناراض پیغامونه یې وویل:
"Reboot NT ماشین [نوم] په کابینې [نوم] [ځای] په: ترینګلې: [هغه وخت او نېټې]"
دا پیغامونه په غوسه شوي ول ځکه چې دوی د "انتقالي" کلمه په کې شامل کړي، کوم چې کیدای شي په عمومی ډول غوسه څرګندوي مګر پدې حالت کې ندي. د دې اتوماتيک انځور لخوا جوړ شوي پیغامونه لرې کول په بشپړه توګه د ورځې په اوږدو کې د غصب څرګند څرګندوي (2.4 شکل). په بل عبارت، د Back, Küfner, and Egloff (2010) اصلي نتیجه د یوه قلمر اثاثه وه. لکه څنګه چې د دې مثال څرګندوي، نسبتا ساده نسبتا پیچلې تحلیل او خرابه ډاټا د احتمالي غلطو حرکتونو احتمال لري.
پداسې حال کې چې نا معلومه معلومات چې په غیرقانوني ډول رامینځته شوي لکه د یو پوزه پوج څخه - کیدای شي د یوې محتاط محقق لخوا کشف شي، داسې آنلاین سیسټمونه هم شتون لري چې د ارادي سپیمرونو جذب کوي. دا سپیمونه په فعال ډول جعلي ډیټا تولیدوي، او اکثرا د ګټې په واسطه هڅول کیږي - د دوی سپیم کولو پټ ساتلو لپاره خورا سخت کار کوي. د مثال په توګه، په ټویټر کې سیاسي فعالیت لږترلږه یو څه معقول مشخص سپیم شاملوي، پداسې حال کې چې ځینې سیاسي الملونه په اراده توګه د نورو مشهوریتونو په نظر کې نیولو سره جوړ شوي دي په حقیقت کې د دوی نسبت (Ratkiewicz et al. 2011) . له بده مرغه، د دې اراده لرونکی سپیم لرې کول خورا ستونزمن دي.
البته د څیړنې پوښتنې په اړه څه ګران تصور شوي ارقام د یوې برخې سره تړاو لري. د بېلګې په توګه، په ويکيپېډيا کې زيات شمېر سمونونه د اتوماتيک بوټو (Geiger 2014) لخوا جوړ شوي. که تاسو د ويکيپېډيا ايکولوژيو سره علاقه لرئ، نو بيا د دې بوټو په منځ کې بدلونونه مهم دي. مګر که تاسو غواړئ چې د انسان په ويکيپېډيا کې څنګه ونډه واخلئ، نو بيا د بوټو جوړ شوي تغيرات بايد بې برخې شي.
دلته هیڅ یو واحد احصائیه تخنیک یا تګلاره شتون نلري چې دا ډاډه کړي چې تاسو په پوره ډول ستاسو ګندو معلومات پاک کړي دي. په پاى کې، زما په اند د ګړنديو معلوماتو له امله د بيولو څخه د مخنيوي غوره لاره داده چې ستاسو د معلوماتو رامنځته کولو په اړه څومره ممکنه پوه شئ.