Big معلوماتي سرچینو سره بی ګټی او سپم کېدلی.
يو شمېر څېړونکي باور لري چې ستر معلوماتي سرچینو، په ځانګړې توګه له آنلاین سرچینې د هغو، ځکه هغوی په اتوماتيک ډول راټول شوي دي روایتا. په حقيقت کې، هغه خلک چې له ستر معلوماتو د سرچينو په کار کړې دې پوه شي چې هغوی دي په وار وار چټل دی. دا ده چې، دوی په وار وار د معلوماتو چې د څېړونکو په ګټه اصلي کړنو څرګندونه نه کوي شامل دي. زيات شمېر ټولنيز پوهان مخکې له مخکې د په لویه کچه د ټولنیز سروې د معلوماتو د دوو دليلونو نور هم ستونزمن پاکول، خو لوی معلوماتي سرچینو د پاکولو د هغې پروسې سره بلد دي له: 1) د دوی له خوا د څیړونکو لپاره د څېړونکو او 2) څېړونکو نه دي جوړ په عمومي توګه د څومره لږ درک دوی جوړ شوي وو.
د چټل ډیجیټل مصرفه معلوماتو د خطر له خوا د Back او د همکارانو د توضيح شوي دي (2010) د د د سپتمبر د 11 د بریدونو د احساساتي غبرګون 2001. څېړونکي په خاصه توګه د غمجنې پېښې له تفکره د معلوماتو له مياشتو او آن کلونو را په کارولو سره ځواب زده مطالعه. خو، شاته او همکارانو څخه 85.000 د امریکا یو تل-on د ډيجيټل شونې-د timestamped سرچينه، په اتوماتيک ډول ثبت پېغامونه وموندل pagers او دا د څېړونکو فعالولو ته په يوه ډېره میده ونکړئ احساساتي غبرګون زده کړه وکړي. Back او همکارانو له خوا د (1) د غمونو اړوند لغاتونه سلنه له خوا د: Table پېغامونه احساساتي محتوا د کوډونې یوه دقیقه-by-دقیقه کې د سپتمبر 11th احساساتي مهال ویش جوړ (د بيلګې په توګه، په ژړا، غم)، (2) د اضطراب (د بيلګې په توګه، اندېښمن، وېره)، او (3) قهر (د بيلګې په توګه، د کرکې، انتقادي). دوی موندلي چې د غمونو او اضطراب د ورځې په اوږدو او قوی ځانګړتیاوی پرته د بدلون، خو چې د ورځې په اوږدو کې د غوسې او غټ لوړ ؤ. په دې څیړنه کې داسې بريښي چې په تل-on معلوماتي سرچینو د بريښنا د يوه په زړه پوري انځور وي: معياري میتودونو په کارولو سره به دا ناممکن کار د داسې يو لوړ د حل د تر نامتوقع پيښه چټک غبرګون ته مهال ویش ولري.
يوازې د يو کال وروسته، که څه هم، Cynthia Pury (2011) د معلوماتو وکتل په احتياط سره. نوموړې کشف چې د فرضي غوسه پېغامونه یو زیات شمیر یو واحد: Table له خوا رامینځ ته شوي دي او د هغوی د ټولو وي. دلته هغه څه دي د هغو په فرضي ډول په غوسه پېغامونه وويل:
"Reboot NT ماشین [نوم] په کابینې [نوم] [ځای] په: ترینګلې: [هغه وخت او نېټې]"
دغه پيغامونه شوي په غوسه بلله ځکه چې دوی کلمه "مهمې"، چې کېدای شي په عمومي غوسه ښيي، خو په دې صورت کې نه دي. د پېغامونه ډول د دې واحد اتومات: Table لرې کول په بشپړ ډول د نن ورځې (2.2 شکل کې) په اوږدو کې په قهر څرګند زیاتوالی له منځه وړي. په بل عبارت، په اصلي پایله Back, Küfner, and Egloff (2010) د یو: Table یو اثر و. څرنګه چې دا مثال بیانوې، چې د نسبتا پيچلې او ګډوډ معلومات نسبتا ساده تحلیل د دې وړتيا لري توګه ناسمه لاړ لري.
په داسې حال کې چټل ارقام دي چي په توګه له یوه غالمغال قصدا لکه جوړ: Table-کولای شي یوه معقوله احتياط څېړونکي له خوا کشف شي، داسې يو شمېر انلاین سیستم چې په قصدي spammers جذب هم دي. دا spammers په فعاله توګه د جعلي معلوماتو د تولید، او زياتره له خوا د ګټې کار ډېر سخت هڅول چې خپل فهرسه پټ وساتي. د مثال په توګه، د سياسي فعاليت په ټوېټر کې داسې ښکاري چې لږ تر لږه يو شمېر معقوله عصري سپم، چیرې چې ځينې سياسي لاملونه دي په قصده ته زيات مشهور په پرتله واقعي دي وګورو شامل دي (Ratkiewicz et al. 2011) . څېړونکو سره د معلوماتو د کار چې ښايي قصدي سپم لري د خپلو اورېدونکو لپاره چې دوی کشف او اړونده سپم لرې قانع ننګونو سره مخامخ دي.
په پای کې، هغه څه چې په پام کې چټل معلوماتو کې په خپلو څيړنو پوښتنې ځیرک لارو کولای پورې اړه لري. د مثال په توګه، د د ويکيپېډيا په ډېرو سمونونه له خوا اتومات کالنې جوړي شوي دي (Geiger 2014) . دي که تاسو د ويکيپېډيا په ايکولوژي سره مينه ولري، نو په دغه کالنې مهم دي. خو، که تاسو په انسانانو کې څومره مرسته د ويکيپېډيا سره مينه ولري، دا سمونونه له خوا د دغو کالنې بايد وايستل شي.
د غوره لارو چارو د مخنيوي په غرق خوا چټل مالومات دي چې پوه شي چې څنګه ستاسو معلومات ساده اکتشافي تحلیل ترسره کړي، لکه د جوړولو ساده توزیعی جوړ شوي وو.