Çavkaniyên daneyan Big dikare were bi kar ênan û spam barkirin.
Hin lêkolîner bawer dikin ku çavkaniyên daneyên mezin, bi taybetî çavkaniyên vekirî, ewrûpî ne ji ber ku ew bixweber bixweber kirin. Di rastiyê de, kesên ku bi çavkaniyên daneyên daneyên mezin ên kar dixebitin ew dizanin ku ew gelek caran germ ne . Ew e, ew bi gelemperî dane dike ku çalakiyên rastîn ên ku ji bo lêkolînerên rastîn nake. Pir zanistên sosyal ji ber pêvajoya paqijkirina lêkolînê ya civakî ya sosyal-sosyal, ji ber çavkaniya daneyên mezin ên paqij dibe ku bêtir zehmet e. Ez bawer dikim çavkaniya dawî ya vê zehmet e ku gelek çavkaniyên çavkaniyên mezin ên ku ji bo lêkolînê ve têne bikaranîn, ji wan re nehatiye bikaranîn, û ji ber ku ew nehêle, tomar kirin, û belgeyên ku paqijkirina danûstendina pêdivî dikin.
Danûstandinên dagir ên dravî yên dravî yên ji hêla paşde û hevalên xwe ve têne dîtin " (2010) lêkolînek hestyarî li ser êrîşên 11ê îlonê, 2001ê de, ku ez di beşê pêşî de di bin beşa borî de got. Lêkolîneran bi gelemperî bersiva ku ji daneyên paşveçûnê ve di meh an jî heta salan de tê berhev kirin. Lê belê, Berê û hevalên xwe ji çavkaniyên dîmên dîjîtal-tim timedamp, bixweberên xwe ji 85,000 dîktatorên xwe bixweber hatine tomar kirin-û ev yek ji wan re bersiv da ku bersivek hestyarî li ser demên dirêjtir bixwînin. Wan ji hêla xemgîniya demokrasiya 11-ê Îlonê ve diaxivin, ji hêla mizgîniya hestyarî ya peyamên xemgîniyê ve ji sedî xeberên peywendîdar (1) xemgîniyê (wek "cry" û "grief"), (2) xemgîn ( nimûne, "xemgînî" û "ditirsî"), û (3) hêrsa (nimûne, "hate" û "nerazî"). Wan dît ku xemgîniyê û xemgîniyê bi tevahiya rojan bêyî berbi hêzek xurt kirin, lê ew di tevahiya rojê de xezebek mezin bû. Ev lêkolînek eşkere ye ku hêzek çavkaniyên daneyên danûstandinên berbiçav: eger çavkaniyên daneyên daneyên kevneşopî bikar anîn, ew dê nimûne pêvajoya bilind a çareseriya xala ku ji bo bersivka yekser nerazîbûna lezgîn be.
Lê piştî salekê tenê, Cynthia Pury (2011) di daneyên bêtir bi baldarî dîtin. Wî dît ku peyamên giran ên pir xeber ji hêla yek pager ve hatin afirandin û ew hemî yekem bû. Va ye ku peyamên hêrs ên ku ji wan re got:
"Makîneya nû ve NT [name] li kabîneya [name] li [location]: krîzîsî: [date û dem]"
Ev peyamên hêrsa wan ji ber ku ji wan re gotina "krîtîk", hebe ku dibe bi gelemperî xezebî lê lê di vê rewşê de hebû. Dema ku ev pagerê otomatîkî ji hêla yekgirtî ve hatî çêkirin, bi temamî xuya dibe ku di seranserê rojê de (xorta 2.4). Di heman demê de, encamên sereke li Back, Küfner, and Egloff (2010) ji berhemek yek ji xerîb bû. Wekî mînak mînak, nirxandineke hêsan a nirxên pirrjimar û danûstandinên pirrjimarte heye ku pir zehf çewt e.
Dema ku daneyên gazî yên bêkêmasî-wek ku ji ji hêla pişkek hêşîn ve têne çêkirin-ji hêla lêkolînerek bi baldarî vekolînê ve tê dîtin, ew sîstemên hinek ên din hene ku spamanên zanistî bikişînin. Ev spammers bi awayekî vekirî têne daneyên danûstandinên hilberîn, û-caran bi gelemperî zehf dikin ku karûbarên xwe veşartin. Ji bo nimûne, çalakiya polîtîk li ser xuya dibe ku bi kêmîre hin hûrgelên sophisticated, tevî ku hin sedemên siyasî bi awayekî zanistî têne çêkirin ku ji hêla gelemperî (Ratkiewicz et al. 2011) . Mixabin, berevajî vê spas veguhastin gelek zehmet dibe.
Bêguman daneyên gazî çi tête hesab kirin, di çarçoveya pirsê de lêkolînê ye. Ji bo nimûne, gelek guhertinên bi Wikipedia-ê ji hêla otomotîkên otomotîk ve têne çêkirin (Geiger 2014) . Heke hûn ecolojiya Wikipedia-ê bisekinin, hingê ev bot-ê veguherandin çê bûne girîng in. Lê heger hûn ji ber ku çawa mirovên Wikipedia di beşdariyê de beşdar dibin, hingê divê guherandinên bot-ê bêne avêtin.
Di teknolojiya statîstîk de an nêzîkbûnek ku hûn dikarin agahdariya wezîfeya xwe ya qirêj paqij kirine tune. Di dawiyê de, ez riya herî baş e ku ji ber daneyên bêkêmayî yên bêaqilî nebe ku ji ber ku hûn daneyên we hatine çêbirin, fêm bikin.