Hin ji yên ku agahiyên ku şîrket û hikûmetan hesas e.
Sîgorteyên sîgorteyên tendurustiyê li ser lênêrînê ya ku ji hêla mişteriyên xwe têne damezrandin. Ev agahî dikare ji bo lêkolîna girîng ya tendurustî tê bikaranîn, lê heger ew gelemperî be, dibe ku dibe ku dibe sedema zerarê hestyarî (wek mînak, şehîdkirin) an jî zirarê aborî (wek mînak, windakirina kar). Gelek çavkaniyên din ên daneyên mezin ên me hene ku agahdar e ku hesas e , ku beşek ji sedemên ku ew pir caran neheq in.
Mixabin, ew eşkere bû ku ew biryar da ku çi agahdarî bi rastî (Ohm 2015) hestî ye, wekî xelata Netflix diyar kir. Wekî ku ez ê di beşa 5ê de, di sala 2006 de Netflix de wezareta nêzîkî 500,000 fîlmên ku bi tevahî cîhanê algorîtmên pêşkêş kiribû ku dikare ji bo fîlmên pêşniyazkirina Netflix re çêtir bikin baştir bikin. Berî berî daneyên danûstandin, Netflix agahdariyên kesane bi kesayetiyê nasnameyek jê veşartî, wekî navên. Lê, du heftan piştî daneyên berdan daneyên Arvind Narayanan û Vitaly Shmatikov (2008) diyar kir ku ew di derheqê fîlmên fîlmên ku ji bo hûn di beşa we de nîşanî dikişînin, fêr dibe ku ew fêr bibe. Rêjeya fîlmên kesan, hîna jî li vir nerazî ne tiştek xuya ye. Dibe ku ev dibe ku di gelemperî de, ji bo kêmtir 500,000 kesan di dataset, fîlmên hûrgelan hestyar bû. Di rastiyê de, di bersiva vekirina danûstendinê û re-nasnameya daneyên, jineke nêzîkkirî ya jinê ya Netflix li dijî Netflix-ê çalakiyek tevlî bûn. Va ye ku ev pirsgirêk di vê zagonê de (Singel 2009) :
"[M] ovie û rêjeya danûstandinê agahdariyên pisporî ye ... xwezayî ya kesane û hestiyar. Daneyên fîlmanê endamê Netflix ji berjewendiya şexsî dike û / yan pirsgirêkên cinsî, nexweşiya derûnî, ji alkolê veguhastin, û qurbaniyê, şîdeta fîzîkî, tundûtûjiya navxweyî, zilamê û tecrûbeyê têkoşîna têkoşînê dike. "
Ev nimûne nîşan dide ku hin agahdarî dibe ku hin kesan di hundurê ku dane ku databasek belengaz be. Ji bilî, ew nîşan dide ku parastina serekî ku lêkolîner dixebitin da ku daneyên danûstendiyên hesas ên hesab-parastin-bi rêbazên şaş in. Ev du fikrên di pirtûka 6'an de bêtir agahdarî hatine pêşxistin.
Wateya dawî ya ku di agahdariya hestyarî de hişyar e, ew bêyî ku bêyî gelên mirovî nerazîbûna ramanên ethnîkî rahev dikin, heta ku zehfek taybet tune ne. Gelek tiştek dît ku kesek bêyî destûra xwe ya zindî bibînin, dibe ku binpêkirina şexsî ya kesek, agahdariya hişmendî ya hişk-bîr -çav kirin û bîr bînin ku çiqas zehmet dibe ku biryarê çi ye-bêyî razîbûna pirsgirêkên nepesaziyê dibe. Ez ê di pirsên şeş 6 de li ser pirsên şexsî vegerim.
Di encamê de, çavkaniyên daneyên mezin, wekî qeydên hikûmetê û karsaziya bazirganî, bi gelemperî ne ji bo armanca lêkolîner a civakî tên afirandin. Çavkaniyên daneyên mezin ên îro, û gumanê sibê, bi taybetî taybetmendiyên 10 hene. Gelek taybetmendiyên ku bi gelemperî ji bo lêkolînê-pir, herdem, û nereactive-ji rastiyê ve di rastiyê de şîrketên derhênerî dîjîtal û ji hêla hikûmetê dikarin di asta peldanka ku berê ve ne. Gelek taybetmendiyên ku bi gelemperî têne lêkolîn kirin, ne ji bo lêkolînê-neheq, neheqîn, nerazîbûn, bêhêzkirin, algorîtmîk, tengahî, neheq, zehf û hest-xerab e ku ev dane ji hêla lêkolînerên ji lêkolîner ve nehatinhev kirin. Hê dûr, min li ser hikûmetê û daneyên karsaziyê re peyivandiye, lê di navbera her du cihan de hene. Di ezmûnê min de, daneyên hukumeta hikûmetê bi awayekî neprespresative kêm dibe, algorîtmîk kêm kêm bûye, û bêtir rabe. Ji aliyê din ve, qeydên îdarî yên bazirganî ji bo herdem her tim bêtir in. Têgihiştina van taybetmendiyên van gelemperî ji bo çavkaniyên daneyên mezin ên li ser gavê yekem alîkar e. Û niha em ji stratejiyên lêkolînê veguherînin ku em bi vê dataê bikar bînin.