Qaar ka mid ah macluumaadka in shirkadaha iyo dawladaha ay leeyihiin waa xasaasi ah.
Shirkadaha caymiska caafimaadku waxay leeyihiin macluumaad faahfaahsan oo ku saabsan daryeelka caafimaad ee ay heleen macaamiishooda. Macluumaadkan waxaa loo isticmaali karaa cilmi baaris muhiim ah oo ku saabsan caafimaadka, laakiin haddii ay noqoto mid dadwaynaha, waxay keeni kartaa dhaawac maskaxeed (tusaale ahaan, ceebeyn) ama waxyeelo dhaqaale (tusaale ahaan, shaqo la'aanta). Meelo kale oo badan oo macluumaad weyn oo xog ah ayaa sidoo kale leh macluumaad macquul ah , taas oo qayb ka ah sababta ay u badan tahay in aan la heli karin.
Nasiib darro, waxay u muuqataa inay aad u adag tahay in la go'aamiyo xogta dhabta ah (Ohm 2015) , sida lagu muujiyey abaalgudka Netflix. Sidii aan ku sharxi lahaa cutubka 5, 2006 Netflix wuxuu sii daayay 100 malyan oo qiimeyn ah oo ay bixisay qiyaastii 500,000 oo xubnood oo heystey wicitaan furan halkaasoo dadka ka yimid adduunka oo dhan ay soo gudbiyeen algorithms kuwaas oo hagaajin kara awoodda Netflix ee ku talin kara filimada. Ka hor inta aan la soo saarin xogta, Netflix waxa ay soo saartay wixii caddayn ah ee shakhsi ahaan caddaynaya, sida magacyada. Laakiin, laba asbuuc ka dib markii xogta la sii daayay Arvind Narayanan iyo Vitaly Shmatikov (2008) ayaa muujiyay inay suurtagal tahay in ay wax ka bartaan dadka khaaska ah ee filimka iyaga oo isticmaalaya trick in aan ku tusin doono cutubka 6aad. In kasta oo uu weeraray uu ogaan lahaa Qiimaynta filimka qofku, weli ma muuqato inuu yahay wax xasaasi ah halkan. Inkastoo laga yaabo inay guud ahaan run ahaantii, ugu yaraan qaar ka mid ah 500,000 oo qof ee xogta ku jira, qiimeynta filimku waxay ahaayeen kuwo xasaasi ah. Xaqiiqdii, ka jawaabista sii-deynta iyo dib-u-aqoonsiga xogta, haweeney haween ah oo xiran ayaa ku biirtay dacwad cadaadis ah oo ka dhan ah Netflix. Waa kuwan sida dhibaatada loo soo saaray dacwaddan (Singel 2009) :
"[M] xogta qiimaha iyo qiimeynta waxay ku qoran yihiin macluumaad ku saabsan ... dabeecad aad u saraysa iyo mid xasaasi ah. Xogta filimada ee xubnaha ayaa muujinaysa danta shakhsi ahaaneed ee Netflix iyo / ama la halgamaan arrimaha kala duwan ee shakhsi ahaaneed, oo ay ka mid yihiin galmada, jirada maskaxda, ka soo kabashada khamriga, iyo dhibanaha ka soo jiidashada, jirdilka jirka, rabshadaha qoyska, sino, iyo kufsashada.
Tusaalahan waxay muujinaysaa in ay jiri karto macluumaad ay dadku u arkaan in ay tahay mid xasaasi ah oo ka mid ah waxa laga yaabo inay u muuqdaan in ay yihiin xog-ururin aan wanaagsaneyn. Dheeraad ah, waxay muujineysaa in difaaca guud ee cilmi-baarayaashu ay shaqaaleysiinayaan si loo ilaaliyo xogta xasaasiga ah-de-aqoonsi-waxay ku guuldareyn kartaa siyaabooyin la yaab leh. Labadan fikradood ayaa si faahfaahsan uga soo baxa cutubka 6aad.
Waxyaabaha ugu dambeeya ee maskaxda ku haya xogta xasaasiga ah waa in ururinta iyada oo aan oggolaanshuhu uu kicinayo su'aalaha anshaxa, xitaa haddii aan wax khasaare ah gaarin. Sida badan oo kale sida daawashada qof qubaysan iyada oo aan ogolaanshahooda laga yaabo in loo tixgeliyo xadgudubka qofkaas gaarka ah, ururinta macluumaadka xasaasiga ah -waxaadna xasuusataa sida ay u adag tahay in la go'aamiyo waxa uu yahay mid xasaasi ah - iyada oo aan ogolaansho laga abuuro walaacyo qarsoodi ah. Waxaan ku soo laaban doonaa su'aalaha ku saabsan qarsoodiga cutubka 6aad.
Gebogebada, ilaha xogta ee weyn, sida diiwaannada maamulka dawladda iyo ganacsiga, guud ahaan looma abuurin ujeedada cilmi baarista bulshada. Ilaha xogta ee maanta, oo laga yaabo inay berrito, waxay u muuqdaan inay leeyihiin 10 dabeecadood. Qaar badan oo ka mid ah guryaha guud ee loo arko in ay u fiicanyihiin cilmi-baaris-weyn, marwalba, iyo kuwa aan firfircooneyn-waxay ka yimaadaan xaqiiqooyinka shirkadaha da 'da iyo kuwa dowladaha hoose ay awoodaan inay ururiyaan xogta miisaan aan hore loo arag. Iyo qaar badan oo ka mid ah hantida guud ahaan loo arko in ay u xun tahay cilmi-baaris aan dhameystirnayn, aan la helin, aan shukaansi lahayn, qulqulaya, algorithmically confounded, aan la heli karin, wasakh, iyo xasaasiyad - ka yimid xaqiiqda ah in xogahani aanay soo ururin cilmi baarayaasha. Illaa iyo hadda, waxaan ka wada hadlayaan xogta dowladda iyo ganacsiga, laakiin waxaa jira farqi u dhaxeeya labadaas. Marka aan waayo-aragnimadayda, xogta dawladdu waxay u egtahay in ay noqoto mid aan ku-saleysnayn, oo aan la fahmin, oo aan qarsoodi lahayn. Dhinaca kale, diiwaannada maamulka ganacsiga waxay u muuqdaan kuwo had iyo jeer ah. Fahamka 10-kii astaamood ee guud ayaa ah talaabada ugu horeysa ee waxtarka u leh barashada ilaha xogta waaweyn. Hada waxaan u jeednaa istaraatiijiyado cilmi baaris ah oo aan ku isticmaali karno xogtan.