Khatarta macluumaadka waa khatarta ugu badan ee cilmi-baarista bulshada; waxay si aad ah u korodhay; waana khatarta ugu wayn ee la fahmi karo.
Caqabada labaad ee anshaxa ee cilmi-baarista digital-ka ah waa khatarta wargelinta , suurtogalnimada waxyeello ka timid soo bandhigidda macluumaadka (National Research Council 2014) . Dhibaatooyinka macluumaadka ee ka soo baxa bixinta macluumaadka shakhsi ahaaneed waxay noqon kartaa dhaqaale (tusaale ahaan, shaqo la'aanta), bulsho (tusaale ahaan, ceebeyn), maskaxiyan (tusaale ahaan, niyadjab), ama xitaa dambi (tusaale ahaan, xirista dhaqanka sharci darrada ah). Nasiib darro, da'da dijitaalku waxay kordhisaa khatarta macluumaadka - waxaa jira macluumaad badan oo badan oo ku saabsan dabeecadeena. Khatarta wargelinta waxaa lagu xaqiijiyay inay aad u adag tahay in la fahmo oo la maareeyo marka la barbar dhigo khataraha ka walaacsan cilmi baaris bulsheed, sida khatar jidheed.
Hal hab in cilmi bulsho yareeyo halista macluumaad waa "anonymization" xogta. "Anonymization" waa hab ka mid ah ay ka saareen lagu garan lahaa shaqsiga cad sida magaca, cinwaanka, iyo lambarka taleefanka ka xogta. Si kastaba ha ahaatee, habkan waa wax badan ka yar ku ool ah ka badan, dad badan ay ogaadaan, oo ay tahay, dhab ahaantii, si qoto dheer oo aasaas ahaan xadidan. Sidaa daraadeed, mar kasta waxaan ku tilmaami "anonymization," Waxaan isticmaali doonaa qaws inaan idin xusuusiyo in nidaamka this abuurtaa muuqaalka kore ee magaciisa laakiin aan magaciisa runta ah.
Tusaale muuqaal ah oo ku fashilmay "aqoonsi la'aanta" waxay ka timaaddaa dabayaaqadii 1990-kii ee Massachusetts (Sweeney 2002) . Guddiga Caymiska Kooxda (GIC) wuxuu ahaa hay'ad dawladeed oo mas'uul ka ah iibinta caymiska caafimaadka dhammaan shaqaalaha gobolka. Iyadoo loo marayo shaqadan, GIC waxay soo aruurisay diiwaanada caafimaad ee faahfaahsan oo ku saabsan kumanaan shaqaale dawladeed. Dadaallada lagu dhiirigelinayo cilmi baarista, GIC waxay go'aansatey in ay u dirto diiwaanadaas cilmi baarayaasha. Si kastaba ha ahaatee, iyagu ma wadaagin dhammaan xogtooda; halkii, waxay "qarsoodi" macluumaadkaas iyaga oo ka saaraya macluumaadka sida magacyada iyo cinwaanada. Si kastaba ha ahaatee, waxay ka tageen macluumaad kale oo ay u malaynayeen inay faa'iido u leeyihiin cilmi-baarayaasha sida macluumaadka dadweynaha (lambarka sirta, taariikhda dhalashada, qowmiyadda, iyo jinsiga) iyo macluumaadka caafimaadka (booqashada xogta, ogaanshaha, habka) (Jaantus 6.4) (Ohm 2010) . Nasiib darro, "tan aqoonsi la'aanta" ma ahan mid ku filan si loo ilaaliyo xogta.
Si loo muujiyo cilladaha GIC ee "qarsoodi", Latanya Sweeney-ka dibna arday ka qalinjabiyey MIT-ka ayaa bixiyay $ 20 si uu u helo diiwaanka codbixinta ee magaalada Cambridge, oo ah tuulada Massachusetts taliyaha William Weld. Diiwaanada codbixinta waxaa ku jira macluumaadka sida magaca, cinwaanka, lambarka koodhka, taariikhda dhalashada, iyo jinsiga. Xaqiiqda ah in xogta caafimaad iyo faylka cod-bixiyuhu ay wadaagaan xarumaha-zip code, taariikhda dhalashada, iyo jinsiga-waxaa loola jeedaa Sweeney inay xiriirin karto. Sweeney waxay ogaatay in dhalashadii Weld ee ahayd 31-kii July, 1945-kii, diiwaanka cod-bixinta ay ka mid yihiin lix qof oo ku nool Cambridge oo leh taariikhda dhalashada. Dheeraad ah, oo ka mid ah lixdaas qofood, saddex kaliya ayaa ahaa rag. Oo, seddexdaas nin, hal kaliya ayaa loo yaqaan 'zip code'. Sidaa darteed, xogta codbixinta waxay muujisay in qof kasta ee xogta caafimaad la leh isku-biiridda Weld ee taariikhda dhalashada, jinsiga, iyo zip code uu ahaa William Weld. Tusaale ahaan, sadexdan qeybood ee macluumaadkaas waxay ku siinayaan faro farabadan isaga oo ku jira xogta. Iyadoo la adeegsanayo xaqiiqda, Sweeney waxay awood u laheyd inay hesho Weld's diiwaanka caafimaadka, iyo, inuu u sheego sheekadiisa, waxay u soo dirtay nuqulka diiwaanadiisa (Ohm 2010) .
Shaqada Sweeney waxay muujineysaa qaab-dhismeedka asaasiga ah ee dib-u-aqoonsi-aqoonsi -waxaa laga qaadayaa ereyga bulshada kombiyuutarka. Weerarrooyinkan, laba nooc oo xog ah, midna midkale laftiisu wuxuu muujinayaa macluumaadka xasaasiga ah, ayaa lala xiriiriyaa, iyada oo loo marayo xidhiidhkan, macluumaadka xasaasiga ah ayaa la soo bandhigayaa.
Marka laga jawaabo shaqada Sweeney, iyo shaqooyinka kale, cilmi-baarayaashu hadda waxay soo saaraan macluumaad badan oo dheeraad ah-oo dhan loogu yeero "shakhsiyan aqoonsiga" (PII) (Narayanan and Shmatikov 2010) -diiqda geeddi-socodka "anonymization." Sidoo kale, cilmi-baarayaal badan Hadda waxay ogtahay in xogta qaarkood - sida diiwaanka caafimaadka, diiwaanka dhaqaalaha, jawaabaha su'aalaha sahanka ee ku saabsan dabeecada sharci darrada ah - waxay u badan tahay inay aad u nugul yihiin sii deynta xitaa ka dib "qirasho." Si kastaba ha ahaatee, tusaalooyinka aan ka bixinayo soo jeedinta cilmi-baarayaasha bulshada si ay u beddelaan fekerkooda. Tallaabada ugu horreysa, waxaa habboon in la qaato in dhammaan xogta ay tahay mid la aqoonsan karo oo dhammaan xogta ay tahay mid xasaasi ah. Si kale marka loo eego, halkii laga fikiri lahaa in khatarta macluumaadka ay khusayso mashruuc yar oo mashaariicda ah, waa in aynu u qaadannaa in uu khuseeyo-qiyaas ahaan heer-mashaariicda oo dhan.
Labada qaybood ee dib-u-kicinta waxaa lagu sharxay abaalgudka Netflix. Sida lagu sharraxay cutubka 5, Netflix ayaa sii daayay 100 milyan oo qiimeyn oo ay bixiyeen 500,000 oo xubnood, waxana ay lahaayeen wicitaan furan oo ay dadku ka soo jeedaan adduunka oo dhan waxay soo gudbiyeen algorithms kuwaas oo hagaajin kara awooda Netflix ee ku talin kara filimada. Ka hor inta aan la soo saarin xogta, Netflix waxa ay soo saartay wixii caddayn ah ee shakhsi ahaan caddaynaya, sida magacyada. Waxay sidoo kale raaceen tallaabo dheeraad ah oo ay soo bandhigeen qoraallo yar oo qaar ka mid ah diiwaanka (tusaale ahaan, bedelida qaar ka mid ah qiimayaasha 4 xiddigood ilaa 3 xiddigood). Si dhakhso ah ayay u ogaatay, inkastoo, inkasta oo dadaalkooda, haddana xogtu weli wali ma sheegin.
Kaliya laba toddobaad ka dib markii xogta la sii daayay, Arvind Narayanan iyo Vitaly Shmatikov (2008) waxay muujiyeen inay suurtogal tahay in ay wax ka bartaan dadka jecel filimka gaarka ah. Trick-ka weerarkooda dib-u-aqoonsigooda waxay u dhigantaa Sweeney: Isku duwo laba ilo macluumaad, hal mid leh macluumaad xasaasi ah oo aan macquul ahayn iyo wax caddaynaya aqoonsiga iyo mid ka mid ah aqoonsiyada dadka. Mid kasta oo ka mid ah ilaha xogtan ayaa noqon kara mid si shakhsiyan ah amaan ah, laakiin marka la isku daro, dataset isku mid ah ayaa abuuri kara khatarta macluumaadka. Xaaladda xogta Netflix, halkan sida ay u dhici karto. Bal qiyaas in aan doorto in aan la wadaagno fekerkayga ku saabsan ficilada iyo filimada majaajilada ah ee la shaqeeyayaasha, laakiin waxaan jeclahay inaanan kula wadaagin fikradayda ku saabsan filimada diimeed iyo siyaasadeed. Shaqaalaheyga ayaa isticmaali kara macluumaadka aan la wadaagay si aan u helo diiwaanadayda shabakadda Netflix; macluumaadka aan la wadaagayo waxay noqon kartaa faro farabadan sida Wet Wet taariikhda dhalashada, zip code, iyo jinsiga. Ka dib, haddii ay heleen farahii faraha ahaa ee xogta, waxay ku baran karaan qiimeynteyda ku saabsan dhammaan filimada, oo ay ku jiraan filimada aan doorto inaanan wadaagin. Marka laga soo tago nooca weerarka lala beegsaday qofkii kaliya, Narayanan iyo Shmatikov ayaa sidoo kale muujiyay inay suurtagal tahay in ay sameeyaan weerar ballaadhan oo ay ku lug leeyihiin dad badan - iyagoo isku darsaday xogta Netflix ee xogta shakhsi ahaaneed iyo filimada oo ay dadku doorteen si aad ugu soo dirto Diiwaanka Muuqaalka Internetka (IMDb). Si fudud u fudud, macluumaad kasta oo ah faro u gaar ah qof gaar ah-xataa xitaa qiyaasta filimada-waxaa loo isticmaali karaa si loo aqoonsado.
Inkasta oo xogta Netflix dib loo soo celin karo weerarka la beegsado ama ballaadhan, haddana waxay u muuqan karaan inay halis yar yihiin. Ka dib oo dhan, qiimeynta filimka uma muuqato mid aad xasaasi u ah. Inkastoo taasi dhici karto in guud ahaan, qaar ka mid ah 500,000 oo qof ee xogta ku jirta, qiimaynta filimku waxay noqon kartaa mid xasaasi ah. Xaqiiqdii, marka laga jawaabayo dib-u-aqoonsiga, gabadh dumar ah oo la xiray ayaa ku biiray dacwad faleed oo ka dhan ah Netflix. Waa kuwan sida dhibaatada loogu qeexay dacwaddooda (Singel 2009) :
"[M] xogta qiimaha iyo qiimeynta waxay ku qoran yihiin macluumaad ku saabsan ... dabeecad aad u saraysa iyo mid xasaasi ah. Xogta filimada ee xubnaha ayaa muujinaysa danta shakhsi ahaaneed ee Netflix iyo / ama la halgamaan arrimaha kala duwan ee shakhsi ahaaneed, oo ay ka mid yihiin galmada, jirada maskaxda, ka soo kabashada khamriga, iyo dhibanaha ka soo jiidashada, jirdilka jirka, rabshadaha qoyska, sino, iyo kufsashada.
Dib-u-aqoonsiga xogta Netflix Prize waxay muujineysaa in dhammaan xogta ay yihiin kuwo la aqoonsan karo oo dhan iyo in dhammaan xogta ay tahay mid xasaasi ah. Waqtigan, waxaad u maleyneysaa in tani ay qusayso oo kaliya macluumaadka ujeedada u ah inay dadku ku saabsan yihiin. Waxaa la yaab leh, taasi ma aha kiiska. Iyadoo laga jawaabayo codsi Sharciyeedka Xoriyadda Macluumaadka, Dawladda New York waxay sii daysay diiwaan-galin kasta oo taksiyada taxanaha ah ee New York ee sanadka 2013, oo ay ka mid yihiin waqtiyada qaadista iyo joojinta, meelaha, iyo qiimaha (dib u soo laabo cutubka 2aad ee Farber (2015) Isticmaalka xogta la midka ah si loo tijaabiyo fikradaha muhimka ah ee dhaqaalaha foosha). Macluumaadka ku saabsan safarrada taksiyada waxay u muuqan karaan kuwo hagaagsan sababtoo ah uma muuqdaan inay bixiyaan macluumaad ku saabsan dadka, laakiin Anthony Tockar waxay xaqiiqsadeen in dataset-kaasu uu dhab ahaantii ku jiro macluumaad badan oo xasaasi ah oo ku saabsan dadka. Si uu u muujiyo, wuxuu eegay dhammaan safarrada ka bilaabma Hustler Club-koox weyn oo ku yaal New York - inta u dhexeysa bartamaha habeenkii iyo 6-da subaxnimo kadibna waxay heleen goobaha ay ka baxaan. Raadintan waxaa lagu soo koobay astaamo-liis ah cinwaanada dadka qaarkood ee ku soo xaadiray Club Hustler (Tockar 2014) . Way adag tahay in la qiyaaso in xukuumadda magaalada ay maskaxda ku hayso marka ay sii daayaan xogta. Xaqiiqda, farsamadan oo kale ayaa loo isticmaali karaa si loo helo cinwaannada guriga ee dadka booqanaya meel kasta oo magaalada ah - rug caafimaad, dhismo dawladeed, ama hay'ad diineed.
Labadan kiis ee Netflix Prize iyo Taxi New York City waxay muujinayaan in dadka xirfadlayaasha ah ay ku guuldareystaan inay ku xisaabiyaan khatarta macluumaadka ee xogta ay bixiyaan-kiisaskani maahan mid gaar ah (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . Intaa waxaa dheer, xaalado badan oo noocan oo kale ah, xogta khatarta ah ayaa wali si xor ah loo heli karaa shabakada internetka, taas oo muujinaysa dhibaatada abid laga sii daayo warka la sii daayay. Wadajir ahaan, tusaalooyinkan-iyo sidoo kale cilmi-baaris ku saabsan sayniska kombiyuutarka ee ku saabsan asturnaanta-waxay keenaysaa gabagabo muhiim ah. Cilmi waa in loo qaato in xogta oo dhan iyo mustaqbal ahaanba la aqoonsan karo oo xogta oo dhan waa laga yaabo xasaasi ah.
Nasiib darro, ma jiro xal fudud oo xaqiiqda ah in dhammaan xogta ay yihiin kuwo la aqoonsan karo oo dhan iyo in dhammaan xogta ay tahay mid xasaasi ah. Si kastaba ha ahaatee, hal hab oo lagu yareeyo khatarta macluumaadka intaad la shaqeyneyso xogta waa inaad abuurto oo raacdo qorshaha badbaadinta xogta . Qorshahani wuxuu hoos u dhigi doonaa fursada macluumaadkaagu uu daadi doono oo uu yareeyn doono dhibaatada haddii duufaantu ay dhacdo. Waxyaabaha ku jira qorshaha badbaadinta xogta, sida nooca loo isticmaalo in la isticmaalo, ayaa isbeddelaya waqti dambe, laakiin Adeegyada Macluumaadka UK waxay si wax ku ool ah u abaabulaan halbeegyada qorshaha badbaadinta xogta shan qaybood oo ay ugu yeeraan shan shuruudood : mashaariic ammaan, dad ammaan ah , goobaha amaanka ah, xogta nabadgelyada, iyo saadaasha badbaadada (jadwalka 6.2) (Desai, Ritchie, and Welpton 2016) . Mid ka mid ah shanta safar midna si shakhsiyan ah ayuu u ilaaliyaa ilaalinta. Hase yeeshe, waxay isu keenaan arrimo awood leh oo yareyn kara khatarta macluumaadka.
Badbaado | Waxqabadka |
---|---|
Mashaariic ammaan ah | Mashaariicda xaddidan macaamiisha xogta kuwa ah anshaxa |
Dadka nabdoon | Helitaanka waxaa xadidan dadka lagu kalsoonaan karo xogta (tusaale ahaan, dadka tababbaridda anshax-marinta) |
Macluumaadka nabdoon | Xogta looma aqoonsan karo oo loo qoondeeyey ilaa inta suuragal ah |
Goobaha amaanka ah | Xogta waxaa lagu kaydiyaa kombiyuutaro leh jimicsi ku habboon (tusaale ahaan, qolka la qufulo) iyo software (sida, ilaalinta sirta, isir-gareynta) |
Kaar amaan ah | Soo saarista cilmibaarista ayaa dib loo eegayaa si looga hortago jebinta arimaha gaarka ah ee shilalka |
Marka laga reebo ilaalinta xogtaada intaad isticmaalayso, hal tallaabo ee geeddi-socodka cilmi-baarista oo khatarta macluumaadka si gaar ah uqeybsanyihiin waa wadaagista macluumaadka cilmi-baarayaasha kale. Xogta wadaagista aqoonyahaniintu waa qiimaha ugu muhiimsan ee waxqabadka sayniska, waxayna si fudud u sahlaysaa horumarka aqoonta. Halkan waxaa ah sidan UK House of Commons ku qeexday muhiimada wadaagga xogta (Molloy 2011) :
"Helitaanka xogta waa aasaasi ah haddii cilmi-baarayaashu ay soo saaraan, hubiyaan oo ay dhisto natiijooyin lagu soo bandhigo suugaanta. Maahan waa in ay ahaato, haddii aysan jirin sabab xoog leh, xogta waa in si buuxda loo shaaciyaa oo loo bixiyaa si cad loo heli karo. "
Hase yeeshee, adiga oo xogtaada la wadaagaya cilmi-baadhaha kale, waxaa laga yaabaa inaad kordhin karto halista macluumaadka ee ka qaybgalayaashaada. Sidaa darteed, waxay u egtahay in wadaagista xogta ay abuurayso xiisad asaasi ah oo u dhaxeysa waajibaadka la wadaagayo xogta cilmi-baadhayaasha kale iyo waajibaadka yareynta khatarta macluumaadka ee kaqeybgalayaasha. Nasiib wanaag, dhibaatadani maahan mid aad u daran sida ay u muuqato. Taas bedelkeeda, way ka fiicantahay in laga fekero wadaagista macluumaadka sida hoos u dhaca, iyada oo la eegayo marxalad kasta oo ay ku bixiso faa'iidooyin kala duwan oo bulshada iyo khatarta kaqaybgalayaasha (sawirka 6.6).
Hal mar, waxaad xogtaada la wadaagi kartaa cidina, taas oo yaraynaysa khatarta ka imaan karta ka qaybgalayaasha, sidoo kale waxay yareyneysaa guulaha bulshada. Dhibaatada kale, waad sii deyn kartaa oo aad iloobi kartaa, halkaas oo xogta "la aqoonsaday" laguna dhajiyo qof walba. Xeerka ah inaan sii daayo xogta, sii-deynta iyo illoobidda bixinta faa'iidooyinka sare ee bulshada iyo khatarta sare ee ka-qaybgalayaasha. Inta u dhaxeysa labadaan xaaladood oo ba'an waa noocyo kala duwan, oo ay ka mid yihiin waxa aan soo wici doono habka beerta duurka leh . Qaabtan qaabkan, xogta waxaa lala wadaagaa dadka buuxiya shuruudaha qaarkood oo ogolaaday in ay ku xidhan yihiin xeerar gaar ah (tusaale, kormeerka IRB iyo qorshe ilaalin xog). Habka beerta dusha sare leh wuxuu bixiyaa faa'iidooyin badan oo ah sii-deyn iyo in la iloobo halis yar. Dabcan, habkan oo kale wuxuu abuuraa su'aalo badan - waa in la helaa, sida xaaladaha, iyo muddada dheer, cidda bixinaysa ilaalinta iyo bilayska beerta dusha sare leh, iwm. - laakiin kuwani waa kuwo aan la cayimin karin. Xaqiiqdii, waxaa jira horay u shaqeyn jiray beeraha dusha sare leh oo ay cilmi-baarayaashu u isticmaali karaan hadda, sida xogta macluumaadka ee Inter-Jaamacadda ee Siyaasadda iyo Cilmi-baarista Bulshada ee Jaamacadda Michigan.
Sidaa darteed, xagee xogta laga helayaa daraasaddaada ku saabsan joogtada ah ee wadaagista, beerta dusha sare leh, oo sii deyn iyo iloobin? Tani waxay ku xiran tahay faahfaahinta xogtaada: cilmi-baarayaashu waa inay isku dheelitiraan ixtiraamka dadka, faa'iidada, caddaaladda, iyo ixtiraamka sharciga iyo danta guud. Marka laga eego aragtidan, wadaagista macluumaadka ma aha khasaare anshax oo kala duwan; Waa mid ka mid ah dhinacyo badan oo cilmi-baaris ah oo ay cilmi-baarayaashu u leeyihiin inay helaan miisaan anshax oo ku habboon.
Dhaleeceynta qaar ayaa guud ahaan ka soo horjeeda wadaagista xogta sababtoo ah, feker ahaanteed, waxay diiradda saarayaan khatarta ay leedahay-taas oo shaki ku jiro dhabta -waxayna iska indhatirayaan faa'iidooyinkeeda. Marka, si aad ugu dhiirigeliso diirada saara khatarta iyo faa'iidooyinka labadaba, waxaan jeclaan lahaa in aan isbarbar dhigo. Sannad kasta, baabuurtu waxay mas'uul ka yihiin kumanaan dhimasho, laakiin ma isku dayi doono inaan joojino wadista. Dhab ahaan, wicitaan ku saabsan joojinta baabuurtu waxay noqon kartaa wax aan caqli ahayn, sababtoo ah baabuurtu waxay u sahlaysaa waxyaabo badan oo cajiib ah Taas beddelkeeda, bulshadu waxay xakameysaa ciddii gaari karta (tusaale ahaan, baahida loo qabo in ay noqoto da 'gaar ah iyo in ay dhaaftay imtixaanada qaarkood) iyo sida ay u wadi karaan (sida, xadka xawaaraha). Bulshadu sidoo kale waxay dadka u xilsaartay inay fuliyaan sharciyadan (tusaale ahaan, booliska), waxaanan ciqaabi doonaa dadka lagu qabtay iyaga oo ku xadgudbay. Nooca isku midka ah ee fikirka isku-dheellitiran ee bulshadu ku habboon tahay nidaamka xawaarida ayaa sidoo kale loo adeegsan karaa wadaagista xogta. Taasi waa, halkii ay ka dhigi lahayd doodo isku dhafan oo la xidhiidha ama ka soo horjeeda macluumaadka, waxaan u maleynayaa in aan samayn doono horumarka ugu weyn iyada oo diiradda saareysa sida aan u yareeyn karno halista iyo kordhinta faa'iidooyinka ka soo wadaagista xogta.
Si loo soo gabagabeeyo, khatarta macluumaadka ayaa si aad ah u kordhay, waana arrin aad u adag in la saadaaliyo oo lagu qiyaaso. Sidaa daraadeed, waxa ugu wanaagsan in la qaato in dhammaan xogta ay yihiin kuwo la aqoonsan karo oo macquul ah. Si loo yareeyo khatarta macluumaadka inta ay socoto baaritaanka, cilmi baarayaashu waxay abuuri karaan oo raaci karaan qorshaha badbaadinta xogta. Intaa waxa dheer, khatarta macluumaadka ma joojinayso cilmi-baarayaasha in ay la wadaagaan xogta cilmi-baadhayaasha kale.