Ang katalagman nga risgo mao ang labing komon nga risgo sa social research; kini nag-uswag pag-ayo; ug kini ang pinakalisud nga pagsabut.
Ang ikaduha nga hangkat sa pamatasan alang sa panukiduki sa digital age mao ang risgo sa impormasyon , ang potensyal alang sa kadaot gikan sa pagbutyag sa impormasyon (National Research Council 2014) . Ang kasayuran nga makadaot gikan sa pagbutyag sa personal nga kasayuran mahimo nga ekonomikanhon (sama pananglit, mawad-an og trabaho), sosyal (pananglitan, kaulaw), sikolohikal (eg, depresyon), o bisan kriminal (pananglit, pag-aresto sa ilegal nga paggawi). Ikasubo, ang digital nga edad nagdugang sa kapeligrohan sa impormasyon nga peligro-adunay daghan pa nga kasayuran mahitungod sa atong kinaiya. Ug ang risgo sa impormasyon nga napamatud-an nga lisud sabton ug madumala kon ikumpara sa mga risgo nga may kalabutan sa panukiduki sa panukiduki nga sama sa pisikal nga edad, sama sa pisikal nga risgo.
Usa ka paagi nga ang sosyal nga mga tigdukiduki pagkunhod impormasyon risgo mao ang "anonymization" sa data. "Anonymization" mao ang proseso sa pagkuha sa klaro nga personal nga ilhanan sama sa ngalan, adres, ug numero sa telepono gikan sa mga data. Apan, kini nga pamaagi mao ang dili kaayo epektibo kay sa daghang mga tawo makaamgo, ug kini mao ang, sa pagkatinuod, pag-ayo ug fundamentally limitado. Tungod niana nga rason, sa matag higayon nga paghulagway sa ako "anonymization," ko sa paggamit sa kinutlo nga marka sa pagpahinumdom kaninyo nga niini nga proseso nagmugna sa dagway sa tago apan dili tinuod nga anonymity.
Ang usa ka tin-aw nga ehemplo sa kapakyasan sa "anonymization" naggikan sa ulahing bahin sa 1990 sa Massachusetts (Sweeney 2002) . Ang Group Insurance Commission (GIC) usa ka ahensya sa gobyerno nga responsable sa pagpalit sa health insurance alang sa tanan nga empleyado sa estado. Pinaagi niini nga trabaho, ang GIC nakolekta ang detalyado nga rekord sa panglawas mahitungod sa liboan ka mga empleyado sa estado. Sa paningkamot nga mag-aghat sa panukiduki, ang GIC mihukom nga buhian ang mga rekord sa mga tigdukiduki. Bisan pa, wala nila ipaambit ang tanan nilang datos; hinoon, sila "wala magpaila" niini nga mga datos pinaagi sa pagkuha sa impormasyon sama sa mga ngalan ug mga adres. Hinuon, gibilin nila ang ubang impormasyon nga gituohan nila nga mapuslanon sa mga tigdukiduki sama sa impormasyon sa demograpiya (zip code, petsa sa pagkatawo, etniko, ug sekso) ug medikal nga kasayuran (pagbisita data, diagnosis, pamaagi) (numero 6.4) (Ohm 2010) . Ikasubo, kini nga "anonymization" dili igo sa pagpanalipod sa datos.
Sa pag-ilustrar sa kakulangan sa "anonymization" sa GIC, si Latanya Sweeney-nga usa ka estudyante sa graduate sa MIT-mibayad $ 20 aron makakuha sa mga rekord sa pagboto gikan sa siyudad sa Cambridge, ang lungsod sa Massachusetts nga gobernador nga si William Weld. Kini nga mga rekord sa pagboto naglakip sa impormasyon sama sa ngalan, adres, zip code, petsa sa pagkatawo, ug gender. Ang kamatuoran nga ang medikal nga file sa datos ug ang voter file nagpakigbahin sa mga field-zip code, petsa sa pagkatawo, ug sekso-nagpasabut nga si Sweeney makahubit kanila. Nahibal-an ni Sweeney nga ang adlawng natawhan ni Weld mao ang Hulyo 31, 1945, ug ang mga talaan sa pagboto naglakip lamang sa unom ka mga tawo sa Cambridge sa maong adlaw nga natawhan. Dugang pa, niadtong unom ka mga tawo, tulo lamang ang lalaki. Ug, sa tulo nga mga lalaki, usa lamang ang mipakigbahin sa zip code sa Weld. Busa, ang datos sa pagboto nagpakita nga bisan kinsa sa medikal nga datos sa kombinasyon sa petsa, gender, ug zip code sa Weld mao si William Weld. Sa pagkatinuod, kining tulo ka piraso sa kasayuran naghatag og usa ka talagsaon nga tudlo sa fingerprint kaniya diha sa datos. Sa paggamit niini nga kamatuoran, si Sweeney nakaplagan ang mga rekord sa medisina ni Weld, ug, aron ipahibalo kaniya ang iyang nahimo, gipadala niya ang usa ka kopya sa iyang mga rekord (Ohm 2010) .
Ang buhat ni Sweeney nag-ilustrar sa batakang estruktura sa mga pag-atake nga pag-ila pag-usab -sa pagsagop sa usa ka termino gikan sa komunidad sa computer security. Sa niini nga mga pag-atake, duha ka mga datos nga wala'y bisan usa nga nagpakita sa sensitibo nga kasayuran, nalambigit, ug pinaagi niini nga linkage, gibutyag ang sensitibo nga impormasyon.
Agi ug tubag sa buhat ni Sweeney, ug uban pang may kalabutan nga trabaho, ang mga tigdukiduki karon sa kinatibuk-ang nagwagtang sa dugang nga kasayuran-ang gitawag nga "personal identifying information" (PII) (Narayanan and Shmatikov 2010) -base sa proseso sa "anonymization." Dugang pa, daghang mga tigdukiduki karon nahibal-an nga ang pipila ka mga datos-sama sa mga rekord sa medikal, mga rekord sa panalapi, mga tubag sa mga pangutana sa pagsurbi mahitungod sa ilegal nga kinaiya-tingali sensitibo usab sa pagpagawas bisan human sa "anonymization." Bisan pa, ang mga panig-ingnan nga akong igahatag aron usbon ang ilang panghunahuna. Ingon nga unang lakang, maalamon nga hunahunaon nga ang tanan nga mga datos mahimo nga mailhan ug ang tanan nga datos mahimo nga sensitibo. Sa laing pagkasulti, imbis maghunahuna nga ang kapeligro sa impormasyon magamit sa usa ka gamay nga bahin sa mga proyekto, kinahanglan kita maghunahuna nga kini magamit-sa pipila ka matang-sa tanan nga mga proyekto.
Ang duha ka aspeto niini nga reorientation gihulagway sa Netflix Prize. Sumala sa gihulagway sa kapitulo 5, ang Netflix nagpagawas sa 100 milyon nga mga rating sa pelikula nga gihatag sa halos 500,000 nga mga miyembro, ug adunay bukas nga tawag diin ang mga tawo gikan sa tibuok kalibutan misumiter og mga algorithm nga makapalambo sa katakus sa Netflix sa pagrekomendar og mga salida. Sa wala pa i-release ang datos, gikuha sa Netflix ang bisan unsang dayag nga personal nga pag-ila sa impormasyon, sama sa mga ngalan. Gihimo usab nila ang usa ka dugang nga lakang ug gipaila-ila ang gamay nga kasamok sa pipila ka mga rekord (pananglitan, nag-usab sa pipila ka mga grado gikan sa 4 ka mga bitoon ngadto sa 3 ka mga bitoon). Sa wala madugay ilang nadiskobrehan, hinoon, nga bisan pa sa ilang mga paningkamot, ang datos wala pa magpaila.
Duha lang ka semana human nga gibuhian ang datos, si Arvind Narayanan ug Vitaly Shmatikov (2008) nagpakita nga posible nga mahibal-an ang mahitungod sa piho nga gusto sa pelikula. Ang lansis sa ilang re-identification nga pag-atake susama sa Sweeney's: paghiusa sa duha ka tinubdan sa kasayuran, usa nga adunay sensitibo nga impormasyon ug walay klaro nga pag-ila sa kasayuran ug usa nga adunay mga identidad sa mga tawo. Ang matag usa niini nga mga tinubdan sa datos mahimo nga luwas nga tagsa-tagsa, apan sa dihang kini gihiusa, ang gitapo nga dataset makamugna og risgo sa impormasyon. Sa kaso sa datos sa Netflix, ania kung unsaon kini mahitabo. Hunahunaa nga gipili ko nga ipaambit ang akong mga hunahuna mahitungod sa aksyon ug mga komedya nga salida sa akong mga katrabaho, apan gipalabi ko nga dili ipaambit ang akong opinyon bahin sa mga salida sa relihiyon ug politika. Mahimo nga gamiton sa akong mga kauban ang mga kasayuran nga akong gipakigbahin kanila aron makita ang akong mga rekord sa datos sa Netflix; ang kasayuran nga akong gipakigbahin mahimong usa ka talagsaong tatak sa tudlo sama sa petsa sa pagkatawo ni William Weld, zip code, ug sekso. Dayon, kon makita nila ang akong talagsaong fingerprint sa datos, mahimo nilang mahibal-an ang akong mga rating mahitungod sa tanan nga mga salida, lakip na ang mga salida nga akong gipili nga dili ipaambit. Gawas pa niining matang sa target nga pag-atake nga naka-focus sa usa ka tawo, si Narayanan ug Shmatikov usab nagpakita nga posible nga buhaton ang usa ka halapad nga pag - atake -nga naglambigit sa daghang mga tawo-pinaagi sa paghiusa sa datos sa Netflix uban ang datos sa rating sa personal ug movie nga gipili sa pipila ka mga tawo sa pag-post sa Internet Movie Database (IMDb). Sa yanong paagi, ang bisan unsang impor- masyon nga talagsaong tudlo sa fingerprint sa usa ka partikular nga tawo-bisan ang ilang mga set sa mga rating sa pelikula-mahimong gamiton aron mailhan kini.
Bisan tuod ang datos sa Netflix mahimong mahibaw-an pag-usab sa target o lapad nga pag-atake, mahimo gihapon kini nga ubos nga risgo. Human sa tanan, ang rating sa pelikula dili kaayo sensitibo. Samtang kana mahimong tinuod sa kinatibuk-an, alang sa pipila sa 500,000 nga mga tawo sa dataset, ang mga rating sa pelikula mahimo nga sensitibo kaayo. Sa pagkatinuod, isip tubag sa pag-ila pag-usab, usa ka hinigala nga lesbian nga babaye miapil sa suit-class suit batok sa Netflix. Ania kung giunsa ang problema gipahayag sa ilang kiha (Singel 2009) :
"Ang datos sa rating sa rating ug impormasyon sa rating adunay impormasyon sa usa ka ... kaayo personal ug sensitibo nga kinaiyahan. Ang datos sa sine sa miyembro nagpakita sa personal nga interes ug / o pakigbisog sa miyembro sa Netflix nga adunay nagkalainlain nga mga personal nga isyu, lakip na ang sekswalidad, sakit sa pangisip, pagbangon gikan sa alkoholismo, ug pagbiktima sa incest, pag-abuso sa pisikal, kapintas sa panimalay, pagpanapaw, ug pagpanglugos.
Ang pag-ila pag-usab sa datos sa Netflix Prize naghulagway nga ang tanan nga mga datos mahimo nga mailhan ug nga ang tanan nga mga datos mahimo nga sensitibo. Niini nga punto, mahimo ka maghunahuna nga kini magamit lamang sa mga datos nga gipunting nga mahitungod sa mga tawo. Katingad-an, dili ingon niana. Agi og tubag sa usa ka hangyo sa Freedom of Information Law, ang gobyerno sa New York City nagpagawas sa mga rekord sa matag biyahe sa taxi sa New York sa 2013, lakip ang pickup ug drop off times, locations, ug fare amounts (ibalik gikan sa kapitulo 2 nga si Farber (2015) gigamit ang susamang datos aron masulayan ang importante nga mga teorya sa ekonomikanhong pangtrabaho). Kini nga mga datos mahitungod sa mga pagbiyahe sa taxi tingali daw benign tungod kay dili kini naghatag og kasayuran mahitungod sa mga tawo, apan si Anthony Tockar nakaamgo nga kining dataset sa taxi adunay tinuod nga daghang sensitibo nga impormasyon bahin sa mga tawo. Sa paghulagway, siya mitan-aw sa tanan nga mga biyahe gikan sa Hustler Club-usa ka dako nga batch club sa New York-tunga-tunga sa tungang gabii ug alas 6 sa buntag ug dayon nakit-an ang ilang mga dapit nga wala na. Kini nga pagpangita gipadayag-sa kinatibuk-an-usa ka lista sa mga adres sa pipila nga mga tawo nga kanunay nga nagtan-aw sa Hustler Club (Tockar 2014) . Lisud mahanduraw nga ang hunahuna sa syudad ang anaa sa hunahuna sa dihang gipagawas ang data. Sa pagkatinuod, kining sama nga pamaagi magamit sa pagpangita sa mga address sa panimalay sa mga tawo nga mobisita sa bisan unsang dapit sa siyudad-usa ka klinika sa medisina, usa ka building sa gobyerno, o usa ka relihiyosong institusyon.
Kining duha ka mga kaso sa Netflix Prize ug ang data sa taxi sa New York City nagpakita nga ang mga skilled nga mga tawo mahimong mapakyas sa hustong pagtantiya sa risgo sa kasayuran sa datos nga ilang gibuhian-ug kini nga mga kaso dili talagsaon (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . Dugang pa, sa daghan nga mga kaso, ang mga problemado nga mga datos libre nga magamit sa internet, nga nagpakita sa kalisud sa pagbungkag sa usa ka pagpagawas sa datos. Sa kinatibuk-an, kini nga mga ehemplo-ingon man usab sa pagsiksik sa siyensya sa kompyuter mahitungod sa privacy-modala ngadto sa usa ka importante nga konklusyon. Ang mga tigdukiduki kinahanglan nga maghunahuna nga ang tanan nga mga datos mahimo nga mailhan ug ang tanan nga datos mahimo nga sensitibo.
Ikasubo, wala'y yano nga kasulbaran sa mga kamatuoran nga ang tanan nga datos mahimo nga mailhan ug nga ang tanan nga datos mahimo nga sensitibo. Apan, ang usa ka paagi sa pagpakunhod sa risgo sa impormasyon samtang ikaw nagtrabaho sa datos mao ang pagmugna ug pagsunod sa usa ka plano sa proteksyon sa datos . Kini nga plano makapakunhod sa kahigayunan nga ang imong datos mogawas ug mokunhod ang kadaot kon ang usa ka tubo mahitabo. Ang mga detalye sa mga plano sa pagpanalipud sa datos, sama sa unsa nga dagway sa pag-encrypt nga gamiton, mausab sa paglabay sa panahon, apan ang UK Data Services makatabang sa pag-organisar sa mga elemento sa usa ka data protection plan ngadto sa lima ka kategoriya nga gitawag nila nga lima ka mga safes : mga luwas nga proyekto, luwas nga mga tawo , luwas nga kahimtangan, luwas nga datos, ug luwas nga mga resulta (lamesa 6.2) (Desai, Ritchie, and Welpton 2016) . Walay usa sa lima ka safes nga tagsa-tagsa naghatag og hingpit nga panalipod. Apan sa tingub sila naglangkob sa usa ka gamhanan nga hugpong sa mga hinungdan nga makapakunhod sa risgo sa impormasyon.
Luwas | Aksyon |
---|---|
Mga proyekto nga luwas | Naglimite sa mga proyekto nga adunay mga datos ngadto sa mga ethical |
Luwas nga mga tawo | Ang access limitado ngadto sa mga tawo nga mahimong kasaligan sa mga datos (pananglitan, ang mga tawo nga nakasinati og maayong pamatasan) |
Luwas nga datos | Ang mga datos nahibal-an ug gi-aggregated kutob sa mahimo |
Luwas nga mga kahimanan | Ang datos gitipigan sa mga kompyuter nga adunay tukmang pisikal (pananglitan, locked room) ug software (pananglitan, proteksyon sa password, encrypted) proteksyon |
Luwas nga output | Ang resulta sa panukiduki gibalik-balik aron mapugngan ang dili aktuwal nga paglapas sa privacy |
Gawas pa sa pagpanalipod sa imong datos samtang imong gigamit kini, usa ka lakang sa proseso sa panukiduki diin ang risgo sa impormasyon labi ka hinungdanon mao ang pagpaambit sa kasayuran sa ubang mga tigdukiduki. Ang pagpakigbahin sa datos sa mga siyentipiko usa ka mahinungdanong bili sa siyentipikanhong paningkamot, ug kini nakapasayon sa pag-uswag sa kahibalo. Ania kung giunsa gibutang sa UK House of Commons ang kamahinungdanon sa pagpaambit sa datos (Molloy 2011) :
"Ang pag-access sa datos mahinungdanon kon ang mga tigdukiduki makahimo sa pagpamunga, pagsuta ug pagtukod sa mga resulta nga gitaho sa literatura. Ang pangagpas kinahanglan nga, gawas kung adunay lig-on nga katarungan kon dili, ang datos kinahanglan nga hingpit nga ibutyag ug ibutang sa publiko. "
Bisan pa, pinaagi sa pagpaambit sa imong data ngadto sa lain nga tigdukiduki, mahimo ka nga magdugang sa risgo sa impormasyon ngadto sa imong mga sumasalmot. Busa, daw ang pagpaambit sa datos nagmugna sa usa ka sukaranan nga tensyon tali sa obligasyon sa pagpaambit sa datos sa uban nga mga siyentipiko ug sa obligasyon sa pagpakunhod sa risgo sa impormasyon ngadto sa mga partisipante. Maayo na lang, kini nga problema dili ingon ka grabe sama sa makita. Hinunoa, mas maayo nga maghunahuna bahin sa pagpaambit sa datos nga nahulog sa usa ka continuum, nga ang matag punto nianang padayon nga paghatag sa nagkalainlain nga nagkalainlain nga mga benepisyo sa katilingban ug risgo sa mga sumasalmot (hulagway 6.6).
Sa usa ka grabe, mahimo nimong ipaambit ang imong datos nga walay bisan kinsa, nga makapakunhod sa risgo sa mga partisipante apan makapakunhod usab sa mga kadaugan sa katilingban. Sa laing kabug-at, mahimo nimong buhian ug kalimtan , diin ang mga datos "wala'y ngalan" ug gibutang sa tanan. Uyon sa dili pagpagawas sa datos, ang pagpagawas ug pagkalimot nagtanyag sa mas taas nga mga benepisyo sa katilingban ug mas taas nga risgo sa mga partisipante. Sa tunga niining duha ka mga grabeng mga kaso mao ang usa ka lainlaing matang sa mga hybrids, lakip na ang akong pagtawag sa usa ka paagi sa pagpalapad sa tanaman . Ubos niini nga pamaagi, ang datos ipaambit ngadto sa mga tawo nga nakakab-ot sa pipila ka mga criteria ug kinsa mouyon nga ilalum sa pipila ka mga lagda (pananglitan, pagdumala gikan sa usa ka IRB ug usa ka data protection plan). Ang gipalapad nga paagi sa hardin naghatag sa daghan nga mga benepisyo sa pagpagawas ug kalimtan nga dili kaayo peligro. Siyempre, ang ingon nga pamaagi nagmugna og daghan nga mga pangutana-kinsay kinahanglan nga adunay access, ubos sa unsa nga mga kondisyon, ug kung unsa ka dugay, kinsay kinahanglan mobayad aron sa pagpadayon ug pag-pulis sa naputos nga tanaman, ug uban pa-apan kini dili mabuntog. Sa pagkatinuod, aduna nay nagtrabaho nga mga hardin nga gigamit nga gigamit sa mga tigdukiduki karon, sama sa archive sa datos sa Inter-university Consortium alang sa Political and Social Research sa University of Michigan.
Busa, diin ang mga kasayuran gikan sa imong pagtuon mag-agad sa pagpadayon sa walay pagpakigbahin, gipalapad nga tanaman, ug buhian ug kalimtan? Kini nagsalig sa mga detalye sa imong datos: ang mga tigdukiduki kinahanglan nga magbalanse sa pagtahod sa mga tawo, benepisyo, hustisya, ug pagrespeto sa balaod ug interes sa publiko. Gitan-aw gikan niini nga panglantaw, ang pagpakigbahin sa datos dili usa ka talagsaon nga pamatasan sa pamatasan; kini usa lamang sa daghan nga mga aspeto sa panukiduki diin ang mga tigdukiduki kinahanglan nga mangita og tukma nga balanse sa etika.
Ang ubang mga kritiko sagad misupak sa pagpakigbahin sa datos tungod kay, sa akong hunahuna, sila naka-focus sa mga kapeligrohan niini-nga walay duhaduha nga tinuod-ug wala magsalikway sa mga benepisyo niini. Busa, aron sa pagdasig sa pag-focus sa duha ka mga kapeligrohan ug mga benepisyo, gusto nakong itanyag ang usa ka analohiya. Matag tuig, ang mga sakyanan maoy hinungdan sa liboan nga mga kamatayon, apan wala kami mosulay pagdumili sa pagdrayb. Sa pagkatinuod, ang usa ka panawagan sa pagdili sa pagdrayb dili makatarunganon tungod kay ang pagdrayb makahimo sa daghang mga kahibulongang mga butang. Hinoon, ang katilingban nagbutang sa mga pagdili kung kinsa ang makadrayb (pananglitan, ang panginahanglan nga mahimong usa ka pila ka edad ug sa pagpasa sa pipila nga mga pagsulay) ug kung unsaon sila makamaneho (pananglitan, ubos sa gikusgon sa tulin). Ang katilingban usab adunay mga tawo nga gitahasan sa pagpatuman niini nga mga kalagdaan (pananglitan, pulis), ug atong silotan ang mga tawo nga masakpan nga naglapas niini. Ang sama nga matang sa balanse nga panghunahuna nga ang katilingban magamit sa pagdumala sa pagdrayb mahimo usab nga magamit sa pagpaambit sa datos. Sa ato pa, imbis nga mohimo sa mga argumento nga hingpit alang sa o batok sa pagpaambit sa kasayuran, sa akong hunahuna nga kita magpauswag gayud pinaagi sa pag-focus kung unsaon nato pagkunhod ang mga risgo ug pagdugang sa mga benepisyo gikan sa pagpakigbahin sa datos.
Sa pagtapos, ang risgo sa kasayuran nadugangan pag-ayo, ug lisud ang pagtag-an ug pag-ihap. Busa, labing maayo nga hunahunaon nga ang tanan nga mga datos mahimong mailhan ug mahimong sensitibo. Aron makunhoran ang risgo sa kasayuran samtang nagsiksik, ang mga tigdukiduki makahimo ug makasunod sa usa ka plano sa proteksyon sa datos Dugang pa, ang risgo sa impormasyon wala makapugong sa mga tigdukiduki sa pagpaambit sa datos sa ubang mga siyentista.