Risicu di nfurmazzioni eni lu risicu di più cumunu in a ricerca suciali; com'hè cresce drammaticamènti; e ghjè u risicu di più duru à capì.
U secondu a sfida etichi di a ricerca, digitale età suciale hè risicu nfurmativu, u putenziale di u male da u disclosure di nfurmazzioni (Council 2014) . Guasco nfurmativu da u disclosure di nfurmazzioni pirsunali pudia esse economicu (per esempiu, pirdennu un impiegu), suciale (per esempiu, embarrassment), custumi (per esempiu, prufonda), o ancu i criminali (per esempiu, arrestu di u cumpurtamentu illegale). Per disgrazia, l 'età digitale aumenta risicu di nfurmazzioni drammaticamènti-ci hè ghjustu tantu cchiù nfurmazzioni supra u nostru cumpurtamentu. È, risicu nfurmativu hà pruvati assai difficiule à capì e amministrari paragunatu à risichi, chì erani cuncerna a l 'età simulate ricerca suciale, cume risicu di fisicu. Per vede cumu l'età digitale aumenta risicu nfurmativu, cunzidirari lu passaggiu di carta, à i cartulari di salute sònura. Tutti dui tipi di i cartulari di creà risicu, ma li miticulusi ilittronica di creà risichi assai cchiù granni pirchì at a scala massiccia statua si pò esse trasmesse à un partitu Live o s'ammiscau cu àutri dischi. circadori suciali in l'età, digitale, aghju dighjà iù datti cun prìculu nfurmativu e, in parte per via ch'elli ùn capìanu cumplettamente quantu à quantify e amministrari lu. Cusì, aghju decisu chè vocu à porghju una manera Corsets à riflette à risicu nfurmativu, è tandu aghju decisu chè vocu à dugnu quarchi cunzigghiu pi comu a gestione di u risicu di nfurmativu in a vostra ricerca è a lasci dati à altre circadori.
Una manera chì circadori suciale favuritu risicu nfurmativu è "anonymization" di dati. "Anonymization" hè u prucessu di toglie còdici persunali, è turnà cum'è nome, indirizzu, è nùmeru liberta da i dati. A ogni modu, stu approcciu hè tantu menu vere cà assai ghjente s'ampara, è si pò, in fatti, assai attivu e funnamintarmenti limitata. Per chì mutivu, Oghji I discrìviri "anonymization," I Mulateri Di L'usu Obed quotation à rammintà, à voi chì stu prucessu, sciuri di l 'aspettu di anonimatu ma nun è veru anonimatu.
Un esempiu vivi di lu fallimentu di "anonymization" veni da a fini di l 'anni 1990 in Massachusetts (Sweeney 2002) . A Cummissione Insurance Group (GIC) era un agenzia di guvernu rispunsevuli di cumprendu finanza a salute per tutti i cullaburatori Statu. À traversu stu travagliu, u GIC studiusu di i cartulari salute info su millaie di persone chì travaglianu Statu. In un sforzu à spur ricerca su manere di fà migliurà a salute, GIC decisu di liberallu sti cartulari à circadori. A ogni modu, si nun ci spartimu tutti di lu so 'infurmazioni; piuttostu, si "anonymized" a lu chiaru di caccià nfurmazzioni comu nomu è adrizzu. A ogni modu, sò partuti da altre infurmazione chì si pinsava pudia esse tandu interessante di circadori cum'è nantu à u corsu demugrafica (codice postale, data di nascita, discinnenza, e sessu) è nantu à u particulare (données visita, boca, a prucedura) (Figura 6,4) (Ohm 2010) . Per disgrazia, stu "anonymization" ùn bastò à prutege i dati.
To illustrate u shortcomings di l ' "anonymization" GIC, Latanya Sweeney-tandu un studiente Lauriatu à MIT-pagatu $ 20 à acquistà i ricordi vutendu da a cità di Cambridge, u paesu nativu di u Massachusetts guvernatore William Weld. Quessi i cartulari vutari facía nfurmazzioni comu nomu, address, codice postale, data di nascita, e voce. U fattu chì u cartulare medicale data, è u codice campi-pustale schedariu in latinu era cumunu, data di nascita, è sessu-significava ca Sweeney elli pudia lià. Sweeney sapia chì anniversariu di l'Weld era u 31 di lugliu, u 1945, è i ricordi vutendu in contu solu sei persone in Cambridge cu ddu 'anniversariu. In seguita, di quelli chì sei persone, solu trè eranu masculi. È, di quelli trè omi, solu unu corpus imitativu codice postale d'Weld. Accussì, quannu li dati vutendu Ammustrau ca lu qualchissia in u dati particulare cù cumminazzioni d'Weld di data di nascita, sissuali, è u codice pustale hè William Weld. In essenza, sti trè pezzi di nfurmazzioni furnì un Agriculture unicu à ellu in u dati. Aduprendu stu fattu, Sweeney, rinisciu a Piatra dischi medicale d'Weld, è à privene u di u so ft, idda cci mailed una copia di u so dischi (Ohm 2010) .
Travagliu d'Sweeney è la struttura di basa di attacchi de-anonymization, affinchì fiurintinu un termine da u cullettivu di sicurità urdinatore. In sti attacchi, dui gruppi di dati, nè di quali par iddu stissu dà nantu à u modu fattivu, sò assuciati, è à traversu issa lingua, nantu à u modu fattivu si puntanu. In certi modi stu prucessu, èni similari a la manera ca, soda è acitu, dui sustanzi ca sunnu par iddi stissi, sicuro cucina, pò èssiri misu a l 'elaburazione di un risultatu brutta.
In risposta à u travagliu d'Sweeney, è altri travagli relative, circadori ora smarisce giniralmenti assai più infurmazioni-tutte ca venniru ciamati "Informazioni parsunali, identificà i" (PII) (Narayanan and Shmatikov 2010) -during u prucessu di "anonymization." In seguita, parechji circadori ora s'ampara chì certi dati-cume i cartulari di salute, i cartulari di a finanza, li rispose nunda à log comu pruvàrinni illegale cumpurtamentu-prubbabbirmenti è troppu sinsibuli di liberallu ancu dopu "anonymization." Però, li siquenti sunnu asempî di più ricenti chì I Mulateri di l'discrìviri sottu à specificà chì circadori suciale tuccherà à canciari lu pròpiu a riflissioni. Comu un primu passu, hè accortu à incaricà chì tutti i dati è Prepaid frontman è tutti i dati è Prepaid fattivu. Ntê àutri palori, chiu tostu di a pinzari ca risicu nfurmativu sugettu à una piccula subset di prughjetti, si deve suppona chì hè sugettu à-à parechji liveddi-à tutti i prugetti.
Tutti dui aspetti di sta sona-urintamentu sò illustrati da u Premiu Netflix. As discritta in Chapter 5, Netflix liberatu, 100 miliuna di valutazioni, vintage fornitu da quasi 500.000 membri, è avia una d 'aria unni genti di tutti li parti di lu munnu pruposti alguritmi ca putìa migghiurari capacità d'Netflix à assicurà chì i filmi. Prima di lasci li dati, Netflix cacciatu ogni infurmazione currispundenu pirsuna-identificà, com'è nomi. Netflix ancu si un passu lettinu è ntruduciutu pìccula perturbations in parechji di i cartulari (per esempiu, à cambià certi évaluation de 4 etoiles à 3 étoiles). Netflix prestu scupertu, però, chi malgratu i sforzi, li dati foru da i mezi anònimu.
Just dui simani doppu la data, foru isciutu Narayanan and Shmatikov (2008) , dimmustrò ca chista era pussibbili a mparari preferenze vintage specifichi di genti. Lu truccu a so attaccu sunari-identificazione era sìmuli ô Sweeney d': mischjà inseme dui fonti nantu à u corsu, unu cun infurmazioni Prepaid fattivu è nisuna infurmazione currispundenu identificà e unu chì cuntene l'identità di genti. Ciascuna de 'sti funti di dati putissi èssiri sicuru lea, ma quand'elli sò assuciata à i dataset si cunfunniu pò creà risicu nfurmativu. Nta lu casu di li dati Netflix, quì, hè cumu si pudia succede. Pensa chi mi sceglie di fà sparte u mo pinzeri piriculosa pi l 'azzioni è i filmi row cù u mo co-travagliadori, ma chì mi piace micca di fà sparte u mio parè circa i filmi religiosa è pulitica. I mo co-travagliadori putìa usari li nfurmazzioni ca Corsu a francisata troppu spartutu cun elli à truvà u mio ricordi a quannu li dati Netflix; l'infurmazioni chì mi ramenti pudia esse un Agriculture unica cum'è l'William Weld data di nascita, codice postale, è sessu. Allora, s'elle si trovi u mio Agriculture unica in i dati, puderanu amparà u mio valutazioni quasi tutti i filmi, frà i filmi induva I sceglie micca di fà sparte. In più di stu tipu di attaccu vulsutu propie à una sola persona, Narayanan and Shmatikov (2008) puru mustrau ca chista era pussibbili putìri fari un surrisu -one attaccu chi trattàvanu tanti pirsuni-di pripara a quannu li dati Netflix cù dati stelle persunale è filmi chì certi pirsuni hannu scigghiutu di li posti nantu à i Internet Movie Archivio (IMDb). Qualchì infurmazione chì hè Agriculture ùnicu a nu spicìficu persona-mancu a so gruppu di filmi valutazioni-pò ièssiri usatu par idantificà elli.
Puru siddu li dati Netflix si pò sunari-idintificata a sonai un attaccu vulsutu, o grossi, si ancora putissi scrivevi à esse suttana risicu. Dopu à tutti, valutazioni, vintage ùn parenu assai fattivu. Mentri ca putissi essiri veru in generale, per certi di i 500.000 persone in u dataset, valutazioni, vintage pudia truvà di modu fattivu. In fatti, in risposta à i de-anonymization una donna, lesbiche closeted raghjunghje un vistitu di classi-azzioni contra Netflix. Ecco comu lu prubbrema fu palesa a so bisticcio (Singel 2009) :
"[M] ovie e stelle di dati cunteni nfurmazzioni di na natura cchiù apprizzati persunale è fattivu [santo]. di dati vintage u membru d'esponi interessu persunale, d'un membru Netflix e / o putiri, incù parechji prublematichi scherzu è persunale, cù a Corsica, malatìa mintali, ripresa da alcoholism, è victimiser da l 'incestu, abusu fisichi, a viulenza di gnustrii, adultère, è gang ".
U de-anonymization di i dati Premiu Netflix è comu sia ca tutti i dati è Prepaid frontman è chì tutti i dati è Prepaid fattivu. A 'stu puntu, ca pinzasti ca chistu vali sulu a data, ca ddu purports a èssiri su pòpulu. Surprisa, ca nun è lu casu. In risposta à una libertà di a dumanda Leghje Information, lu Guvernu City New York liberatu i cartulari di ogni accriscimentu tassì in New York in u 2013, frà i truck e Drop Murat volte, Ama, è limitati cù tariffu (richiamari da Chapter 2 chi Farber (2015) usatu stu dati à pruvà la li tiurìi supra l 'mpurtanti nta l' econumìa fatica). Puru siddu sta data, su affare tassì ùn hè pemphigus perchè ùn ci hè micca parenu esse assai nutizzi, populu, Anthony Tockar avvisti chì stu tassì dataset intreccia cuntatu mori infurmazioni Prepaid fattivu su pòpulu. To illustrate, doppu ca taliò pi tutti li voti chi principianu à U Calzini Club-una grossa squadra striscia in New York-frà mezanotte è 6am e poi ritrova u so loci goccia-off. Sta ricerca rivilatu-à essenza-cunteni na lista di indirizzi di certi pirsuni ca friquenti U Calzini Club (Tockar 2014) . Hè difficiuli à fà à pensà chì u guvernu cità avia sta a menti, quannu lu liberatu i dati. In fatti, stu stissu tècnica pò ièssiri usatu a truvari la saluti 'ncasa di la genti ca visita ogni locu in la cità-una clinica medica, un palazzu di guvernu, o un istitutu riliggiusa.
Sti dui casi-Premiu Netflix è i tassì New York City dati-addimustranu ca genti spinu, abili hà fiascatu à cuntà cum'ellu ci vole u risicu nfurmativu a quannu li dati ca iddi liberatu, è sti casi sunnu da i mezi ùnicu (Barbaro and Zeller Jr 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . In seguita, in parechji di sti casi, li dati prubbrimàticu hè sempre liberu missi in ligna, mintuvendu i difficultà di i sèculi undoing na libbirtati di dati. Fusioni dî sti asempi-oltri a ricerca in compiuter ca circa a privacy-sbocca nantu à una cunclusioni mpurtanti. Circadori avissi a pigghiari chì tutti i dati è Prepaid frontman è tutti i dati è Prepaid fattivu.
Per disgrazia, ùn ci hè micca sèmplice suluzione a lu fattu ca tutti i dati è Prepaid frontman è tutti i dati è Prepaid fattivu. Tuttavia, unu modu d'accurtà u so risicu di nfurmazzioni, mentri chì vo u travagliu cù data, è à creà è seguità un pianu di prutezzione di dati. Issu pianu hà decreases u casu chì i vostri dati vi Lithuania e ti favuritu la 'nsigna si faci in una certa manera, un Lithuania. U specifics di i piani prutezzione di dati, com'è chì forma di bez à aduprà, vùagliu canciari filu di u tempu, ma lu Services Data UK cuurganizighja helpfully l'elementi di un pianu di prutezzione di dati nta 5 categorie chì si chjama u 5 safes: prughjetti di sicuru, populu, sicuro , bastimentu, sicuro, dati, sicuro, è outputs sicuru (Table 6,2) (Desai, Ritchie, and Welpton 2016) . None di i cinque safes derà lea prutezzione perfetta. Ma, nsemmula, formanu un gruppu putente di fattura, chì pò favuritu risicu nfurmativu.
Safe | Action |
---|---|
prugetti Safe | limiti prugetti incù dati à quelli chì sò etichi |
populu Safe | accessu hè limitata à a ghjente chì pò essa criduti cù dati (per esempiu, i populi anu suppurtatu a furmazione è eticu) |
di dati Safe | di dati hè, de-identificatu è aggregated à u puntu pussibuli |
iventi Safe | di dati hè cullucatu in impianti cu degne fisicu (per esempiu, stanza, chiuso) e dû software (per esempiu, a prutezzione di a chjave, encrypted) prutizzioni |
radicali avrìanu pututu Safe | La pruduzzioni di ricerca hè hat à impidiscia accasu breaches a privacy |
'N agghiunta a prutizzioni di i vostri dati mentri vo aduprate lu, unu passu in u prucessu di ricerca unni risicu nfurmativu hè chjaru salient è spartera di dati cù altre circadori. spartera dati à mezu à i scentifichi hè un valori nudelli di u studiu scentificu, e lu assai ghjente lu prugressu di la canuscenza. Ecco comu lu House UK di Commons qualificatu a so impurtanza di spartera dati:
"Access a data, è funnamintali siddu circadori sò di ripruducesi, verificate è di custruisce nantu à i risultati chi sò signalati à la littiratura. U presumption deve esse chì, s'ellu ùn ci hè una raghjoni forti altrimenti, di dati di fassi rimbursà disclosed è fatti dispunibbili pubbricamenti. In linia cu stu principiu, unni pussibule, di dati assuciata incù tutti i ricerchi finanzatu FAQ deve esse fatta ricunnisciuta è u benistà dispunibbili. " (Molloy 2011)
Eppuru, par cuntà i vostri dati incù un altru militante, pudite esse più numarosi risicu nfurmativu e to your participanti. Cusì, si pò quissa chì circadori chì vulete fà sparte a so dati-o sò nicissarii pà sparta a so dati-sò di punta à un tinzioni fundamintale. Nantu à l 'na manu hannu un òbbricu etichi di fà sparte e so infurmazioni cù altre scentifichi, spiciarmenti siddu li ricerchi urigginali hè FAQ finanzatu. Eppuru, a lu stissu tempu, circadori anu nu 'òbbricu è eticu à minimize, quant'è pussìbule, u risicu nantu à u corsu à i so i participanti.
Par furtuna, sta bœuf ùn hè micca cum'è un rigalu comu si pò vede. Hè impurtante à pinsà di dati di spartera, lungo un cuntinuu da senza spartera di dati di liberallu, è vi scurdate, unni dati hè "anonymized" è affissate per qualchidunu à accede (Figura 6.6). Tutti dui di sti pusizzioni estremu hannu rischi e prestazione. Pirtantu, è ùn hè micca solu l'affare u più boni à ùn ci ancu i vostri dati; un tali avvicinamentu eliminates tanti putinziali, accussì si sviluppi à a sucità. U ritornu à Taste, Ties, è Time, un esempiu viditi lu discursu pricidenti in lu capitulu, argumenti contru à libbirtati di dati ca pinsàri solu nant'à pussibuli Guasco, è chì ùn cunnosci micca pussibule sviluppi sò porghje una-schiera; I Mulateri Di L'numaru di i prublemi cù stu approcciu unu-Ciclopi, straziata misuri in più tecnica in sottu à quandu vi porghju i cunsigli di rende e decisioni in u visu di a miseria (Section 6.6.4).
In seguita, in trà sti dui casi estremu hè ciò chì I Mulateri Di L'chjama un accostu giardinu murato unni dati hè cumunu trà ghjenti chì risponde à certi criterii è chì cunnizzioni di usu pi esse liatu da certe regule (per esempiu, oversight da un IRB è una dî chiani a prutezzione di dati) . Stu accostu giardinu murato accerta chì parechji di i benefici di libbirtati e scurdari cu menu risicu. Di sicuru, un accostu giardinu murato crèa tanti dumanni-chi 'ndannu i tenunu accessu, sottu à ciò chì e cundizioni, di quantu tempu, chì deve pagà à rispettà e polizia l' ortu murato ecc-ma quisti quì ùn sò sempri unu svantaghju. In fatti, ùn ci sò digià u travagliu orti murato a postu chì circadori pò aduprà subitu subitu, com'è u pacchettu di dati di l 'Eda Inter-Universita di Research politiche è Suciali a l'Univirsitati di Michigan.
Allura, unni avissi a quannu li dati da u vostru studiu sia nantu à u cuntinuu di nuddu spartera, giardinu, murato, è publicava e scurdari? Hè assai nantu à i ditagli di i vostri dati; circadori vole allargà U rispettu di Persons, Beneficence, la Giustizia, e rispettu di a lege è intérêt Public. Quandu valutà equilibriu degne di lucca e decisioni circadori ani circatu i cunsigli è accunsentu di IRBs, e vennu libbirati li dati pò esse ghjustu un'antra parti di ddu prucessu. Nta àutri paroli, puru si certi pirsuni sù cchiù di libbirtati di dati com'è un morass etichi hopeless, avemu già hannu sistemi in locu per aiutà circadori equilibriu sti tipu di dilemmas etichi.
Una manera finali à riflette à spartera di dati hè par omu. Ogni annu, cars sò rispunsevuli di millaie di morti, ma nun nni vosi pi mannari cunduce. In fatti, un tali chiamata a mannari cunduce saria sciocchi perchè cunduce permette à parechje cose una maraviglia. Invece, a sucetà metti nta l 'chì pò scaccià (per esempiu, tocca à esse una certa età, tuccherà à avìssiru a certe prove), è cumu ponu caccià (per esempiu, sottu à u limitu vitezza). Societa hà ancu populu tasked cu enforcing ste règule (per esempiu, pulizzìa), e avemu anchi puniri chiddi ca sunnu cunsideratu chì elli violating. Stu stissu tipu di riflissioni equilibrati chì a sucetà hè appiecatu à regulated cunduce pò esse ancu si rifiriscinu a spartera di dati. Pirtantu, chiu tostu facìa argumenti assulutista di per o contru à u sparte data, pensu chi lu cchiù granni e prestazione vinarà da un millesimu cumprènniri comu putemu spartiri più di dati di più è salvu.
To cunchiùdiri, risicu nfurmativu hà cresce drammaticamènti, è ghjè assai difficiuli à fà predict e quantify. Per quessa, hè megliu à incaricà chì tutti i dati è Prepaid frontman è Prepaid fattivu. To favuritu risicu nfurmativu mentris a ricerca, circadori pò creà è seguità un pianu di prutezzione di dati. In seguita, risicu nfurmativu ùn impediscenu micca circadori da cuntà i dati cù altre scinziati.