Informatiounen Risiko ass déi gemeinsam Risiko am sozialen Fuerschung; et ass ganz fräi; an et ass d'Kinneksetapp Risiko ze verstoen.
Déi zweet ethesch Erausfuerderung fir sozial Alter digital Fuerschung ass Informatioun Risiko, d'Potential fir Schued vum Präisgi vu Informatiounen (Council 2014) . Informatioun erwisenermoossen aus der Präisgi vu perséinlechen Informatioune kéinten wirtschaftlech ginn (zB, eng Aarbecht ze verléieren), sozial (zB, bréngt), psychesch (zB, Depressiounen), oder souguer kriminellen (zB, verhaft fir illegal gelooss). Leider geet de digital Alter Informatiounen riskéieren dramatesch-do just sou vill méi Informatiounen iwwer ons Verhalen ass. An, huet Informatioun Risiko ganz schwiereg erwisen ze verstoen an verwalten Risiken am Verglach zu dass Suergen am Analog Alter sozial Fuerschung waren, wéi kierperlech Gefor. Ze gesinn, wéi déi digital Alter zouhëlt Informatioun Risiko, als dem Iwwergank vum Pabeier mat elektronescher medezinesch Rekorder. Béid Typen vun records schafen Risiko, mä den elektronesche records schafen vill grouss Risiken, well bei engem massive Skala kann se bis eng net autoriséiert Partei oder huet se mat anere records iwwerdroen gin. Social Fuerscher an der digitaler Ära schonn lafen an onroueg mat Informatioun Risiko, an en Deel well se net komplett gemaach verstoen wéi ofgedonkelt an et verwalten. Also, ech hun elo eng hëllefräich Manéier ze bidden iwwer Informatioun Risiko ze denken, an da Dir iwwerquéieren ginn e puer Rotschléi fir wéi d'Informatioun Risiko zu Är Fuerschung ze verwalten an Daten un aner Fuerscher Thorunn.
Eng Manéier déi sozial Fuerscher Informatioun Risiko Verloscht ass "anonymization" vun Daten. "Anonymization" ass de Prozess kloer perséinlech Identifikatiounen vun Stoppen wéi den Numm, Adress, an Telefonsnummer aus der Daten. Allerdéngs ass dës Approche vill manner efficace wéi vill Leit wëssen, an et ass, an Tatsaach, déif an grondsätzlech limitéiert. Aus deem Grond, wann ech beschreiwen "anonymization," ech zréck Spuren benotzt Dir ze erënneren, dass dëse Prozess d'Opkommen vun Anonymitéit entsprécht awer net richteg Anonymitéit.
E liewege Beispill vun der Verfehlung vun "anonymization" kënnt aus de spéiden 1990er an Massachusetts (Sweeney 2002) . D'Group Insurance Kommissioun (GIC) war eng Regierung Agence responsabel fir Krankekeess fir all Staatsbeamten Keef. Duerch dës Aarbecht, gesammelt der GIC detailléierte Gesondheet records iwwer dausende vu Staatsbeamten. An en Effort Fuerschung iwwer Weeër ze Ellipse Gesondheet ze verbesseren, decidéiert GIC dësen Undeel un Fuerscher fräiginn. Mä si huet net all hir Daten deelen; éischter, si se andeems Informatiounen wéi den Numm an d'Adress "anonymized". Mä si huet aner Informatiounen, déi si geduecht fir Fuerscher nëtzlech kéint wéi demographesch Informatiounen (Postleitzuel, Gebuertsdatum, Herkunft, an Geschlecht) a medezinesch Informatiounen (bei Donnéeën, Diagnos, Prozedur) (Dorënner 6.4) (Ohm 2010) . Leider war dat "anonymization" net genuch den Daten ze schützen.
Fir d'Defiziter vun der GIC "anonymization" Ganzt, Latanya Sweeney-dann eng CSL Schüler um MIT-bezuelten 20 $ Wahl records aus der Stad Cambridge, déi Heemechtsduerf Massachusetts Gouverneur William Weld ze gewannen. Dës Wahl records abegraff Informatiounen wéi den Numm, Adress, Postleitzuel, Gebuertsdatum, a Geschlecht. D'Tatsaach, datt d'medezinesch Donnéeën Fichier an d'Wahlbedeelegung Fichier gemeinsam Felder-Postleitzuel, Gebuertsdatum, a Sex-gemengt dass Sweeney hinnen Link hätt. Sweeney wosst dass Weld de Gebuertsdag 31. Juli 1945, an der Wahl records abegraff nëmmen sechs Leit zu Cambridge mat dass Gebuertsdag. Weider, vun deene sechs Leit, just dräi waren männlech. An, vun deenen dräi Männer, nëmmen ee gemeinsame Weld d'Postleitzuel. Soumat huet de Stëmmrechter Donnéeën dass jiddereen an der medezinesch Donnéeën mat Weld d'Kombinatioun vun Gebuertsdatum, Geschlecht, an Postleitzuel war William Weld. An Essenz, gëtt dës dräi Stécker vun Informatiounen enger eenzegaarteger Fangerofdrock zu him am Daten. Mat Hëllef vun dëser Tatsaach, Sweeney konnt Weld d'medezinesch records Geldautomat, an him vun hirem feat ze informéieren, si mailen him eng Kopie vu sengem records (Ohm 2010) .
Sweeney d'Aarbecht illustréiert d'Struktur vun de-anonymization Attacken Dosis e Begrëff aus dem Computer Sécherheet Communautéit adoptéieren. An dëse Säiten, zwee Donnéeën baut, weder vun deenen déi sech verréid sensiblen Informatiounen, Altere, an duerch dëse linkage, ass sensiblen Informatiounen ausgesat. An e puer Manéieren, ass dëse Prozess ähnlech zu der Aart a Weis, datt baken Soda an Esseg, zwee Substanzen, déi sech sécher sinn, kann engem Zweekampf Resultat ze produzéieren kombinéiert ginn.
An enger Äntwert op Sweeney d'Aarbecht, an aner wëssenschaftlech Aarbecht, Fuerscher ewechhuelen elo allgemeng vill méi Informatiounen-all sougenannten "Identifikatiounselement Perséinlech" (PII) (Narayanan and Shmatikov 2010) -during de Prozess vum "anonymization." Weider, elo vill Fuerscher mierken, datt verschidden Donnéeën-ewéi medezinesch records, finanziell records, Froen iwwer illegal zu Ëmfro gelooss-ass wahrscheinlech ze empfindlech och der Verëffentlechung "anonymization." mä, méi rezent Beispiller, déi ech beschreiwen wäert ënnert weg dass sozialer Fuerscher brauchen ze änneren hir denken. Als éischte Schrëtt, ass et richteg, datt all Donnéeën ze iwwerhuelen potenziell erkennbar ass an all Date as potenziell géintiwwer. An anere Wierder, amplaz datt Informatioun Risiko denken un engem klenge Ziel vun Projeten zielt, sollen mir dovun ausgoen, datt et gëllt-gewëssen Mooss-zu all Projeten.
Béid Aspekter vun dëser Neiorientéierung sinn duerch d'Netflix Prix illustréiert. Wéi 5 am Kapitel beschriwwen, Verëffentlechung Netflix 100 Milliounen Bewäertungen Film vun bal 500.000 Membere gëtt, an hat en Opruff, wou Leit aus der ganzer Welt algorithms deposéiert Netflix de Géigner ze recommandéieren Filmer verbessere kéint. Ier d'Donnéeën Thorunn, geläscht Netflix all selbstverständlech perséinlech-Identifikatiounselement, wéi Nimm. Netflix ass och eng extra Schrëtt an agefouert schmäerzhafte Wierkung an e puer vun de Rekorder (zB, eng Bewäertung vun 4 Stären bis 3 Stären wiessele). Netflix geschwënn, awer entdeckt, datt trotz hiren Efforten, déi Donnéeën, déi kee sech heescht anonym.
Just zwou Wochen no den Donnéeë Bommen Narayanan and Shmatikov (2008) gewisen, datt et méiglech war iwwer spezifesch Leit de Film Preferenzen ze léieren. D'Hattrick fir hir nei-Identifikatioun Attack war ähnlech ze Sweeney d': fusionéieren zesummen zwee Informatiounsquellen, ee mat potenziell sensiblen Informatiounen a kee selbstverständlech Identifikatiounselement an een, datt d'Identitéit vun de Leit ass. Jidwereen vun dësen Daten Quellen kann individuell sécher ginn, mee wann se kombinéiert ginn de fusionéierte Donnéeën kann Informatioun Risiko schafen. Am Fall vun der Netflix Donnéeën, hei ass, wéi dat geschéie kéint. Stellt Iech vir, dass ech mech fir meng Gedanken iwwer Aktioun a Comedy Filmer mat mengem Co-Aarbechter deelen, mä datt ech léiwer net meng Meenung iwwer reliéis a politesch Filmer ze deelen. Meng Co-Aarbechter konnten d'Informatioune benotzen, déi ech mat hinnen gedeelt hun meng Rekorder an der Netflix Donnéeën ze fannen; der Informatioun, datt ech eng eenzegaarteg Fangerofdrock gin just wëll William Weld d'Gebuertsdatum, Postleitzuel, a Sex deelen konnt. Dann, wa se meng eenzegaarteg Fangerofdrock an der Donnéeën fannen, konnt si meng Bewäertungen iwwer all Filmer léieren, och Filmer, wou ech net deelen. Zousätzlech zu dëser Zort vun geziilte Attack op enger eenzeger Persoun do, Narayanan and Shmatikov (2008) huet och, datt et méiglech ass eng breet Attack FROT sensibiliséieren vill ze maachen Leit, déi vun der Netflix Donnéeë mat perséinlechen a Film Bewäertung Donnéeën geduecht datt e puer Leit hunn an dëse Match gaangen op der Internet Movie Datebank ze Post (IMDb). All Informatiounen déi ass eenzegaarteg Fangerofdrock zu enger bestëmmter Persoun-och hir Formatioun vum Film Bewäertungen-kënne benotzt gin se ze identifizéieren.
Obschonn d'Netflix Daten kënnen an entweder eng geziilte oder breet Attack du-identifizéiert ginn, et kéint nach vläicht niddereg Risiko ze ginn. No all, Film Bewäertungen schéngs net ganz empfindlech. Während déi allgemeng wouer wier, fir e puer vun den 500.000 Leit an d'Donnéeën, kéint Film Bewäertungen ganz sensibel ginn. An Tatsaach, sech an enger Äntwert op der de-anonymization enger t lesbesch Fra eng Klass-Aktioun Kostüm géint Netflix. Hei ass, wéi de Problem an hirem Prozess ausgedréckt huet (Singel 2009) :
"[M] ovie an Rating Donnéeën enthält Informatiounen vun enger méi héich perséinlech a sensibel [Léift!]. De Film Daten d'Member kritesch engem Netflix Member d'perséinlechen Interessi an / oder Kämpf mat verschiddenen héich perséinlech Problemer, dorënner Sexualitéit, mental Krankheet, Erhuelung Alkoholiker, an victimization aus incest, kierperlech Mëssbrauch, Gewalt am Stot, doten, a senger Duechter. "
Der de-anonymization vun der Netflix Prix Donnéeën illustréiert souwuel datt all Daten potenziell erkennbar ass an dass all Daten as potenziell géintiwwer. Op dësem Punkt, kéint Dir mengt dass dat nëmmen zu Daten gëllt, datt déi ronn Leit gin purports. Verwonnerlech, ass dat net de Fall. An enger Äntwert op eng Fräiheet vun Informatiounen Law Demande, verëffentlecht vun der New York City Regierung records vun all Taxi Geschäft zu New York am Joer 2013, wéi de wëllt an Féieren Mol, Plazen, an heel Quantitéiten (Réckruff vun Kapitel 2 datt Farber (2015) dës Donnéeën benotzt wichteg Theorien an Aarbechtsmaart Wirtschaft ze testen). Obwuel dës Donnéeën iwwer Taxi Reesen kéint benign Virworf, well et keng Informatiounen iwwer Leit gin schéngt, realiséiert Anthony Tockar datt dës Taxi Donnéeën eigentlech vill potenziell sensiblen Informatiounen iwwer Leit aus. Fir dat Ganzt, ausgesinn hie bei all Reesen op de Hustler Club-eng grouss Sträif Club zu New York Start-tëscht Klengbetten an 6am an dann hir Drop-ugefaangen Plazen fonnt. Dës Sich réischt-an Essenz-enger Lëscht vun Adressen vun e puer Leit, déi de Hustler Club heefeg (Tockar 2014) . Et ass schwéier ze envisagéieren ass, datt d'Stad Regierung am Geescht vun dëser hu wann et d'Donnéeën lassgelooss. An Tatsaach, kéint dat selwecht Technik benotzt ginn d'Lat Adressen vu Leit ze fannen, déi keng Plaz an der Stad-engem medezineschen Ambulanz fueren, eng Regierung Gebai, oder eng reliéis Institutioun.
Dës zwee Fäll-d'Netflix Präis an der New York City Taxi Daten-weisen, datt relativ qualifizéiert Leit gescheitert zu korrekt der Informatioun Risiko vun der Donnéeën schätzen, datt se dann, an dësen Fäll sinn duerch keng heescht eenzegaarteg (Barbaro and Zeller Jr 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . Weider, ass d'Problematik Donnéeën an vill vun deene Fäll, nach fräi online sinn, d'Schwieregkeet vum Kéier ofzeschléissen enger Daten release ugëtt. Zesummen dës Beispiller-souwéi Fuerschung zu Computerentwécklungen iwwer Privatsphär-to eng wichteg Conclusioun. Fuerscher sollen ausgoen, dass all Daten potenziell erkennbar ass an all Date as potenziell géintiwwer.
Leider, et ass keng einfach Léisung fir de Fait, datt all Daten potenziell erkennbar ass an all Date as potenziell géintiwwer. Mä, eng Manéier Informatiounen Risiko ze reduzéieren, wann Dir mat Donnéeë schafft ass ze schafen an enger Dateschutz Plan verfollegen. Dës Pläng erof d'Chance dass Är Donnéeë gëtt Affer a wäert de Schued ofhuelen, wann en Affer existeiert iergendwéi. D'Spezifizitéiten vu Dateschutz Pläng, wéi déi Form vun Dateverschlësselung, benotze wäert méi Zäit änneren, mä de UK Data Services organiséiert opzemonteren d'Elementer vun engem Dateschutz plangen an 5 Kategorien datt si de 5 safes ruffen: sécher Projeten, sécher Leit , sécher Astellungen, sécher Donnéeën, a sécher ze accordéieren (Table 6.2) (Desai, Ritchie, and Welpton 2016) . Keen vun de fënnef safes individuell perfekt Schutz bidden. Mä, zesummen si Form e mächtege Set vu Facteuren, datt Informatioun Risiko ofhuelen kann.
Safe | Aktiounen |
---|---|
Safe Projeten | deenen Limiten Projeten mat Daten un déi ethesch sinn |
Safe Leit | Accès ass fir Leit beschränkt, déi mat Daten trauen kann (zB, hu Leit ethesch Aus-) |
Safe Donnéeën | Donnéeën ass de-identifizéiert an d'Ausmooss méiglech aggregéiert |
Safe Astellungen | Donnéeën ass zu Computeren mat passenden kierperlech (zB, Raum) a Software (zB, Passwuert Schutz, verschlësselte) Protectiounen gespäichert |
Safe Wasserstoff | Fuerschung Wasserstoff ass iwwerschafft Accident Privatsphär Verstéiss ze verhënneren |
Zousätzlech Är Donnéeën ze schützen, wann Dir se benotzt, ee Schrëtt an der Fuerschung Prozess wou Informatioun Risiko besonnesch markante ass Daten deelt mat anere Fuerscher. Donnéeën sharing ënnert Wëssenschaftler ass e Grondwäert vun der wëssenschaftlecher probéieren, an et daitlech Ariichtungen zugonschte vu Wëssen. Hei ass wéi de UK House of Commons der Wichtegkeet vun Donnéeën sharing beschriwwen:
"Zougang zu Donnéeën ass fundamental wann Fuerscher ze reproduzéieren sinn, z'iwwerpréiwen an bauen op Resultater datt an der Literatur an Untersuchungshaft sinn. Wivill muss ginn, datt, wann et e staarke Grond soss ass, soll Donnéeën voll publik präisginn a gemaach ginn. An Linn mat dësem Prinzip, wou méiglech, mat all ëffentlech finanzéiert Fuerschung verbonne Donnéeë soll iwwerall an fräi sinn gemaach ginn. " (Molloy 2011)
Nach, duerch Är Donnéeën mat anere Fuerscher deelt, kënnt Dir Informatioun Risiko fir Är Participanten gin waarden. Sou, kann et schéngt dass Fuerscher, déi wëllen hir ze deelen Daten-oder sinn néideg hir ze deelen Daten-ginn eng fundamental Spannungen konfrontéiert. Op engersäits si hunn eng ethesch obligation hir Date mat anere Wëssenschaftler ze deelen, virun allem wann d'Original Fuerschung ass ëffentlech finanzéiert. Nach, bei der selwechter Zäit, Fuerscher hunn eng ethesch Obligatioun ze minimiséieren, sou vill wéi méiglech, d'Informatiounen Risiko fir hire Mataarbechter.
Duerfir, ass dëst Dilemma net esou grouss, wéi et schéngt. Et ass wichteg vun Donnéeën ze denken laanscht eng continuum aus keng Daten sharing sharing ze verëffentlechen a vergiessen, wou Daten "anonymized" ass an fir jiddereen deen op Zougang (Dorënner 6,6). Zwee vun dësen extrem Positiounen hunn Risiken an d'Virdeeler. Dat ass, et ass net automatesch déi ethesch Saach un net Är Donnéeën deelen; esou eng Approche entfält vill Potential Gesellschaft profitéieren. Probéiert zréckgoen un, Ties, a Time, e Beispill virdrun am Kapitel diskutéiert, Argumenter géint Donnéeën release datt nëmmen op méiglech erwisenermoossen konzentréieren an dat ignoréieren méiglech Virdeeler sinn zevill eent-eesäitegen; Ëch d'Problemer mat dësem eent-eesäitegen, zevill Schutzpatrounin Approche méi am Detail an ënnert beschreiwen wann ech Rot Offer iwwer Décisiounen an d'Gesiicht vun Onsécherheet (Section 6.6.4) bruecht.
Weider, ass tëschent dësen zwou extrem Fäll, wat ech engem walled Gaart Approche genannt hun wou Date mat Leit gedeelt ass déi gewësse Kritären treffen an deen Accord vun verschidden Reegelen (zB, iwwert aus enger IRB an engem Dateschutz Pläng) gebonnen ze sinn . Dëst walled Gaart Approche déi vill vun de Virdeeler vun der Fräisetzung a vergiessen mat manner Risiko. Natierlech, entsprécht engem walled Gaart Approche vill Froen, déi Zougank hunn sollen, ënner wat fir Bedingungen, fir wéi laang, deen de walled Gaart ze erhalen a Police bezuelen soll etc.-mä dës net insurmountable sinn. An Tatsaach, sinn et schonn schaffen walled Gäert Plaz dass Fuerscher grad elo, wéi d'Donnéeë Archiv vun der Inter-Uni Consortium fir politesch a sozial Fuerschung op der Universitéit vu Michigan benotze kann.
Also, wou sollen d'Donnéeë vun Ärer studéieren ginn op der continuum vun kee sharing, walled Gaart, an Fräiloossung a vergiessen? Et hänkt op d'Detailer vun Ären Donnéeën? Fuerscher muss Respekt fir Leit, Beneficence, Justizminister, an Respekt fir Droit an ëffentlechen Interessi Gläichgewiicht. Wéini fir aner Décisioune passenden Gläichgewiicht Fliessband sichen Fuerscher d'Berodung an Akraafttriede vun IRBs, an Daten Fräisetzung kënnen just aneren Deel vun deem Prozess ginn. An anere Wierder, wa verschidde Leit vun Donnéeën Verëffentlechung als verschleeft ethesch morass denken, hun mir schon Systemer am Plaz Fuerscher dës Zort vun ethesch Mann Gläichgewiicht ze hëllefen.
Eng final Manéier iwwer Donnéeën sharing ze denken ass duerch Analogie. All Joer Autoen si responsabel fir Dausende vun Iwwerschwemmungen, mee mir maachen Versuch net Führerschäin ze verbannen. An Tatsaach, wéi en Opruff Führerschäin ze verbannen wier Manipulatioun, well dreiwend vill wonnerschéi Saachen erlaabt. Villméi Gesellschaft Plazen Restriktiounen op deen fueren kann (zB, muss ee gewëssen Alter ze ginn, muss gewësse Tester gestëmmt hunn) a wéi kann se (zB, ënnert der Vitesse limitéiert) fuert. Gesellschaft huet och Persounen, mat dëse Regelen anhaalen (zB, Police), a mir bestrofen Leit déi se séier sinn, verletzen. Dat selwecht Zort vu equilibréiert denken dass Gesellschaft gëllt Führerschäin ze dreiwen kann och zu Daten sharing applizéiert ginn. Dat ass, anstatt nees Absolutioun Argumenter fir oder géint Donnéeën sharing, dass ech de gréisste Virdeeler vum mr eraus kommen, wéi mer méi Donnéeë méi Fluchtweeër deele kann.
Fir ofzeschléissen, huet Informatioun Risiko ganz grouss, an et ass ganz schwéier ze soe an ofgedonkelt. Dofir ass et am Beschten ze huelen, datt all Daten potenziell erkennbar ass an eventuell géintiwwer. Erfgoe geloss Informatioun riskéieren iwwerdeems Recherche maachen, kann Fuerscher schafen an enger Dateschutz Plan verfollegen. Weider, verhënneren heescht Informatioun Risiko net Fuerscher aus Date mat anere Wëssenschaftler eens.