Riskju ta 'Informazzjoni huwa r-riskju aktar komuni fir-riċerka soċjali; dan żdied b'mod drammatiku; u huwa r-riskju aktar diffiċli biex jifhmu.
It-tieni sfida etika għal riċerka diġitali età soċjali hija riskju informattivi, il-potenzjal għall-ħsara mit-iżvelar ta 'informazzjoni (Council 2014) . ħsara informatorja mill-iżvelar ta 'informazzjoni personali tista' tkun ekonomika (eż, jitilfu l-impjieg), soċjali (eż, imbarazzament), psikoloġika (eż dipressjoni), jew saħansitra kriminali (eż arrest għal imġieba illegali). Sfortunatament, l-era diġitali żżid ir-riskju ta 'informazzjoni b'mod drammatiku-hemm biss tant aktar informazzjoni dwar l-imġiba tagħna. U, ir-riskju informattivi kien diffiċli ferm li wieħed jifhem u jimmaniġġjaw mqabbla ma 'riskji li kienu tħassib fir-riċerka soċjali età Analog, bħal riskju fiżiku. Biex tara kif l-era diġitali żżid ir-riskju informattivi, jikkunsidraw it-tranżizzjoni mill-karta għar-reġistri mediċi elettroniċi. Iż-żewġ tipi ta 'records joħolqu riskju, iżda l-rekords elettroniċi joħolqu riskji ferm akbar għaliex fil skala kbira jkunu jistgħu jiġu trasmessi lil parti mhux awtorizzat jew ingħaqdu ma' rekords oħra. riċerkaturi soċjali fl-era diġitali diġà jidħlu f'inkwiet b'riskju informattivi, parzjalment minħabba li ma jifhmu bis-sħiħ kif biex jiġi kkwantifikat u li titmexxa b'mod. Allura, jien ser joffru mod utli biex jaħsbu dwar riskju informattivi, u mbagħad jien ser jagħtuk xi pariri għal kif ġestit ir-riskju informattivi fir-riċerka tiegħek u fil-ħruġ tad-data għal riċerkaturi oħra.
Mod wieħed li r-riċerkaturi soċjali jnaqqsu riskju informazzjonali huwa "anonimizzazzjoni" ta 'data. "Anonimizzazzjoni" huwa l-proċess ta 'tneħħija identifikaturi personali ovvji bħal isem, indirizz, u numru tat-telefon mill-informazzjoni. Madankollu, dan l-approċċ huwa ħafna inqas effikaċi minn ħafna nies realizzata, u huwa, fil-fatt, ħafna u fundamentalment limitat. Għal din ir-raġuni, kull meta I jiddeskrivi "anonimizzazzjoni," jien ser tuża virgoletti infakkarkom li dan il-proċess joħloq l-apparenza ta 'anonimità, iżda mhux anonimità veru.
Eżempju ħaj ta 'l-falliment ta' "anonimizzazzjoni" ġej mill-1990 tard f'Massachusetts (Sweeney 2002) . Il-Kummissjoni Assigurazzjoni Grupp (GIC) kien aġenzija tal-gvern responsabbli għax-xiri ta 'assigurazzjoni tas-saħħa għall-impjegati kollha statali. Permezz ta 'dan ix-xogħol, il-GIC miġbura reġistri dettaljati dwar is-saħħa madwar eluf ta' impjegati l-istat. Fi sforz biex jixprunaw ir-riċerka dwar modi biex ittejjeb is-saħħa, GIC iddeċieda li jirrilaxxa dawn ir-rekords għar-riċerkaturi. Madankollu, huma ma jaqsmu kollha tad-data tagħhom; pjuttost, huma "għamla anonima" huwa billi tneħħi l-informazzjoni bħall-isem u l-indirizz. Madankollu, ikunu telqu informazzjoni oħra li ħasbu jistgħu jkunu utli għar-riċerkaturi bħall-informazzjoni demografika (zip code, data tat-twelid, l-etniċità, u s-sess) u l-informazzjoni medika (data żjara, dijanjożi, il-proċedura) (Figura 6.4) (Ohm 2010) . Sfortunatament, dan il- "anonimizzazzjoni" ma kienx biżżejjed biex jipproteġu d-data.
Biex nispjegaw-nuqqasijiet tal-GIC "anonimizzazzjoni", Latanya Sweeney-mbagħad student gradwat fil-MIT imħallsa $ 20 sa jakkwista r-rekords tal-votazzjoni mill-belt ta 'Cambridge, l-Hometown ta' gvernatur Massachusetts William Weld. Dawn ir-rekords tal-vot inkluż informazzjoni bħall-isem, l-indirizz, zip code, data tat-twelid, u s-sess. Il-fatt li l-fajl mediku tad-data u l-kodiċi fajl votant maqsuma oqsma zip, data tat-twelid, u li Sweeney jista jorbtuhom fisser sess. Sweeney kien jaf li birthday Iwweldja kienet Lulju 31, 1945, u r-rekords tal-votazzjoni inklużi biss sitt persuni fil Cambridge ma 'dak birthday. Barra minn hekk, ta 'dawk sitt persuni, tlieta biss kienu rġiel. U, dawn it-tliet irġiel, wieħed biss maqsuma zip code Weld s. Għalhekk, id-dejta tal-vot wriet li xi ħadd fid-data medika ma 'taħlita Iwweldja ta' data tat-twelid, sess, u l-kodiċi zip kien William Weld. Essenzjalment, dawn it-tliet biċċiet ta 'informazzjoni pprovduta minn marki tas-swaba unika lilu fid-data. Meta tuża dan il-fatt, Sweeney kienet kapaċi jsibu r-rekords mediċi Weld, u biex tinfurmah bid-ADT tagħha, hija impustata lilu kopja tar-rekords tiegħu (Ohm 2010) .
Xogħol Sweeney s turi l-istruttura bażika ta 'attakki de-anonimimizzazzjoni -to jadotta terminu mill-komunità sigurtà tal-kompjuter. Fil dawn l-attakki, żewġ settijiet ta 'data, la ta' li minnha nfisha tiżvela informazzjoni sensittiva, huma marbuta, u permezz ta 'din ir-rabta, l-informazzjoni sensittiva hija esposta. F'xi metodi dan il-proċess huwa simili għall-mod li baking soda u ħall, żewġ sustanzi li huma minnhom infushom sikuri, jistgħu jiġu kkombinati biex jipproduċu riżultat diżgustanti.
Bi tweġiba għall-ħidma Sweeney, u xogħol relatat ieħor, ir-riċerkaturi issa ġeneralment jneħħi ħafna aktar informazzjoni kollha hekk imsejħa "informazzjoni personalment identifikazzjoni" (PII) (Narayanan and Shmatikov 2010) -matul l-proċess ta ' "anonimizzazzjoni". Barra minn hekk, ħafna riċerkaturi issa jirrealizzaw li ċerti dejta 'bħal reġistri mediċi, reġistri finanzjarji, tweġibiet għall-istħarriġ mistoqsijiet dwar illegali imġiba hija probabbilment wisq sensittivi biex jirrilaxxa anki wara "anonimizzazzjoni". Madankollu, aktar eżempji riċenti li jien ser jiddeskrivu hawn taħt jindikaw li r-riċerkaturi soċjali jeħtieġ li bidla ħsieb tagħhom. Bħala l-ewwel pass, huwa għaqli li wieħed jassumi li kull data hija potenzjalment identifikabbli u d-data kollha hija potenzjalment sensittiva. Fi kliem ieħor, aktar milli taħseb dan ir-riskju informattivi tapplika għal subsett żgħir ta 'proġetti, għandna nassumu li dan japplika għal ċertu grad ta' għall-proġetti kollha.
Iż-żewġ aspetti ta 'din l-orjentazzjoni mill-ġdid huma illustrati mill-Premju Netflix. Kif deskritt fil-Kapitolu 5, Netflix rilaxxati 100 miljun klassifikazzjonijiet movie pprovduti minn kważi 500,000 membri, u kellhom sejħa miftuħa fejn in-nies minn madwar id-dinja sottomess algoritmi li jistgħu jtejbu ħila Netflix biex jirrakkomandaw films. Qabel ma jiġu rilaxxati l-informazzjoni, Netflix jitneħħa kwalunkwe informazzjoni ovvjament personalment-identifikazzjoni, bħal ismijiet. Netflix wkoll marru pass addizzjonali u introduċew perturbazzjonijiet żgħir f'xi wħud mill-rekords (eż, jinbidlu xi klassifikazzjonijiet minn 4 stilel sa 3 stilel). Netflix malajr skoprew, madankollu, li minkejja l-isforzi tagħhom, id-dejta ma bl-ebda mod anonimu.
Biss ġimgħatejn wara li l-informazzjoni ġiet rilaxxata Narayanan and Shmatikov (2008) wera li kien possibbli li jitgħallmu dwar il-preferenzi movie nies speċifiċi taċ. Il-trick li kross minn identifikazzjoni mill-ġdid tagħhom kien simili għal Sweeney s: jingħaqdu flimkien żewġ sorsi ta 'informazzjoni, wieħed b'informazzjoni potenzjalment sensittiva u l-ebda informazzjoni ovvjament tidentifika u wieħed li fih l-identità ta' poplu. Kull wieħed minn dawn is-sorsi ta 'data tista' tkun individwalment sikuri, iżda meta dawn huma kombinati-dataset amalgamata tista 'toħloq riskju informattivi. Fil-każ tad-data Netflix, hawnhekk kif dan jista 'jiġri. Immaġina li I jagħżlu li jaqsmu l-ħsibijiet tiegħi dwar azzjoni u films kummiedja ma 'tiegħi ko-ħaddiema, iżda li nippreferi li ma jaqsmu l-opinjonijiet tiegħi dwar films reliġjużi u politiċi. My ko-ħaddiema jkunu jistgħu jużaw l-informazzjoni li stajt maqsuma magħhom biex isibu rekords tiegħi fid-dejta Netflix; l-informazzjoni li jiena naqbel jista 'jkun marki tas-swaba unika bħad-data William Iwweldja s twelid, kodiċi zip, u s-sess. Imbagħad, jekk isibu marki tas-swaba unika tiegħi fid-dejta, dawn jistgħu jitgħallmu klassifikazzjonijiet tiegħi dwar films kollha, inkluż films fejn I jagħżlu li ma jmorrux jaqsmu. B'żieda ma 'dan it-tip ta' attakk immirat iffokat fuq persuna waħda, Narayanan and Shmatikov (2008) wera wkoll li kien possibbli li jagħmlu -one attakk wiesgħa li jinvolvi ħafna nies bl-inkorporazzjoni tad-data Netflix ma 'data tal-klassifikazzjoni tal personali u movie li xi nies għażlu li post fuq il Internet Movie Database (IMDb). Kwalunkwe informazzjoni li hija marki tas-swaba uniċi għal persuna saħansitra sett tagħhom speċifiku ta 'movie klassifikazzjonijiet' jistgħu jintużaw biex jidentifikaw lilhom.
Anki jekk jista 'jerġa' identifikata d-dejta Netflix jew fil-attakk immirat jew wiesa ', xorta jista' jidher li jkun ta 'riskju baxx. Wara kollox, il-klassifikazzjonijiet movie ma jidhirx sensittiva ħafna. Filwaqt li jista 'jkun minnu, b'mod ġenerali, għal xi wħud mill-poplu 500,000 fl-dataset klassifikazzjonijiet movie jista' jkun pjuttost sensittiva. Fil-fatt, bi tweġiba għall-de-anonimimizzazzjoni mara lesbjani closeted ssieħbu libsa klassi azzjoni kontra Netflix. Ara kif l-problema ġiet espressa lawsuit tagħhom (Singel 2009) :
"[M] ovie u klassifikazzjoni dejta fiha tagħrif ta 'natura aktar għolja personali u sensittiva [sic]. data movie-membru jesponi interess u / jew ġlidiet personali ta 'membru Netflix ma' diversi kwistjonijiet ferm personali, inkluż sesswalità, mard mentali, l-irkupru mill-alkoħoliżmu, u vittimizzazzjoni mill inċest, abbuż fiżiku, il-vjolenza domestika, adulterju, u l-istupru. "
De-anonimimizzazzjoni tad-data Premju Netflix turi kemm dik id-data kollha hija potenzjalment identifikabbli u li d-data kollha hija potenzjalment sensittiva. Wara dan, inti tista 'taħseb li dan japplika biss għad-data li din suppost intiża li tkun madwar in-nies. Surprisingly, dan mhuwiex il-każ. Bi tweġiba għal-Libertà tat-talba Information Law, il-New York City Gvern rilaxxati rekords ta 'kull rikba taxi fi New York fl-2013, inkluż il-Pickup u qatra off times, postijiet, u l-ammonti nollijiet (sejħa lura mill-Kapitolu 2 li Farber (2015) użat din id-data biex jittestjaw teoriji importanti fl-ekonomija tax-xogħol). Għalkemm din id-data dwar vjaġġi ta 'taxi jista' jidher beninni għaliex ma jidhirx li jkun informazzjoni dwar in-nies, Anthony Tockar induna li dan taxi CCD attwalment jinsabu lottijiet ta 'informazzjoni potenzjalment sensittiva dwar in-nies. Biex nispjegaw, hu ħares lejn vjaġġi kollha li jibdew minn Il-Club klabb strixxa kbira Hustler fi New York-nofs nofs il-lejl u 06:00 u mbagħad misjuba f'postijiet drop-off tagħhom. Din it-tfittxija żvelat fil essenza-lista ta 'indirizzi ta' xi nies li frekwenti-Club Hustler (Tockar 2014) . Huwa diffiċli li wieħed jimmaġina li l-gvern belt kellha dan f'moħħu meta rilaxxati d-data. Fil-fatt, dan l-istess teknika tista 'tintuża biex isibu l-indirizzi tad-dar ta' nies li jżuru kwalunkwe post fil-belt klinika medika, bini tal-gvern, jew istituzzjoni reliġjuża.
Dawn iż-żewġ każijiet il-Premju Netflix u l-New York City taxi data 'juru li n-nies relattivament b'ħiliet naqas milli jistmaw korrettament ir-riskju informattivi fid-dejta li huma rilaxxati, u dawn il-każijiet bl-ebda mod uniku (Barbaro and Zeller Jr 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . Barra minn hekk, f'ħafna minn dawn il-każijiet, id-data problematika tkun għadha disponibbli liberament fuq l-internet, li jindika d-diffikultà ta 'dejjem jintilfu rilaxx tad-data. Kollettivament dawn-l-eżempji kif ukoll riċerka fix-xjenza tal-kompjuter dwar il-privatezza 'twassal għal konklużjoni importanti. Riċerkaturi għandha tassumi li d-data kollha hija potenzjalment identifikabbli u d-data kollha hija potenzjalment sensittiva.
Sfortunatament, m'hemm l-ebda soluzzjoni sempliċi għall-fatt li d-data kollha hija potenzjalment identifikabbli u d-data kollha hija potenzjalment sensittiva. Madankollu, mod wieħed biex jitnaqqas ir-riskju ta 'informazzjoni waqt li qed jaħdmu ma' data hu li toħloq u jsegwu pjan ta 'protezzjoni tad-data. Dan il-pjan se jnaqqas iċ-ċans li d-data tiegħek ser tnixxi u se jnaqqsu l-ħsara jekk nixxija b'xi iseħħ. L-ispeċifiċitajiet ta 'pjanijiet ta' protezzjoni tad-dejta, bħal liema forma ta 'encryption għall-użu, se jinbidlu maż-żmien, iżda l-servizzi ta' data tar-Renju Unit siewi jorganizza l-elementi ta 'pjan ta' protezzjoni tad-data 5 kategoriji li huma jitolbu l-kaxxiforti 5: proġetti sikuri, nies bla periklu , l-issettjar sikuri, data sikur, u r-riżultati siguri (Tabella 6.2) (Desai, Ritchie, and Welpton 2016) . Ebda wieħed mill-ħames kaxxiforti jipprovdu individwalment protezzjoni perfetta. Iżda, flimkien jikkostitwixxu sett b'saħħtu ta 'fatturi li jistgħu jnaqqsu ir-riskju informattivi.
Safe | azzjoni |
---|---|
proġetti Safe | jillimita proġetti ma 'data lil dawk li huma etiċi |
nies bla periklu | aċċess huwa ristrett għal persuni li jistgħu jkunu fdati bid-dejta (taħriġ etika eż, in-nies għaddew) |
data Safe | data hija de-identifikati u miġbura sa fejn hu possibbli |
settings Safe | data hija maħżuna fil-kompjuters bil xieraq fiżiċi (eż, kamra msakkra) u software (eż, protezzjoni password, encrypted) protezzjonijiet |
produzzjoni sikuri | riżultati tar-riċerka huwa rivedut biex tipprevjeni aċċidentalment ksur ta 'privatezza |
Minbarra l-protezzjoni tad-data tiegħek waqt li tkun qed tuża dan, pass wieħed fil-proċess ta 'riċerka fejn ir-riskju informazzjonali huwa partikolarment importanti hija iskambju tad-dejta ma' riċerkaturi oħra. kondiviżjoni ta 'data bejn ix-xjentisti huwa valur ċentrali ta' l-isforzi xjentifiċi, u faċilitajiet ħafna l-avvanz fl-għarfien. Ara kif il-House of Commons tar-Renju Unit iddeskriva l-importanza tal-qsim tad-dejta:
"L-aċċess għad-dejta hija fundamentali jekk ir-riċerkaturi għandhom jirriproduċu, jivverifikaw u tibni fuq ir-riżultati li huma rrapportati fil-letteratura. Il-preżunzjoni għandha tkun li, sakemm ma jkunx hemm raġuni qawwija mod ieħor, id-data għandha tkun żvelata b'mod sħiħ u jkun pubblikament disponibbli. F'konformità ma 'dan il-prinċipju, meta possibbli, data assoċjata ma' kull riċerka ffinanzjata pubblikament għandha ssir b'mod wiesa 'u liberament disponibbli. " (Molloy 2011)
Madankollu, billi jaqsmu data tiegħek ma 'riċerkatur ieħor, inti tista' tkun mhedda informattivi lill-parteċipanti tiegħek. Għalhekk, jista 'jidher li r-riċerkaturi li jixtiequ jaqsmu tagħhom dejta' jew huma meħtieġa li jaqsmu tagħhom id-data 'qed jiffaċċjaw tensjoni fundamentali. Min-naħa waħda huma għandhom l-obbligu etiku biex jaqsmu d-dejta tagħhom ma 'xjentisti oħrajn, speċjalment jekk ir-riċerka oriġinali ffinanzjata pubblikament. Madankollu, fl-istess ħin, ir-riċerkaturi għandhom obbligu etiku biex jimminimizzaw, kemm jista 'jkun, ir-riskju ta' informazzjoni lill-parteċipanti tagħhom.
Fortunatament, din id-dilemma mhijiex daqshekk gravi kif jidher. Huwa importanti li wieħed jaħseb ta kondiviżjoni tul continuum minn ebda kondiviżjoni tad-dejta li jirrilaxxa u tinsa, fejn id-data hija "anonimizzati" u stazzjonati għal kulħadd aċċess għal data (Figura 6.6). Dawn iż-żewġ pożizzjonijiet estremi jkollhom riskji u l-benefiċċji. Dan huwa, mhuwiex awtomatikament l-aktar ħaġa etiku li ma jaqsmu data tiegħek; tali approċċ jelimina benefiċċji potenzjali ħafna għas-soċjetà. Jirritornaw lejn Togħma, Ingravajjet, u Ħin, eżempju diskuss aktar kmieni fil-kapitolu, l-argumenti kontra rilaxx tad-data li jiffokaw biss fuq ħsara possibbli u li jinjora l-benefiċċji possibbli huma wisq fuq naħa waħda; I ser jiddeskrivu l-problemi ma 'dan, l-approċċ żżejjed protettiv fuq naħa waħda f'aktar dettall fil hawn isfel meta I joffru pariri dwar teħid deċiżjonijiet fil-wiċċ ta' inċertezza (Taqsima 6.6.4).
Barra minn hekk, bejn dawn iż-żewġ każijiet estremi huwa dak li jien ser jissejjaħ approċċ ġnien walled fejn id-data hija maqsuma ma 'nies li jissodisfaw ċerti kriterji u li jaqblu li jkunu marbuta bil ċerti regoli (eż superviżjoni minn IRB u ta' pjanijiet ta 'protezzjoni tad-data) . Dan l-approċċ ġnien walled jipprovdi ħafna mill-benefiċċji ta 'rilaxx u tinsa b'inqas riskju. Of course, approċċ ġnien walled joħloq ħafna mistoqsijiet-li għandu jkollhom aċċess, taħt liema kondizzjonijiet, għal kemm żmien, li għandu jħallas li żżomm u pulizija tal-ġnien walled eċċ-imma dawn mhumiex insormontabbli. Fil-fatt, hemm diġà qed jaħdmu ġonna b'ħitan fis-seħħ li r-riċerkaturi jistgħu jużaw id-dritt issa, bħall-arkivju tad-dejta tal-Konsorzju Inter-universitarju għar-Riċerka Politika u Soċjali fl-Università ta 'Michigan.
Allura, meta għandhom id-dejta minn studju tiegħek tkun fuq il-continuum ta 'ebda qsim, ġnien b'ħitan, u r-rilaxx u tinsa? Hija tiddependi fuq id-dettalji tad-data tiegħek; riċerkaturi għandhom jibbilanċjaw ir-rispett għad-Persuni, benefiċenza,-Ġustizzja, u Rispett għal-Liġi u Interess Pubbliku. Waqt il-valutazzjoni bilanċ xieraq għad-deċiżjonijiet l-oħra riċerkaturi tfittex il-parir u l-approvazzjoni ta 'IRBs, u r-rilaxx tad-data tista' tkun daqstant parti oħra ta 'dak il-proċess. Fi kliem ieħor, għalkemm xi nies jaħsbu rilaxx tad-data bħala morass etika bla tama, aħna diġà għandhom sistemi stabbiliti biex jgħinu riċerkaturi jibbilanċja dawn it-tip ta dilemmi etiċi.
Mod wieħed finali biex jaħsbu dwar qsim ta 'dejta hija b'analoġija. Kull karozzi sena huma responsabbli għal eluf ta 'mwiet, iżda aħna ma tentattiv biex jipprojbixxu sewqan. Fil-fatt, tali sejħa għall-projbizzjoni tas-sewqan ikun assurd minħabba sewqan jippermetti affarijiet sbieħ ħafna. Pjuttost, is-soċjetà tqiegħed restrizzjonijiet fuq min jista 'jsuq (eż, jeħtieġ li tkun ċerta età, jeħtieġ li jkunu għaddew ċerti testijiet) u kif dawn jistgħu jsuqu (eż, taħt il-limitu tal-veloċità). Soċjetà għandha wkoll nies inkarigati bl-infurzar dawn ir-regoli (eż, tal-pulizija), u aħna jikkastigaw nies li jinqabdu jiksru lilhom. Dan l-istess tip ta 'ħsieb bilanċjat li s-soċjetà tapplika għar-regolazzjoni tas-sewqan jistgħu jiġu applikati wkoll għal qsim ta' dejta. Dan huwa, minflok ma argumenti Absolutist favur jew kontra qsim tad-data, naħseb li l-ikbar benefiċċji se jiġu minn jidhru kif nistgħu jaqsmu aktar data aktar sikur.
Biex wieħed jikkonkludi, ir-riskju informattivi żdied b'mod drammatiku, u huwa ferm diffiċli li wieħed ibassar u kkwantifikati. Għalhekk, huwa aħjar li wieħed jassumi li d-data kollha hija potenzjalment identifikabbli u potenzjalment sensittiva. Biex jonqos ir-riskju informattivi filwaqt li tagħmel ir-riċerka, ir-riċerkaturi jistgħu joħolqu u jsegwu pjan ta 'protezzjoni tad-data. Barra minn hekk, ir-riskju informattivi ma jwaqqafx riċerkaturi milli jaqsmu data ma 'xjentisti oħrajn.