Ir-riskju informattiv huwa r-riskju l-iktar komuni fir-riċerka soċjali; żdied b'mod drammatiku; u huwa r-riskju l-iktar diffiċli li tifhem.
It-tieni sfida etika għar-riċerka dwar l -età diġitali hija r- riskju informattiv , il-potenzjal għal ħsara mill-iżvelar tal-informazzjoni (National Research Council 2014) . Dannu informattiv mill-iżvelar ta 'informazzjoni personali jista' jkun ekonomiku (eż. Jitlef impjieg), soċjali (eż. Imbarazzat), psikoloġiku (eż. Dipressjoni), jew saħansitra kriminali (eż. Sfortunatament, l-età diġitali żżid ir-riskju informattiv b'mod drammatiku - hemm biss tant aktar informazzjoni dwar l-imġiba tagħna. U r-riskju informattiv wera diffiċli ħafna li jifhem u jimmaniġġja meta mqabbel mar-riskji li kienu tħassib f'riċerka soċjali ta 'età analoga, bħal riskju fiżiku.
Mod wieħed li r-riċerkaturi soċjali jnaqqsu riskju informazzjonali huwa "anonimizzazzjoni" ta 'data. "Anonimizzazzjoni" huwa l-proċess ta 'tneħħija identifikaturi personali ovvji bħal isem, indirizz, u numru tat-telefon mill-informazzjoni. Madankollu, dan l-approċċ huwa ħafna inqas effikaċi minn ħafna nies realizzata, u huwa, fil-fatt, ħafna u fundamentalment limitat. Għal din ir-raġuni, kull meta I jiddeskrivi "anonimizzazzjoni," jien ser tuża virgoletti infakkarkom li dan il-proċess joħloq l-apparenza ta 'anonimità, iżda mhux anonimità veru.
Eżempju ħaj tal-falliment ta '"anonimizzazzjoni" ġej mill-aħħar tas-snin disgħin f'Massachusetts (Sweeney 2002) . Il-Kummissjoni tal-Assigurazzjoni tal-Grupp (GIC) kienet aġenzija tal-gvern responsabbli għax-xiri ta 'assigurazzjoni tas-saħħa għall-impjegati kollha tal-istat. Permezz ta 'dan ix-xogħol, il-GIC ġab rekords dettaljati tas-saħħa dwar eluf ta' impjegati tal-istat. Fi sforz biex titħeġġeġ ir-riċerka, il-GIC iddeċieda li jirrilaxxa dawn ir-rekords lir-riċerkaturi. Madankollu, ma kinux jaqsmu d-data kollha tagħhom; pjuttost, huma "anonimizzati" din id-dejta billi tneħħew informazzjoni bħal ismijiet u indirizzi. Madankollu, ħallew informazzjoni oħra li ħasbu li tista 'tkun utli għal riċerkaturi bħal informazzjoni demografika (kodiċi zip, data tat-twelid, etniċità u sess) u informazzjoni medika (żjara ta' dejta, dijanjosi, proċedura) (Figura 6.4) (Ohm 2010) . Sfortunatament, din l- "anonimizzazzjoni" ma kinitx biżżejjed biex tipproteġi d-dejta.
Biex turi n-nuqqasijiet ta '"anonimizzazzjoni" tal-GIC, Latanya Sweeney-imbagħad student gradwat fl-MIT ħallas $ 20 biex jakkwista r-rekords tal-votazzjoni mill-belt ta' Cambridge, il-belt ta 'Massachusetts Weld. Dawn ir-rekords tal-votazzjoni kienu jinkludu informazzjoni bħal isem, indirizz, zip code, data tat-twelid u sess. Il-fatt li l-fajl tad-data medika u l-fajl tal-votanti maqsuma bejn il-kodiċi taż-zip-oqsma, id-data tat-twelid u s-sess-fissru li Sweeney setgħet tgħaqqadhom. Sweeney kien jaf li l-birthday ta 'Weld kien il-31 ta' Lulju, 1945, u r-rekords tal-votazzjoni kienu jinkludu biss sitt persuni f'Cambridge ma 'dik id-data. Barra minn hekk, minn dawk is-sitt persuni, tlieta biss kienu rġiel. U, minn dawk it-tliet irġiel, wieħed biss jikkondividi l-kodiċi zip tal-Weld. Għalhekk, id-dejta tal-votazzjoni wriet li kull persuna fid-dejta medika bil-kombinazzjoni ta 'Weld ta' data tat-twelid, sess u kodiċi zip kienet William Weld. Essenzjalment, dawn it-tliet biċċiet ta 'informazzjoni pprovdewha marki tas-swaba' unika fid-dejta. Bl-użu ta 'dan il-fatt, Sweeney seta' jsib ir-rekords mediċi ta 'Weld, u biex jinfurmah bil-proeza tiegħu, huwa bagħatlu kopja tar-rekords tiegħu (Ohm 2010) .
Ix-xogħol ta 'Sweeney juri l-istruttura bażika ta ' attakki ta 'identifikazzjoni mill-ġdid biex jiġi adottat terminu mill-komunità tas-sigurtà tal-kompjuter. F'dawn l-attakki, żewġ settijiet ta 'dejta, li minnhom waħedhom ma jiżvelawx informazzjoni sensittiva, huma marbuta, u permezz ta' din ir-rabta, hija esposta informazzjoni sensittiva.
Bħala tweġiba għall-ħidma ta 'Sweeney, u xogħol ieħor relatat, ir-riċerkaturi issa ġeneralment ineħħu ħafna aktar informazzjoni - l-hekk imsejħa "informazzjoni li tidentifika personalment" (PII) (Narayanan and Shmatikov 2010) matul il-proċess ta' "anonimizzazzjoni". issa rrealizzaw li ċerta dejta - bħar-rekords mediċi, ir-rekords finanzjarji, tweġibiet għall-mistoqsijiet tal-istħarriġ dwar imġieba illegali - probabbilment huma wisq sensittivi għar-rilaxx anki wara "anonimizzazzjoni". Madankollu, l-eżempji li nipproponi jissuġġerixxi li r-riċerkaturi soċjali jeħtieġu biex ibiddlu l-ħsieb tagħhom. Bħala l-ewwel pass, huwa għaqli li wieħed jassumi li d-data kollha hija potenzjalment identifikabbli u d-dejta kollha hija potenzjalment sensittiva. Fi kliem ieħor, aktar milli jaħseb li r-riskju informattiv japplika għal subsett żgħir ta 'proġetti, għandna nassumu li dan japplika - sa ċertu punt - għall-proġetti kollha.
Iż-żewġ aspetti ta 'din l-orjentazzjoni mill-ġdid huma illustrati mill-Premju Netflix. Kif deskritt fil-kapitolu 5, Netflix ħarġet 100 miljun klassifikazzjoni tal-films pprovduti minn kważi 500,000 membru, u kellhom sejħa miftuħa fejn in-nies minn madwar id-dinja ssottomettew algoritmi li jistgħu jtejbu l-kapaċità ta 'Netflix li jirrakkomanda films. Qabel ma ħarġet id-data, Netflix neħħa kwalunkwe informazzjoni ovvja li tidentifika personalment, bħal ismijiet. Huma wkoll marru pass ieħor u introduċew perturbazzjonijiet ħfief f'xi rekords (eż., Ibiddlu klassifikazzjonijiet minn 4 stilel għal 3 stilel). Huma dalwaqt skoprew, madankollu, li minkejja l-isforzi tagħhom, id-dejta kienet għadha bl-ebda mod anonima.
Ftit ġimgħatejn wara li d-data ġiet rilaxxata, Arvind Narayanan u Vitaly Shmatikov (2008) urew li kien possibbli li wieħed jitgħallem dwar preferenzi ta 'films speċifiċi tan-nies. L-imgħoddi għall-attakk ta 'identifikazzjoni mill-ġdid tagħhom kien simili għal Sweeney's: jingħaqdu flimkien żewġ sorsi ta' informazzjoni, waħda b'informazzjoni potenzjalment sensittiva u mingħajr informazzjoni ovvja li tidentifika u waħda li fiha l-identitajiet tan-nies. Kull wieħed minn dawn is-sorsi tad-data jista 'jkun sikur individwalment, iżda meta jkunu kkombinati, is-sett tad-data magħquda jista' joħloq riskju informattiv. Fil-każ tad-data ta 'Netflix, hawnhekk huwa kif jista' jiġri. Immaġina li nagħżel li naqsam il-ħsibijiet tiegħi dwar films ta 'azzjoni u komedy mal-ko-ħaddiema tiegħi, imma li nippreferi li ma taqbilx l-opinjoni tiegħi dwar films reliġjużi u politiċi. Il-ħaddiema kooperattivi tiegħi jistgħu jużaw l-informazzjoni li għedt magħhom biex isibu r-rekords tiegħi fid-data ta 'Netflix; l-informazzjoni li għandi sehem tista 'tkun marki tas-swaba' unika bħad-data tat-twelid ta 'William Weld, il-kodiċi zip u s-sess. Imbagħad, jekk sabu l-marki tas-swaba 'unika tiegħi fid-dejta, jistgħu jitgħallmu l-klassifikazzjonijiet tiegħi dwar il-films kollha, inklużi l-films li jagħżlu li ma jaqsmux. Minbarra dan it-tip ta 'attakk immirat iffukat fuq persuna waħda, Narayanan u Shmatikov urew ukoll li kien possibbli li jsir attakk wiesa' , li jinvolvi ħafna nies billi tgħaqqad id-data Netflix mad-dejta tal-klassifikazzjoni personali u movie li xi nies għażlu biex titniżżel fuq l-Internet Movie Database (IMDb). Sempliċiment, kwalunkwe informazzjoni li hija marki tas-swaba 'uniċi lil persuna speċifika - saħansitra s-sett ta' klassifikazzjonijiet tal-films tagħhom - tista 'tintuża biex tidentifikahom.
Anki jekk id-dejta Netflix tista 'tiġi identifikata mill-ġdid jew f'area mmirata jew wiesgħa, xorta jista' jidher li huwa ta 'riskju baxx. Wara kollox, il-klassifikazzjonijiet tal-films ma jidhrux sensittivi ħafna. Filwaqt li dan jista 'jkun minnu b'mod ġenerali, għal xi wħud mill-500,000 persuna fid-dataset, il-klassifikazzjonijiet tal-films jistgħu jkunu pjuttost sensittivi. Fil-fatt, bi tweġiba għall-identifikazzjoni mill-ġdid, mara lesbjetta mqaxxra ssieħbet ma 'azzjoni ta' klassi kontra Netflix. Hawnhekk kif ġiet espressa l-problema fil-kawża tagħhom (Singel 2009) :
"[Id-data] u l-informazzjoni tal-klassifikazzjoni fiha informazzjoni ta '... natura ferm personali u sensittiva. Id-dejta tal-film tal-membru tesponi interess personali ta 'membru Netflix u / jew ġlidiet b'ħafna kwistjonijiet personali ħafna, inklużi sesswalità, mard mentali, irkupru minn alkoħoliżmu u vittimizzazzjoni minn inċest, abbuż fiżiku, vjolenza domestika, adulterju u stupru. "
L-identifikazzjoni mill-ġdid tad-dejta tal-Premju Netflix turi kemm li d-dejta kollha hija potenzjalment identifikabbli u li d-data kollha hija potenzjalment sensittiva. Fuq dan il-punt, inti tista 'taħseb li dan japplika biss għal dejta li għandha x'taqsam man-nies. B'mod sorprendenti, dak mhuwiex il-każ. Bi tweġiba għal-Libertà tat-talba Information Law, il-New York City Gvern rilaxxati rekords ta 'kull rikba taxi fi New York fl-2013, inkluż l-Pickup u qatra off times, postijiet, u l-ammonti nol (irtirar minn kapitolu 2 li Farber (2015) użaw dejta simili biex tittestja teoriji importanti fl-ekonomija tax-xogħol). Din id-dejta dwar vjaġġi bit-taxi tista 'tidher beninna għax ma jidhirx li jipprovdu informazzjoni dwar in-nies, iżda Anthony Tockar induna li dan id-dataset tat-taxi fil-fatt fih ħafna informazzjoni potenzjalment sensittiva dwar in-nies. Biex juri, huwa ħares lejn il-vjaġġi kollha li bdew fil-Hustler Club - klabb kbir ta 'strixxi fi New York - bejn nofs il-lejl u s-6 am u mbagħad sabu l-postijiet ta' tluq tagħhom. Din it-tfittxija żvelat - essenzjalment - lista ta 'indirizzi ta' xi nies li frekwentaw il-Hustler Club (Tockar 2014) . Huwa diffiċli li wieħed jimmaġina li l-gvern tal-belt kellu dan f'moħħu meta ħareġ id-dejta. Fil-fatt, din l-istess teknika tista 'tintuża biex issib l-indirizzi tad-dar ta' nies li jżuru kwalunkwe post fil-belt-klinika medika, bini tal-gvern jew istituzzjoni reliġjuża.
Dawn iż-żewġ każijiet tal-Premju Netflix u d-dejta tat-taxi tat-Tip ta 'New York juru li persuni relattivament kwalifikati jistgħu jonqsu milli jikkalkolaw b'mod korrett ir-riskju informattiv fid-dejta li jirrilaxxaw u dawn il-każijiet bl-ebda mod mhumiex uniċi (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . Barra minn hekk, f'ħafna każi bħal dawn, id-dejta problematika għadha disponibbli b'xejn fuq l-internet, u tindika d-diffikultà li qatt titħassar ir-rilaxx tad-dejta. Kollettivament, dawn l-eżempji - kif ukoll ir-riċerka fix-xjenza tal-kompjuter dwar il-privatezza - iwasslu għal konklużjoni importanti. Ir-riċerkaturi għandhom jassumu li d-data kollha hija potenzjalment identifikabbli u d-data kollha hija potenzjalment sensittiva.
Sfortunatament, m'hemmx soluzzjoni sempliċi għall-fatti li d-data kollha hija potenzjalment identifikabbli u li d-data kollha hija potenzjalment sensittiva. Madankollu, mod wieħed biex tnaqqas ir-riskju informattiv waqt li tkun qed taħdem b'data huwa li toħloq u ssegwi pjan ta 'protezzjoni tad - data . Dan il-pjan se jnaqqas iċ-ċans li d-dejta tiegħek tonqos u tnaqqas il-ħsara jekk xi nixxija b'xi mod isseħħ. L-ispeċifiċitajiet tal-pjanijiet tal-protezzjoni tad-dejta, bħal liema forma ta 'encryption għall-użu, se jinbidlu maż-żmien, iżda s-Servizzi tad-Dejta tar-Renju Unit jorganizzaw l-elementi ta' pjan ta 'protezzjoni tad-dejta f'ħames kategoriji li jsejħu l- ħames kaxxiforti : , issettjar sikur, informazzjoni sigura, u prodotti sikuri (tabella 6.2) (Desai, Ritchie, and Welpton 2016) . L-ebda waħda mill-ħames kaxxiforti individwali ma tipprovdi protezzjoni perfetta. Iżda flimkien jiffurmaw sett qawwi ta 'fatturi li jistgħu jnaqqsu r-riskju informattiv.
Sikur | Azzjoni |
---|---|
Proġetti sikuri | Jillimita proġetti b'dejta għal dawk li huma etiċi |
Persuni sikuri | L-aċċess huwa ristrett għal persuni li jistgħu jiġu fdati b'data (eż. Nies li jkunu għaddew minn taħriġ etiku) |
Dejta sigura | Id-dejta tiġi ddeidentifikata u aggregata sal-limitu possibbli |
Allokazzjonijiet sikuri | Id-data hija maħżuna f'kompjuters b'kamra fiżika (eż., Kamra msakkra) u softwer (eż., Protezzjoni bil-password, kriptata) protezzjoni |
Produzzjoni sikura | Il-produzzjoni tar-riċerka hija riveduta biex tipprevjeni ksur ta 'privatezza aċċidentali |
Minbarra l-protezzjoni tad-dejta tiegħek waqt li tkun qed tużahom, pass fil-proċess ta 'riċerka fejn ir-riskju informattiv huwa partikolarment importanti huwa l-qsim tad-dejta ma' riċerkaturi oħrajn. Il-qsim tad-dejta fost ix-xjentisti huwa valur ċentrali tal-isforz xjentifiku, u jiffaċilita bil-kbir l-avvanz tal-għarfien. Hawnhekk kif il-House of Commons tar-Renju Unit iddeskriviet l-importanza tal-qsim tad-dejta (Molloy 2011) :
"L-aċċess għad-data huwa fundamentali jekk ir-riċerkaturi għandhom jirriproduċu, jivverifikaw u jibnu fuq ir-riżultati li huma rrappurtati fil-letteratura. Il-preżunzjoni għandha tkun li, sakemm ma jkunx hemm raġuni soda xort'oħra, id-dejta għandha tkun żvelata b'mod sħiħ u tkun disponibbli għall-pubbliku. "
Madankollu, billi taqsam id-dejta tiegħek ma 'riċerkatur ieħor, tista' tkun li żżid ir-riskju informattiv għall-parteċipanti tiegħek. Għalhekk, jista 'jidher li l-kondiviżjoni tad-dejta toħloq tensjoni fundamentali bejn l-obbligu li tinqasam id-dejta ma' xjenzati oħra u l-obbligu li jitnaqqas ir-riskju informattiv lill-parteċipanti. Fortunatament, din id-dilemma mhix gravi daqs kemm tidher. Pjuttost, huwa aħjar li wieħed jaħseb dwar il-kondiviżjoni tad-dejta bħala li taqa 'fuq kontinwu, b'kull punt fuq dak il-kontinwu li jipprovdi taħlita differenti ta' benefiċċji għas-soċjetà u riskju għall-parteċipanti (figura 6.6).
Fl-estrem, tista 'taqsam id-dejta tiegħek bl-ebda waħda, li tnaqqas ir-riskju għall-parteċipanti iżda wkoll timminimizza l-qligħ lis-soċjetà. Fl-estrem l-ieħor, tista ' tirrilaxxa u tinsa , fejn id-dejta hija "anonimizzata" u stazzjonata għal kulħadd. Fir-rigward li ma tiġix rilaxxata d-dejta, ir-rilaxx u t-tbagħbis toffri kemm benefiċċji ogħla lis-soċjetà kif ukoll riskju ogħla għall-parteċipanti. Fost dawn iż-żewġ każijiet estremi hemm firxa ta 'ibridi, inkluż dak li se nsejjaħ approċċ tal -ġnien mgħottija . Taħt dan l-approċċ, id-dejta tinqasam ma 'nies li jissodisfaw ċerti kriterji u li jaqblu li jkunu marbuta b'ċerti regoli (eż., Superviżjoni minn IRB u pjan ta' protezzjoni tad-data). L-approċċ tal-ġnien mgħottija jipprovdi ħafna mill-benefiċċji tar-rilaxx u tinsa b'anqas riskju. Naturalment, approċċ bħal dan joħloq bosta mistoqsijiet -li għandu jkollhom aċċess, taħt liema kundizzjonijiet, u għal kemm żmien, min għandu jħallas biex iżomm u jipproċessa l-ġnien mgħotti, eċċ .- iżda dawn mhumiex insormontabbli. Fil-fatt, diġà jeżistu ġonna tal-ħajt li fihom jistgħu jintużaw riċerkaturi bħalissa, bħall-arkivju tad-dejta tal-Konsorzju Inter-universitarju għar-Riċerka Politika u Soċjali fl-Università ta 'Michigan.
Allura, fejn għandha d-data mill-istudju tiegħek tkun fuq il-continuum ta 'qsim, ġnien walled, u rilaxx u tinsa? Dan jiddependi fuq id-dettalji tad-data tiegħek: ir-riċerkaturi għandhom jibbilanċjaw ir-rispett għall-Persuni, il-Benefiċjenza, il-Ġustizzja u r-rispett għall-Liġi u l-Interess Pubbliku. Minn din il-perspettiva, il-kondiviżjoni tad-dejta mhijiex konundament etiku distintiv; huwa biss wieħed mill-ħafna aspetti tar-riċerka li fihom ir-riċerkaturi jridu jsibu bilanċ etiku xieraq.
Uħud mill-kritiċi huma ġeneralment opposti għall-qsim tad-dejta għaliex, fil-fehma tiegħi, huma ffokati fuq ir-riskji tiegħu - li bla dubju huma reali - u qed jinjoraw il-benefiċċji tiegħu. Għalhekk, sabiex ninkoraġġixxu l-enfasi kemm fuq ir-riskji kif ukoll fuq il-benefiċċji, nixtieq nipproponi analoġija. Kull sena, il-karozzi huma responsabbli għal eluf ta 'mwiet, iżda aħna ma nippruvawx nipprojbixxu sewqan. Fil-fatt, sejħa għal projbizzjoni tas-sewqan tkun assurd għax is-sewqan jippermetti ħafna affarijiet mill-isbaħ. Pjuttost, is-soċjetà tpoġġi restrizzjonijiet fuq min jista 'jsuq (eż., Il-ħtieġa li tkun ċerta età u għaddew ċerti testijiet) u kif jistgħu jsuqu (eż., Taħt il-limitu tal-veloċità). Is-soċjetà għandha wkoll in-nies inkarigati li jinfurzaw dawn ir-regoli (eż. Il-pulizija), u aħna jikkastigaw lin-nies li jinqabdu jiksruhom. Dan l-istess tip ta 'ħsieb bilanċjat li s-soċjetà tapplika għar-regolazzjoni tas-sewqan jista' jiġi applikat ukoll għall-kondiviżjoni tad-dejta. Jiġifieri, aktar milli nagħmlu argumenti assolutivi favur jew kontra l-qsim tad-dejta, naħseb li se nagħmlu l-akbar progress billi niffukaw fuq kif nistgħu nnaqqsu r-riskji u nżidu l-benefiċċji mill-qsim tad-dejta.
Bħala konklużjoni, ir-riskju informattiv żdied b'mod drammatiku, u huwa diffiċli ħafna li wieħed ibassar u jikkwantifika. Għalhekk, l-aħjar huwa li wieħed jassumi li d-data kollha hija potenzjalment identifikabbli u potenzjalment sensittiva. Sabiex jitnaqqas ir-riskju informattiv waqt li ssir ir-riċerka, ir-riċerkaturi jistgħu joħolqu u jsegwu pjan ta 'protezzjoni tad-data. Barra minn hekk, ir-riskju informattiv ma jwaqqafx lil riċerkaturi milli jaqsmu dejta ma 'xjenzati oħra.