Is ionann riosca Eolas an riosca is coitianta i dtaighde sóisialta; sé méadú suntasach; agus is é an riosca is deacair a thuiscint.
Is é an dara dúshlán eiticiúil le haghaidh taighde digiteach aois sóisialta riosca eolais, an acmhainneacht le haghaidh dochar as nochtadh faisnéise (Council 2014) . D'fhéadfadh HARMS eolais ó nochtadh faisnéise pearsanta a eacnamaíoch (mar shampla, go gcaillfidís post), sóisialta (m.sh., náire), síceolaíoch (eg, dúlagar), nó fiú coiriúil (m.sh., gabhála na hiompraíochta neamhdhleathaí). Ar an drochuair, méadaíonn an aois dhigiteach riosca eolais mór tagtha-níl ach i bhfad níos mó eolais a fháil faoinár iompar. Agus, tá riosca eolais cruthaithe an-deacair a thuiscint agus a bhainistiú i gcomparáid le rioscaí a raibh imní i dtaighde sóisialta aois aschur, mar riosca fisiciúil. Chun féachaint ar conas a mhéadaíonn an aois dhigiteach riosca eolais, a mheas an t-aistriú ó pháipéar ar thaifid leighis leictreonach. chruthú dá chineál taifead riosca, ach a chruthú ar an taifid leictreonacha rioscaí i bhfad níos mó mar gheall ar scála ollmhór is féidir iad a tharchur chuig do pháirtí neamhúdaraithe nó chumasc le taifid eile. taighdeoirí Sóisialta san aois dhigiteach a bheith ar siúl cheana féin i dtrioblóid le riosca eolais, i bpáirt toisc nach raibh siad a thuiscint go hiomlán conas a chainníochtú agus a bhainistiú. Mar sin, tá mé ag dul a thairiscint ar bhealach cuiditheach chun smaoineamh ar riosca eolais, agus ansin mé ag dul a thabhairt duit roinnt comhairle maidir le conas an riosca eolais i do chuid taighde a bhainistiú agus sonraí a scaoileadh do thaighdeoirí eile.
Is bealach amháin gur laghdú taighdeoirí sóisialta riosca eolais "anonymization" sonraí. Is "anonymization" an próiseas a bhaint aitheantóirí pearsanta soiléir ar nós ainm, seoladh, agus uimhir theileafóin ó na sonraí. Mar sin féin, tá an cur chuige i bhfad níos lú éifeachtaí ná a bhaint amach go leor daoine, agus tá sé, i ndáiríre, go domhain agus go bunúsach teoranta. Ar an ábhar sin, aon uair cur síos mé "anonymization," beidh mé úsáid comharthaí athfhriotail a chur i gcuimhne duit go gcruthaíonn an próiseas seo an chuma ar anaithnideacht ach ní anaithnideacht fíor.
Is sampla beoga ar an teip ar "anonymization" a thagann ó 1990í déanacha i Massachusetts (Sweeney 2002) . Ba é an Coimisiún Insurance Group (GIC) gníomhaireacht rialtais atá freagrach as a cheannach árachais sláinte do gach fostaí stáit. Tríd an obair seo, a bailíodh ar an GIC taifid sláinte mionsonraithe mar gheall mílte na bhfostaithe stáit. In iarracht taighde faoi bhealaí chun sláinte a fheabhsú a spor, chinn GIC leis na taifid a scaoileadh do thaighdeoirí. Mar sin féin, ní raibh siad a roinnt go léir a gcuid sonraí; in áit, siad "anonymized" dó le faisnéis a bhaint den sórt sin mar ainm agus do sheoladh. Mar sin féin, d'fhág siad faisnéis eile a bhain lena bheith úsáideach do thaighdeoirí ar nós eolas déimeagrafach (cód zip, dáta breithe, eitneachas, agus gnéas) agus eolas leighis (sonraí cuairte, diagnóis, nós imeachta) (Figiúr 6.4) (Ohm 2010) . Ar an drochuair, ní raibh sé seo "anonymization" leordhóthanach chun na sonraí a chosaint.
Chun léiriú ar na lochtanna an GIC "anonymization", Latanya Sweeney-ansin mac léinn iarchéime ag MIT-íoctha $ 20 ar na taifid vótála a fháil ó chathair na Cambridge, an bhaile dúchais Massachusetts rialtóir William Weld. Na taifid seo vótála bhí faisnéis den sórt sin mar ainm, seoladh, cód zip, dáta breithe, agus inscne. Ós rud é go bhfuil an comhad leighis sonraí agus an cód réimsí-zip comhad vótálaithe roinnte, dáta breithe, agus gnéas-Chiallaigh sé sin go bhféadfadh Sweeney iad a nascadh. Sweeney fhios go raibh lá breithe Weld ar 31 Iúil, 1945, agus na taifid vótála san áireamh ach amháin seisear i Cambridge leis sin lá breithe. Thairis sin, de na seisear, ach trí a bhí fir. Agus, de na triúr fear, ach amháin roinnte cód zip Weld ar. Dá bhrí sin, léirigh na sonraí vótála go raibh duine ar bith sna sonraí leighis le meascán Weld de dháta breithe, inscne, agus cód zip William Weld. Go bunúsach, ar choinníoll na trí phíosa eolais a méarloirg uathúil dó sna sonraí. Ag baint úsáide as an méid sin, bhí Sweeney ábalta taifid sláinte Weld, agus a chur in iúl dó ar a feat, phost sí dó cóip dá thaifid (Ohm 2010) .
Léiríonn obair Sweeney s an struchtúr bunúsach na n-ionsaithe de-anonymization -chun téarma ón bpobal slándála ríomhaire a ghlacadh. Sna hionsaithe, dhá thacar sonraí, ceachtar acu féin nochtann faisnéis íogair, nasctha, agus tríd an nasc, tá faisnéis íogair nochta. I roinnt bealaí tá an próiseas cosúil leis an mbealach a bácála Soda agus fínéagar, dhá shubstaint atá féin sábháilte is féidir, a chur le chéile chun toradh olc.
Mar fhreagra ar an obair Sweeney, agus obair dá shórt, taighdeoirí anois go ginearálta a bhaint i bhfad níos mó eolais a fháil-go léir mar sin ar a dtugtar "Eolas Pearsanta aithint" (PII) (Narayanan and Shmatikov 2010) -during an bpróiseas "anonymization." Thairis sin, go leor taighdeoirí anois a thuiscint go mar áirithe sonraí den sórt taifid leighis, taifid airgeadais, freagraí ar cheisteanna faoi mídhleathacha suirbhé iompar is-dócha ró-íogair a scaoileadh fiú tar éis "anonymization." mar sin féin, samplaí níos déanaí go mbainfidh mé cur síos anseo thíos le fios gur gá taighdeoirí sóisialta a athrú a gcuid smaointe. Mar chéim thosaigh, tá sé ciallmhar a glacadh leis go bhfuil na sonraí go léir a d'fhéadfadh inaitheanta agus na sonraí go léir fhéadfadh a bheith íogair. I bhfocail eile, seachas ag smaoineamh ar riosca eolais bhaineann le fo-thacar beag de thionscadail, ba chóir linn glacadh leis go bhfuil feidhm le sé roinnt céim-le gach tionscadal.
An dá ghné den ath-treoshuíomh atá léirithe ag an Duais Netflix. Mar a chuirtear síos i gCaibidil 5, scaoileadh Netflix 100 milliún rátálacha scannán sholáthraíonn beagnach 500,000 ball, agus go raibh glao oscailte nuair chuir daoine ó gach cearn den domhan halgartaim a d'fhéadfadh feabhas ar chumas Netflix chun scannáin a mholadh. Roimh scaoileadh na sonraí, a bhaint Netflix aon fhaisnéis ar ndóigh pearsanta-a aithint, cosúil le hainmneacha. Chuaigh Netflix freisin chéim breise agus tugadh isteach corraíl beag i gcuid de na taifid (m.sh., athrú ar roinnt rátálacha ó 4 réaltaí go 3 réaltaí). Netflix amach go luath, áfach, in ainneoin a n-iarrachtaí, bhí na sonraí ar chor ar bith gan ainm.
Just a dhá sheachtain tar éis na sonraí a Scaoileadh Narayanan and Shmatikov (2008) léirigh go raibh sé indéanta chun foghlaim faoi roghanna scannáin daoine ar leith ar. Ba é an trick a n-ionsaí ath-aithint cosúil leis Sweeney s: chumasadh le chéile dhá fhoinse eolais, ar a bhfuil faisnéis fhéadfadh a bheith íogair agus aon fhaisnéis ar ndóigh aithint agus ceann ina bhfuil an céannacht na ndaoine. Is féidir le gach ceann de na foinsí sonraí ina n-aonar sábháilte, ach nuair a bhfuil siad le chéile is féidir leis an tacar sonraí cumaiscthe chruthú riosca eolais. I gcás na sonraí Netflix, a anseo conas a d'fhéadfadh sé tarlú. Samhlaigh go roghnaíonn mé a roinnt mo smaointe faoi gníomhaíochta agus scannáin grinn le mo comh-oibrithe, ach is fearr liom gan a roinnt mo thuairim maidir le scannáin creidimh agus polaitiúla. D'fhéadfadh Mo comh-oibrithe an t-eolas go bhfuil mé roinnt leo chun teacht ar mo thaifid sna sonraí Netflix a úsáid; D'fhéadfadh an t-eolas a roinnt mé a bheith ina méarloirg ar leith díreach cosúil dáta William Weld rugadh, cód zip, agus gnéas. Ansin, má fhaigheann siad ar mo méarloirg uathúil sna sonraí, d'fhéadfadh siad a fhoghlaim mo rátálacha faoi scannáin, lena n-áirítear scannáin nuair nach roghnaigh mé a roinnt. Chomh maith le chineál seo ionsaí spriocdhírithe atá dírithe ar dhuine singil, Narayanan and Shmatikov (2008) léirigh freisin go raibh sé indéanta a dhéanamh ar -Amháin ionsaí leathan a bhaineann le go leor daoine-trí chumasc na sonraí Netflix sonraí rátála pearsanta agus scannáin go bhfuil roinnt daoine a roghnaigh a phost ar an Internet Movie Database (IMDb). Aon eolas atá méarloirg uathúil ar leith duine ar mheá a leagan scannán rátálacha-is féidir a úsáid chun iad a aithint.
Cé gur féidir na sonraí a Netflix a ath-aithint i gceachtar ionsaí spriocdhírithe nó leathan, d'fhéadfadh sé le feiceáil fós a bheith riosca íseal. Tar éis an tsaoil, ní dhéanann rátálacha scannán is cosúil an-íogair. Cé a d'fhéadfadh a bheith fíor i gcoitinne, i gcás roinnt de na 500,000 duine sa tacar sonraí, d'fhéadfadh rátálacha scannán íogair go leor. Go deimhin, mar fhreagra ar an dí-anonymization chuaigh bean leispiach closeted agra rang-gníomh i gcoinne Netflix. Seo an chaoi a bhí an fhadhb in iúl ina lawsuit (Singel 2009) :
"Tá faisnéis de chineál níos mó go mór pearsanta agus íogair [sic] [M] ovie agus rátála sonraí. Exposes sonraí scannán an chomhalta leas pearsanta bhall Netflix agus / nó struggles le saincheisteanna an-phearsanta éagsúla, lena n-áirítear gnéasacht, tinneas meabhrach, a ghnóthú ó alcólacht, agus íospairt ó ciorrú coil, mí-úsáid fhisiciúil, foréigean teaghlaigh, adhaltranas, agus éigniú. "
Léiríonn an dí-anonymization na sonraí Duais Netflix araon go bhfuil na sonraí go léir a d'fhéadfadh inaitheanta agus go bhfuil na sonraí go léir fhéadfadh a bheith íogair. Ag an bpointe seo, d'fhéadfá smaoineamh go bhaineann sé seo ach le sonraí go go airbheartaíonn faoi dhaoine. Ionadh, nach bhfuil an cás. Mar fhreagra ar iarratas Saoráil Dlí Faisnéise, d'eisigh an Nua-Eabhrac Cathrach Rialtais taifid de gach turas tacsaí i Nua-Eabhrac i 2013, lena n-áirítear an pickup agus titim amach amanna, ionaid, agus méideanna táille (aisghlaoch ó Chaibidil 2 go Farber (2015) úsáidtear na sonraí seo a thástáil teoiricí tábhachtacha san eacnamaíocht saothair). Cé go bhféadfadh na sonraí seo maidir le turais tacsaí cosúil go neamhurchóideach toisc nach bhfuil sé cosúil le bheith eolas faoi dhaoine, thuig Anthony Tockar gur chuimsigh an tacar sonraí tacsaí i ndáiríre go leor eolais ad'fhéadfadh a bheith íogair faoi dhaoine. Chun a léiriú, d'fhéach sé ar gach turas ag tosú ag The Hustler Club-club stiall mhór i Nua-Eabhrac-idir meán oíche agus 06:00 agus ansin fuair a gcuid suíomhanna fágála. Seo cuardaigh Léirigh-bunúsach-liosta seoltaí na roinnt daoine a ngnáthaíonn Club Hustler (Tockar 2014) . Tá sé deacair a shamhlú go raibh an rialtas cathrach seo san áireamh nuair a scaoileadh sé na sonraí seo. Go deimhin, d'fhéadfadh an teicníc chéanna a úsáid chun teacht ar an seoltaí baile na ndaoine a thugann cuairt ar aon áit sa chathair-clinic leighis, foirgneamh rialtais, nó foras creidimh.
Tá na dhá chás-Duais Netflix agus an tacsaí Nua-Eabhrac Sonraí thaispeáint gur theip daoine réasúnta oilte a mheas i gceart ar an riosca eolais sna sonraí a scaoileadh leo, agus na cásanna ar chor ar bith ar leith (Barbaro and Zeller Jr 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . Thairis sin, i gcuid mhaith de na cásanna, tá na sonraí fadhbanna fós ar fáil gan bhac líne, rud a léiríonn an deacracht a bhaineann riamh chealú scaoileadh sonraí. Le chéile na samplaí-chomh maith le taighde san eolaíocht ríomhaireachta faoi phríobháideacht-cúis le conclúid tábhachtach. Ba cheart do thaighdeoirí glacadh leis go bhfuil na sonraí go léir a d'fhéadfadh inaitheanta agus na sonraí go léir fhéadfadh a bheith íogair.
Ar an drochuair, níl aon réiteach simplí ar an bhfíric go bhfuil na sonraí go léir a d'fhéadfadh inaitheanta agus na sonraí go léir fhéadfadh a bheith íogair. Mar sin féin, tá bealach amháin chun an riosca eolais laghdú cé go bhfuil tú ag obair le sonraí a chruthú agus a leanúint ar phlean um chosaint sonraí. Beidh an plean seo laghdaíonn an seans go mbeidh do shonraí sceite agus beidh laghdú ar an dochar a dhéanamh má bhealach tharlaíonn sceitheadh. Beidh na saintréithe atá pleananna cosanta sonraí, ar nós a bhfuil foirm de criptithe a úsáid, athrú le himeacht ama, ach na Seirbhísí Sonraí na Ríochta Aontaithe Eagraíonn cabhrach na gnéithe de phlean cosanta sonraí i 5 chatagóir a thugann siad ar an 5 safes: tionscadail sábháilte, daoine sábháilte , suímh slán, sonraí sábháilte, agus aschuir sábháilte (Tábla 6.2) (Desai, Ritchie, and Welpton 2016) . Níl aon cheann de na cúig safes sholáthar ina n-aonar cosaint foirfe. Ach, le chéile mar siad sraith cumhachtach na fachtóirí is féidir a laghdú an riosca eolais.
sábháilte | gníomh |
---|---|
tionscadail sábháilte | teorainneacha tionscadail le sonraí dóibhsean atá eiticiúil |
daoine sábháilte | Tá rochtain teoranta do daoine ar féidir leo a bheith iontaofa le sonraí (oiliúint eiticiúil m.sh., tá daoine ndearnadh) |
shonraí sábháilte | Tá na sonraí dí-aitheanta agus chomhbhailiú a mhéid is féidir |
socruithe sábháilte | Tá sonraí atá stóráilte i ríomhairí faoi mhíchumais fhisiceacha iomchuí (eg, seomra faoi ghlas) agus bogearraí (eg, cosaint phasfhocal, criptithe) cosaintí |
aschur sábháilte | Déantar athbhreithniú aschur taighde a chosc trí thimpiste sáruithe príobháideachta |
Chomh maith le do shonraí a chosaint cé go bhfuil tú ag baint úsáide as é, tá céim amháin sa phróiseas taighde nuair atá riosca eolais ar leith salient sonraí a roinnt le taighdeoirí eile. Is sonraí a roinnt i measc eolaithe croíluach den iarracht eolaíochta, agus áiseanna sé go mór chun cinn an eolais. Seo an chaoi dTeach na Ríochta Aontaithe na dTeachtaí cur síos ar an tábhacht a bhaineann le sonraí a roinnt:
"Tá rochtain ar shonraí bunúsacha má tá taighdeoirí a atáirgeadh, a fhíorú agus a thógáil ar thorthaí a tuairiscíodh sa litríocht. Ní mór don toimhde a bheith go, ach amháin má tá cúis láidir a mhalairt, ba cheart na sonraí a nochtadh go hiomlán agus ar fáil go poiblí. Ag teacht leis an bprionsabal sin, i gcás ina chóir agus is féidir, sonraí a bhaineann le gach taighde a mhaoinítear go poiblí a chur ar go forleathan agus fáil saor in aisce. " (Molloy 2011)
Ach, trí roinnt do shonraí le taighdeoir eile, is féidir leat a bheith ag méadú an riosca eolais do rannpháirtithe. Dá bhrí sin, d'fhéadfadh sé cosúil go bhfuil lucht taighde ar mian leo a gcuid sonraí nó is gá chun a gcuid sonraí ag tabhairt aghaidh ar teannas bunúsach. Ar thaobh amháin tá siad oibleagáid eiticiúil a gcuid sonraí le heolaithe eile, go háirithe má tá an taighde bunaidh a mhaoinítear go poiblí. Ach, ag an am céanna, tá taighdeoirí oibleagáid eiticiúil a íoslaghdú, oiread agus is féidir, ar an riosca eolais a rannpháirtithe.
Fortunately, nach bhfuil sé seo aincheist chomh dian mar atá sé. Tá sé tábhachtach chun smaoineamh ar roinnt sonraí ann mar sin ó sonraí a roinnt a scaoileadh agus dearmad, áit a bhfuil na sonraí "anonymized" agus sa phost do dhuine ar bith rochtain a fháil (Figiúr 6.6). Tá an dá de na poist mhór rioscaí agus na tairbhí. Is é sin, nach bhfuil sé go huathoibríoch ar an rud is eiticiúil chun Ní do shonraí; Eliminates leithéid de chur chuige tairbhí féideartha go leor don tsochaí. Ag filleadh ar Blas, Carbhait, agus Time, sampla a pléadh níos luaithe sa chaibidil, argóintí i gcoinne scaoileadh sonraí a díriú ach ar díobhálacha is féidir agus go neamhaird buntáistí féideartha ró aon-Thaobh; Feicfidh mé cur síos a dhéanamh ar na fadhbanna leis an gcur chuige aon-Thaobh, ró cosanta níos mionsonraithe in thíos nuair is mian liom comhairle maidir le cinntí a dhéanamh i bhfianaise na neamhchinnteachta (Alt 6.6.4).
Thairis sin, i idir an dá gcásanna tromchúiseacha is cad beidh mé a dtugtar cur chuige gharraí daingean ina bhfuil sonraí roinnte le daoine a chomhlíonann critéir áirithe agus a thoilíonn a bheith faoi cheangal ag rialacha áirithe (eg, maoirseacht ó IBR agus pleananna cosanta sonraí) . Tugann an cur chuige gairdín daingean go leor de na buntáistí a bhaineann le scaoileadh agus déan dearmad le riosca níos lú. Ar ndóigh, cruthaíonn cur chuige gharraí daingean go leor ceisteanna-daoine ar cheart go mbeadh rochtain, cad iad na coinníollacha, cá fhad, ba chóir a íocann a choimeád ar bun agus a póilíní an gairdín daingean srl-ach nach bhfuil na dosháraithe. Go deimhin, tá go ag obair cheana féin garraithe daingne i bhfeidhm gur féidir le taighdeoirí a úsáid ceart anois, mar shampla an chartlann sonraí an Cuibhreannas Idir-ollscoile do Polaitiúil agus Sóisialta Taighde in Ollscoil Michigan.
Mar sin, áit ar cheart na sonraí ó do staidéar ar an leanúntas gan roinnt, garraí daingean, agus scaoileadh agus dearmad? ag brath ar na sonraí de do shonraí; Ní mór do lucht taighde cothromaíocht Meas Daoine, beneficence, Dlí agus Cirt, agus Meas ar an Dlí agus le Leas an Phobail. Nuair gcothromaíocht chuí maidir le cinntí eile a mheasúnú lorg taighdeoirí comhairle agus ceadú IRBs, agus is féidir scaoileadh sonraí díreach i gcuid eile den phróiseas sin. I bhfocail eile, cé go síleann daoine áirithe de scaoileadh sonraí mar morass eiticiúil hopeless, ní mór dúinn cheana córais i bhfeidhm chun cabhrú le taighdeoirí a chothromú na chineál aincheisteanna eiticiúla.
Is é ceann bhealach deiridh chun smaoineamh ar roinnt sonraí de réir analaí. Tá Gach gluaisteáin bhliain atá freagrach as na mílte bás, ach ní féidir linn iarracht tiomáint a thoirmeasc. Go deimhin, bheadh a leithéid glao tiomána a thoirmeasc a absurd mar go bhfuiltear ábalta tiomáint a lán rudaí iontach. Ina ionad sin, cuireann an tsochaí srianta ar féidir leo tiomáint (m.sh., ní mór a bheith ina aois áirithe, ní mór a bhfuil pas faighte tástálacha áirithe) agus conas is féidir leo tiomáint (mar shampla, faoi luasteorainn). Tá Cumann freisin do dhaoine de chúram na rialacha sin (m.sh., póilíní) a fhorfheidhmiú, agus ár gcuid pionós daoine atá gafa a shárú leo. Is féidir an cineál céanna smaointeoireachta cothrom go bhfuil feidhm ag an tsochaí le tiomáint rialáil a chur i bhfeidhm le comhroinnt sonraí. Is é sin, in ionad a dhéanamh argóintí absolutist do nó i gcoinne comhroinnt sonraí, sílim go mbeidh na buntáistí is mó a thagann as figuring amach conas is féidir linn a roinnt níos sonraí níos sábháilte.
Mar fhocal scoir, tá baol eolais méadú mór tagtha, agus tá sé an-deacair a thuar agus a chainníochtú. Dá bhrí sin, is fearr a glacadh leis go bhfuil na sonraí go léir a d'fhéadfadh inaitheanta agus d'fhéadfadh a íogair. Chun laghdú riosca eolais ag déanamh taighde, féidir le taighdeoirí a chruthú agus a leanúint ar phlean um chosaint sonraí. Thairis sin, ní théann an riosca eolais cosc taighdeoirí ó shonraí a roinnt le heolaithe eile.