Is e cunnart fiosrachaidh an cunnart as cumanta ann an rannsachadh sòisealta; tha e air àrdachadh gu mòr; agus is e an cunnart as duilghe a thuigsinn.
Is e an dàrna dùbhlan beusach airson rannsachadh aois-digiteach cunnart fiosrachaidh , an comas airson cron bho sgaoileadh fiosrachaidh (National Research Council 2014) . Dh'fhaodadh fios a bhith a 'cronachadh fiosrachadh pearsanta fhoillseachadh eaconamach (me, a' call obair), sòisealta (me, nàire), saidhgeòlas (me, trom-inntinn), no eadhon eucoireach (me, a bhith a 'cur an grèim airson giùlan mì-laghail). Gu mì-fhortanach, tha an aois dhidseatach a 'meudachadh cunnart fiosrachaidh gu mòr - chan eil ach barrachd fiosrachaidh air ar giùlan. Agus tha cunnart fiosrachaidh air a bhith gu math duilich a thuigsinn agus a riaghladh an coimeas ri cunnartan a bha an-sàs ann an rannsachadh sòisealta co-ionnan, leithid cunnart corporra.
Aon dòigh a tha luchd-rannsachaidh sòisealta a lughdachadh fiosrachaidh cunnairt a tha "anonymization" dàta. "Anonymization" 'S e pròiseas a thoirt air falbh follaiseach pearsanta aithnichearan leithid ainm, seòladh, àireamh fòn agus bho an dàta. Ach, dòigh-obrach seo a tha mòran nas soirbheachail mòran dhaoine a thoirt gu buil, agus tha e, gu dearbh, gu domhainn agus gu bunaiteach cuingealaichte. Airson an adhbhar sin, nuair a tha mi a 'mìneachadh "anonymization," Tha mi a' cleachdadh cromagan turrach gus cur an cuimhne dhuibh gu bheil am pròiseas seo a 'cruthachadh coltas dìomhaireachd ach chan eil fìor dìomhaireachd.
Tha eisimpleir beothail air fàilligeadh "gun ainm" a 'tighinn bho dheireadh nan 1990an ann am Massachusetts (Sweeney 2002) . B 'e buidheann riaghaltais a bh' ann an Coimisean Àrachais a 'Bhuidhinn (NHS) a bha an urra ri bhith a' ceannach àrachas slàinte do luchd-obrach na stàite. Tron obair seo, chruinnich an NHS clàran slàinte mionaideach mu mhìltean de luchd-obrach stàite. Ann an oidhirp gus rannsachadh a bhrosnachadh, chuir an t-Ionad-gnìomha suas na clàran sin a leigeil ma sgaoil do luchd-rannsachaidh. Ach, cha robh iad a 'roinn a h-uile dàta aca; an àite, tha iad "gun urra" an dàta seo le bhith a 'toirt air falbh fiosrachadh mar ainmean agus seòlaidhean. Ach, dh'fhàg iad fiosrachadh eile a bha iad a 'smaoineachadh a dh'fhaodadh a bhith feumail do luchd-rannsachaidh leithid fiosrachadh deamografach (còd zip, ceann-latha breith, cinneadh agus gnè) agus fiosrachadh meidigeach (fiosrachadh tadhail, breithneachadh, modh-obrach) (figear 6.4) (Ohm 2010) . Gu mì-fhortanach, cha robh an "neo-ainm" seo gu leòr airson an dàta a dhìon.
Gus sealltainn air na duilgheadasan aig an NHS "neo-ainmichte", Latanya Sweeney-an uair sin phàigh oileanach ceumnachaidh aig MIT $ 20 airson na clàran bhòtaidh fhaighinn bho bhaile Cambridge, baile mòr riaghladair Massachusetts Uilleam Weld. Bha na clàran bhòtaidh sin a 'gabhail a-steach fiosrachadh mar ainm, seòladh, còd zip, ceann-latha breith agus gnè. Bha an fhìrinn gun robh am faidhle dàta meidigeach agus am faidhle bhòtaidh a 'roinn raointean-còd-zip, ceann-latha breith, agus gnè - a' ciallachadh gum faodadh Sweeney ceangal a dhèanamh riutha. Bha fios aig Sweeney gur e co-là-breith Weld an 31mh Iuchair 1945, agus na clàran bhòtaidh cha robh ach sianar ann an Cambridge leis a 'cheann-là breith sin. A bharrachd air na sia daoine sin, cha robh ach triùir dhiubh fireann. Agus, de na triùir sin, chan eil ann ach aon chòd-phuist aig Weld. Mar sin, sheall an dàta bhòtaidh gur e Uilleam Weld duine sam bith anns an dàta meidigeach le measgachadh de dh 'aois breith, gnè, agus còd-puist Weld. Gu dearbh, thug na trì pìosan fiosrachaidh seo meur sònraichte dha anns an dàta. A 'cleachdadh na fìrinn seo, b' urrainn dha Sweeney clàran meidigeach Weld a lorg, agus, gus innse dha mu a h-obair, chuir i lethbhreac dheth de na clàran aige (Ohm 2010) .
Tha obair Sweeney a 'sealltainn structar bunaiteach ionnsaighean ath-aithneachadh - gus gabhail ri teirm bho choimhearsnachd tèarainteachd coimpiutair. Anns na h-ionnsaighean sin, tha dà sheata dàta, agus chan eil a-mhàin a 'nochdadh fiosrachadh cugallach, air an ceangal, agus tron cheangal seo, tha fiosrachadh mothachail fosgailte.
Mar fhreagairt do obair Sweeney, agus obair a tha co-cheangailte ris, tha luchd-rannsachaidh a-nis a 'toirt mòran fiosrachaidh a-mach às a h-uile rud ris an canar "fiosrachadh a tha a' comharrachadh pearsanta" (PII) (Narayanan and Shmatikov 2010) - a thaobh a 'phròiseas "neo-aithnichte." A bharrachd, tha mòran luchd-rannsachaidh a-nis a 'tuigsinn gu bheil cuid de dhàta-leithid clàran meidigeach, clàran ionmhasail, freagairtean do cheistean suirbhidh mu ghiùlan mì-laghail - dualtach a bhith ro chudromach airson a bhith air an leigeil ma sgaoil eadhon às dèidh "gun ainm." Ach, tha na h-eisimpleirean a tha mi a' dol a thoirt seachad a 'toirt a-mach gu bheil feum aig luchd-rannsachaidh sòisealta gus am beachdan a atharrachadh. Mar a 'chiad cheum, tha e glic a bhith den bheachd gum faodadh a h-uile dàta a bhith aithnichte agus gu bheil gach dàta comasach air a bhith mothachail. Ann am faclan eile, an àite a bhith a 'smaoineachadh gu bheil cunnart fiosrachaidh a' buntainn ri fo-bheag bheag de phròiseactan, bu chòir dhuinn a bhith den bheachd gu bheil e a 'buntainn - gu ìre gu ìre - gu gach pròiseact.
Tha an dà thaobh den ath-thaisbeanadh seo air an sealltainn le Duais Netflix. Mar a chaidh a mhìneachadh ann an caibideil 5, chuir Netflix 100 millean rangachadh film air an solarachadh le faisg air 500,000 ball, agus bha gairm fosgailte aca far an robh daoine bho air feadh an t-saoghail a 'cur a-steach iomraidhean a chuireadh comas Netflix air filmichean a mholadh. Mus sgaoileadh an dàta, thug Netflix fiosrachadh sam bith follaiseach pearsanta a chomharrachadh, mar ainmean. Chaidh iad cuideachd ceum a bharrachd agus thug iad beagan dragh air cuid de na clàran (me, ag atharrachadh cuid de dh 'ìrean bho 4 rionnagan gu 3 rionnagan). Ach cha d 'fhuair iad a-mach, ge-tà, a dh'aindeoin an oidhirpean, cha robh an dàta fhathast gun urra.
Dìreach dà sheachdain an dèidh don dàta a bhith air a leigeil a-mach, sheall Arvind Narayanan agus Vitaly Shmatikov (2008) gun robh e comasach ionnsachadh mu roghainnean film dhaoine sònraichte. Bha an cleas don ionnsaigh ath-aithneachadh aca coltach ri Sweeney: dà thobar fiosrachaidh còmhla, aon le fiosrachadh a dh'fhaodadh a bhith fallain agus nach eil gu follaiseach a 'comharrachadh fiosrachadh agus aon a tha a' toirt a-steach fèin-aithne dhaoine. Faodaidh gach aon de na stòran dàta sin a bhith sàbhailte gu faiceallach, ach nuair a thèid an cur còmhla, faodaidh an dàta còmhla a bhith a 'cruthachadh cunnart fiosrachaidh. Ann an cùis dàta Netflix, seo mar a dh'fhaodadh e tachairt. Smaoinich gu bheil mi a 'taghadh mo smuaintean mu dheidhinn gnìomhan agus filmichean comadaidh le mo cho-obraichean, ach is fheàrr leam gun a bhith a' roinn mo bheachdan mu fhilmichean creideimh agus poilitigeach. Dh'fhaodadh na co-obraichean agam am fiosrachadh a tha mi air a roinn leotha a chleachdadh gus mo chlàran fhaighinn ann an dàta Netflix; Dh'fhaodadh am fiosrachadh a tha mi a 'roinn a bhith na lorgan meur sònraichte, coltach ri latha breith Uilleim Weld, còd-puist agus gnè. An uairsin, nan lorg iad am meur sònraichte aca anns an dàta, dh 'ionnsaich iad mo rangachadh mu na filmichean gu lèir, nam measg filmichean a thaghas mi gun a bhith a' roinn. A bharrachd air an seòrsa ionnsaigh targaidichte seo a bha ag amas air aon neach, nochd Narayanan agus Shmatikov gun robh e comasach ionnsaigh fharsaing a dhèanamh - a 'gabhail a-steach mòran dhaoine - le bhith a' ceangal dàta Netflix le dàta pearsanta agus rangachadh film a tha cuid de dhaoine air taghadh airson a phostadh air an Stòr-dàta Movie Internet (IMDb). Gu sìmplidh, faodar fiosrachadh sam bith a tha na lorgan meòir sònraichte do neach sònraichte-eadhon an seata de rangachadh film-a chleachdadh gus an comharrachadh.
Ged a dh 'urrainnear dàta Netflix ath-aithneachadh ann an ionnsaigh tarraingeach no farsaing, dh'fhaodadh gum bi e fhathast cunnartach. As deidh na h-uile, chan eil rangachadh film a 'coimhead gu math mothachail. Ged a dh'fhaodadh sin a bhith fìor san fharsaingeachd, airson cuid de na 500,000 neach anns an t-siostam-dàta, dh'fhaodadh rangachadh film a bhith gu math mothachail. Gu dearbh, mar fhreagairt air an ath-aithneachadh, chaidh boireannach leasbach le càirdeas a-steach gu tag-gnìomh clas an aghaidh Netflix. Seo mar a chaidh an duilgheadas a nochdadh anns an lagh-lagha (Singel 2009) :
"Tha [[M] ovie agus a 'toirt seachad fiosrachadh air fiosrachadh mu ... fìor phearsanta agus mothachail. Tha dàta film a 'bhall a' nochdadh ùidh phearsanta agus / no strì pearsanta neach Netflix le diofar chùisean pearsanta, a 'gabhail a-steach gnèitheachd, tinneasan inntinn, ath-bheothachadh bho deoch-làidir, agus fulang bho chladhach, droch dhìol corporra, fòirneart dachaigheil, adhaltranas agus èigneachadh. "
Tha ath-aithneachadh dàta Duais Netflix a 'sealltainn an dà chuid gu bheil an dàta gu lèir comasach air aithneachadh agus gum faodadh a h-uile dàta a bhith mothachail. Aig an ìre seo, is dòcha gum bi thu a 'smaoineachadh nach eil seo ach a' buntainn ri dàta a tha a 'meas a bhith mu dhaoine. Gu iongantach, chan e sin a tha. Mar fhreagairt do dh'iarrtas Lagh Saorsa Fiosrachaidh, leig Riaghaltas Baile New York clàran de gach turas tagsaidh ann an New York ann an 2013, a 'gabhail a-steach na h-amannan taghaidh, tuiteam a-mach, àiteachan agus sòlaidean (tha cuimhne aig caibideil 2 gu bheil Farber (2015) cleachdadh dàta coltach ri chèile gus deuchainnean cudromach a dhearbhadh ann an eaconamas obrach). Dh'fhaodadh an dàta seo mu thurasan tacsaidh a bhith mì-chinnteach oir chan eil coltas gu bheil iad a 'toirt seachad fiosrachadh mu dhaoine, ach thuig Anthony Tockar gu robh tòrr fiosrachaidh a dh'fhaodadh a bhith a' faireachdainn mu dhaoine mu dheidhinn an tacsa tacsaidh seo. Gus dealbh a dhèanamh, sheall e air na turasan a bha a 'tòiseachadh aig Hustler Club - club stiall mòr ann an New York-eadar meadhan oidhche agus 6m agus an uairsin lorg iad na h-àiteachan a bha a' tuiteam orra. Sheall an rannsachadh seo - gu h-àraid - liosta de sheòlaidhean cuid de dhaoine a bha a 'siubhal air Hustler Club (Tockar 2014) . Tha e duilich a bhith a 'creidsinn gu robh riaghaltas a' bhaile air cuimhneachadh nuair a leig e seachad an dàta. Gu dearbh, dh 'fhaodadh an aon dhòigh-obrach seo a chleachdadh gus seòlaidhean dachaigh dhaoine a tha a' tadhal air àite sam bith sa bhaile -clinig leigheis, togalach riaghaltais, no ionad creideimh.
Tha an dà chùis seo de Duais Netflix agus dàta tagsaidh City New York a 'sealltainn nach urrainn do dhaoine a tha gu math sgileil tuairmse a dhèanamh ceart air an cunnart fiosrachaidh anns an dàta a tha iad a' leigeil a-mach-agus chan eil na cùisean sin air leth sònraichte (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . A bharrachd, ann am mòran de na cùisean sin, tha an dàta duilich fhathast ri fhaotainn air-loidhne, a 'sealltainn an duilgheadais a tha a-riamh a' cur às dha sgaoileadh dàta. Còmhla, tha na h-eisimpleirean seo - a thuilleadh air rannsachadh ann an saidheans coimpiutair mu phrìobhaideachd - a 'leantainn gu co-dhùnadh cudromach. Bu chòir do luchd-rannsachaidh a bhith den bheachd gum faodadh a h-uile dàta a bhith aithnichte agus gu bheil gach dàta comasach air a bhith mothachail.
Gu mì-fhortanach, chan eil fuasgladh sìmplidh ann don fhìrinn gu bheil an dàta gu lèir comasach air aithneachadh agus gum faodadh a h-uile dàta a bhith mothachail. Ach, aon dòigh gus cunnart fiosrachaidh a lùghdachadh fhad 'sa tha thu ag obair le dàta gus plana dìon dàta a chruthachadh agus a leantainn. Leigidh am plana seo an cothrom gum bi an dàta agad a 'falbh agus lùghdaichidh e an cron ma bhios rudeigin a' tachairt ann an dòigh sam bith. Nì na h-àiteachan sònraichte de phlanaichean dìon dàta, mar an seòrsa crioptachadh ri chleachdadh, thar ùine, ach tha Seirbheisean Dàta na Rìoghachd Aonaichte gu cuideachail a 'cur air dòigh eileamaidean plana dìon dàta ann an còig roinnean ris an canar iad còig saorsaidhean : pròiseactan sàbhailte, daoine sàbhailte , suidheachaidhean sàbhailte, dàta sàbhailte, agus toraidhean sàbhailte (clàr 6.2) (Desai, Ritchie, and Welpton 2016) . Chan eil gin de na còig tèaraintean fa leth a 'toirt dìon foirfe. Ach còmhla, tha iad a 'cruthachadh seata cumhachdach de nithean a dh'fhaodas cunnart fiosrachaidh a lùghdachadh.
Sàbhailte | Gnìomh |
---|---|
Pròiseactan sàbhailte | A 'cuingealachadh phròiseactan le dàta don fheadhainn a tha modhail |
Daoine sàbhailte | Tha ruigsinneachd air a chuingealachadh ri daoine air am faod earbsa a bhith ann le dàta (me, daoine a tha air trèanadh beusanta a dhèanamh) |
Dàta sàbhailte | Tha dàta air an comharrachadh agus air an lìonadh chun na h-ìre as urrainn |
Suidhichidhean sàbhailte | Tha dàta air an stòradh ann an coimpiutairean le corporra iomchaidh (me, seòmar glaiste) agus bathar-bog (me dìon dìon facal-faire, dìon) |
Toradh sàbhailte | Tha toraidhean rannsachaidh air an luachadh gus casg a chur air briseadh prìobhaideachd tubaisteach |
A bharrachd air a bhith a 'dìon do dhàta fhad' s a tha thu gan cleachdadh, tha aon cheum anns a 'phròiseas rannsachaidh far a bheil cunnart fiosrachaidh gu h-àraid iomchaidh a' co-roinn dàta le luchd-rannsachaidh eile. Tha co-roinn dàta am measg luchd-saidheans na luach bunaiteach den oidhirp saidheansail, agus tha e gu mòr a 'cuideachadh adhartachadh eòlas. Seo mar a mhìnich Taigh nan Cumantan na RA cho cudromach 'sa tha roinneadh dàta (Molloy 2011) :
"Tha cothrom air dàta bunaiteach ma tha luchd-rannsachaidh ri ath-riochdachadh, dearbhadh agus togail air toraidhean a tha air an aithris anns an litreachas. Feumaidh an toimhde sin a bhith, mura h-eil adhbhar làidir a dhìth air dhòigh eile, bu chòir dàta a bhith air fhoillseachadh gu h-iomlan agus air a sgaoileadh gu poblach. "
Ach, le bhith a 'co-roinn an dàta agad le neach-rannsachaidh eile, is dòcha gu bheil thu a' meudachadh cunnart fiosrachaidh do na com-pàirtichean agad. Mar sin, tha e coltach gu bheil co-roinn dàta a 'cruthachadh teannachadh bunaiteach eadar an dleastanas airson dàta a roinn le luchd-saidheans eile agus an dleastanas gus cunnart fiosrachaidh a lùghdachadh do chom-pàirtichean. Gu fortanach, chan eil an duilgheadas seo cho dona mar a tha e coltach. An àite sin, tha e nas fheàrr smaoineachadh air co-roinn dàta mar a tha a 'tuiteam air leantainneachd, le gach puing air an leantainneachd sin a' toirt measgachadh eadar-dhealaichte de bhuannachdan don chomann-shòisealta agus cunnart do chom-pàirtichean (figear 6.6).
Aig aon cheann, faodaidh tu an dàta agad a cho-roinn le neach sam bith, a tha a 'lùghdachadh cunnart do chom-pàirtichean ach cuideachd a' lùghdachadh buannachdan don chomann-shòisealta. Aig an fhìor cheann eile, faodaidh tu leigeil às agus dìochuimhneachadh , far a bheil dàta "gun urra" agus air a phostadh airson a h-uile duine. Ann an coimeas ri gun a bhith a 'leigeil seachad dàta, a' leigeil às agus a 'dìochuimhneachadh tha tairgsean nas àirde don chomann-shòisealta agus cunnart nas àirde do chom-pàirtichean Eadar an dà dhroch chùis seo tha raon de dhroch-fhillte, a 'gabhail a-steach na bhios mi ag iarraidh modh gàrraidh le ballachan . Fo an dòigh-obrach seo, tha dàta air a cho-roinn le daoine a choinnicheas ri slatan-tomhais sònraichte agus a tha ag aontachadh a bhith air an ceangal le riaghailtean àraid (me, sgrùdadh bho IRB agus plana dìon dàta). Tha an dòigh gàrraidh ballaichte a 'solarachadh mòran de na buannachdan a tha an lùib a bhith air an leigeil ma sgaoil agus a dhìochuimhneachadh le nas lugha de chunnart Gu dearbh, tha dòigh-obrach mar sin a 'cruthachadh mòran cheistean - cò bu chòir a bhith a' faighinn cothrom, fo na cumhaichean, agus dè cho fada, cò bu chòir a phàigheadh gus an gàrradh balla a chumail suas agus a phoileis, msaa - ach chan eil iad sin iongantach. Gu dearbh, tha gàrraidhean ballachan ag obair mar-thà a dh'fhaodas luchd-rannsachaidh a chleachdadh an-dràsta, leithid tasglann dàta Co-bhanntachd Eadar-oilthighe airson Rannsachadh Poilitigeach agus Sòisealta aig Oilthigh Michigan.
Mar sin, càite am bu chòir don dàta bhon sgrùdadh agad a bhith air a chumail suas gun a bhith a 'co-roinn, gàrradh le ballachan, agus foillseachadh agus a dhìochuimhneachadh? Tha seo an urra ri fiosrachadh mun dàta agad: feumaidh luchd-rannsachaidh Measachd airson Daoine, Buannachd, Ceartas, agus Urram a chothromachadh airson Lagh agus Ùidh Poblach. Air a faicinn bhon sealladh seo, chan e co-dhruim beusanta sònraichte a th 'ann an co-roinn dàta; chan eil ann ach aon de na diofar thaobhan de rannsachadh anns am feum luchd-rannsachaidh cothromachadh iomchaidh a lorg.
San fharsaingeachd, tha cuid de luchd-breithneachaidh an aghaidh a bhith a 'co-roinn dàta oir tha iad nam bheachd-sa gu bheil iad a' cuimseachadh air a chunnartan - a tha gun teagamh fìor, agus gu bheil iad a 'toirt aire dha na buannachdan. Mar sin, airson fòcas a bhrosnachadh air an dà chunnart agus buannachdan, bu mhath leam a bhith a 'tairgsinn dòigh-smaoineachaidh. Gach bliadhna, tha carbadan an urra ri mìltean de bhàis, ach chan fheum sinn dragh a chuir air dràibheadh. Gu dearbh, bhiodh gairm gus casg a chuir air dràibheadh annasach oir tha draibheadh a 'toirt comas dha mòran rudan iongantach. An àite sin, bidh comann-sòisealta a 'cur bacadh air cò as urrainn dràibheadh (me, an fheum a bhith na aois shònraichte agus gun tèid deuchainnean sònraichte a dhèanamh) agus mar as urrainn dhaibh dràibheadh (me, fon chuingeam luath). Tha daoine aig a 'Chomann cuideachd air na riaghailtean sin a chur an gnìomh (me, poileas), agus bidh sinn a' peanasachadh dhaoine a tha gan glacadh a 'bualadh orra. Faodar an aon seòrsa smaoineachaidh cothromaichte a tha a 'buntainn ris a' chomann-shòisealta a thaobh riaghladh draibhidh a chleachdadh cuideachd airson co-roinn dàta. Is e sin, an àite a bhith a 'dèanamh argamaidean fìor-dhìona airson no an aghaidh co-roinn dàta, tha mi a' smaoineachadh gun dèan sinn an adhartas as fheàrr le bhith a 'cuimseachadh air mar as urrainn dhuinn na cunnartan a lùghdachadh agus na buannachdan bho cho-roinn dàta a mheudachadh.
Gu crìch, tha cunnart fiosrachaidh air a dhol am meud gu mòr, agus tha e gu math duilich a bhith air a mhealladh agus air a tomhas. Mar sin, is fheàrr a bhith den bheachd gu bheil e comasach do gach dàta a bhith aithnichte agus a dh'fhaodadh a bhith mothachail. Gus lùghdachadh cunnart fiosrachaidh fhad 'sa tha thu a' dèanamh rannsachadh, faodaidh luchd-rannsachaidh plana dìon dàta a chruthachadh agus a leantainn. A bharrachd, chan eil cunnart fiosrachaidh a 'bacadh air luchd-rannsachaidh bho bhith a' co-roinn dàta le luchd-saidheans eile.