Ozi ize ndụ bụ ihe kasị nkịtị n'ihe ize ndụ na-elekọta mmadụ research; ya abawanyele n'ike n'ike; na ọ bụ hardest ize ndụ nghọta.
Nke abụọ usoro ziri ezi ihe ịma aka na-elekọta mmadụ afọ digital research bụ informational ize ndụ, na e nwere ike imerụ site na ngosi nke ozi (Council 2014) . Informational Harms si ngosi nke ozi nkeonwe nwere ike ịbụ aku (eg, adịkwa a ọrụ), na-elekọta mmadụ (eg, ihere), psychological (eg, ịda mbà n'obi), ma ọ bụ ọbụna mpụ (eg, njide maka iwu na-akwadoghị omume). N'ụzọ dị mwute, digital afọ enwekwu ọmụma ize ndụ n'ụzọ dị ịrịba ama-e nwere nnọọ ọtụtụ ihe ndị ọzọ gbasara anyị omume. Na, informational ize ndụ pụtara nnọọ ike ịghọta na jikwaa tụnyere ihe ize ndụ ndị na-akpata nchegbu na analọg afọ elekọta mmadụ nnyocha, dị ka anụ ahụ n'ihe ize ndụ. Iji hụ otú dijitalụ afọ enwekwu informational ize ndụ, tụlee mgbanwe site akwụkwọ na electronic ike na. Ma ụdị nke ndekọ ike n'ihe ize ndụ, ma electronic ndia ike nnọọ ukwuu ize ndụ n'ihi na a oke ọnụ ọgụgụ ha pụrụ ibunye ndị ihe n'enweghị ikike ọzọ ma ọ bụ merged na ndị ọzọ ndia. Social-eme nnyocha na dijitalụ afọ ugbua na-agba n'ime nsogbu na informational ize ndụ, na akụkụ n'ihi na ha aghọtachaghị otú gụpụta ma jikwaa ya. Ya mere, m na-aga na-enye a na-enye aka n'ụzọ na-eche banyere informational ize ndụ, na mgbe ahụ, m na-aga na-enye gị ụfọdụ ndụmọdụ maka otu esi ejikwa ihe informational ize ndụ gị nnyocha na na-atọhapụ data ka ndị ọzọ na-eme nnyocha.
Otu ụzọ na-elekọta mmadụ na-eme nnyocha ibelata informational ize ndụ bụ "anonymization" nke data. "Anonymization" bụ usoro nke wepụ ihe doro anya ihe onwe onye nchọpụta dị ka aha, adreesị, na na nọmba ekwentị si data. Otú ọ dị, nke a ji nnọọ obere irè karịa ọtụtụ ndị na-aghọta, na ọ bụ, n'ezie, n'ụzọ miri emi ma na fundamentally mmachi. N'ihi nke ahụ, mgbe ọ bụla m na-akọwa "anonymization," m ga-eji e kwuru mark-echetara gị na usoro a na-emepụta onye ahụ nke anonymity ma ọ bụghị ezi anonymity.
A vivid atụ banyere ọdịda nke "anonymization" si mbubreyo 1990s na Massachusetts (Sweeney 2002) . The Group Insurance Commission (GIC) bụ ụlọ ọrụ gọọmentị ahụ maka ịzụta ike mkpuchi maka ihe nile gọọmenti ọrụ. Site n'ọrụ a, ndị GIC anakọtara zuru ezu ike ihe ndekọ banyere ọtụtụ puku ala ọrụ. Ná mgbalị iji ịkpali nnyocha banyere ụzọ ka mma ahụ ike, GIC kpebiri ịhapụ ndekọ ahụ na-eme nnyocha. Otú ọ dị, ha enweghị ihe niile nke ha data; kama, ha na-"anonymized" ya site na iwepu ozi dị ka aha na adreesị. Otú ọ dị, ha hapụrụ ozi ndị ọzọ na ha chere nwere ike iji na-eme nnyocha dị otú ahụ dị ka omume igwe mmadụ ozi (zip koodu, ụbọchị a mụrụ, agbụrụ, na mmekọahụ) na ọgwụ na ozi (nleta data, nchoputa, usoro) (ọgụgụ 6.4) (Ohm 2010) . O di nwute na, a "anonymization" bụghị zuru ezu iji chebe data.
Iji maa atụ adịghị ike nke ndị GIC "anonymization", Latanya Sweeney-ahụ a gụsịrị akwụkwọ akwụkwọ na MIT-akwụ ụgwọ $ 20 iji nweta ịtụ vootu ndia site n'obodo Cambridge, obodo nke ndị Massachusetts gọvanọ William Weld. Ndị a ịtụ vootu ndia gụnyere ozi dị ka aha, adreesị, zip koodu, ụbọchị a mụrụ, na okike. Eziokwu ahụ bụ na ahụ ike na data faịlụ na Voter faịlụ na-akọrọ ubi-zip koodu, ụbọchị a mụrụ, na mmekọahụ-pụtara na Sweeney nwere ike ejikọta ha. Sweeney maara na Weld ụbọchị ọmụmụ bụ July 31, 1945, na ịtụ vootu ndia gụnyere nanị mmadụ isii na Cambridge na na ụbọchị ọmụmụ. Ọzọkwa, ndị na isii ndị mmadụ, nanị atọ bụ nwoke. Na, n'ime ndị ikom atọ, naanị otu na-akọrọ Weld si zip koodu. N'ihi ya, ịtụ vootu data gosiri na onye ọ bụla na ahụ ike na data na Weld si Nchikota ụbọchị a mụrụ, okike, na zip koodu bụ William Weld. N'ikwu eziokwu, ihe atọ ndị a iberibe ozi nyere a pụrụ iche akara mkpisiaka ya na data. Iji eziokwu a, Sweeney nwee ike ịchọta Weld si ike na, na-agwa ya ya feat, ọ na-ezigara ya a oyiri nke ya na ndekọ (Ohm 2010) .
Sweeney ọrụ egosi ihe owuwu nke de-anonymization ọgụ -iji ịmụta a okwu site na kọmputa nche obodo. Na ndị a ọgụ, abụọ data tent, ọ dịghịkwa nke a site na ya onwe ya na-ekpughe mwute ozi, na-jikọrọ, na site na nke a linkage, mwute ozi n'anwụ. N'ụzọ ụfọdụ nke a yiri ihe n'ụzọ na mmiri soda na mmanya, abụọ bekee bụ site onwe ha mma, nwere ike ikpokọta mepụtaba mkpari pụta.
Omume Sweeney ọrụ, na ndị ọzọ yiri ọrụ, na-eme nnyocha ugbu a n'ozuzu wepu ọtụtụ ihe ndị ọzọ ozi-niile otú a na-akpọ "Onwe Ịmata Information" (PII) (Narayanan and Shmatikov 2010) -during usoro nke "anonymization." Ọzọkwa, ọtụtụ ndị nnyocha ugbu a na-aghọta na ụfọdụ data-dị ka ike na, ego na ndekọ, azịza-elegharị ajụjụ banyere iwu na-akwadoghị omume-bụ eleghị anya kwa mwute nyak ọbụna mgbe "anonymization." Otú ọ dị, ihe na-adịbeghị anya ihe atụ ndị nke m na-akọwa n'okpuru na-egosi na-elekọta mmadụ na-eme nnyocha mkpa ịgbanwe echiche ha. Dị ka a nzọụkwụ mbụ, ọ bụ ihe amamihe iche na niile data bụ ike nwere ike amata na niile data bụ nwere mmetụta ọsọ ọsọ. Ndị ọzọ okwu, kama na-eche na informational n'ihe ize ndụ na-emetụta a obere subset nke oru ngo, anyị kwesịrị iche na ọ na-emetụta-ruo n'ókè ụfọdụ-ihe nile oru ngo.
Akụkụ abụọ nke a re-nghazi na-¯ nkp o oro Netflix Nrite. Dị ka a kọwara n'Isi nke 5, Netflix tọhapụrụ 100 nde nkiri Anyela nye site na ọ fọrọ nke nta 500,000 òtù, ma na-emeghe oku na-aga ebe ndị mmadụ si n'akụkụ nile nke ụwa osụk algọridim na ike mma Netflix nwere ikike nwere ike ikwu na fim. Tupu ahapụ ndị data, Netflix wepụrụ ọ bụla doro anya na ya onwe-akọwapụta ihe ndị dị ka aha. Netflix we onye amara nzọụkwụ na ẹkenam nta perturbations na ụfọdụ n'ime ihe ndekọ (eg, na-agbanwe ụfọdụ ratings si 4 kpakpando na-3 kpakpando). Netflix n'oge na-adịghị chọpụtara Otú ọ dị, na n'agbanyeghị mgbalị ha, ndị data ndị ọlị amaghị aha.
Dị nnọọ izu abụọ mgbe data a tọhapụrụ Narayanan and Shmatikov (2008) gosiri na ọ bụ ike ịmụta banyere kpọmkwem ndị ji ihe nkiri mmasị. Nke atọ ka ha re-identification agha yiri Sweeney si: jikọrọ ọnụ ọnụ abụọ ọmụma na isi mmalite, onye nke nwere ike ịkpatara mwute ozi na-enweghị doro anya na ịmata ihe ọmụma na otu na e dere ihe njirimara nke ndị mmadụ. Onye ọ bụla n'ime ndị a data isi mmalite ike ịbụ n'otu n'otu mma, ma mgbe ha na-achọkwa na-merged dataset nwere ike ịmepụta informational n'ihe ize ndụ. Na ihe banyere ndị Netflix data, ebe a bụ otú o nwere ike ime. Were ya na m na-ahọrọ ịkọrọ echiche m banyere ihe na ntochi nkiri sịnịma na m ngalaba-ọrụ, ma na adịghị m achọ ịkọrọ m na uche banyere okpukpe na ndị ọchịchị na fim. My ngalaba-ọrụ ike iji ozi ahụ na m na-akọrọ ha ka ha chọta m ndekọ na Netflix data; ozi na m ịkọrọ nwere ike ịbụ a pụrụ iche akara mkpisiaka dị ka William Weld mụrụ ụbọchị, zip koodu, na mmekọahụ. Mgbe ahụ, ọ bụrụ na ha na-ahụ m pụrụ iche akara mkpisiaka na data, ha nwere ike ịmụta m ratings banyere fim nile, gụnyere ihe nkiri ebe m na-ahọrọ ịghara ikere òkè. Na mgbakwunye na ụdị ezubere iche agha lekwasịrị anya otu onye, Narayanan and Shmatikov (2008) gosikwara na ọ bụ ike ime a sara mbara agha -one metụtara ọtụtụ mmadụ-site-asọkọta ọnụ na Netflix data na onye na nkiri fim bụ maka data na ụfọdụ ndị họọrọ biputere na Internet Movie database (IMDb). Ozi ọ bụla nke bụ ihe pụrụ iche akara mkpisiaka ka a kpọmkwem onye-ọbụna ha set nke nkiri Anyela-ike ga-eji ya iji chọpụta ha.
Ọ bụ ezie na Netflix data nwere ike re-kwuru na ọ bụ na ma a ezubere iche ma ọ bụ sara agha, ọ ka nwere ike iyi ndị na-ala n'ihe ize ndụ. Mgbe niile, nkiri Anyela adịghị ka nnọọ mwute. Mgbe ahụ ka ọ dị ná mma, n'ihi na ụfọdụ n'ime 500,000 ndị mmadụ na dataset, nkiri Anyela pụrụ ịbụ nnọọ ihe mwute. N'ezie, omume ndị de-anonymization a closeted nwanyị nwere mmasị nwanyị nwaanyị sonyeere a na klas-edinam uwe megide Netflix. Nke a bụ otú nsogbu E gosipụtara ha ikpe (Singel 2009) :
"[M] ovie na fim data e dere ozi nke a ọzọ ukwuu onwe onye na mwute ọdịdị [sic]. The so ji ihe nkiri data ekpughe a Netflix so nwere mmasị na / ma ọ siiri dị iche iche nke ukwuu onwe onye nsogbu, gụnyere mmekọahụ, isi mgbaka, mgbake aṅụrụma, na victimization si idina onye ikwu, iti ihe, ike n'ezinụlọ, ịkwa iko, na idina mmadụ n'ike. "
The de-anonymization nke Netflix Nrite data na-egosi ma na niile data bụ ike nwere ike amata na niile data bụ nwere mmetụta ọsọ ọsọ. N'oge a, ị pụrụ iche na a na-emetụta data na na purports na-banyere ndị mmadụ. N'ụzọ dị ịtụnanya, na na abụghị ikpe. Omume a Freedom of Information Iwu arịrịọ, na New York City Government tọhapụrụ ndekọ nke ọ bụla tagzi na New York na 2013, gụnyere ụgbọala na-adapụsị ugboro, ọnọdụ, na ụgbọ ichekwa (cheta si Isi nke 2 na Farber (2015) -eji nke a data iji nwalee ihe dị mkpa chepụtara na-amụ enweta ego). Ọ bụ ezie na nke a data banyere taxi njem ahụ pụrụ iyi benign n'ihi na ọ dịghị ka ihe ga ọmụma banyere ndị mmadụ, Anthony Tockar ghọtara na a tagzi dataset n'ezie dị ọtụtụ nke nwere mwute ozi banyere ndị mmadụ. Iji maa atụ, o lere ha anya njem nile-amalite na The hustler Club-a nnukwu warara ahụ ke New York-n'etiti n'etiti abalị wee 6am wee hu ihe ha dobe-apụ ọnọdụ. Nke a search kpughere-in kachasi mkpa-a ndepụta nke adreesị nke ụfọdụ ndị na-agachi The hustler Club (Tockar 2014) . O siri ike iche n'echiche na ndị isi obodo ukwu bu nke a n'uche mgbe ọ tọhapụrụ ndị data. N'ezie, nke a otu ihe ahụ Usoro a pụrụ iji chọta ụlọ adreesị nke ndị na-eleta ọ bụla ebe ke obio-a ọgwụ na ahụ ike ụlọ ọgwụ, a ọchịchị ụlọ, ma ọ bụ a okpukpe na alụmdi.
Abụọ ndị a rịara ya-Netflix Nrite na New York City taxi data-egosi na dịtụ ndị nwere nkà okpu n'ụzọ ziri ezi na-eme atụmatụ na informational ize ndụ na data na ha wepụtara, na okwu ikpe ndị a ị bụghị ma ọlị pụrụ iche (Barbaro and Zeller Jr 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . Ọzọkwa, na ọtụtụ n'ime ndị a, ndị mfịna data ka n'efu online, na-egosi ike nke mgbe n'imezi a data ntọhapụ. Ịgụnye ihe atụ ndị a-nakwa nnyocha na kọmputa sayensị banyere nzuzo-edu otu ihe dị mkpa. Na-eme nnyocha kwesịrị iche na niile data bụ ike nwere ike amata na niile data bụ nwere mmetụta ọsọ ọsọ.
O di nwute na, na e nweghị ngwọta dị mfe nye eziokwu ahụ bụ niile data bụ ike nwere ike amata na niile data bụ nwere mmetụta ọsọ ọsọ. Otú ọ dị, otu ụzọ isi belata ọmụma ize ndụ mgbe ị na-arụ ọrụ na data bụ ike na-eso a data nchedo plan. Nke a plan ga mbelata ohere na gị data ga ihi mmiri na ga ibelata ihe ọjọọ ma ọ bụrụ na a ehi ehi n'ụzọ ụfọdụ pụtara. The nkọwa ndị doro nke data nchedo atụmatụ, dị ka nke ụdị izo ya ezo na-eji, ga-agbanwe oge na-aga, ma UK Data Services aka nke na-ahazi ndị ọcha nke a data nchedo plan n'ime 5 edemede na ha na-akpọ ndị 5 safes: mma oru ngo, mma ndị mmadụ , mma ntọala, mma data, na mma-ndapụta (Isiokwu 6.2) (Desai, Ritchie, and Welpton 2016) . Ọ dịghị onye nke ise safes n'otu n'otu na-enye zuru okè nchebe. Ma, ọnụ ha na-etolite dị ike set nke ihe ndị pụrụ ibelata informational n'ihe ize ndụ.
Nchekwa | Action |
---|---|
Nchekwa oru ngo | egbochi oru ngo na data ka ndị na-usoro ziri ezi |
Nchekwa ndị | ohere bụ nanị ndị na-nwere ike obi na data (eg, ndị undergone usoro ziri ezi ọzụzụ) |
Nchekwa data | data na-edepuchaala mata na aggregated ruo n'ókè o kwere |
Nchekwa ntọala | data na-echekwara na kọmputa na kwesịrị ekwesị n'ụzọ anụ (eg, ekpochi ụlọ) na software (eg, paswọọdụ nchedo, ezoro ezo) nchebe |
Nchekwa mmepụta | research mmepụta enyocha iji gbochie mmadụ na mberede nzuzo gbawara agbawa |
Na mgbakwunye na-echebe gị data mgbe ị na-eji ya, otu nzọụkwụ na nnyocha usoro ebe informational ize ndụ karịsịa salient bụ nkekọrịta data ndị ọzọ na-eme nnyocha. Nkekọrịta data n'etiti ndị ọkà mmụta sayensị bụ a isi uru nke mmụta sayensị na mbọ, na ya nke ukwuu ụlọ ọrụ ọganihu nke ihe ọmụma. Nke a bụ otú ndị UK Ụlọ Commons kọwara mkpa nke nkekọrịta data:
"Access ka data bụ isi ma ọ bụrụ na-eme nnyocha bụ mụta nwa, nyochaa ma wuo on pụta na-akọ banyere na akwụkwọ ndị ahụ. The nwem n'ukwu n'ukwu jeghari ga-ahụ, ọ gwụla ma e nwere ike mere na uzọ ọzọ, data ga-n'ụzọ zuru ezu mara na mere n'ihu ọha dị. N'ikwekọ n'ụkpụrụ a, n'ebe o kwere mee, data metụtara na niile n'ihu ọha kwụrụ ụgwọ research ka n'ọtụtụ ebe na n'efu. " (Molloy 2011)
Ma, site n'ikere òkè gị data ọzọ na-eme nchọpụta, ị nwere ike ịba ụba informational ize ndụ gị sonyere. N'ihi ya, ọ pụrụ ịdị ka na-eme nnyocha chọrọ ịkọrọ ha data-ma ọ bụ na-chọrọ ịkọrọ ha data-na-eche ihu a isi erughị ala. Na otu aka ha na-enwe usoro ziri ezi kwesịrị ịkọrọ ha data ndị ọzọ na ndị ọkà mmụta sayensị, karịsịa ma ọ bụrụ na mbụ nnyocha na-n'ihu ọha kwụrụ ụgwọ. Ma, n'otu oge ahụ, na-eme nnyocha nwere usoro ziri ezi ọrụ na-ebelata, ka o kwere mee, ndị ọmụma ize ndụ iji ha sonyere.
Ọ dabara nke ọma, a nsogbu, ọ dịghị ka oké dị ka ọ na-egosi. Ọ dị mkpa na-eche echiche nke data na-ekere òkè tinyere a continuum si dịghị nkekọrịta data nyak na-echefu, ebe data na-"anonymized" na posted n'ihi na onye ọ bụla iji nweta (ọgụgụ 6.6). Ma ndị a gabigara ókè ọnọdụ nwere ize ndụ na abamuru. Ya bụ, na ọ bụghị na-akpaghị aka ndị kasị usoro ziri ezi ihe ekweghị n'ihe i data; onye mere otú eliminates ọtụtụ nwere uru na-otu. -Alọta nụrụ ụtọ, Ties, na Time, ihe atụ tụlere mbụ ke ibuot, arụmụka megide data ntọhapụ na anya naanị kwere omume Harms na na na-eleghara ekwe omume uru na-gabiga ókè otu kwadoro; Aga m na-akọwa na nsogbu na nke a otu kwadoro, ekwe ya megharịa obibia na ihe nkowa na n'okpuru mgbe m na-enye ndụmọdụ banyere-eme mkpebi na ihu nke ejighị ihe n'aka (Nkebi 6.6.4).
Ọzọkwa, na n'etiti abụọ ndị a dị oké njọ bụ ihe m ga-akpọ a walled ubi obibia ebe data na-akọrọ ndị na-iru ihe ụfọdụ ibiere na onye na-ekweta na-agbụ site iwu ụfọdụ (eg, nlekọta site na IRB na a data nchedo atụmatụ) . Nke a walled ubi obibia enye ọtụtụ nke uru nke ntọhapụ na-echefu na-erughị ize ndụ. N'ezie, a walled ubi obibia emepụta ọtụtụ ajụjụ-ndị kwesịrị nwere ohere, n'ọnọdụ ndị dị aṅaa, olee mgbe, onye ga-akwụ ụgwọ ịnọgide na-enwe na ndị uwe ojii na mgbidi gburugburu ogige wdg-ma ndị a na-adịghị na-agaghị emerili. N'eziokwu, e na-ama na-arụ ọrụ walled ubi na ebe na-eme nnyocha nwere ike iji ugbu a, dị ka data Archive nke Inter-mahadum Consortium maka Political and Social Research na Mahadum nke Michigan.
Ya mere, ebe a ga na data site n'ọmụmụ na-na continuum nke enweghị òkè, mgbidi gburugburu ubi, ma hapụ na-echefu? Ọ adabere na-nkọwa nke gị data; na-eme nnyocha ga-akwado Nkwanye Ùgwù maka Persons, Beneficence, Justice, na nrubeisi nye iwu na Public Interest. Mgbe adabere na ya kpebie kwesịrị ekwesị itule maka ndị ọzọ mkpebi na-eme nnyocha ịchọ ndụmọdụ na nkwado nke IRBs, na data ntọhapụ pụrụ ịbụ nnọọ ọzọ nke na usoro. Ndị ọzọ okwu, ọ bụ ezie na ụfọdụ ndị na-eche data ntọhapụ dị ka a olileanya na-adịghị usoro ziri ezi morass, anyị na-ama nwere usoro na ebe-enyere-eme nnyocha si akwado ndị a ụdị usoro ziri ezi nsogbu.
One ikpeazụ ụzọ na-eche banyere data nkekọrịta bụ site ntụnyere. Kwa afọ ụgbọala na-ahụ maka ọtụtụ puku ọnwụ, ma anyị adịghị anwa iji tie iwu megide ịnya ụgbọ ala. N'ezie, ndị dị otú ahụ a oku ka tie iwu megide ịnya ụgbọ ala ga-uche na-adịghị n'ihi ịnya ụgbọ ala na-enyere ọtụtụ ihe magburu onwe. Kama nke ahụ, ọha mmadụ si mmachibido onye nwere ike ụgbọala (eg, mkpa ka a afọ ndụ ụfọdụ, mkpa ka nwere ebe ụfọdụ ule) na otú ha nwere ike ụgbọala (eg, n'okpuru oke ịgba ọsọ). Society nwekwara ndị tasked na ịmanye ndị a iwu (eg, uwe ojii), na anyị na-ata ndị mmadụ ahụhụ ndị na-ejide emebi ha. A otu ụdị echiche guzoziri eguzozi ndị mmadụ na-emetụta inye iwu na-anya ụgbọ nwekwara ike a n'ọrụ nkekọrịta data. Ya bụ, kama eme absolutist arụmụka nke ma ọ bụ megide nkekọrịta data, m na-eche nnukwu uru ga-esi figuring si otú anyị nwere ike ịkọrọ ihe data ọzọ n'udo.
Ikwubi, informational ize ndụ abawanyele n'ike n'ike, na ọ bụ nnọọ ike ikwu na gụpụta. Ya mere, ọ kasị mma iche na niile data bụ nwere amata nke nwere mwute. Ka ibelata informational n'ihe ize ndụ mgbe na-eme nnyocha, na-eme nnyocha nwere ike ịmepụta na-eso a data nchedo plan. Ọzọkwa, informational ize ndụ adịghị egbochi eme nnyocha si ekere òkè data na ndị ọzọ ndị ọkà mmụta sayensị.