വിവരം റിസ്ക് സോഷ്യൽ റിസർച്ച് ഏറ്റവും റിസ്ക്; അതു നാടകീയമായി വർദ്ധിച്ചിരിക്കുന്നു; അതു മനസ്സിലാക്കാൻ .കൗതുകമോ റിസ്ക് ആണ്.
സോഷ്യൽ പ്രായം ഡിജിറ്റൽ റിസർച്ച് രണ്ടാം നൈതിക വെല്ലുവിളി വിജ്ഞാനദായകവുമായ റിസ്ക്, വിവരങ്ങളുടെ വെളിപ്പെടുത്തൽ നിന്ന് ഉപദ്രവം കാരണമാകുന്നതാണ് (Council 2014) . സ്വകാര്യ വിവരങ്ങളുടെ വെളിപ്പെടുത്തൽ നിന്ന് വിവരദായകം അപ്രകാരം സാമ്പത്തിക കഴിഞ്ഞില്ല (ഉദാ, ജോലി നഷ്ടപ്പെടുന്നത്), സോഷ്യൽ (ഉദാ, ഉളുപ്പും), മനഃശാസ്ത്രപരമായ (ഉദാ, വിഷാദം), അല്ലെങ്കിൽ പോലും ക്രിമിനൽ (ഉദാ, നിയമവിരുദ്ധമായ സ്വഭാവത്തിന് അറസ്റ്റ്). നിർഭാഗ്യവശാൽ, ഡിജിറ്റൽ യുഗത്തിൽ വിവരങ്ങൾ റിസ്ക് നാടകീയമായി-അവിടെ ഞങ്ങളുടെ പെരുമാറ്റത്തെക്കുറിച്ച് വെറും അങ്ങനെ അധികം വിവരങ്ങളാണ് വർദ്ധിപ്പിക്കുന്നു. പിന്നെ, അനൌപചാരികവും റിസ്ക് പോലുള്ള ഫിസിക്കൽ റിസ്ക്, അനലോഗ് പ്രായം സോഷ്യൽ ഗവേഷണത്തിൽ ആശങ്കകൾ ഉണ്ടായിരുന്ന അപകടസാധ്യതകൾ അപേക്ഷിച്ച് മനസ്സിലാക്കാനും നിയന്ത്രിക്കാൻ വളരെ ബുദ്ധിമുട്ടുള്ള തെളിയിക്കപ്പെട്ടിട്ടുണ്ട്. ഡിജിറ്റൽ യുഗത്തിൽ വിജ്ഞാനദായകവുമായ സാധ്യത വർദ്ധിപ്പിക്കുന്നു എങ്ങനെ കാണാൻ, ഇലക്ട്രോണിക് മെഡിക്കൽ റെക്കോർഡുകൾ പേപ്പറിൽ നിന്നും സംക്രമണം പരിഗണിക്കുക. റെക്കോർഡുകൾ രണ്ടു തരം റിസ്ക് സൃഷ്ടിക്കാൻ, പക്ഷേ ഒരു വലിയ അളവിൽ അവർ അനധികൃതമായ കക്ഷിക്ക് കൈമാറ്റം ചെയ്യപ്പെടുന്ന അല്ലെങ്കിൽ മറ്റ് രേഖകള് ലയിപ്പിക്കും കാരണം കഴിയും ഇലക്ട്രോണിക് രേഖകള് അധികം റിസ്ക്കുകൾ സൃഷ്ടിക്കുക. അവർ പൂർണ്ണമായി വഴികൂടിയായിരുന്നു നിയന്ത്രിക്കാനും എങ്ങനെ മനസ്സിലാക്കാൻ കാരണം ഡിജിറ്റൽ യുഗത്തിൽ സോഷ്യൽ ഗവേഷകർ ഇതിനകം വിവരണാത്മ സാധ്യത പ്രശ്നമുണ്ട്, ഭാഗത്ത് കുറയും. അങ്ങനെ ഞാൻ വിജ്ഞാനദായകവുമായ റിസ്ക് ചിന്തിക്കാൻ ഒരു സഹായകരമായ മാർഗ്ഗം പോകുന്നു; പിന്നെ നിങ്ങളുടെ ഗവേഷണം ഡാറ്റ മറ്റ് ഗവേഷകർ വിട്ടയച്ചതിൽ ലെ വിജ്ഞാനദായകവുമായ റിസ്ക് നിയന്ത്രിക്കാൻ ചില ഉപദേശം നൽകാൻ പോകുന്നു.
സോഷ്യൽ ഗവേഷകർ വിജ്ഞാനദായകവുമായ സാധ്യത കുറയ്ക്കുകയും ഒരു വഴി ഡാറ്റ "anonymization" ആണ്. "Anonymization" ഡാറ്റ നിന്ന് പേര്, വിലാസം, ടെലിഫോൺ നമ്പർ വ്യക്തമായ സ്വകാര്യ ഐഡന്റിഫയറുകൾ നീക്കംചെയ്യുന്ന പ്രക്രിയയാണ്. എന്നിരുന്നാലും, ഈ സമീപനം പലരും ഗ്രഹിക്കാൻ കുറവാണ് പ്രാബല്യത്തിലാകും, അതു വാസ്തവത്തിൽ, ആഴത്തിൽ ഒപ്പം അടിസ്ഥാനപരമായി പരിമിതമായ ആണ്. അതുകൊണ്ടാണ് ഞാൻ വിവരിക്കുക എപ്പോഴൊക്കെ "anonymization," ഞാൻ ഉദ്ധരണി ചിഹ്നങ്ങൾ ഈ പ്രക്രിയ നിലനി എന്നാൽ യഥാർഥ കാലനാണെന്നു രൂപം സൃഷ്ടിക്കുന്നു കാര്യം ഓർമിപ്പിക്കാൻ ഉപയോഗിക്കും.
"Anonymization" എന്ന പരാജയം വർണ്ണാഭമായ ഉദാഹരണമാണ് മസാച്യുസെറ്റ്സ് വൈകി 1990 വരുന്നു (Sweeney 2002) . ഗ്രൂപ്പ് ഇൻഷുറൻസ് കമ്മീഷൻ (IFCI) ഒരു സർക്കാർ ഏജൻസി സംസ്ഥാന ജീവനക്കാരുടെ ആരോഗ്യ ഇൻഷ്വറൻസ് വാങ്ങുന്നതിനു കാരണമായത്. ഈ സൃഷ്ടിയുടെ വഴി, GIC സംസ്ഥാന ആയിരക്കണക്കിന് ജീവനക്കാർ വിശദമായ ആരോഗ്യ രേഖകൾ ശേഖരിച്ചു. ആരോഗ്യം മെച്ചപ്പെടുത്താൻ വഴികളെ ഗവേഷണം ഉദ്ദീപിപ്പിക്കുന്നു ശ്രമത്തിൽ, GIC ഗവേഷകർ ഈ റെക്കോർഡുകൾ റിലീസ് തീരുമാനിച്ചു. എന്നിരുന്നാലും, തങ്ങളുടെ വിവരങ്ങൾ എല്ലാ പങ്കിടാൻ ചെയ്തില്ല; അല്ല, അവർ പോലുള്ള പേരും വിലാസവും വിവരങ്ങൾ നീക്കംചെയ്യുന്നതിന് അതിനെ "അജ്ഞാതമാക്കുന്നതിന്". എന്നാൽ അവർ അത്തരം ജനസംഖ്യാപരമായ വിവരം പോലുള്ള ഗവേഷകർ ഉപയോഗപ്രദമാകും കഴിഞ്ഞില്ല വിചാരിച്ചു മറ്റ് വിവരങ്ങളോ (പിൻ കോഡ്, ജനന തീയതി, വംശീയത, ലൈംഗിക), മെഡിക്കൽ വിവരങ്ങൾ (സന്ദർശനം ഡാറ്റ, രോഗനിർണയം, നടപടിക്രമം) (ചിത്രം 6.4) അവശേഷിക്കുന്നു (Ohm 2010) . നിർഭാഗ്യവശാൽ, ഈ "anonymization" ഡാറ്റ രക്ഷിക്കാൻ അവയ്ക്കു ആയിരുന്നില്ല.
കേംബ്രിഡ്ജ്, മസാച്ചുസെറ്റ്സ് ഗവർണർ വില്യം .ബേസ് എന്ന ജന്മനാട് നഗരത്തിൽ നിന്ന് വോട്ടിംഗ് രേഖകള് ഏറ്റെടുക്കാൻ എംഐടി-പെയ്ഡ് $ 20 ഒരു ബിരുദ വിദ്യാർത്ഥി, GIC "anonymization" കുറവുകൾ ദൃഷ്ടാന്തത്തിന് Latanya ഷാനിന്റെ-പിന്നീട്. ഈ വോട്ടിംഗ് രേഖകള് പേര്, വിലാസം, പിൻകോഡ്, ജനന തീയതി, ലിംഗഭേദം വിവരങ്ങൾ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. മെഡിക്കൽ ഡാറ്റ ഫയലും വോട്ടർ ഫയൽ പങ്കിട്ട ഫീൽഡുകൾ-പിൻ കോഡ്, ജനന തീയതി, ലൈംഗിക-ഉദ്ദേശിച്ചുള്ള ഷാനിന്റെ അവരെ കണ്ണികളുണ്ട് കഴിഞ്ഞില്ല വസ്തുത. ഷാനിന്റെ .ബേസ് ജന്മദിനം ജൂലൈ 31, 1945 എന്ന്, വോട്ടിംഗ് രേഖകള് ആ പിറന്നാൾ കൂടെ കേംബ്രിഡ്ജ് ആളുകൾ ആറ് ഉൾപ്പെടുത്തിയിട്ടുണ്ട് അറിയാമായിരുന്നു. കൂടുതൽ, ആ ആറു പേർ മാത്രമേ മൂന്ന് പുരുഷൻമാരാണ്. പിന്നെ, ആ മൂന്നു പുരുഷന്മാർക്കും മാത്രമേ .ബേസ് ന്റെ പിൻ കോഡ് പങ്കിട്ടു. ഇപ്രകാരം, വോട്ടിംഗ് ഡാറ്റ ജനനത്തീയതി എന്ന .ബേസ് ന്റെ കോമ്പിനേഷൻ കൊണ്ട് മെഡിക്കൽ ഡാറ്റ, ലിംഗഭേദം, പിൻ കോഡ് ആരുമായും വില്യം .ബേസ് കഴിഞ്ഞു. തത്വത്തിൽ, വിവരങ്ങൾ ഈ മൂന്നു കഷണങ്ങൾ ഡാറ്റ അവനെ അതുല്യമായ വിരലടയാള നൽകി. ഈ അനന്യത, ഷാനിന്റെ .ബേസ് മെഡിക്കൽ റെക്കോർഡുകൾ കണ്ടെത്താൻ, അവളുടെ നേട്ടം പറ്റി അദ്ദേഹത്തിന് വിവരം കഴിഞ്ഞു അവൾ തന്റെ റെക്കോർഡുകളുടെ ഒരു പകർപ്പ് തപാലിൽ (Ohm 2010) .
ഷാനിന്റെ പ്രവൃത്തി -ഡെസ്ക്ടോപ്പിൽ കമ്പ്യൂട്ടർ സുരക്ഷാ കമ്മ്യൂണിറ്റിയിൽ നിന്ന് ഒരു പദം സ്വീകരിക്കാം ദേ-anonymization ആക്രമണങ്ങൾ അടിസ്ഥാന നൽകണം. ഈ ആക്രമണങ്ങൾ, രണ്ടു ഡാറ്റ സെറ്റുകൾ ചെയ്യാതെയും ഇതിൽ സ്വയം രഹസ്യസ്വഭാവമുള്ള വിവരങ്ങൾ വെളിപ്പെടുത്തുന്നു, ലിങ്കു ഈ ബന്ധം വഴി സെൻസിറ്റീവ് വിവരങ്ങൾ എക്സ്പോസുചെയ്തിരിക്കുന്നു. ഒരു വിധത്തിൽ ഈ പ്രക്രിയ ബേക്കിംഗ് സോഡ വിനാഗിരി, സുരക്ഷിതം തനിച്ചു രണ്ട് ലഹരിവസ്തുക്കൾ ഒരു ഡോണും ഫലമാണ് ഉത്പാദിപ്പിക്കാൻ സംയോജിപ്പിക്കും കഴിയുന്ന അങ്ങനെയാണ്.
ഷാനിന്റെ പ്രവൃത്തി, മറ്റ് അനുബന്ധ പ്രവൃത്തി മറുപടിയായി, ഗവേഷകർ ഇപ്പോൾ പൊതുവേ കൂടുതലും-എല്ലാം (PII) "വ്യക്തിപരമായി തിരിച്ചറിയാൻ വിവരങ്ങൾ" അങ്ങനെ വിളിച്ചു നീക്കം (Narayanan and Shmatikov 2010) പ്രക്രിയ -during പല ഗവേഷകർ ഇപ്പോൾ "anonymization." ഇനിയും എങ്കിലും, ഞാൻ താഴെ വിവരിക്കുക കാണാം എന്ന് കൂടുതൽ സമീപകാല ഉദാഹരണങ്ങൾ സോഷ്യൽ ഗവേഷകർ നൽകണം എന്ന് സൂചിപ്പിക്കുന്നതിന് ചില ഡാറ്റ-പോലുള്ള മെഡിക്കൽ റെക്കോർഡുകൾ, സാമ്പത്തിക രേഖകള്, ഉത്തരങ്ങൾ നിയമവിരുദ്ധമായ പെരുമാറ്റം-ആണ് ഒരുപക്ഷേ ശേഷവും റിലീസ് വളരെ സെൻസിറ്റീവ് സംബന്ധിച്ച ചോദ്യങ്ങൾക്ക് സർവേ ഗ്രഹിക്കാൻ "anonymization." അവരുടെ ചിന്താഗതിക്കു മാറ്റം. ആദ്യ പടി, എല്ലാ ഡാറ്റയും സാധ്യതയുള്ള തിരിച്ചറിയാൻ എല്ലാ ഡാറ്റയും തീർത്തും സെൻസിറ്റീവ് ആണ് കരുതാവുന്നതാണ് ബുദ്ധി. മറ്റു വാക്കുകളിൽ, മറിച്ച് വിവരണാത്മ റിസ്ക് പദ്ധതികൾ ഒരു ചെറിയ ഉപഗണം ബാധകമാണ് അബദ്ധധാരണ അധികം ഞങ്ങൾ അതു ബാധകമാണ്-ലേക്ക് ചില ഡിഗ്രി-ലേക്ക് എല്ലാ പദ്ധതികൾക്കും അനുമാനിക്കേണ്ടതാണ്.
ഈ റീ-ഓറിയന്റേഷൻ രണ്ടും വശങ്ങൾ നെറ്റ്ഫിക്സ് സമ്മാനം ചിത്രീകരിച്ചിരിക്കുന്നു ചെയ്യുന്നു. അദ്ധ്യായം 5 പോലെ, നെറ്റ്ഫിക്സ് ഏതാണ്ട് 500,000 അംഗങ്ങൾ നൽകിയ 100 ദശലക്ഷം സിനിമ റേറ്റിംഗ് വിട്ടയച്ചു ലോകത്തില് നിന്നും ആളുകൾ സിനിമകൾ ശുപാർശ ലേക്കുള്ള നെറ്റ്ഫിക്സ് കഴിവിനെ മെച്ചപ്പെടുത്താൻ കഴിഞ്ഞില്ല അൽഗോരിതങ്ങൾ സമർപ്പിച്ച എവിടെ ഒരു തുറന്ന കോൾ ഉണ്ടായിരുന്നു. ഡാറ്റ പുറത്തറിയിക്കുന്നതിനുമുമ്പ്, നെറ്റ്ഫിക്സ് പോലുള്ള പേരുകൾ, ഏതെങ്കിലും വ്യക്തമായും വ്യക്തിപരമായി-തിരിച്ചറിയൽ വിവരങ്ങൾ നീക്കം. നെറ്റ്ഫിക്സ് പുറമേ ഒരു അധിക ഘട്ടം ചെന്നു ചില റെക്കോർഡുകൾ ചെറിയ ചലനങ്ങളെ അവതരിപ്പിച്ചു (ഉദാ, 3 നക്ഷത്രങ്ങൾ 4 നക്ഷത്രങ്ങൾ നിന്ന് ചില റേറ്റിംഗുകൾ മാറ്റുന്നതിൽ). നെറ്റ്ഫിക്സ് ഉടൻ അവരുടെ പരിശ്രമം ഉണ്ടെങ്കിലും, ഡാറ്റ ഒരിക്കലുമില്ല അജ്ഞാത ആയിരുന്നു എന്ന് എന്നാൽ കണ്ടെത്തിയത്.
ഡാറ്റ വിട്ടയച്ചു ജസ്റ്റ് രണ്ടാഴ്ച Narayanan and Shmatikov (2008) പ്രത്യേക ജനങ്ങളുടെ സിനിമ മുൻഗണനകൾ കുറിച്ച് പഠിക്കാൻ സാധ്യത കഴിഞ്ഞു. അവരുടെ റീ-ഐഡന്റിഫിക്കേഷൻ ആക്രമണം ഹാട്രിക് ഷാനിന്റെ സമാനമായ ആയിരുന്നു: ഒരുമിച്ചു ലയിപ്പിക്കാൻ രണ്ടു വിവരങ്ങൾ ഉറവിടങ്ങൾ, രഹസ്യസ്വഭാവമുള്ളവ വിവരങ്ങൾ യാതൊരു വ്യക്തമായും തിരിച്ചറിയൽ ജനത്തിന്റെ ഐഡന്റിറ്റി അടങ്ങുന്ന വൺ. ഈ ഡാറ്റ ഉറവിടങ്ങളിൽ ഓരോ വ്യക്തിഗതമായി സുരക്ഷിതം, പക്ഷേ അവർ കൂടിച്ചേർന്ന് ചെയ്യുമ്പോൾ ലയിച്ച ഡാറ്റാഗണത്തിന്റെ വിജ്ഞാനദായകവുമായ റിസ്ക് സൃഷ്ടിക്കാൻ കഴിയും. നെറ്റ്ഫിക്സ് ഡാറ്റ കാര്യത്തിൽ, അത് ഇവിടെ നേടാന് കഴിയും എങ്ങനെ. ഞാൻ എന്റെ സഹപ്രവർത്തകർക്കൊപ്പം നടപടി ഹാസ്യ സിനിമകളെ കുറിച്ച് എന്റെ ചിന്തകൾ പങ്കിടാൻ തിരഞ്ഞെടുക്കുന്ന, പക്ഷേ എനിക്ക് മത രാഷ്ട്രീയ സിനിമകളെ കുറിച്ച് എന്റെ അഭിപ്രായം പങ്കിടരുതെന്ന് ഇഷ്ടപ്പെടുന്നത് സങ്കൽപ്പിക്കുക. എന്റെ സഹപ്രവർത്തകർ നെറ്റ്ഫിക്സ് ഡാറ്റ എന്റെ റെക്കോർഡുകൾ കണ്ടെത്താൻ ഞാൻ അവരുമായി പങ്കിട്ട വിവരങ്ങളും ഉപയോഗിക്കാം; ഞാൻ പങ്കിടുന്ന വിവരങ്ങൾ വെറും വില്യം .ബേസ് ന്റെ ജനന തീയതി, പിൻ കോഡ്, ലൈംഗിക പോലുള്ള ഒരു അതുല്യ വിരലടയാളം കഴിഞ്ഞില്ല. അങ്ങനെ അവർ ഡാറ്റ എന്റെ അതുല്യമായ വിരലടയാളം കണ്ടാൽ അവർ എന്റെ റേറ്റിംഗുകൾ ഞാൻ പങ്കിടരുതെന്ന് തിരഞ്ഞെടുക്കാൻ കഴിയുന്ന സിനിമകൾ ഉൾപ്പെടെ എല്ലാ സിനിമകളും കുറിച്ച് പഠിക്കാൻ കഴിഞ്ഞില്ല. ഒരൊറ്റ വ്യക്തിയെ കേന്ദ്രീകരിച്ചായിരുന്നു ലക്ഷ്യമിടുന്ന ആക്രമണം ഇത്തരത്തിലുള്ള പുറമെ, Narayanan and Shmatikov (2008) അതു പലരും-സ്വകാര്യ മൂവി റേറ്റിംഗ് ഡാറ്റ ഉപയോഗിച്ച് നെറ്റ്ഫിക്സ് ഡാറ്റ സംയോജിപ്പിച്ചുകൊണ്ട് ചില ഉൾപ്പെട്ട ഒരു വിശാലമായ ആക്രമണം -നൽകാൻ ചെയ്യാൻ സാധ്യത തെളിയിച്ച ജനം ഇന്റർനെറ്റ് മൂവി ഡാറ്റാബേസിൽ (IMDb) ൽ പോസ്റ്റുചെയ്യാൻ തിരഞ്ഞെടുത്തു. ഒരു പ്രത്യേക വ്യക്തി-പോലും സിനിമ റേറ്റിംഗ്-കഴിയും അവരെ തിരിച്ചറിയാൻ ഉപയോഗിക്കുന്നതാണ് അവരുടെ സെറ്റ് അതുല്യമായ വിരലടയാളം ഏതെങ്കിലും വിവരങ്ങൾ.
നെറ്റ്ഫിക്സ് ഡാറ്റ കഴിയും ഒന്നുകിൽ ഒരു ലക്ഷ്യമിട്ടുകൊണ്ടുള്ള വീതിയേറിയ ആക്രമണത്തിൽ വീണ്ടും തിരിച്ചറിഞ്ഞ പോലും ഇപ്പോഴും കുറഞ്ഞ റിസ്ക് ആയിരിക്കും തോന്നാം. എല്ലാത്തിനുമുപരി, സിനിമ റേറ്റിംഗ് വളരെ സെൻസിറ്റീവ് തോന്നുന്നില്ല. ആ പൊതുവെ നിവൃത്തിയാകേണ്ടതിന്നു സമയത്ത്, ഡാറ്റാഗണത്തിൽ 500,000 ആളുകൾ ചില, സിനിമ റേറ്റിംഗ് വളരെ സെൻസിറ്റീവ് ആകേണ്ടതിന്നു. സത്യത്തിൽ, ദേ-anonymization പ്രതികരണമായി ഒരു closeted ലെസ്ബിയൻ സ്ത്രീ നെറ്റ്ഫിക്സ് നേരെ ക്ലാസ്-ആക്ഷൻ സ്യൂട്ട് ചേർന്നു. ഇവിടെ പ്രശ്നം അവരുടെ നിയമവ്യവഹാരത്തിലെ പ്രകടിപ്പിച്ചു എങ്ങനെ (Singel 2009) :
"[എം] ovie റേറ്റിംഗും ഡാറ്റ കൂടുതൽ വളരെ വ്യക്തിപരവും സെൻസിറ്റീവ് പ്രകൃതി വിവരങ്ങൾ [സഖ്യശക്തികൾ] ഉൾക്കൊള്ളുന്നു. അംഗത്തിന്റെ സിനിമ ഡാറ്റ ഒരു നെറ്റ്ഫിക്സ് മെമ്പറുടെ വ്യക്തിപരമായ താത്പര്യം തുറന്നുകാട്ടുന്നു ഒപ്പം / അല്ലെങ്കിൽ ലൈംഗികത, മാനസിക രോഗം, മദ്യപാനം നിന്ന് വീണ്ടെടുക്കൽ, ഒപ്പം അത്ര അഗമ്യഗമനം, ശാരീരിക ദുരുപയോഗം, ഗാർഹിക, വ്യഭിചാരം, ബലാത്സംഗം നിന്ന് ഉൾപ്പെടെ വിവിധ വളരെ വ്യക്തിപരമായ പ്രശ്നങ്ങൾ, കൂടെ സമരങ്ങളും. "
നെറ്റ്ഫിക്സ് സമ്മാനം ഡാറ്റ ദേ-anonymization ഇരുവരും എല്ലാ ഡാറ്റയും തീർത്തും തിരിച്ചറിയാൻ എല്ലാ ഡാറ്റയും തീർത്തും സെൻസിറ്റീവ് ആണ് കാണിക്കുന്നു. ഈ സമയത്ത്, ഈ മാത്രമേ ജനം എന്നതിനെക്കുറിച്ചാണെന്ന് purports ഡാറ്റ ബാധകമാണ് കരുതിയേക്കും. കൌതുകകരമായ, ആ കേസ് അല്ല. വിവര നിയമം അഭ്യർത്ഥനയുടെ ഒരു ഫ്രീഡം മറുപടിയായി, ന്യൂയോർക്ക് സിറ്റി ഗവൺമെൻറ് ന്യൂയോർക്കിൽ ഓരോ ടാക്സി കേവലമൊരു രേഖകള് 2013 ൽ, പിക്കപ്പ് ഉൾപ്പെടെ പുറത്തിറക്കി തവണ, ലൊക്കേഷനുകൾ, യാത്രാനിരക്ക് അളവിൽ കുറയുമ്പോൾ (തിരിച്ചുവിളിക്കാൻ അദ്ധ്യായം 2 മുതൽ Farber (2015) ലേബർ ഇക്കണോമിക്സ് പ്രധാന സിദ്ധാന്തങ്ങളേയും പരീക്ഷിക്കാനും ഈ ഡാറ്റ ഉപയോഗിച്ച്). അതു ജനം കുറിച്ചുള്ള വിവരങ്ങൾ തോന്നുന്നില്ല കാരണം ടാക്സി യാത്രകൾ കുറിച്ച് ഈ ഡാറ്റ ബസ്സില് തോന്നിയാലും ആണെങ്കിലും, ആന്റണി Tockar ഈ ടാക്സി ഡാറ്റാഗണത്തിന്റെ ആളുകളെ കുറിച്ച് രഹസ്യസ്വഭാവമുള്ളവ കുറേ വിവരങ്ങൾ അടങ്ങിയിരിക്കുന്ന മനസ്സിലായി. ദൃഷ്ടാന്തത്തിന്, അവൻ ഗണിക ക്ലബ്-ഒരു വലിയ സ്ട്രിപ്പ് ന്യൂ ക്ലബ്ബിന്റെ ന്യൂയോർക്ക്-തമ്മിലുള്ള അർദ്ധരാത്രിക്കും 6am തുടങ്ങുന്ന എല്ലാ യാത്രകൾ നോക്കി തുടർന്ന് അവരുടെ ഡ്രോപ്പ്-ഓഫ് ലൊക്കേഷനുകൾ കണ്ടെത്തി. ഈ തിരയൽ വെളിപ്പെടുത്തി-ഇൻ സാരാംശം-ഒരു ഗണിക ക്ലബ് സ്ഥിരമായി ചിലർ ആളുകളുടെ വിലാസങ്ങളുടെ പട്ടിക (Tockar 2014) . അത് ഡാറ്റ റിലീസ് സന്ദർഭം സർക്കാർ മനസ്സിൽ ഈ ഉള്ളതെന്ന് സങ്കൽപ്പിക്കാനാവില്ല. സത്യത്തിൽ, ഈ അതേ നഗര മെഡിക്കൽ ക്ലിനിക്ക് ഒരു സർക്കാർ കെട്ടിടം, അല്ലെങ്കിൽ ഒരു മത സ്ഥാപനത്തിൽ ഏത് സ്ഥലത്തും സന്ദർശിക്കുന്ന ആളുകളെ വീട്ടിൽ വിലാസങ്ങൾ കണ്ടെത്തുന്നതിന് ഉപയോഗപ്പെടുത്താം.
ഈ രണ്ടു കേസുകൾ-നെറ്റ്ഫിക്സ് സമ്മാനം താരതമ്യേന വിദഗ്ധ ജനം ശരിയായി ഡിസ്ചാർജ്ജ് ഡാറ്റ ലെ വിജ്ഞാനദായകവുമായ റിസ്ക് കണക്കാക്കാൻ പരാജയപ്പെട്ട ന്യൂയോർക്ക് സിറ്റി ടാക്സി ഡാറ്റ-ഷോ, ഈ കേസുകളിൽ യാതൊരു വഴി മാർഗങ്ങൾ ചെയ്യുന്നു അതുല്യമായ (Barbaro and Zeller Jr 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . കൂടുതൽ, ഈ കേസുകളിൽ നിരവധി, പ്രശ്നക്കാരായ ഡാറ്റ ഇപ്പോഴും സ്വതന്ത്രമായി ലഭ്യമായ എന്നേക്കും ഒരു ഡാറ്റ റിലീസ് പഴയപടിയാക്കുന്നതിൽ ബുദ്ധിമുട്ടിനെ സൂചിപ്പിക്കുന്നു ഓൺലൈൻ. ഒന്നിച്ച് ഈ ഉദാഹരണങ്ങൾ-അതോടൊപ്പം തന്നെ ഒരു പ്രധാന നിഗമനത്തിൽ സ്വകാര്യത-ലീഡുകൾ കുറിച്ച് കമ്പ്യൂട്ടർ സയൻസ് ഗവേഷണ. ഗവേഷകർ എല്ലാ ഡാറ്റയും തീർത്തും തിരിച്ചറിയുന്ന അനുമാനിക്കേണ്ടതാണ് എല്ലാ ഡാറ്റയും തീർത്തും സെൻസിറ്റീവ് ആണ്.
നിർഭാഗ്യവശാൽ, എല്ലാ ഡാറ്റയും തീർത്തും തിരിച്ചറിയാൻ എല്ലാ ഡാറ്റയും രഹസ്യസ്വഭാവമുള്ളവ വസ്തുത യാതൊരു ലളിതമായ പരിഹാരം ഇല്ല. എന്നിരുന്നാലും, നിങ്ങൾ ഡാറ്റ ഉപയോഗിച്ച് പ്രവർത്തിക്കുമ്പോഴും വിവരങ്ങൾ സാധ്യത കുറയ്ക്കാൻ ഒരു വിധം തയ്യാറാക്കി ഒരു ഡാറ്റ പരിരക്ഷ പ്ലാൻ പിന്തുടരുകയാണ്. ഈ പ്ലാൻ നിങ്ങളുടെ ഡാറ്റ പുഞ്ചപ്പാടത്ത് ഒപ്പം ഒരു ലീക്ക് എങ്ങനെയോ സംഭവിച്ചതെങ്കിൽ ദോഷം കുറയും സാധ്യത കുറയ്ക്കുന്നു ചെയ്യും. സുരക്ഷിതം പദ്ധതികൾ, സുരക്ഷിതം ആളുകൾ: ഉപയോഗിക്കാൻ എൻക്രിപ്ഷൻ ഫോം ഡാറ്റാ പ്രൊട്ടക്ഷൻ പ്ലാനുകൾ കൃത്യമായ വിവരങ്ങൾ,, കാലാകാലങ്ങളിൽ മാറാം, പക്ഷേ യുകെ ഡാറ്റ സേവനങ്ങൾ സഹായകരമാണ് അവർ 5 safes വിളിക്കുന്ന 5 വിഭാഗങ്ങളായി ഒരു ഡാറ്റ പരിരക്ഷ പദ്ധതി ഘടകങ്ങൾ സംഘടിപ്പിക്കാറുണ്ട് , സുരക്ഷിതം ക്രമീകരണങ്ങൾ, സുരക്ഷിതം ഡാറ്റ, സുരക്ഷിതം ഔട്പുട്ടുകൾ (പട്ടിക 6.2) (Desai, Ritchie, and Welpton 2016) . അഞ്ചു safes ഒന്നുമല്ല വ്യക്തിഗതമായി തികഞ്ഞ സംരക്ഷണം നൽകുക. എന്നാൽ ഒരുപോലെ വിജ്ഞാനദായകവുമായ സാധ്യത കുറയ്ക്കുകയും കഴിയുന്ന ഘടകങ്ങൾ ശക്തമായ സെറ്റ് രൂപം.
സുരക്ഷിതമായ | ആക്ഷൻ |
---|---|
സുരക്ഷിത പദ്ധതികൾ | നൈതിക ആ ഡേറ്റാ പരിധികൾ പദ്ധതികൾ |
സുരക്ഷിത ആളുകൾ | ആക്സസ് (ഉദാ, ജനം നൈതിക പരിശീലനം വിധേയമായിട്ടുണ്ട്) ഡാറ്റ ഉപയോഗിച്ച് വിശ്വസിക്കുകയാണുചിതമെന്നമുള്ള ആളുകൾക്ക് നിയന്ത്രിച്ചിരിക്കുന്നു |
സുരക്ഷിത ഡാറ്റ | ഡാറ്റ ദേ-തിരിച്ചറിഞ്ഞ് സമാഹരിച്ചതാണ് സാധ്യത പരിധി വരെ |
സുരക്ഷിത ക്രമീകരണങ്ങൾ | ഡാറ്റ ഉചിതമായ ഫിസിക്കൽ (ഉദാ ബന്ധിച്ചിരിക്കുന്നു മുറി) കമ്പ്യൂട്ടറുകൾ സംഭരിച്ചിരിക്കുന്ന സോഫ്റ്റ്വെയർ (ഉദാ, പാസ്വേഡ് പരിരക്ഷ, എൻക്രിപ്റ്റ്) സംരക്ഷണങ്ങൾ |
സുരക്ഷിതമായ ഔട്ട്പുട്ട് | ഗവേഷണ ഔട്ട്പുട്ട് അബദ്ധത്തിൽ സ്വകാര്യത ഇടിവുകൾ തടയാൻ അവലോകനം |
നിങ്ങൾ ഉപയോഗിക്കുന്ന സമയത്ത് നിങ്ങളുടെ ഡാറ്റ പരിരക്ഷിക്കുന്നതിൽ പുറമേ, അനൌപചാരികവും റിസ്ക് പ്രത്യേകിച്ച് പ്രധാനപ്പെട്ട എവിടെ ഗവേഷണ പ്രക്രിയയിൽ ഒരു പടി ഗവേഷകർ ഡാറ്റ പങ്കിടുന്നത് ആണ്. ശാസ്ത്രജ്ഞർ ഡാറ്റ പങ്കിടൽ ശാസ്ത്ര ഒരു കോർ മൂല്യം, അത് അത്യന്തം സൗകര്യങ്ങളും അറിവിന്റെ പുരോഗതി. ഇവിടെ യുകെ ഹൗസ് കോമൺസിലെ ഡാറ്റ പങ്കിടൽ പ്രാധാന്യം വിവരിച്ച രീതി:
ഗവേഷകർക്കും, പുനർനിർമ്മാണം സ്ഥിരീകരിച്ച് സാഹിത്യത്തിലും റിപ്പോർട്ടുചെയ്തിരിക്കുന്ന ഫലങ്ങളിൽ പണിയാൻ എങ്കിൽ "ഡാറ്റ ആക്സസ്സുചെയ്യുക അത്യാവശ്യം ആണ്. അനുമാനം ശക്തമായ കാരണം മറ്റുതരത്തിൽ അവിടെ ഇല്ലെങ്കിൽ, ഡാറ്റ പൂർണ്ണമായി വെളിപ്പെടുത്തുകയും പൊതുവായി ലഭ്യമാക്കണം എന്നു വേണം ആയിരിക്കണം. എല്ലാ പരസ്യമായി സ്വരൂപിക്കുന്നത് ഗവേഷണം ബന്ധപ്പെട്ട സാധ്യത, ഡാറ്റ വ്യാപകമായി ഉണ്ടാക്കി സ്വതന്ത്രമായി ലഭ്യമാകാത്ത വേണം ഈ തത്ത്വം, വരിയിൽ ൽ. " (Molloy 2011)
എന്നാൽ, മറ്റൊരു ഗവേഷകൻ ഉപയോഗിച്ച് നിങ്ങളുടെ ഡാറ്റ പങ്കിടൽ വഴി, നിങ്ങൾ വിജ്ഞാനദായകവുമായ റിസ്ക് നിങ്ങളുടെ പങ്കാളികൾ വർദ്ധനവിനെക്കുറിച്ച് ചെയ്തേക്കാം. അങ്ങനെ അത് അവരുടെ പങ്ക് ആഗ്രഹിക്കുന്ന ഡാറ്റ-അല്ലെങ്കിൽ അവരുടെ പങ്കിടാൻ ആവശ്യമാണ് ആർ ഗവേഷകർ ഒരു അടിസ്ഥാനപരമായ പിരിമുറുക്കം നേരിടുന്ന ഡാറ്റ-എന്ന് തോന്നിയേക്കാം. ഒരു വശത്ത് അവർ മറ്റ് ശാസ്ത്രജ്ഞർ അവരുടെ ഡാറ്റ പങ്കിടാൻ ഒരു നൈതിക കടപ്പാടുണ്ട് യഥാർത്ഥ ഗവേഷണ പരസ്യമായി നടന്നുപോകുന്നു പ്രത്യേകിച്ചും. അതേ സമയം, ഗവേഷകർ കുറയ്ക്കുന്നതിന് നൈതിക കടപ്പാടാണ്, അത്രയും കഴിയുന്നത്ര അവരുടെ പങ്കെടുക്കുന്നവർക്ക് വിവരങ്ങൾ സാദ്ധ്യതയും.
ഭാഗ്യവശാൽ, ഈ ധർമ്മസങ്കടം അത് പ്രത്യക്ഷപ്പെടുമ്പോൾ പോലെ കഠിനമായ അല്ല. ഇത് എവിടെ ഡാറ്റ "അജ്ഞാതമാക്കുന്നതിന്" ഒപ്പം (ചിത്രം 6.6) ആക്സസ് ആർക്കും പോസ്റ്റുചെയ്തു, റിലീസ് മറക്കാനുള്ള യാതൊരു ഡാറ്റ പങ്കിടൽ നിന്ന് ഒരു continuum സഹിതം ഡാറ്റ പങ്കിടൽ ചിന്തിക്കുന്നത് പ്രധാനമാണ്. ഈ അങ്ങേയറ്റത്തെ സ്ഥാനങ്ങൾ രണ്ടും അപകട പ്രയോജനങ്ങളെടുക്കാം. അതാണ് അത് സ്വയം നിങ്ങളുടെ ഡാറ്റ പങ്കുവയ്ക്കാതിരിക്കാൻ ഏറ്റവും നൈതിക കാര്യം അല്ല; ഇത്തരമൊരു സമീപനത്തിൽ സമൂഹത്തിൽ നിരവധി സാധ്യതകൾ ആനുകൂല്യങ്ങൾ ഇല്ലാതാക്കുന്നു. , രുചി സമനിലകൾ, സമയം, നേരത്തെ അധ്യായം ചർച്ച ഒരു ഉദാഹരണം റിട്ടേണിങ് സാധ്യത അപ്രകാരം മാത്രം ശ്രദ്ധ സാധ്യതയുണ്ട് ആനുകൂല്യങ്ങൾ അവഗണിക്കാൻ ഡാറ്റ റിലീസ് വാദഗതികൾ അമിതമായി ഏകപക്ഷീയമായ ആകുന്നു; ഞാൻ അനിശ്ചിതത്വം (വിഭാഗം 6.6.4) നേരിട്ടുകൊണ്ട് തീരുമാനങ്ങൾ കുറിച്ച് ഉപദേശവും വാഗ്ദാനം സമയത്ത് ഞാൻ പ്രശ്നങ്ങളും ഏകപക്ഷീയമായ, അമിതമായി സംരക്ഷക സമീപനം കൂടുതൽ വിശദമായി താഴെ വിവരിക്കുക കാണാം.
കൂടുതൽ, ഈ രണ്ടു നൽകാവൂ തമ്മിലുള്ള ഞാൻ എവിടെ ഡാറ്റ നിശ്ചിത മാനദണ്ഡങ്ങൾ സംഗമം ചില നിയമങ്ങൾ (ഉദാ, ഒരു IRB ഒരു ഡാറ്റ പ്രൊട്ടക്ഷൻ പ്ലാനുകൾ നിന്ന് അദ്ധ്യക്ഷസ്ഥാനം) ബാധ്യസ്ഥരാണെന്നും സമ്മതിക്കുന്നു ആർ ആളുകളുമായി പങ്കിട്ട ആണ് മതിലുള്ള തോട്ടം സമീപനം വിളിച്ചു കാണാം എന്താണ് . ഈ ഉറപ്പുള്ള തോട്ടം സമീപനം റിലീസ് ആനുകൂല്യങ്ങൾ പല നൽകുന്നു കുറവ് സാധ്യത മറക്കരുത്. ഗതി, മതിലുള്ള തോട്ടം സമീപനം പല ചോദ്യങ്ങളും-ആർ ആക്സസ് ഉണ്ടായിരിക്കണം, എത്രത്തോളം എന്തു അവസ്ഥ കീഴിൽ, നിലനിർത്തുക, പോലീസ് ഉറപ്പുള്ള തോട്ടത്തിൽ നല്കണം ആർ തുടങ്ങിയവ-എന്നാൽ ഈ കഴിയാത്ത അല്ല സൃഷ്ടിക്കുന്നു. വാസ്തവത്തിൽ, ഗവേഷകർ പോലുള്ള രാഷ്ട്രീയ സാമൂഹ്യ റിസർച്ച് ഇന്റർ യൂണിവേഴ്സിറ്റി കൺസോർഷ്യം മിഷിഗൺ സർവകലാശാലയിലെ ഡാറ്റ ആർക്കൈവ് ഇപ്പോൾ ഉപയോഗിക്കാൻ കഴിയുന്ന സ്ഥലത്തു ഇതിനകം പ്രവർത്തിക്കുന്നു ഉറപ്പുള്ള സ്വർഗത്തോപ്പുകളുണ്ട്.
അതിനാൽ, നിന്റെ പഠനത്തിൽ നിന്നും ഡാറ്റ യാതൊരു പങ്കിടൽ continuum ന് ആയിരിക്കും ഉറപ്പുള്ള തോട്ടം, റിലീസ് മറക്കുക എന്തുകൊണ്ട്? നിങ്ങളുടെ ഡാറ്റ വിശദാംശങ്ങൾ ആശ്രയിക്കുന്നില്ല; ഗവേഷകർ പേഴ്സൺസ് ആദരവു സന്തുലനവും വേണം, Beneficence, നീതി, നിയമം പൊതു പലിശ ബഹുമാനം. മറ്റു തീരുമാനങ്ങൾ ഉചിതമായ ബാലൻസ് വിലയിരുത്തുമ്പോൾ ഗവേഷകർ IRBs ഉപദേശം അംഗീകാരവും അന്വേഷിക്കും, ഡാറ്റ റിലീസ് ആ പ്രക്രിയയുടെ മറ്റൊരു ഭാഗമാകാൻ കഴിയും. മറ്റു വാക്കുകളിൽ, ചില ആളുകൾ ഇടമില്ലാത്തിടത്ത് നൈതിക morass ഡാറ്റ റിലീസ് തോന്നിയേക്കാമെങ്കിലും, ഞങ്ങൾ ഇതിനകം ഗവേഷകർ നൈതിക dilemmas ഈ തരത്തിലുള്ള balance സഹായിക്കുന്നതിന് സ്ഥലത്തു വ്യവസ്ഥയാണ്.
ഡാറ്റ പങ്കിടൽ ചിന്തിക്കാൻ ഒരു ഫൈനൽ വഴി താരതമ്യപ്പെടുത്തുന്നതാണു് എന്നതാണ്. എല്ലാ വർഷവും കാറുകൾ മരണങ്ങൾ ആയിരക്കണക്കിന് ഉത്തരവാദി, പക്ഷെ ഞങ്ങൾ ഡ്രൈവിംഗ് നിരോധിക്കാൻ ശ്രമിക്കരുത്. വാസ്തവത്തിൽ, കാരണം ഡ്രൈവിംഗ് പല അത്ഭുതമായി പ്രാപ്തമാക്കുന്നു ഡ്രൈവിംഗ് നിരോധനം അത്തരം ഒരു കോൾ അസംബന്ധം തന്നെ. മറിച്ച് സമൂഹത്തിലെ വാഹനമോടിക്കാൻ ആർക്കൊക്കെ നിയന്ത്രണങ്ങൾ (ഉദാ, ചില പരിശോധനകൾ കടന്നു ലഭിക്കേണ്ട ഒരു നിശ്ചിത പ്രായം ആവശ്യമുള്ളിടത്ത്) അവർ എങ്ങനെയാണ് (വേഗതാ പരിധി കീഴിൽ ഉദാ) ഡ്രൈവ് സ്ഥലങ്ങളിൽ. സൊസൈറ്റി ഈ നിയമങ്ങൾ നടപ്പിലാക്കുന്നതിനും കൊണ്ട് tasked ജനം (ഉദാ പോലീസ്) നാം അവരെ ലംഘിക്കുകയാണ് പിടിച്ചു ചെയ്യുന്ന ആളുകളെ ശിക്ഷിക്കാൻ. സമതുലിതമായ ഈ വിചാരം അതേ സമൂഹം ഡ്രൈവിംഗ് നിയന്ത്രിക്കുന്നതിൽ ബാധകമാകുന്ന പുറമേ ഡാറ്റ പങ്കിടൽ പ്രയോഗിക്കാൻ കഴിയും. താല്പര്യം അല്ലെങ്കിൽ നേരെ ഡാറ്റ പങ്കിടൽ absolutist വാദങ്ങൾ പൗരനല്ലാത്ത ഞാൻ വലിയ ആനുകൂല്യങ്ങൾ ഞങ്ങൾ കൂടുതൽ സുരക്ഷിതമായി കൂടുതൽ ഡാറ്റ പങ്കിടാൻ എങ്ങനെ നിർണയിക്കുന്നത് മുതൽ വരും കരുതുന്നു ആണ്.
എത്തിച്ചേരരുത്, അനൌപചാരികവും റിസ്ക് നാടകീയമായി വർദ്ധിച്ചിരിക്കുന്നു; പ്രവചിക്കാനാവില്ല ചെയ്ത് വഴികൂടിയായിരുന്നു വളരെ ബുദ്ധിമുട്ടാണ്. അതുകൊണ്ട്, എല്ലാ ഡാറ്റയും സാധ്യതയുള്ള തിരിച്ചറിയാവുന്ന തീർത്തും സെൻസിറ്റീവ് ആണ് കരുതാവുന്നതാണ് നല്ലത്. ഗവേഷണം ചെയ്യുമ്പോൾ വിജ്ഞാനദായകവുമായ സാധ്യത കുറയ്ക്കുകയും, ഗവേഷകർ സൃഷ്ടിക്കാനും പിന്തുടരാൻ കഴിയും ഒരു ഡാറ്റ പരിരക്ഷ പ്ലാൻ. എന്നുതന്നെയല്ല, വിജ്ഞാനദായകവുമായ റിസ്ക് മറ്റ് ശാസ്ത്രജ്ഞർ ഡാറ്റ പങ്കിടുന്നത് ഗവേഷകർ തടയില്ല.