കമ്പനികളും സർക്കാരുകൾ ഉണ്ടെന്ന് ചില വിവരങ്ങൾ സെൻസിറ്റീവ് ആണ്.
ആരോഗ്യ ഇൻഷ്വറൻസ് കമ്പനികൾ അവരുടെ ഉപഭോക്താക്കൾക്ക് ലഭിച്ച ചികിത്സ വിശദമായ വിവരങ്ങൾ ഉണ്ട്. ഈ വിവരം ആരോഗ്യം പ്രധാനപ്പെട്ട ഗവേഷണ ഉപയോഗിക്കാൻ കഴിഞ്ഞില്ല, എന്നാൽ അത് എല്ലാവർക്കും മാറി എങ്കിൽ ഇത് തീർത്തും വൈകാരിക ദോഷം (ഉദാ, ജാള്യതയും) സാമ്പത്തിക ദോഷം (ഉദാ, തൊഴിൽ നഷ്ടം) നയിച്ചേക്കാം. ഫാർ വ്യതിരിക്ത നിന്ന്, പല വലിയ ഡാറ്റ ഉറവിടങ്ങളിൽ സെൻസിറ്റീവ് ആണ് വിവരങ്ങൾ ഞങ്ങൾക്കുണ്ട്. ഈ വിവരങ്ങളുടെ സെൻസിറ്റീവ് സ്വഭാവം വലിയ ഡാറ്റ ഉറവിടങ്ങളിൽ പലപ്പോഴും (മുകളിൽ വിശദീകരിച്ചിട്ടുണ്ട്) നല്കുമെന്നും ആകുന്നു എന്നു കാരണം ഭാഗമാണ്.
ഗവേഷകർ ഈ സാഹചര്യം കൈകാര്യം ചെയ്യാൻ ഒരു വഴി ഡീ-തിരിച്ചറിയാൻ സെൻസിറ്റീവ് വിവരങ്ങളും ഡാറ്റാസെറ്റുകള്ക്കു ആണ്. എന്നാൽ, ഞാൻ വിശദമായി അദ്ധ്യായം 6 (എത്തിക്സ്) ഗുരുതരമായി വ്യാപകമായി സാമൂഹിക ശാസ്ത്രജ്ഞന്മാർ ഡാറ്റ ശാസ്ത്രജ്ഞർ ഇരുവരും ഉയരാനിടയാക്കിയത് അല്ല എന്നു വഴികളിൽ പരിമിതപ്പെടുത്തിയിരിക്കുന്നു ഈ സമീപനം കാണിക്കും.
സമാപന ഇന്നത്തെ ബിഗ് ഡാറ്റ ഉറവിടങ്ങളിൽ (നാളെയും) പൊതുവിൽ പത്തു വിശേഷലക്ഷണങളുണ്ട്. നല്ല ഉള്ള-ബിഗ് പലരും എപ്പോഴും, ഡിജിറ്റൽ പ്രായ കമ്പനികളും സർക്കാരുകളിൽ വസ്തുത nonreactive-വരുന്നു മുമ്പ് സാധ്യമല്ലെന്ന് ഒരു സ്കെയിലിൽ ഡാറ്റ ശേഖരിക്കാൻ കഴിയും ആകുന്നു. പിന്നെ, മോശം ഉള്ള-പൂർത്തിയായിട്ടില്ല, നല്കുമെന്നും, നോൺ-പ്രതിനിധി പലരും ളിനിയുള്ള, അൽഗൊരിത അമ്പരന്നു നല്കുമെന്നും, വൃത്തികെട്ട, ഡാറ്റ ഗവേഷകർ വേണ്ടി ഗവേഷകർ വാങ്ങാത്ത വസ്തുത നിന്ന് സെൻസിറ്റീവ്-വരുന്നു. ഇതിൻറെ മനസിലാക്കുന്നു ബിഗ് ഡാറ്റ നിന്ന് പഠന ഒരു ആവശ്യമായ ആദ്യത്തെ പടി ആകുന്നു. പിന്നെ, ഇപ്പോൾ നാം ഈ ഡാറ്റ ഉപയോഗിച്ച് ഉപയോഗിക്കാൻ കഴിയും തന്ത്രങ്ങൾ ഗവേഷണം തിരിയുന്നു.