සමාගම් සහ ආණ්ඩු ඇති බව සමහර විස්තර සංවේදී ය.
සෞඛ්ය රක්ෂණ සමාගම් තම පාරිභෝගිකයන් විසින් ලැබෙන වෛද්ය ප්රතිකාර පිළිබඳව සවිස්තරාත්මක තොරතුරු ඇත. සෞඛ්යය පිළිබඳ වැදගත් පර්යේෂණයන් සඳහා මෙම තොරතුරු භාවිතා කළ හැකි වුවද එය මහජනතාව බවට පත් වුව හොත්, එය චිත්තවේගීය හානි (උදාහරනය, අපහසුතාවයන්) හෝ ආර්ථික හානියකට හේතු විය හැක (උදාහරණ වශයෙන් රැකියා අහිමිවීම). වෙනත් බොහෝ විශාල දත්ත මූලාශ්රද සංවේදී තොරතුරු ඇති අතර, ඒවා බොහෝ විට අමාරු වීමට හේතුවකි.
අවාසනාවකට මෙන්, එය Netflix ත්යාගය මගින් නිදසුන් ලෙස නිරූපනය කරන ලද තොරතුරු සැබැවින්ම සංවේදී (Ohm 2015) තීරණය කිරීමට ඉතා රළු විය. 2006 වසරේ පස්වන පරිච්ඡේදයේදී මම විස්තර කරන පරිදි Netflix විසින් මිලියන 500 ක සාමාජික සංඛ්යාවක් ලබා දුන් අතර චිත්රපටය නිර්දේශ කිරීම සඳහා නෙට්ෆ්රික්ස්ගේ හැකියාව වැඩි දියුණු කළ හැකි ඇල්ගොරිතමයන් ලොව පුරා සිටින ජනයා ඉදිරිපත් කරන ලදි. දත්ත මුදා හැරීමට පෙර, Netflix නාමයන් වැනි පැහැදිලි පෞද්ගලිකත්ව හඳුනාගැනීමේ තොරතුරු ඉවත් කරන ලදී. නමුත් දත්ත නිකුත් වූ සති දෙකකට පසුව ආර්වින් නාරායනන් සහ විතානයි ශිමිටොව් (2008) පෙන්නුම් කළේ, විශේෂිත පුද්ගලයින්ගේ චිත්රපට ශ්රේණිගත කිරීම් පිළිබද දැන ගැනීමට හැකි වන පරිදි, 6 වන පරිච්ඡේදයෙහි ඔබට පෙන්වනු ඇති බවය. ප්රහාරකයාට සොයා ගත හැකි වුවද පුද්ගලයාගේ චිත්රපට ශ්රේණිගත කිරීම් තවමත් මෙහි කිසිම සංවේදීතාවයක් නොමැත. පොදුවේ සත්ය විය හැකි වුවත්, දත්ත සමුදාය තුළ සිටින පුද්ගලයින්ගෙන් අවම වශයෙන් 500,000 ක් පමණ දෙනා සඳහා චිත්රපට වර්ගීකරණයන් සංවේදී විය. ඇත්ත වශයෙන්ම, දත්ත නිකුත් කිරීම සහ නැවත හඳුනා ගැනීමෙන් ප්රතිචාර දක්වන ලද, වංශික කාන්තාවක් වන නෙට්ෆික්ස් එරෙහිව පංති ක්රියාමාර්ගයක් අනුගමනය කරන ලදි. මෙම නඩුවේ ගැටලුව ප්රකාශයට පත් කර ඇත්තේ කෙසේද? (Singel 2009) :
"[M] මෙම සහ ශ්රේණිගත කිරීමේ දත්ත අඩංගු ... අතිශය පුද්ගලික හා සංවේදී ස්වභාවය. සාමාජිකයාගේ සිනමා දත්ත මගින් Netflix සාමාජිකයාගේ පෞද්ගලික උනන්දුව සහ / හෝ අරගල විවිධ ලිංගිකත්වය, මානසික රෝග, මත්පැන් පානය නැවත යථා තත්ත්වයට පත් කිරීම සහ ව්යසනකාරිත්වය, ශාරීරික අපචාර, ගෘහස්ථ ප්රචණ්ඩත්වය, කාමමිථ්යාචාරය සහ දූෂණය ඇතුළු විවිධ පෞද්ගලික ගැටලු සමඟ නිරාවරණය කරයි. "
මෙම උදාහරණවලින් පෙනී යන්නේ සමහර අය සිතන්නේ අසම්පූර්ණ දත්ත සමුදායක් ලෙස පෙනෙන දේ තුළ සංවේදී බවක් ඇති බවය. තවද, සංවේදී දත්ත ආරක්ෂා කිරීම සඳහා පර්යේෂකයන් යොදා ගන්නා ප්රධාන ආරක්ෂක රැකවරණ පරාසයන් හඳුනා ගැනීමට නොහැකි වීම පුදුම සහගත ක්රමවලින් අසමත් විය හැකිය. මෙම අදහස් දෙක 6 වන පරිච්ඡේදයේ වඩාත් විස්තරාත්මකව සකස් කර ඇත.
සංවේදී දත්ත පිළිබඳ මතක තබා ගැනීමට අවසාන කාරණය වන්නේ, ජනතාවගේ අනුමැතිය නොමැතිව එය රැස් කිරීම සදාචාරමය ප්රශ්න මතු කරයි. විශේෂිත හානියක් සිදු නොවුනත්. තම කැමැත්තෙන් තොරව වැසිකිළියක් බලා සිටින අයෙකු දෙස බලන විට, එම පුද්ගලයාගේ පෞද්ගලිකත්වය උල්ලංඝනය කිරීම, සංවේදී තොරතුරු රැස් කිරීම, සහ සංවේදී දේ තීරණය කිරීම කොතරම් අසීරු දැ යි මතකයට නංවන්නට හැකිය. 6 වෙනි පරිච්ඡේදයේ පෞද්ගලිකත්වයේ ගැටලු ගැන නැවත නැවතත් කතා කරමි.
අවසාන වශයෙන්, රජයේ හා ව්යාපාර පරිපාලන වාර්තා වැනි විශාල දත්ත මූලාශ්ර සමාජ පර්යේෂණ සඳහා අරමුණු නොකෙරේ. වර්තමානයේ විශාල දත්ත මූලාශ්ර හෙවත් හෙට හෙවත් ලක්ෂණ 10 ක් ඇත. බොහෝ විට, පර්යේෂණ සඳහා හොඳ යැයි සිතිය හැකි බොහෝ දේ, ඩිජිටල් යුගයේ සමාගම්වල සහ විශාල වශයෙන්, සෑම විටම සහ විරූපී නොවන බව පෙනේ. මීට කලින් කල නොහැකි තරම් පරිමාණයෙන් දත්ත රැස්කිරීමට රජයන්ට හැකි වී තිබේ. පර්යේෂණ සඳහා නුසුදුසු, අසමසම නොවන, නොවිසඳුනු, පාවෙන, ඇල්ගොරිතම වශයෙන් ව්යාකූල වූ, අපහසු, අපිරිසිදු හා සංවේදී වූ පර්යේෂණ සඳහා නරක ලෙස සලකනු ලබන බොහෝ දේවලින් පර්යේෂකයන් පර්යේෂකයන් විසින් මෙම දත්ත එකතු නොකළේය. මෙතෙක් මම රජයේ සහ ව්යාපාරික දත්ත ගැන කතා කරමි. නමුත් දෙදෙනා අතර යම් වෙනස්කම් තිබේ. මගේ අත්දැකීම්වලදී, රජයේ දත්ත අඩු නොඅඟවන, අඩු ඇල්ගොරිතම වශයෙන් ව්යාකූල හා අඩු පිහිනුම් වේ. අනෙක් අතට, ව්යාපාරික පරිපාලන වාර්තා නිතරම වැඩි විය යුතුය. මෙම දත්තයන් 10 අවබෝධ කර ගැනීම විශාල දත්ත මූලාශ්ර වලින් ඉගෙන ගැනීම සඳහා ප්රයෝජනවත් පළමු පියවරකි. දැන් අපි මෙම දත්ත සමඟ භාවිතා කළ හැකි පර්යේෂණ ක්රමෝපායන් වෙත හැරෙමු.