සමාගම් හා ආන්ඩු විසින් පවත්වන දත්ත පර්යේෂකයන්ට ප්රවේශ වීමට අපහසුය.
2014 මැයි මාසයේදී, එක්සත් ජනපද ජාතික ආරක්ෂක ඒජන්සියේ ග්රාමීය යුටාහි දත්ත මධ්යස්ථානයක් ආරම්භ කරන ලද බුද්ධි ප්රජාව පිළිබඳ පුළුල් තොරතුරු ජාතික Cybersecurity ආරම්භක දත්ත කේන්ද්රය සමඟ අත්වැල් බැඳගෙන ඇත. කෙසේ වෙතත්, උතා දත්ත මධ්යස්ථානය ලෙස හඳුන්වන මෙම දත්ත මධ්යස්ථානය, විශ්මයජනක හැකියාවන් ඇති බවට වාර්තා වී ඇත. එක් වාර්තාවක සඳහන් වන්නේ "සියලු විද්යුත් සන්නිවේදනයන්, ජංගම දුරකථන ඇමතුම් සහ ගූගල් සෙවීම් වැනි සියලු ආකාරයේ සන්නිවේදනයන් ගබඩා කර සකසනු ලබන අතර, සියලු ආකාරයේ පෞද්ගලික දත්ත මංසලකින් - වාහන නැවැත්වීම්, ගමන් ගමන් මාර්ග, පොත් සාප්පු මිලදී ගැනීම් , සහ අනෙකුත් ඩිජිටල් 'පොකට් ස්ට්රටට්' " (Bamford 2012) . මහා දත්ත වල ග්රහණය කරගත් තොරතුරු බොහෝ සංවේදී ස්වභාවය පිලිබඳව උත්සුකතාවන්ට අමතරව, පහත දැක්වෙන විස්තර පහත දැක්වෙන අතර, උතා දත්ත මධ්යස්ථානය යනු පර්යේෂකයන්ට උපකාරී නොවන පොහොසත් දත්ත මූලාශ්රයක අතිශය නිදසුනකි. පොදුවේ බොහෝ ප්රයෝජනවත් වන දත්ත විශාල මූලාශ්ර ආණ්ඩු මගින් පාලනය කරනු ලැබේ. (උදා: බදු දත්ත සහ අධ්යාපන දත්ත) හෝ සමාගම් (උදා. සෙවීම් ඇන්ජින් සහ දුරකථන ඇමතුම් meta-දත්ත සඳහා විමසුම්). එමනිසා, මෙම දත්ත මූලාශ්රයන් පැවතියද, ඒවා සමාජ විද්යාත්මක පර්යේෂණයන් සඳහා නිෂ්ඵල ය.
මගේ අත්දැකීම් අනුව, විශ්ව විද්යාලවල සිටින බොහෝ පර්යේෂකයන් මෙම අසමසමතාවයේ ප්රභවය වැරදියට වටහාගෙන ඇත. සමාගම්වල සහ ආණ්ඩුවල සිටින අය මෝඩ, කම්මැලි හෝ නොසැලකිලිමත් වන නිසා මෙම දත්ත අපොහොසත් වේ. ඒ වෙනුවට, දත්ත ප්රවේශය වැළැක්වීම සඳහා බරපතල නීතිමය, ව්යාපාර සහ සදාචාර බාධක තිබේ. නිදසුනක් ලෙස, වෙබ් අඩවි සඳහා සමහර සේවා ගිවිසුම් සමහර විට සේවකයින් විසින් දත්ත භාවිතා කිරීමට හෝ සේවාව වැඩි දියුණු කිරීමට ඉඩ ලබා දේ. එබැවින් ඇතැම් දත්ත හුවමාරු ක්රම මගින් පාරිභෝගිකයින්ගෙන් නීත්යානුකූල නඩු පැවරීම මගින් සමාගම් හෙළිදරව් කළ හැකිය. දත්ත බෙදා හදා ගැනීමේ සමාගම් වලට සැලකිය යුතු ව්යාපාර අවදානමක් ඇත. විශ්වවිද්යාල පර්යේෂණ කටයුතුවල කොටසක් ලෙස ගූගල් වෙතින් පුද්ගලික සෙවුම් දත්ත අහම්බෙන් පිටවී ගියහොත් ජනතාවට ප්රතිචාර දක්වන ආකාරය සිතා බලන්න. එවැනි දත්ත උල්ලංඝනය කිරීමක් නම්, සමාගමට අවදානම් සහිත අවදානම පවා විය හැකිය. එබැවින් ගූගල් සහ බොහෝ විශාල සමාගම් පර්යේෂකයන් සමඟ දත්ත හුවමාරු කර ගැනීමේ අවදානමක් ඇත.
ඇත්ත වශයෙන්ම, විශාල ප්රමාණයේ දත්ත ප්රවේශය ලබා ගත හැකි ඕනෑම කෙනෙකුට ඇබ්ඩර් චෞද්රිගේ කතාව දන්නා කරුණකි. 2006 දී ඔහු AOL හි පර්යේෂණ කළමණාකරු ලෙස කටයුතු කළ විට, ඔහු AOL භාවිතා කරන්නන් 650,000 න් නිර්නාමිකිත සෙවුම් විමසුම් ලෙස සිතුවේ කුමක් ද යන්න ගැන පර්යේෂණ ප්රජාව වෙත අදහස් ප්රකාශ කරන ලදී. මට කියන්න පුළුවන් තරම්, AOL හි චෞද්රි සහ AOL පර්යේෂකයන්ට හොඳ චේතනාවක් තිබුනේ, ඔවුන් දත්තයන් නිර්වචනය කළ බව සිතූහ. නමුත් ඔවුන් වැරදියි. පර්යේෂකයන් සිතූ පරිදි මෙම දත්ත නිර්නාමික ලෙස සොයා ගන්නා ලද අතර නිව් යෝර්ක් ටයිම්ස් පුවත්පතේ වාර්තාකරුවන්ට දත්ත සමුදාය තුළ කෙනෙකු හඳුනා ගැනීමට හැකි විය. (Barbaro and Zeller 2006) . මෙම ගැටළු සොයාගත් පසු චෝල්ඩ්රි AOL ගේ වෙබ් අඩවියෙන් දත්ත ඉවත් කළ නමුත් එය ප්රමාද විය. මෙම වෙබ් අඩවි වෙනත් වෙබ් අඩවිවල නැවත නැවතත් ප්රකාශයට පත් කර ඇති අතර, ඔබ මෙම පොත කියවන විට තවමත් එය ලබාගත හැකිය. චොව්ධුරේ වෙඩි තැබූ අතර AOL සමාගමේ ප්රධාන තාක්ෂණික නිලධාරියා ඉල්ලා අස් විය. (Hafner 2006) . මෙම උදාහරණ පෙන්වා දෙන පරිදි, දත්ත ප්රවේශ පහසුකරණය සඳහා සමාගම් ඇතුළුව නිශ්චිත පුද්ගලයන් සඳහා ප්රතිලාභ ලස්සන වන අතර නරකම සිද්ධිය භයානක ය.
කෙසේවෙතත්, පර්යේෂකයන්ට සාමාන්යයෙන් පොදු ජනතාව වෙත ප්රවේශය නැති දත්ත වලට ප්රවේශය ලබා ගත හැකිය. පර්යේෂකයන්ට පිවිසීමට අයදුම් කළ හැකි ක්රියාමාර්ග සමහර රජයන්ට තිබේ. තවද මෙම පරිච්ඡේදයේ පසුව ඇති නිදසුන් මඟින් පර්යේෂකයන්ට ඇතැම් අවස්ථාවලදී සංගත දත්ත වෙත ප්රවේශය ලබා ගත හැකිය. උදාහරණයක් ලෙස, Einav et al. (2015) සමඟ අමුත්තන් වෙන්දේසි අධ්යනය කිරීම සඳහා ඊබී පර්යේෂකයෙකු සමඟ හවුල් විය. මෙම සහයෝගිතාවයෙන් පසුව මෙම පර්යේෂණයෙන් පසුව සිදු කරන ලද පර්යේෂණයන් ගැන වැඩි විස්තර මම සාකච්ඡා කරමි. නමුත් එය දැන් සාර්ථක ලෙස හවුල්කාරිත්වයන් තුළ මා දකින අමුද්රව්ය හතරක් තිබීම නිසා මම එය සඳහන් කරමි. පර්යේෂකයින්ගේ උනන්දුව, පර්යේෂක හැකියාවන්, සමාගම් උනන්දුව සහ සමාගම් හැකියාවන් . පර්යේෂකයෙක් හෝ හවුල්කරුවෙකු හෝ සමාගමක් හෝ ආණ්ඩුවක් විය හැකි බැවින් මෙම අමුද්රව්යවලින් එකක්වත් නොතිබීම නිසා බොහෝ විභව සහයෝගයන් අසමත් වී තිබේ.
කෙසේ වෙතත්, ව්යාපාරයක් සමඟ හවුල් ව්යාපාරයක් හෝ රජයේ සීමා කළ දත්ත වලට ප්රවේශ වීමට ඔබට හැකි වුවද, ඔබ සඳහා අඩුපාඩු තිබේ. පළමුව, වෙනත් පර්යේෂකයන් සමඟ ඔබේ දත්ත හුවමාරු කර ගැනීමට ඔබට නොහැකි වනු ඇත. එයින් අදහස් කරන්නේ වෙනත් පර්යේෂකයන්ට ඔබගේ ප්රතිඵල සත්යාපනය කිරීමට සහ ඒවායේ ප්රතිඵල තවදුරටත් පුළුල් කිරීමට නොහැකි බවයි. දෙවනුව, ඔබගෙන් ඉල්ලා සිටින ප්රශ්න සීමිත විය හැකිය. සමාගම් නරක පෙනුමක් ඇති කළ හැකි පර්යේෂණයන්ට ඉඩ නොදෙනු ඇත. අන්තිමේ දී, මෙම හවුල්කාරිත්වයන් අවම වශයෙන් ගැටුම්කාරී ගැටුමක් ඇතිවීමට ඉඩ ඇති අතර, ඔබේ ප්රතිඵල ඔබේ හවුල්කාරිත්වයට බලපෑම් ඇති බව මිනිසුන් සිතනු ඇත. මෙම අඩුපාඩු සියල්ලම ආමන්ත්රණය කළ හැකි වුවද, සෑම කෙනෙකුට ම ප්රවේශ විය නොහැකි දත්ත සමඟ වැඩ කිරීමෙන් පසුබස සහ අඩුපාඩු ඇති බව පැහැදිලිය.
සාරාංශයක් වශයෙන්, විශාල දත්ත විශාල ප්රමාණයක් පර්යේෂකයන්ට සොයාගත නොහැකි ය. දත්ත ප්රවේශය වැළැක්වීම සඳහා බරපතල නෛතික, ව්යාපාර සහ ආචාරධාර්මික බාධක තිබේ. තාක්ෂණික බාධක නොලැබීම නිසා මෙම බාධක තාක්ෂණික දියුණුවීම අඩුවේ. සමහර ජාතික ආන්ඩු දත්ත සමුදායන් සඳහා දත්ත ප්රවේශය ලබා දීම සඳහා ක්රමවේදයක් සකස් කර ඇති නමුත්, මෙම ක්රියාවලිය විශේෂයෙන් ප්රාන්ත සහ ප්රාදේශීය මට්ටම්වල විශේෂයෙන් විශේෂිත වේ. එසේම සමහර අවස්ථාවලදී, පර්යේෂකයින්ට දත්ත ප්රවේශ ලබා ගැනීමට සමාගම් සමඟ හවුල් විය හැකි නමුත්, මෙය පර්යේෂකයන් හා සමාගම් සඳහා විවිධ ගැටළු නිර්මාණය කළ හැකිය.