ទិន្នន័យដែលបានប្រារព្ធធ្វើឡើងដោយក្រុមហ៊ុនអាជីវកម្មនិងរដ្ឋាភិបាលមានការលំបាកសម្រាប់អ្នកស្រាវជ្រាវដើម្បីចូលដំណើរការ។
នៅខែឧសភាឆ្នាំ 2014 របៀបវារៈសន្ដិសុខជាតិរបស់អាមេរិកបានបើកមជ្ឈមណ្ឌលទិន្នន័យមួយនៅជនបទក្នុងរដ្ឋយូថាហ៍ដែលមានឈ្មោះឆ្គងនេះមជ្ឈមណ្ឌលទិន្នន័យសុវត្ថិភាពជាតិផ្តួចផ្តើមស៊ើបការណ៍សម្ងាត់សហគមន៍ទូលំទូលាយ។ ទោះជាយ៉ាងណា, កណ្តាលទិន្នន័យនេះដែលបានមកត្រូវបានគេស្គាល់ថាជាមជ្ឈមណ្ឌលទិន្នន័យរដ្ឋយូថាហ៍ត្រូវបានរាយការណ៍ថាមានសមត្ថភាពបរិបូរ។ របាយការណ៍មួយបានចោទប្រកាន់ថាមជ្ឈមណ្ឌលទិន្នន័យរដ្ឋយូថាហ៍គឺអាចរក្សាទុកនិងដំណើរការគ្រប់ទម្រង់ទាំងអស់នៃការទំនាក់ទំនងរួមមាន "មាតិកាពេញលេញនៃអ៊ីម៉ែលឯកជន, ការហៅទូរស័ព្ទដៃនិងការស្វែងរករបស់ Google ព្រមទាំងប្រភេទទាំងអស់នៃទិន្នន័យផ្ទាល់ខ្លួនវិក័យប័ត្រពីក្រោយ-កន្លែងចតរថយន្ត, ផ្លូវធ្វើដំណើរ ទិញហាងលក់សៀវភៅនិងឌីជីថលផ្សេងទៀតហោប៉ៅ: សំរាម» (Bamford 2012) ។ លើសពីនេះទៀតមានការព្រួយបារម្ភអំពីការចិញ្ចឹមរសើបនៃធម្មជាតិច្រើនពត័មានដែលបានចាប់យកនៅក្នុងទិន្នន័យធំមួយដែលនឹងត្រូវបានរៀបរាប់បន្ថែមទៀតដូចខាងក្រោមនេះមជ្ឈមណ្ឌលទិន្នន័យរដ្ឋយូថាហ៍គឺជាគំរូមួយយ៉ាងខ្លាំងនៃប្រភពទិន្នន័យមួយដែលសម្បូរបែបនោះគឺជាការមិនអាចចូលដំណើរការដល់អ្នកស្រាវជ្រាវ។ ជាទូទៅ, ប្រភពជាច្រើននៃទិន្នន័យធំមួយដែលនឹងមានប្រយោជន៍ដល់អ្នកស្រាវជ្រាវត្រូវបានគ្រប់គ្រងនិងការដាក់កម្រិតដោយរដ្ឋាភិបាល (ឧទាហរណ៍ទិន្នន័យនិងទិន្នន័យអប់រំពន្ធ) និងក្រុមហ៊ុន (ឧទាហរណ៍, សំណួរដល់ម៉ាស៊ីនស្វែងរកនិងការហៅទូរស័ព្ទមេតាទិន្នន័យ) ។ ដូច្នេះទិន្នន័យទាំងនេះនឹងមិនអាចប្រើបានភ្លាមទៅកាន់ក្រុមអ្នកស្រាវជ្រាវនៅសាកលហើយភាគច្រើននឹងមិនអាចប្រើបាននៅក្នុងការស្រាវជ្រាវក្នុងរដ្ឋាភិបាលឬក្រុមហ៊ុន។
នៅក្នុងបទពិសោធរបស់ខ្ញុំ, ក្រុមអ្នកស្រាវជ្រាវសាកលវិទ្យាល័យជាច្រើនដែលមានមូលដ្ឋាននៅប្រភពនៃការមិនមានលទ្ធភាពយល់ច្រឡំនេះ។ ទិន្នន័យទាំងនេះគឺមិនអាចចូលដំណើរការបានដោយសារតែមនុស្សនៅក្នុងក្រុមហ៊ុននិងរដ្ឋាភិបាលគឺជាការឆោតល្ងង់, ខ្ជិលឬចេះយកចិត្ដទុកដាក់។ ផ្ទុយទៅវិញមានធ្ងន់ធ្ងរផ្នែកច្បាប់, បច្ចេកទេស, អាជីវកម្ម, និងឧបសគ្គវិជ្ជាជីវៈដែលការពារការចូលដំណើរការទិន្នន័យ។ ឧទាហរណ៍មួយចំនួនដែលកិច្ចព្រមព្រៀងលក្ខខណ្ឌនៃសេវាកម្មសម្រាប់វេបសាយត្រឹមតែអនុញ្ញាតឱ្យទិន្នន័យដែលត្រូវបានប្រើដោយបុគ្គលិកឬដើម្បីកែលម្អសេវាកម្ម។ ដូច្នេះទម្រង់ជាក់លាក់នៃការចែករំលែកទិន្នន័យដែលអាចធ្វើឱ្យក្រុមហ៊ុនធ្វើពាក្យបណ្តឹងស្របច្បាប់ពីអតិថិជន។ ក្រៅពីនេះមានហានិភ័យអាជីវកម្មច្រើនទៅឱ្យក្រុមហ៊ុនចូលរួមនៅក្នុងការចែករំលែកទិន្នន័យ។ សូមព្យាយាមដើម្បីស្រមៃមើលថាតើសាធារណជននឹងឆ្លើយតបប្រសិនបើទិន្នន័យស្រាវជ្រាវផ្ទាល់ខ្លួនលេចធ្លាយដោយចៃដន្យចេញពីក្រុមហ៊ុន Google ជាផ្នែកមួយនៃគម្រោងស្រាវជ្រាវសាកលវិទ្យាល័យ។ លួចទិន្នន័យបែបមួយប្រសិនបើខ្លាំង, ទោះបីជាអាចមានហានិភ័យសព្វសម្រាប់ក្រុមហ៊ុន។ ដូច្នេះក្រុមហ៊ុន Google និងធំបំផុតរបស់ក្រុមហ៊ុនគឺមានហានិភ័យ averse អំពីការចែករំលែកទិន្នន័យជាមួយក្រុមអ្នកស្រាវជ្រាវយ៉ាងខ្លាំង។
នៅក្នុងការពិត, មនុស្សគ្រប់គ្នាស្ទើរតែដែលមាននៅក្នុងទីតាំងមួយដើម្បីផ្តល់នូវការចូលដំណើរការទៅចំនួនទិន្នន័យធំដឹងពីរឿងរ៉ាវនៃ Abdur Chowdhury នេះ។ នៅឆ្នាំ 2006 ពេលដែលគាត់ជាប្រធានផ្នែកស្រាវជ្រាវចំណែកក្រុមហ៊ុន AOL ក្តាប់នោះលោកបានចេញផ្សាយចេតនាអ្វីដែលលោកគិតត្រូវបានគេអនាមិកសំណួរស្វែងរកពីអ្នកប្រើចំណែកក្រុមហ៊ុន AOL ក្តាប់ដល់សហគមន៍ស្រាវជ្រាវ 650.000 នេះ។ ដូចជានៅឆ្ងាយដូចជាខ្ញុំអាចប្រាប់បាន, Chowdhury ក្រុមអ្នកស្រាវជ្រាវនៅនិង AOL មានបំណងល្អហើយពួកគេបានគិតថាពួកគេបានអនាមិកទិន្នន័យ។ ប៉ុន្តែពួកគេខុស។ វាត្រូវបានគេរកឃើញយ៉ាងលឿនថាទិន្នន័យនេះត្រូវបានគេមិនមែនជាអនាមិកដែលជាអ្នកស្រាវជ្រាវបានគិតនិងរាយការណ៍ពីកាសែត New York Times ត្រូវបានគេអាចកំណត់ពីមនុស្សក្នុងសំណុំទិន្នន័យជាមួយភាពងាយស្រួល (Barbaro and Zeller Jr 2006) ។ ពេលដែលបញ្ហាទាំងនេះត្រូវបានរកឃើញ Chowdhury បានយកចេញពីគេហទំព័រចំណែកក្រុមហ៊ុន AOL ក្តាប់ទិន្នន័យរបស់នោះទេប៉ុន្តែវាជាការយឺតពេល។ ទិន្នន័យនេះត្រូវបានគេ reposted នៅលើគេហទំព័រផ្សេងទៀតហើយវានឹងប្រហែលជានៅតែអាចប្រើបាននៅពេលដែលអ្នកកំពុងអានសៀវភៅនេះ។ ដោយសារតែការព្យាយាមរបស់គាត់ដើម្បីចែករំលែកទិន្នន័យជាមួយសហគមន៍ការស្រាវជ្រាវនេះ Chowdhury ត្រូវបានគេបាញ់និងប្រធានផ្នែកបច្ចេកវិទ្យាបានលាលែងចំណែកក្រុមហ៊ុន AOL ក្តាប់ (Hafner 2006) ។ ជាឧទាហរណ៍នេះបានបង្ហាញអត្ថប្រយោជន៍សម្រាប់បុគ្គលជាក់លាក់នៅខាងក្នុងរបស់ក្រុមហ៊ុនដើម្បីជួយសម្រួលដល់ការចូលដំណើរការទិន្នន័យដែលមានទំហំតូចស្អាតនិងសេណារីយ៉ូដែលអាក្រក់បំផុតករណីនេះគឺគួរឱ្យភ័យខ្លាច។
ស្រាវជ្រាវអាចទោះជាយ៉ាង, ទទួលបានការចូលដំណើរការទិន្នន័យដែលជាមិនអាចចូលដំណើរការទៅឱ្យសាធារណជនទូទៅ។ រដ្ឋាភិបាលមាននីតិវិធីដែលអ្នកស្រាវជ្រាវអាចអនុវត្តតាមដើម្បីអនុវត្តសម្រាប់ការចូលដំណើរការនិងជាឧទាហរណ៍នៅពេលក្រោយក្នុងជំពូកបង្ហាញនេះ, អ្នកស្រាវជ្រាវបានម្តងម្កាលអាចទទួលបាននូវការចូលដំណើរការទៅកាន់ទិន្នន័យសាជីវកម្ម។ ឧទាហរណ៍ Einav et al. (2015) សហការជាមួយអ្នកស្រាវជ្រាវនៅ eBay ដើម្បីសិក្សាដានឌីជីថលពីការដេញថ្លៃលើបណ្តាញ។ ខ្ញុំនឹងនិយាយបន្ថែមទៀតអំពីការស្រាវជ្រាវដែលបានមកពីការសហការនេះនៅពេលក្រោយនៅក្នុងជំពូក (ផ្នែក 2.4.3.2) នោះទេប៉ុន្តែខ្ញុំនិយាយវាឥឡូវនេះទេព្រោះវាមានទាំងបួននៃគ្រឿងផ្សំដែលខ្ញុំបានឃើញនៅក្នុងភាពជាដៃគូទទួលបានជោគជ័យ: ការចាប់អារម្មណ៍ស្រាវជ្រាវសមត្ថភាពស្រាវជ្រាវ, ការចាប់អារម្មណ៍របស់ក្រុមហ៊ុន, និងសមត្ថភាពរបស់ក្រុមហ៊ុន។ នៅក្នុងពាក្យផ្សេងទៀត Einav និងមិត្តរួមការងារត្រូវបានគេចាប់អារម្មណ៍នៅក្នុងនិងសមត្ថភាពនៃការសិក្សាពីការដេញថ្លៃលើបណ្តាញ។ ហើយរបស់ eBay ផងដែរ។ ទោះយ៉ាងណាខ្ញុំបានឃើញការសហការគ្នាដែលអាចធ្វើបានជាច្រើនបានបរាជ័យដោយសារតែទាំងអ្នកស្រាវជ្រាវឬក្រុមហ៊ុនខ្វះមួយនៃគ្រឿងផ្សំទាំងនេះ។
សូម្បីតែប្រសិនបើអ្នកគឺជាអ្នកអាចអភិវឌ្ឍភាពជាដៃគូជាមួយនឹងអាជីវកម្មមួយ, ទោះជាយ៉ាងណា, មានការធ្លាក់ចុះមួយចំនួនសម្រាប់អ្នកមាន។ ដំបូង, សំណួរដែលអ្នកអាចសួរជាមួយនឹងទិន្នន័យដែលទំនងជាត្រូវបានកំណត់ជាមួយនេះ; មានក្រុមហ៊ុនគឺមិនទំនងដើម្បីអនុញ្ញាតឱ្យការស្រាវជ្រាវដែលអាចធ្វើឱ្យពួកគេមើលទៅអាក្រក់។ ទីពីរអ្នកប្រហែលជាមិនអាចចែករំលែកទិន្នន័យរបស់អ្នកជាមួយនឹងក្រុមអ្នកស្រាវជ្រាវផ្សេងទៀតដែលមានន័យថាក្រុមអ្នកស្រាវជ្រាវផ្សេងទៀតនឹងមិនអាចផ្ទៀងផ្ទាត់និងពង្រីកលទ្ធផលរបស់អ្នក។ លើសពីនេះទៀតភាពជាដៃគូទាំងនេះអាចបង្កើតយ៉ាងហោចណាស់រូបរាងនៃទំនាស់ផលប្រយោជន៍, ដែលជាកន្លែងដែលមនុស្សអាចគិតថាការស្វែងរករបស់អ្នកត្រូវបានរងឥទ្ធិពលដោយភាពជាដៃគូរបស់អ្នក។ ការទាំងអស់នៃការធ្លាក់ចុះទាំងនេះអាចត្រូវបានដោះស្រាយនោះទេប៉ុន្តែវាជាការសំខាន់ដើម្បីជាការច្បាស់ណាស់ថាការធ្វើការជាមួយទិន្នន័យនោះគឺមិនអាចចូលដំណើរការទៅមនុស្សគ្រប់គ្នាមានទាំងចិត្តសប្បុរសដោយអាស្រ័យនិងការធ្លាក់ចុះ។
នៅក្នុងសេចក្ដីសង្ខេប, ច្រើននៃទិន្នន័យធំគឺមិនអាចចូលដំណើរការដល់អ្នកស្រាវជ្រាវ។ មានធ្ងន់ធ្ងរផ្នែកច្បាប់, បច្ចេកទេសអាជីវកម្ម, គឺមាន, និងឧបសគ្គវិជ្ជាជីវៈដែលការពារសិទ្ធិចូលដំណើរការទិន្នន័យ, និងឧបសគ្គទាំងនេះនឹងមិនបាត់ទៅវិញ។ រដ្ឋាភិបាលជាតិទូទៅបានបង្កើតនីតិវិធីដើម្បីអនុញ្ញាតការចូលដំណើរការទិន្នន័យ, ប៉ុន្តែដំណើរការនេះអាចនឹងមានច្រើនជាងនេះអាដហុកនៅរដ្ឋនិងមូលដ្ឋានកម្រិត។ ដូចគ្នានេះផងដែរក្នុងករណីខ្លះ, អ្នកស្រាវជ្រាវអាចជាដៃគូជាមួយក្រុមហ៊ុនដើម្បីទទួលបានការចូលដំណើរការទិន្នន័យ, ប៉ុន្តែនេះអាចបង្កើតភាពខុសគ្នានៃបញ្ហាសម្រាប់អ្នកស្រាវជ្រាវមួយ។