ទិន្នន័យដែលគ្រប់គ្រងដោយក្រុមហ៊ុននិងរដ្ឋាភិបាលមានភាពពិបាកសម្រាប់អ្នកស្រាវជ្រាវក្នុងការចូលប្រើ។
នៅខែឧសភាឆ្នាំ 2014 ទីភ្នាក់ងារសន្តិសុខជាតិអាមេរិកបានបើកមជ្ឈមណ្ឌលទិន្នន័យមួយនៅតំបន់យូថាហ៍ដែលមានឈ្មោះមិនល្អមួយមជ្ឈមណ្ឌលទិន្នន័យគំនិតផ្តួចផ្តើមកុំព្យួទ័រជាតិស៊ីវិល។ ទោះជាយ៉ាងណាមជ្ឈមណ្ឌលទិន្នន័យនេះដែលត្រូវបានគេស្គាល់ថាជាមជ្ឈមណ្ឌលទិន្នន័យយូថាហ៍ត្រូវបានគេរាយការណ៍ថាមានសមត្ថភាពគួរឱ្យភ្ញាក់ផ្អើល។ របាយការណ៍មួយបានចោទប្រកាន់ថាវាអាចរក្សាទុកនិងដំណើរការគ្រប់ទម្រង់ទំនាក់ទំនងទាំងអស់រួមទាំង "មាតិកាពេញលេញនៃអ៊ីម៉ែលឯកជនការហៅទូរស័ព្ទនិងការស្វែងរករបស់ Google ក៏ដូចជាគ្រប់ប្រភេទនៃទិន្នន័យផ្លូវផ្ទាល់ខ្លួន - ចំណតចតឡានទេសចរណ៍ការទិញសៀវភៅហាងទំនិញ , និងឌីជីថលផ្សេងទៀត 'ទុកដាក់សំរាមហោប៉ៅ' " (Bamford 2012) ។ លើសពីនេះទៀតការបង្កើនការព្រួយបារម្ភអំពីលក្ខណៈរសើបនៃពត៌មានភាគច្រើនដែលបានចាប់យកនៅក្នុងទិន្នន័យធំដែលនឹងត្រូវបានពិពណ៌នានៅខាងក្រោមនេះមជ្ឈមណ្ឌលទិន្នន័យយូថាហ៍គឺជាឧទាហរណ៍ដ៏ល្អមួយនៃប្រភពទិន្នន័យសំបូរបែបដែលមិនអាចចូលដំណើរការបានសម្រាប់អ្នកស្រាវជ្រាវ។ ជាទូទៅប្រភពជាច្រើននៃទិន្នន័យធំ ៗ ដែលមានប្រយោជន៍ត្រូវបានគ្រប់គ្រងនិងដាក់កម្រិតដោយរដ្ឋាភិបាល (ឧទាហរណ៍ទិន្នន័យពន្ធនិងទិន្នន័យអប់រំ) ឬក្រុមហ៊ុន (ឧ។ សំណួរទៅម៉ាស៊ីនស្វែងរកនិងទិន្នន័យមេតាទូរស័ព្ទ) ។ ហេតុដូច្នេះទោះបីប្រភពទិន្នន័យទាំងនេះមានក៏ដោយក៏វាគ្មានប្រយោជន៍សម្រាប់គោលបំណងនៃការស្រាវជ្រាវសង្គមព្រោះវាមិនអាចចូលបាន។
តាមបទពិសោធន៍របស់ខ្ញុំអ្នកស្រាវជ្រាវជាច្រើនដែលមានមូលដ្ឋាននៅតាមសាកលវិទ្យាល័យនានាយល់ច្រឡំនូវប្រភពនៃភាពមិនអាចប្រើប្រាស់នេះ។ ទិន្នន័យទាំងនេះមិនអាចចូលបានទេដោយសារតែមនុស្សនៅក្រុមហ៊ុននិងរដ្ឋាភិបាលគឺឆោតល្ងង់ខ្ជិលឬមិនខ្វល់។ ផ្ទុយទៅវិញមានឧបសគ្គផ្នែកច្បាប់ពាណិជ្ជកម្មនិងក្រមសីលធម៌ដែលរារាំងការចូលប្រើទិន្នន័យ។ ឧទាហរណ៍កិច្ចព្រមព្រៀងលក្ខខណ្ឌសេវាកម្មមួយចំនួនសម្រាប់គេហទំព័រអនុញ្ញាតតែទិន្នន័យដែលត្រូវប្រើដោយនិយោជិកឬដើម្បីកែលម្អសេវា។ ដូច្នេះទំរង់នៃការចែករំលែកទិន្នន័យមួយចំនួនអាចបង្ហាញឱ្យក្រុមហ៊ុនធ្វើការប្តឹងផ្តល់តាមផ្លូវច្បាប់ពីអតិថិជន។ ក៏មានហានិភ័យអាជីវកម្មគួរឱ្យកត់សម្គាល់ផងដែរចំពោះក្រុមហ៊ុនដែលពាក់ព័ន្ធនៅក្នុងការចែករំលែកទិន្នន័យ។ ព្យាយាមស្រមៃមើលថាតើសាធារណជននឹងឆ្លើយតបយ៉ាងណាប្រសិនបើទិន្នន័យស្វែងរកផ្ទាល់ខ្លួនបានលេចធ្លាយដោយចៃដន្យចេញពី Google ជាផ្នែកនៃគម្រោងស្រាវជ្រាវសាកលវិទ្យាល័យ។ ការរំលោភបំពានទិន្នន័យបែបនេះបើសិនជាធ្ងន់ធ្ងរអាចជាហានិភ័យមួយសម្រាប់ក្រុមហ៊ុន។ ដូច្នេះក្រុមហ៊ុនហ្គូហ្គលនិងក្រុមហ៊ុនធំ ៗ ភាគច្រើនមានទំនោរទៅនឹងការចែករំលែកទិន្នន័យជាមួយអ្នកស្រាវជ្រាវ។
តាមការពិតស្ទើរតែគ្រប់គ្នាដែលមានឋានៈដើម្បីផ្តល់នូវលទ្ធភាពទទួលបានទិន្នន័យដ៏ច្រើនស្គាល់រឿងរបស់លោក Abdur Chowdhury ។ នៅឆ្នាំ 2006 នៅពេលដែលគាត់ជាប្រធាននៃការស្រាវជ្រាវនៅ AOL គាត់បានចេញផ្សាយដោយចេតនាដល់សហគមន៍អ្នកស្រាវជ្រាវដែលគាត់គិតថាមានសំណួរស្វែងរកអនាមិកពីអ្នកប្រើ AOL 650.000 នាក់។ តាមដែលខ្ញុំអាចប្រាប់បាន Chowdhury និងក្រុមអ្នកស្រាវជ្រាវនៅ AOL មានចេតនាល្អហើយពួកគេគិតថាពួកគេបានធ្វើអនាមិកទិន្នន័យ។ ប៉ុន្តែពួកគេខុស។ វាត្រូវបានគេរកឃើញយ៉ាងឆាប់រហ័សថាទិន្នន័យទាំងនោះមិនមានលក្ខណៈអនាមិកដូចដែលអ្នកស្រាវជ្រាវបានគិតនោះទេហើយអ្នកយកព័ត៌មានពីកាសែត New York Times អាចកំណត់អត្តសញ្ញាណនរណាម្នាក់នៅក្នុងសំណុំទិន្នន័យបានយ៉ាងងាយស្រួល (Barbaro and Zeller 2006) ។ នៅពេលដែលបញ្ហាទាំងនេះត្រូវបានរកឃើញ Chowdhury បានដកចេញទិន្នន័យពីវេបសាយរបស់ AOL ប៉ុន្តែវាយឺតពេលហើយ។ ទិន្នន័យត្រូវបានដាក់នៅលើវេបសាយដទៃទៀតហើយវានឹងនៅតែអាចប្រើបាននៅពេលអ្នកកំពុងអានសៀវភៅនេះ។ Chowdhury ត្រូវបានបណ្តេញចេញហើយមន្រ្តីជាន់ខ្ពស់ផ្នែកបច្ចេកវិទ្យារបស់ AOL បានលាលែងពីតំណែង (Hafner 2006) ។ ដូចឧទាហរណ៍នេះបានបង្ហាញថាអត្ថប្រយោជន៍សម្រាប់បុគ្គលជាក់លាក់នៅក្នុងក្រុមហ៊ុនដើម្បីសម្របសម្រួលការចូលប្រើប្រាស់ទិន្នន័យមានទំហំតូចហើយសភាពការណ៍ដ៏អាក្រក់បំផុតគឺគួរឱ្យភ័យខ្លាច។
ទោះជាយ៉ាងណាក៏ដោយអ្នកស្រាវជ្រាវអាចទទួលបានទិន្ន័យដែលមិនអាចរកបានសម្រាប់សាធារណជនទូទៅ។ រដ្ឋាភិបាលមួយចំនួនមាននីតិវិធីដែលអ្នកស្រាវជ្រាវអាចអនុវត្តតាមដើម្បីដាក់ពាក្យចូលប្រើហើយដូចដែលឧទាហរណ៍នៅក្នុងជំពូកនេះបានបង្ហាញអ្នកស្រាវជ្រាវអាចទទួលបានទិន្នន័យសាជីវកម្មម្តងម្កាល។ ឧទាហរណ៍ Einav et al. (2015) សហការជាមួយអ្នកស្រាវជ្រាវម្នាក់នៅ eBay ដើម្បីសិក្សាការដេញថ្លៃតាមអ៊ីនធឺណិត។ ខ្ញុំនឹងនិយាយបន្ថែមទៀតអំពីការស្រាវជ្រាវដែលបានមកពីកិច្ចសហការនេះក្រោយមកនៅក្នុងជំពូកនេះប៉ុន្តែខ្ញុំនិយាយពីពេលនេះព្រោះវាមានគ្រឿងផ្សំទាំងបួនដែលខ្ញុំឃើញនៅក្នុងភាពជាដៃគូដ៏ជោគជ័យ: ការចាប់អារម្មណ៍អ្នកស្រាវជ្រាវសមត្ថភាពអ្នកស្រាវជ្រាវផលប្រយោជន៍របស់ក្រុមហ៊ុននិងសមត្ថភាពរបស់ក្រុមហ៊ុន ។ ខ្ញុំបានឃើញកិច្ចសហការមានសក្តានុពលជាច្រើនបរាជ័យដោយសារតែទាំងអ្នកស្រាវជ្រាវឬដៃគូដែលជាក្រុមហ៊ុនឬរដ្ឋាភិបាលដែលខ្វះមួយក្នុងចំណោមគ្រឿងផ្សំទាំងនេះ។
ទោះបីជាអ្នកអាចបង្កើតភាពជាដៃគូជាមួយអាជីវកម្មឬទទួលបាននូវទិន្នន័យដែលបានដាក់កម្រិតក៏ដោយតែមានការធ្លាក់ចុះខ្លះសម្រាប់អ្នក។ ដំបូងអ្នកប្រហែលជានឹងមិនអាចចែករំលែកទិន្នន័យរបស់អ្នកជាមួយអ្នកស្រាវជ្រាវផ្សេងទៀតដែលមានន័យថាអ្នកស្រាវជ្រាវដទៃទៀតនឹងមិនអាចផ្ទៀងផ្ទាត់និងពង្រីកលទ្ធផលរបស់អ្នកបានទេ។ ទីពីរសំនួរដែលអ្នកអាចសួរអាចមានកំរិត។ ក្រុមហ៊ុនមិនទំនងដើម្បីអនុញ្ញាតឱ្យការស្រាវជ្រាវដែលអាចធ្វើឱ្យពួកគេមើលទៅមិនល្អ។ ជាចុងក្រោយភាពជាដៃគូទាំងនេះអាចបង្កើតយ៉ាងហោចណាស់រូបរាងនៃទំនាស់ផលប្រយោជន៍ដែលមនុស្សអាចគិតថាលទ្ធផលរបស់អ្នកត្រូវបានទទួលឥទ្ធិពលពីភាពជាដៃគូរបស់អ្នក។ ទាំងអស់នៃការថយចុះនេះអាចត្រូវបានដោះស្រាយប៉ុន្តែវាជាការសំខាន់ណាស់ដើម្បីឱ្យមានភាពច្បាស់លាស់ថាការធ្វើការជាមួយទិន្នន័យដែលមិនអាចចូលដំណើរការបានដល់មនុស្សគ្រប់គ្នាមានទាំងការរអាក់រអួលនិងការធ្លាក់ចុះ។
សរុបសេចក្ដីមកទិន្នន័យធំ ៗ ជាច្រើនមិនអាចរកបានសម្រាប់អ្នកស្រាវជ្រាវ។ មានឧបសគ្គផ្នែកច្បាប់ពាណិជ្ជកម្មនិងក្រមសីលធម៌ដែលរាំងស្ទះដល់ការចូលប្រើទិន្នន័យហើយឧបសគ្គទាំងនេះនឹងមិនរលាយបាត់ទេនៅពេលដែលបច្ចេកវិទ្យាកាន់តែប្រសើរឡើងដោយសារតែវាមិនមែនជាឧបសគ្គបច្ចេកទេស។ រដ្ឋាភិបាលជាតិមួយចំនួនបានបង្កើតនីតិវិធីសម្រាប់ការចូលដំណើរការទិន្នន័យសម្រាប់សំណុំទិន្នន័យមួយចំនួនប៉ុន្តែដំណើរការនេះគឺជាពិសេសនៅកម្រិតរដ្ឋនិងថ្នាក់មូលដ្ឋាន។ ដូចគ្នានេះផងដែរក្នុងករណីខ្លះអ្នកស្រាវជ្រាវអាចធ្វើការជាដៃគូជាមួយក្រុមហ៊ុនដើម្បីទទួលបានការចូលប្រើទិន្នន័យប៉ុន្តែនេះអាចបង្កើតបញ្ហាជាច្រើនសម្រាប់អ្នកស្រាវជ្រាវនិងក្រុមហ៊ុន។