ប្រភពពីរនៃការមិនមានប្រជាជនដែលតំណាងលំនាំការប្រើប្រាស់ផ្សេងគ្នានិងភាពខុសគ្នា។
ទិន្នន័យធំមាននិន្នាការទៅត្រូវបានលំអៀងជាលក្ខណៈប្រព័ន្ធក្នុងវិធីសំខាន់ពីរ។ នេះមិនចាំបាច់បង្កឱ្យមានបញ្ហាសម្រាប់ប្រភេទនៃការវិភាគទាំងអស់នោះទេប៉ុន្តែសម្រាប់ការវិភាគខ្លះវាអាចជាកំហុសធ្ងន់ធ្ងរ។
ប្រភពដំបូងនៃភាពលំអៀងជាលក្ខណៈប្រព័ន្ធគឺថាមនុស្សដែលបានចាប់យកគឺមានជាធម្មតាទាំងសកលលោកពេញលេញនៃប្រជាជនទាំងអស់ឬគំរូចៃដន្យមកពីចំនួនប្រជាជនជាក់លាក់ណាមួយទេ។ ឧទាហរណ៍ជនជាតិអាមេរិកនៅលើ Twitter គឺមិនមែនជាគំរូចៃដន្យនៃជនជាតិអាមេរិក (Hargittai 2015) ។ ប្រភពមួយទៀតនៃការលំអៀងគឺថាប្រព័ន្ធប្រព័ន្ធទិន្នន័យជាច្រើនបានចាប់យកសកម្មភាពធំនិងមនុស្សមួយចំនួនបានរួមចំណែកសកម្មភាពច្រើនជាងអ្នកដទៃ។ ឧទាហរណ៍, មនុស្សមួយចំនួននៅលើ Twitter ចូលរួមចំណែករាប់រយនាក់នៃធ្វីតដងច្រើនជាងអ្នកដទៃ។ ដូច្នេះព្រឹត្តិការណ៍នៅលើវេទិកាជាក់លាក់មួយដែលអាចត្រូវបានឆ្លុះបញ្ចាំងពីការដែលមិនធ្លាប់ខ្លាំងជាងរបស់ក្រុមរងមួយចំនួនជាងការវេទិការបស់វា។
ជាធម្មតាអ្នកស្រាវជ្រាវចង់ដឹងច្រើនអំពីទិន្នន័យដែលពួកគេមាន។ ប៉ុន្តែបានផ្តល់ឱ្យធម្មជាតិដែលមិនមែនជាតំណាងនៃទិន្នន័យធំវាគឺមានប្រយោជន៍ផងដែរដើម្បីត្រឡប់បន្ទាត់ការគិតរបស់អ្នក។ អ្នកត្រូវដឹងច្រើនអំពីទិន្នន័យដែលអ្នកមិនមាននោះទេ។ នេះគឺជាការពិតជាពិសេសនៅពេលទិន្នន័យដែលអ្នកមិនមានប្រព័ន្ធខុសគ្នាពីមានទិន្នន័យថាអ្នកមាន។ ឧទាហរណ៍ប្រសិនបើអ្នកមានកំណត់ត្រាការហៅពីក្រុមហ៊ុនទូរស័ព្ទចល័តនៅក្នុងប្រទេសមួយដែលកំពុងអភិវឌ្ឍន៍, អ្នកគួរតែគិតមិនមែនគ្រាន់តែអំពីមនុស្សនៅក្នុងសំណុំទិន្នន័យរបស់អ្នក, ប៉ុន្តែផងដែរអំពីមនុស្សដែលអាចនឹងក្រពេកដើម្បីជាម្ចាស់ទូរស័ព្ទចល័តមួយ។ លើសពីនេះទៀតនៅក្នុងជំពូកទី 3 យើងនឹងរៀនអំពីរបៀបដែលអាចអនុញ្ញាតឱ្យមានទំងន់អ្នកស្រាវជ្រាវល្អប្រសើរជាងមុនដើម្បីធ្វើឱ្យការប៉ាន់ស្មានដែលមិនមានទិន្នន័យពីតំណាង។