অ প্রতিনিধীত্বগুলির দুই উত্স বিভিন্ন জনগোষ্ঠী এবং বিভিন্ন ব্যবহারের নিদর্শন আছে.
বিগ তথ্য ধারাক্রমে দুটি প্রধান উপায় পক্ষপাতদুষ্ট হতে থাকে. এই বিশ্লেষণ সব ধরণের জন্য একটি সমস্যা সৃষ্টি করার প্রয়োজন নেই, কিন্তু কিছু বিশ্লেষণের জন্য এটি একটি সমালোচনামূলক ত্রুটি হতে পারে.
নিয়মানুগ পক্ষপাত প্রথম উৎস যে মানুষ বন্দী সাধারণত তন্ন তন্ন সব মানুষের একটি সম্পূর্ণ মহাবিশ্ব বা কোনো নির্দিষ্ট জনগোষ্ঠী থেকে একটি র্যান্ডম নমুনা হয়. উদাহরণস্বরূপ, টুইটার উপর আমেরিকানরা আমেরিকানদের একটি র্যান্ডম নমুনা নয় (Hargittai 2015) . নিয়মানুগ পক্ষপাত দ্বিতীয় উৎস যে অনেক বড় তথ্য ব্যবস্থা কর্ম ক্যাপচার, এবং কিছু মানুষ অন্যদের তুলনায় অনেক বেশি কর্ম অবদান. উদাহরণস্বরূপ, টুইটারে কিছু মানুষ অন্যদের তুলনায় গুণ বেশি টুইট শত শত অবদান. অতএব, একটি নির্দিষ্ট প্ল্যাটফর্মে ঘটনা প্ল্যাটফর্ম চেয়ে নির্দিষ্ট উপগোষ্ঠী সদা আরো প্রচন্ডভাবে প্রতিফলিত হতে পারে.
সাধারণত গবেষকরা তথ্য আছে যে, তারা সম্পর্কে অনেক জানতে চাই. কিন্তু, বড় তথ্য অ প্রতিনিধি প্রকৃতি প্রদত্ত, এটা সহায়ক এছাড়াও আপনার চিন্তা টুসকি হয়. এছাড়াও আপনি তথ্য আপনি না যে সম্পর্কে অনেক কিছু জানতে হবে. এই বিশেষভাবে সত্য যখন তথ্য আপনি না যে ডেটা আপনি যে থেকে ধারাক্রমে ভিন্ন. উদাহরণস্বরূপ, যদি আপনি একটি উন্নয়নশীল দেশের একটি মোবাইল ফোন কোম্পানীর কাছ থেকে কল রেকর্ড আছে, আপনি চিন্তা করা উচিত না ঠিক, কিন্তু সব লোক খুব একটি মোবাইল ফোন মালিক দরিদ্র হতে পারে সম্পর্কে আপনার ডেটাসেটে মানুষ সম্পর্কে. উপরন্তু, অধ্যায় 3, আমরা তৌল কিভাবে গবেষকরা অ প্রতিনিধি ডেটা থেকে ভাল অনুমান করতে সক্ষম করতে পারেন সম্পর্কে জানতে পারবেন.