Бус төлөөлөх хоёр эх үүсвэр нь өөр өөр хүн ам, янз бүрийн хэрэглээний хэв маяг юм.
Big мэдээллийн үндсэн хоёр арга замаар системтэйгээр илүү хазайсан байх хандлагатай байдаг. Энэ нь шинжилгээний бүх төрлийн хүндрэл учруулах хэрэггүй, харин зарим нь дүн шинжилгээ хийх нь чухал алдаа байж болно.
системтэй хэвийсэн нь анхны эх үүсвэр нь баригдсан хүмүүс нь ихэвчлэн бүх ард түмний бүрэн орчлон ертөнц, эсвэл ямар нэгэн өвөрмөц хүн амаас санамсаргүй түүвэр ч байдаг. Жишээ нь, Twitter дээр америкчууд америкчуудын санамсаргүй түүвэр биш юм (Hargittai 2015) . системтэй хэвийсэн хоёр дахь эх үүсвэр нь олон том мэдээллийн систем арга хэмжээ авах гэж байна, зарим хүмүүс бусдаасаа илүү олон арга хэмжээг хувь нэмэр оруулдаг. Жишээ нь, Twitter дээр зарим хүмүүс бусдаасаа илүү дахин их твиттэрийн олон зуун хувь нэмэр оруулдаг. Тиймээс тодорхой тавцан дээр үйл явдал тавцан нь өөрөө илүү тодорхой дэд нь улам их тусгал байж болох юм.
Ер нь судлаачид байгаа өгөгдлийг талаар маш их мэдэхийг хүсч байна. Харин том мэдээ бус төлөөлөгч мөн чанар өгсөн, энэ нь ашигтай нь таны бодол санааг харандаа юм. Та бас мэдээ танд байхгүй талаар их мэдэх хэрэгтэй. Та байхгүй бол мэдээ танд байдаг вэ өгөгдлөөс системтэй өөр үед энэ нь бүр ч үнэн юм. Жишээ нь, та хөгжиж буй орнуудад гар утасны компаниас дуудлага баримт байгаа бол та зүгээр л дүн таны датасетийн хүмүүсийн тухай, бас нэг гар утас эзэмших нь хэтэрхий ядуу байж болох хүмүүсийн тухай бодох хэрэгтэй. Цаашилбал, 3-р бүлэгт бид хэрхэн жингийн бус төлөөлөгч мэдээлэл илүү сайн тооцоо хийх судлаачдыг идэвхжүүлж болох талаар суралцах болно.