Two sumber non-representativeness sing populasi beda lan pola berkas beda.
data Big kathah bakal runtut condhong ing rong cara utama. Iki ora perlu nimbulaké masalah kanggo kabeh jenis analisis, nanging kanggo sawetara analisis bisa dadi cacat kritis.
A sumber pisanan Bias rapi iku wong dijupuk biasane ora Semesta lengkap kabeh wong utawa sampel acak saka populasi tartamtu. Contone, Amerika ing Twitter ora sampel acak Amerika (Hargittai 2015) . A sumber liya Bias rapi iku akeh sistem data amba dijupuk tumindak, lan sawetara wong kontribusi luwih akeh tumindak saka liyane. Contone, sawetara wong ing Twitter kontribusi atusan kaping luwih tweets saka liyane. Mulane, acara ing platform tartamtu bisa tau luwih akeh banget termenung saka subgroups tartamtu saka ing platform dhewe.
Biasane peneliti pengin ngerti akèh bab data sing padha duwe. Nanging, diwenehi alam non-wakil saka data amba, iku mbiyantu kanggo uga loncat karo muter awak pikiran. Sampeyan uga kudu ngerti akèh bab data sing ora duwe. Iki utamané bener nalika data sing ora duwe sing runtut beda saka data sing duwe. Contone, yen sampeyan duwe cathetan telpon saka perusahaan ponsel ing negara-negara berkembang, sampeyan kudu mikir ora mung bab wong-wong ing perlengkapan data, nanging uga bab wong-wong sing bisa dadi miskin duwe telpon seluler. Luwih, ing Bab 3, kita bakal mangerteni carane nimbang bisa ngaktifake peneliti nggawe prakiraan luwih saka data non-wakil.