Jumlah kesilapan kajian ralat = perwakilan + ralat pengukuran.
Terdapat banyak jenis kesilapan yang boleh menjalar ke dalam anggaran daripada kaji selidik, dan sejak tahun 1940-an penyelidik telah bekerja secara sistematik menyusun, memahami, dan mengurangkan kesilapan-kesilapan ini. Hasil penting dari semua usaha yang rangka kerja ralat kajian jumlah (Groves et al. 2009; Weisberg 2005) . Wawasan utama dari rangka kerja ralat kajian jumlah adalah bahawa masalah boleh dikumpulkan ke dalam dua baldi utama: masalah yang berkaitan dengan siapa anda bercakap (perwakilan) dan masalah yang berkaitan dengan apa yang anda belajar dari perbualan (ukuran). Sebagai contoh, anda mungkin berminat dalam menganggarkan sikap tentang privasi dalam talian di kalangan orang dewasa yang tinggal di Perancis. Membuat anggaran ini memerlukan dua jenis agak berbeza pentaabiran. Pertama, daripada jawapan responden memberi, anda perlu untuk membuat kesimpulan sikap mereka tentang privasi dalam talian. Kedua, dari sikap disimpulkan di kalangan responden, anda mesti membuat kesimpulan sikap penduduk secara keseluruhannya. Jenis pertama inferens adalah domain psikologi dan sains kognitif; dan jenis kedua inferens adalah domain statistik. Satu skim persampelan sempurna dengan soalan tinjauan buruk akan menghasilkan anggaran yang tidak baik, dan skim persampelan yang buruk dengan soalan tinjauan sempurna juga akan menghasilkan anggaran yang buruk. Anggaran yang baik memerlukan pendekatan bunyi untuk pengukuran dan perwakilan. Memandangkan latar belakang itu, yang akan datang, saya akan mengkaji bagaimana penyelidik kajian telah berfikir tentang perwakilan dan ukuran pada masa lalu. Saya menjangkakan bahawa banyak bahan ini akan menjadi kajian untuk scienitsts sosial, tetapi ia mungkin baru kepada beberapa saintis data. Kemudian, saya akan menunjukkan kepada anda bagaimana idea-idea membimbing penyelidikan kajian umur digital.