Tổng số lỗi khảo sát lỗi = đại diện + sai số phép đo.
Có rất nhiều loại lỗi mà có thể chui vào ước tính từ các cuộc điều tra, và từ những năm 1940 các nhà nghiên cứu đã làm việc để tổ chức có hệ thống, hiểu, và giảm thiểu những sai sót. Một kết quả quan trọng từ tất cả các nỗ lực đó là tổng số khung lỗi khảo sát (Groves et al. 2009; Weisberg 2005) . Sự thấu hiểu chính từ tổng khuôn khổ lỗi khảo sát là vấn đề có thể được nhóm lại thành hai xô chính: các vấn đề liên quan đến những người bạn nói chuyện với (đại diện) và các vấn đề liên quan đến những gì bạn học được từ những cuộc hội thoại (đo lường). Ví dụ, bạn có thể quan tâm trong việc ước tính thái độ về sự riêng tư trực tuyến ở người trưởng thành sống ở Pháp. Làm cho những ước tính đòi hỏi hai loại hoàn toàn khác nhau của suy luận. Thứ nhất, từ những câu trả lời mà người trả lời cho, bạn phải suy ra thái độ của họ về sự riêng tư trực tuyến. Thứ hai, từ thái độ suy ra số người trả lời, bạn phải suy luận ra những thái độ trong dân số nói chung. Các loại đầu tiên của suy luận là lĩnh vực tâm lý học và khoa học nhận thức; và loại thứ hai của suy luận là lĩnh vực thống kê. Một kế hoạch lấy mẫu hoàn hảo với những câu hỏi khảo sát xấu sẽ sản xuất ước tính xấu, và một chương trình lấy mẫu xấu với câu hỏi khảo sát hoàn hảo cũng sẽ sản xuất ước tính xấu. Ước tính tốt đòi hỏi cách tiếp cận âm để đo lường và đại diện. Với nền tảng đó, tiếp theo, tôi sẽ xem xét làm thế nào các nhà nghiên cứu khảo sát đã nghĩ về đại diện và đo lường trong quá khứ. Tôi hy vọng rằng có rất nhiều vật liệu này sẽ được xem xét lại để scienitsts xã hội, nhưng nó có thể là mới đối với một số nhà khoa học dữ liệu. Sau đó, tôi sẽ cho bạn thấy làm thế nào những ý tưởng hướng dẫn nghiên cứu khảo sát đại kỹ thuật số.