Total de erros de pesquisa de erro = representação + erros de medição.
Existem muitos tipos de erros que podem insinuar-se estimativas dos inquéritos, e desde a década de 1940 pesquisadores têm trabalhado para organizar sistematicamente, entender e reduzir esses erros. Um resultado importante de todo esse esforço é a estrutura de erro levantamento total de (Groves et al. 2009; Weisberg 2005) . A principal percepção do quadro de erro levantamento total é que os problemas podem ser agrupados em dois baldes principais: problemas relacionados com quem você fala (representação) e problemas relacionados com o que você aprende com essas conversas (de medição). Por exemplo, você poderia estar interessado em estimar as atitudes sobre a privacidade on-line entre os adultos que vivem na França. Fazendo essas estimativas requer dois tipos muito diferentes de inferência. Em primeiro lugar, a partir das respostas que os entrevistados dar, tem que deduzir as suas atitudes sobre a privacidade online. Em segundo lugar, a partir das atitudes inferidas entre os inquiridos, você deve inferir as atitudes na população como um todo. O primeiro tipo de inferência é o domínio da psicologia e ciência cognitiva; e o segundo tipo de inferência é o domínio de estatísticas. Um esquema de amostragem perfeito com perguntas do inquérito ruim vai produzir estimativas ruins, e um sistema de amostragem ruim com perguntas da pesquisa perfeito também irá produzir estimativas ruins. Boas estimativas requer abordagens de som para medição e representação. Dado que o fundo, em seguida, eu vou rever a forma como os pesquisadores da pesquisa ter pensado sobre representação e de medição no passado. Espero que muito desse material será de revisão para scienitsts sociais, mas pode ser novo para alguns cientistas de dados. Então, eu vou lhe mostrar como essas idéias orientar a pesquisa levantamento era digital.