Total de erros de busca de erro = representación + erros de medida.
Existen moitos tipos de erros que poden insinuar-se estimacións das enquisas, e desde a década de 1940 investigadores traballaron para organizar sistemáticamente, entender e reducir estes erros. Un resultado importante de todo este esforzo é a estrutura de erro levantamento total de (Groves et al. 2009; Weisberg 2005) . A principal percepción do cadro de erro levantamento total é que os problemas poden ser agrupados en dous baldes principais: problemas relacionados con quen fala (representación) e problemas relacionados co que aprende con esas conversas (de medida). Por exemplo, podería estar interesado en estimar as actitudes sobre a privacidade en liña entre os adultos que viven en Francia. Facendo estas estimacións require dous tipos moi diferentes de inferencia. En primeiro lugar, a partir das respostas que os entrevistados dar, ten que deducir as súas actitudes sobre a privacidade en liña. En segundo lugar, a partir das actitudes inferidas entre os enquisados, debes inferir as actitudes da poboación no seu conxunto. O primeiro tipo de inferencia é o dominio da psicoloxía e ciencia cognitiva; eo segundo tipo de inferencia é o dominio de estatísticas. Un esquema de mostraxe perfecto con preguntas da enquisa mal producirá estimacións malas, e un sistema de mostraxe malo con preguntas da investigación perfecto tamén xerará estimacións malas. Boas estimacións require enfoques de son para medida e representación. Dado que o fondo, a continuación, vou revisar o xeito no que os investigadores da busca pensar sobre representación e de medida no pasado. Espero que moi dese material será de revisión para scienitsts sociais, pero pode ser novo para algúns científicos de datos. Entón, eu vou lle amosar como esas ideas orientar a investigación levantamento era dixital.