Total de erros de pesquisa de erro = representação + erros de medição.
Estimativas provenientes de pesquisas por amostragem são freqüentemente imperfeitas. Ou seja, geralmente há uma diferença entre a estimativa produzida por uma pesquisa de amostra (por exemplo, a altura média estimada de alunos em uma escola) e o valor real na população (por exemplo, a altura média real de alunos em uma escola). Às vezes, esses erros são tão pequenos que não são importantes, mas às vezes, infelizmente, podem ser grandes e conseqüentes. Na tentativa de entender, medir e reduzir erros, os pesquisadores criaram gradualmente uma estrutura conceitual única e abrangente para os erros que podem surgir em pesquisas por amostragem: a estrutura total de erros de pesquisa (Groves and Lyberg 2010) . Embora o desenvolvimento dessa estrutura tenha começado na década de 1940, acredito que nos oferece duas ideias úteis para pesquisa de pesquisa na era digital.
Primeiro, a estrutura total de erros de pesquisa esclarece que existem dois tipos de erros: viés e variância . Grosseiramente, o viés é um erro sistemático e a variância é um erro aleatório. Em outras palavras, imagine executar 1.000 replicações da mesma pesquisa de amostra e, em seguida, analisar a distribuição das estimativas dessas 1.000 replicações. O viés é a diferença entre a média dessas estimativas replicadas e o valor real. A variância é a variabilidade dessas estimativas. Tudo o mais sendo igual, gostaríamos de um procedimento sem viés e pequena variância. Infelizmente, para muitos problemas reais, tais procedimentos de não-viés e de pequena variância não existem, o que coloca os pesquisadores na difícil posição de decidir como equilibrar os problemas introduzidos pelo viés e pela variância. Alguns pesquisadores instintivamente preferem procedimentos imparciais, mas um foco único no viés pode ser um erro. Se o objetivo é produzir uma estimativa que seja a mais próxima possível da verdade (ou seja, com o menor erro possível), então você pode estar melhor com um procedimento que tenha um pequeno viés e uma pequena variância do que com um que seja imparcial, mas tem uma grande variação (figura 3.1). Em outras palavras, a estrutura total do erro de pesquisa mostra que, ao avaliar os procedimentos de pesquisa de pesquisa, você deve considerar o viés e a variação.
O segundo principal insight do quadro de erro total da pesquisa, que organizará grande parte deste capítulo, é que existem duas fontes de erros: problemas relacionados com quem você fala ( representação ) e problemas relacionados ao que você aprende com essas conversas ( medição ). Por exemplo, você pode estar interessado em estimar atitudes sobre privacidade online entre adultos que vivem na França. Fazer essas estimativas requer dois tipos diferentes de inferência. Primeiro, a partir das respostas dadas pelos entrevistados, você deve deduzir suas atitudes sobre a privacidade on-line (que é um problema de medição). Em segundo lugar, a partir das atitudes inferidas entre os entrevistados, você deve inferir as atitudes na população como um todo (que é um problema de representação). A amostragem perfeita com perguntas de pesquisa ruins produzirá estimativas ruins, assim como a amostragem incorreta com perguntas de pesquisa perfeitas. Em outras palavras, boas estimativas requerem abordagens sólidas para medição e representação. Dada essa contextualização, analisarei como os pesquisadores da pesquisa pensaram sobre representação e medição no passado. Em seguida, mostrarei como as ideias sobre representação e medição podem orientar a pesquisa de pesquisa da era digital.