Samlet undersøgelse error = repræsentation fejl + målefejl.
Der er mange former for fejl, der kan krybe ind estimater fra undersøgelser, og siden 1940'erne har forskerne arbejdet systematisk organisere, forstå og reducere disse fejl. Et vigtigt resultat fra alle af denne indsats er den samlede undersøgelse fejl rammer (Groves et al. 2009; Weisberg 2005) . Den vigtigste indsigt fra den samlede undersøgelse fejl rammer er, at problemer kan opdeles i to hovedkategorier spande: Problemer i forbindelse med hvem du taler med (repræsentation) og problemer i forbindelse med, hvad du lærer af disse samtaler (måling). For eksempel kan du være interesseret i at estimere holdninger om online privatliv blandt voksne, der bor i Frankrig. Gør disse skøn kræver to helt forskellige typer af inferens. Først fra de svar, som respondenterne giver, er du nødt til at udlede deres holdninger om online privatliv. For det andet, fra de udledte holdninger blandt respondenterne, skal du udlede holdninger i befolkningen som helhed. Den første type inferens er domænet for psykologi og kognitiv videnskab; og den anden type inferens er det domæne af statistikker. En perfekt prøveudtagningsplan med dårlige undersøgelsesspørgsmål vil producere dårlige skøn, og en dårlig prøveudtagningsplan med perfekt undersøgelsesspørgsmål vil også producere dårlige skøn. Gode estimater kræver fornuftige tilgange til måling og repræsentation. Da baggrunden, næste, vil jeg se på, hvordan undersøgelsens forskere har tænkt over repræsentation og måling i fortiden. Jeg forventer, at meget af dette materiale vil være gennemgang til sociale scienitsts, men det kan være nyt for nogle data forskere. Derefter vil jeg vise dig, hvordan disse idéer guide digitale tidsalder undersøgelse forskning.