Totale errori sondaggio errore = rappresentanza + errori di misura.
Le stime che provengono da indagini campionarie sono spesso imperfette. Cioè, di solito c'è una differenza tra la stima prodotta da un'indagine campionaria (ad esempio, l'altezza media stimata degli studenti in una scuola) e il vero valore nella popolazione (ad esempio, l'altezza media effettiva degli studenti in una scuola). A volte questi errori sono così piccoli che non sono importanti, ma a volte, sfortunatamente, possono essere grandi e consequenziali. Nel tentativo di comprendere, misurare e ridurre gli errori, i ricercatori hanno gradualmente creato un quadro concettuale unico e globale per gli errori che possono emergere nei sondaggi di esempio: il quadro complessivo degli errori dell'indagine (Groves and Lyberg 2010) . Sebbene lo sviluppo di questo quadro sia iniziato negli anni '40, penso che ci offra due idee utili per la ricerca di sondaggi nell'era digitale.
Innanzitutto, il quadro complessivo degli errori di indagine chiarisce che esistono due tipi di errori: bias e varianza . Approssimativamente, il bias è un errore sistematico e la varianza è un errore casuale. In altre parole, immagina di eseguire 1.000 repliche dello stesso sondaggio campione e quindi di esaminare la distribuzione delle stime da queste 1.000 repliche. Il bias è la differenza tra la media di queste stime replicate e il valore reale. La varianza è la variabilità di queste stime. A parità di tutti gli altri, vorremmo una procedura senza bias e varianza piccola. Sfortunatamente, per molti problemi reali, non esistono procedure tali da evitare errori, che mettono i ricercatori nella difficile posizione di decidere come bilanciare i problemi introdotti da bias e varianza. Alcuni ricercatori preferiscono istintivamente le procedure imparziali, ma un approccio mirato alla parzialità può essere un errore. Se l'obiettivo è quello di produrre una stima che sia il più vicino possibile alla verità (cioè, con il minimo errore possibile), allora potresti stare meglio con una procedura che ha un piccolo bias e una piccola varianza rispetto a una che è imparziale ma ha una grande varianza (figura 3.1). In altre parole, il quadro generale degli errori dell'indagine mostra che quando si valutano le procedure di ricerca dei sondaggi, è necessario considerare sia la distorsione sia la varianza.
La seconda intuizione principale del quadro complessivo degli errori di indagine, che organizzerà gran parte di questo capitolo, è che ci sono due fonti di errori: problemi relativi a chi parli ( rappresentazione ) e problemi relativi a ciò che apprendi da quelle conversazioni ( misurazione ). Ad esempio, potresti essere interessato a stimare le attitudini sulla privacy online tra gli adulti che vivono in Francia. Fare queste stime richiede due diversi tipi di inferenza. In primo luogo, dalle risposte fornite dagli intervistati, devi dedurre i loro atteggiamenti sulla privacy online (che è un problema di misurazione). In secondo luogo, dagli atteggiamenti inferiti tra gli intervistati, è necessario inferire gli atteggiamenti nella popolazione nel suo complesso (che è un problema di rappresentazione). Il campionamento perfetto con domande di sondaggio errate produrrà stime errate, così come un cattivo campionamento con domande di sondaggio perfette. In altre parole, le buone stime richiedono approcci solidi per la misurazione e la rappresentazione. Considerando questo background, esaminerò in che modo i ricercatori del sondaggio hanno pensato alla rappresentazione e alla misurazione in passato. Quindi, mostrerò come le idee sulla rappresentazione e la misurazione possono guidare la ricerca sui sondaggi sull'età digitale.