[ , ] Nel capitolo, sono stato molto positivo sulla post-stratificazione. Tuttavia, questo non migliora sempre la qualità delle stime. Costruisci una situazione in cui la post-stratificazione può ridurre la qualità delle stime. (Per un suggerimento, vedi Thomsen (1973) .)
[ , , ] Progetta e conduci un sondaggio non probabilistico su Amazon Mechanical Turk per chiedere informazioni sulla proprietà delle armi e gli atteggiamenti nei confronti del controllo delle armi. Affinché sia possibile confrontare le stime con quelle ottenute da un campione probabilistico, si prega di copiare il testo delle domande e le opzioni di risposta direttamente da un'indagine di alta qualità come quelle eseguite dal Pew Research Center.
[ , , ] Goel e colleghi (2016) somministrato 49 domande attitudinali a scelta multipla tratte dal sondaggio sociale generale (GSS) e hanno selezionato sondaggi dal Pew Research Center a un campione non probabilistico di intervistati tratto da Amazon Mechanical Turk. Si sono quindi adeguati alla non rappresentatività dei dati utilizzando la post-stratificazione basata su modelli e hanno confrontato le loro stime corrette con quelle delle indagini GSS e Pew basate sulla probabilità. Conduci lo stesso sondaggio su Amazon Mechanical Turk e prova a replicare la figura 2a e la figura 2b confrontando le stime corrette con le stime dei cicli più recenti delle indagini GSS e Pew. (Vedi l'appendice tabella A2 per l'elenco di 49 domande.)
[ , , ] Molti studi utilizzano misure auto-segnalate sull'uso del telefono cellulare. Questo è un ambiente interessante in cui i ricercatori possono confrontare il comportamento auto-segnalato con il comportamento registrato (vedi ad esempio, Boase and Ling (2013) ). Due comportamenti comuni su cui chiedere sono chiamate e messaggi di testo e due intervalli di tempo comuni sono "ieri" e "nell'ultima settimana".
[ , ] Schuman e Presser (1996) sostengono che gli ordini di domande sarebbero importanti per due tipi di domande: domande parziali in cui due domande sono allo stesso livello di specificità (ad esempio, le valutazioni di due candidati alla presidenza); e domande parzialmente intere in cui una domanda generale segue una domanda più specifica (ad esempio, chiedendo "Quanto sei soddisfatto del tuo lavoro?" seguito da "Quanto sei soddisfatto della tua vita?").
Descrivono ulteriormente due tipi di effetti dell'ordine delle domande: gli effetti di coerenza si verificano quando le risposte a una domanda successiva vengono avvicinate (rispetto a quelle che sarebbero altrimenti) a quelle date a una domanda precedente; gli effetti di contrasto si verificano quando ci sono maggiori differenze tra le risposte a due domande.
[ , Basandosi sul lavoro di Schuman e Presser, Moore (2002) descrive una dimensione separata dell'effetto ordine delle domande: effetti additivi e sottrattivi. Mentre gli effetti di contrasto e coerenza sono prodotti come conseguenza delle valutazioni degli intervistati dei due elementi in relazione l'uno con l'altro, gli effetti additivi e sottrattivi vengono prodotti quando gli intervistati sono resi più sensibili al quadro più ampio all'interno del quale si pongono le domande. Leggi Moore (2002) , quindi progetta ed esegui un esperimento di indagine su MTurk per dimostrare effetti additivi o sottrattivi.
[ , ] Christopher Antoun e colleghi (2015) condotto uno studio confrontando i campioni di convenienza ottenuti da quattro diverse fonti di reclutamento online: MTurk, Craigslist, Google AdWords e Facebook. Progetta una semplice indagine e recluta i partecipanti attraverso almeno due diverse fonti di reclutamento online (queste fonti possono essere diverse dalle quattro fonti utilizzate in Antoun et al. (2015) ).
[ ] Nel tentativo di prevedere i risultati del referendum UE 2016 (cioè Brexit), YouGov - una società di ricerche di mercato basata su Internet - ha condotto sondaggi online di un panel di circa 800.000 intervistati nel Regno Unito.
Una descrizione dettagliata del modello statistico di YouGov è disponibile su https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. In parole povere, YouGov ha suddiviso gli elettori in tipi basati sulla scelta del voto delle elezioni generali del 2015, sull'età, sulle qualifiche, sul genere e sulla data dell'intervista, nonché sul collegio elettorale in cui vivevano. Innanzitutto, hanno utilizzato i dati raccolti dai relatori di YouGov per stimare, tra coloro che hanno votato, la proporzione di persone di ciascun tipo di elettore che intendevano votare. Hanno stimato l'affluenza di ciascun tipo di elettore utilizzando il British Election Study (BES) del 2015, un'indagine face-to-face post-elettorale, che ha convalidato l'affluenza alle liste elettorali. Infine, hanno stimato quante persone ci fossero di ogni tipo di elettore nell'elettorato, sulla base dell'ultimo censimento e indagine annuale sulla popolazione (con alcune informazioni aggiuntive da altre fonti di dati).
Tre giorni prima del voto, YouGov ha mostrato un vantaggio di due punti per il Leave. Alla vigilia della votazione, il sondaggio indicava che il risultato era troppo vicino per chiamare (49/51 Remain). L'ultimo studio giornaliero prevedeva 48/52 in favore di Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). In realtà, questa stima ha mancato il risultato finale (52/48 congedo) di quattro punti percentuali.
[ , ] Scrivere una simulazione per illustrare ciascuno degli errori di rappresentazione nella figura 3.2.
[ , ] La ricerca di Blumenstock e colleghi (2015) comportato la costruzione di un modello di apprendimento automatico che potesse utilizzare i dati di traccia digitale per prevedere le risposte al sondaggio. Ora proverai la stessa cosa con un set di dati diverso. Kosinski, Stillwell, and Graepel (2013) scoperto che i Mi piace di Facebook possono predire tratti e attributi individuali. Sorprendentemente, queste previsioni possono essere anche più accurate di quelle di amici e colleghi (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) utilizzato i record di dettaglio delle chiamate (CDR) dai telefoni cellulari per prevedere le tendenze aggregate della disoccupazione.