attività

Chiave:

  • Grado di difficoltà: facile facile , medio medio , difficile difficile , molto difficile molto difficile
  • richiede la matematica ( richiede la matematica )
  • richiede la codifica ( richiede codifica )
  • raccolta dati ( raccolta dati )
  • i miei preferiti ( il mio preferito )
  1. [ difficile , richiede la matematica ] Nel capitolo, ero molto positivo post-stratificazione. Tuttavia, non sempre migliora la qualità delle stime. Costruire una situazione in cui può post-stratificazione può diminuire la qualità delle stime. (Per un suggerimento, vedere Thomsen (1973) ).

  2. [ difficile , raccolta dati , richiede codifica ] Progettazione e la conduzione di un sondaggio non probabilistico su Amazon MTurk per chiedere di possesso di armi ( "che fai, o qualcuno nella vostra famiglia, possedere una pistola, fucile o pistola? E 'che voi o qualcun altro nella tua famiglia?") E atteggiamenti verso il controllo delle armi ( "Cosa pensi sia più importante, per proteggere il diritto degli americani di possedere armi da fuoco, o per controllare il possesso di armi?").

    1. Quanto dura il sondaggio prende? Quanto costa? Come i dati demografici del campione confronta con la demografia della popolazione degli Stati Uniti?
    2. Qual è la stima grezza di possesso di armi usando il vostro campione?
    3. Corretto per la non rappresentatività del campione utilizzando post-stratificazione o qualche altra tecnica. Ora che cosa è la stima del possesso di armi?
    4. Come le stime confronta con l'ultima stima dal Pew Research Center? Cosa pensi a spiegare le discrepanze, se c'è?
    5. Ripetete l'esercizio 2-5 per gli atteggiamenti verso il controllo delle armi. Come i vostri risultati differiscono?
  3. [ molto difficile , raccolta dati , richiede codifica ] Goel e colleghi (2016) somministrato un sondaggio non a base di probabilità composto da 49 domande a scelta multipla attitudinali tratti dalla Survey Generale sociale (GSS) e selezionare le indagini da parte del Pew Research Center su Amazon MTurk. Hanno quindi regolare per la non rappresentatività dei dati utilizzando il modello basato su post-stratificazione (Mr. P), e confrontare le stime rettificate con quelle stimate per mezzo di indagini GSS / Pew probabilistici. Effettuare la stessa indagine sulla MTurk e cercare di replicare Figura 2a e Figura 2b confrontando le stime regolati con le stime dei più recenti cicli di GSS / Pew (Vedi Appendice A2 per l'elenco delle 49 domande).

    1. Confrontare e contrapporre i risultati per i risultati di Pew e GSS.
    2. Confrontare e contrapporre i risultati ai risultati del sondaggio MTurk in Goel, Obeng, and Rothschild (2016) .
  4. [ medio , raccolta dati , richiede codifica ] Molti studi utilizzano misure di self-report dei dati di attività di telefonia mobile. Si tratta di un ambiente interessante in cui i ricercatori possono confrontare il comportamento auto-riferito con il comportamento connessi (si veda ad esempio, Boase and Ling (2013) ). Due comportamenti comuni da porre sulla vengono chiamare e mandare SMS, e due tempi comuni sono "ieri" e "la scorsa settimana."

    1. Prima di raccogliere tutti i dati, che del self-report misure pensi sia più preciso? Perché?
    2. Reclutare 5 dei tuoi amici di essere nel vostro sondaggio. Si prega di riassumere brevemente come questi 5 amici sono stati campionati. Potrebbe questa procedura di campionamento indurre distorsioni specifiche nelle stime?
    3. Si prega di chiedere loro il seguente micro-sondaggio:
    • "Quante volte hai usato il telefono cellulare per chiamare gli altri ieri?"
    • "Quanti messaggi di testo hai mandato ieri?"
    • "Quante volte si utilizza il telefono cellulare per chiamare gli altri negli ultimi sette giorni?"
    • "Quante volte si utilizza il telefono cellulare per inviare o ricevere messaggi di testo / SMS negli ultimi sette giorni?" Una volta che l'indagine è completa, chiedere di controllare i loro dati di utilizzo come registrati dal proprio telefono o fornitore di servizi.
    1. In che modo l'utilizzo self-report confrontare per registrare i dati? Che è più preciso, che è meno preciso?
    2. Ora combinare i dati che avete raccolto con i dati di altre persone nella tua classe (se si sta facendo questa attività per una classe). Con questo set di dati più grandi, ripetere una parte (d).
  5. [ medio , raccolta dati ] Schuman e Presser (1996) sostengono che gli ordini di domanda sarebbe un problema per i due tipi di relazioni tra domande: domande parziale parte in cui due questioni sono allo stesso livello di specificità (ps valutazioni dei due candidati presidenziali); e domande part-interi in cui una domanda di carattere generale segue una domanda più specifica (ad esempio, chiedere "Quanto è soddisfatto con il vostro lavoro?", seguito da "Quanto sei soddisfatto della tua vita?").

    Si caratterizzano inoltre due tipi di effetto dell'ordine domanda: gli effetti di consistenza si verificano quando le risposte a una domanda successiva si avvicinano (di quanto sarebbe altrimenti) a quelle date a una precedente interrogazione; contrastare gli effetti si verificano quando ci sono maggiori differenze tra le risposte alle due domande.

    1. Creare un paio di domande parziale di parte che si ritiene possano avere un grande effetto dell'ordine domanda, un paio di domande part-whole che pensi possano avere un grande effetto dell'ordine, e un altro paio di domande il cui ordine si pensa che non sarebbe un problema. Eseguire un esperimento indagine su MTurk per testare le vostre domande.
    2. Quanto grande è stato l'effetto parziale parte sono stati in grado di creare? Era un effetto di coerenza o contrasto?
    3. Quanto grande è stato l'effetto part-tutto sono stati in grado di creare? Era un effetto di coerenza o contrasto?
    4. C'è stato un effetto di ordine domanda nella vostra coppia in cui non hai pensato l'ordine sarebbe un problema?
  6. [ medio , raccolta dati ] Basandosi sul lavoro di Schuman e Presser, Moore (2002) descrive una dimensione separata di effetto dell'ordine domanda: additivi e sottrattiva. Mentre effetto di contrasto e coerenza sono prodotti come conseguenza delle valutazioni dei due elementi rispondenti in relazione reciproca, additivi e sottrattivi effetti sono prodotti quando rispondenti sono più sensibili al quadro più ampio entro il quale sono poste le domande. Leggi Moore (2002) , quindi progettare ed eseguire un esperimento di un'indagine su MTurk dimostrare additivi o sottrattivi effetti.

  7. [ difficile , raccolta dati ] Christopher Antoun e colleghi (2015) hanno condotto uno studio confrontando i campioni di convenienza ottenuti da quattro diverse fonti di reclutamento on-line: MTurk, Craigslist, Google AdWords e Facebook. Progettare una semplice indagine e reclutare i partecipanti attraverso almeno due diverse fonti di reclutamento on-line (possono essere diverse fonti dalle quattro fonti utilizzate in Antoun et al. (2015) ).

    1. Confrontare il costo per recluta, in termini di denaro e di tempo, tra le diverse fonti.
    2. Confrontare la composizione dei campioni ottenuti da fonti diverse.
    3. Confrontare la qualità dei dati tra i campioni. Per idee su come misurare la qualità dei dati da parte degli intervistati, vedere Schober et al. (2015) .
    4. Qual è la vostra fonte preferita? Perché?
  8. [ medio ] YouGov, una società di ricerca di mercato basata su Internet, ha condotto sondaggi online di un panel di circa 800.000 intervistati nel Regno Unito e utilizzato il signor P. per predire il risultato del referendum UE (vale a dire, Brexit), dove gli elettori britannici votano sia per rimanere o lasciare l'Unione europea.

    Una descrizione dettagliata del modello statistico di YouGov è qui (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). In parole povere, YouGov suddivide gli elettori in tipi sulla base di 2015 elezioni generali scelta voto, età, qualifiche, sesso, data di intervista, così come la circoscrizione in cui vivono. In primo luogo, hanno usato i dati raccolti dai panel YouGov per la stima, tra quelli che votano, la percentuale di persone di ogni tipo elettore che intendono votare congedo. Si stima un'affluenza di ogni tipo elettore, utilizzando 2015 britannico Election Study (BES) post-elettorale faccia a faccia sondaggio, che ha convalidato l'affluenza dalle liste elettorali. Infine, si stima di quante persone ci sono di ogni tipo elettore nell'elettorato sulla base di ultimo censimento e indagine annuale della popolazione (con alcune informazioni Inoltre dalle BES, YouGov dati di rilievo provenienti da tutto il elezioni generali, e le informazioni su quante persone hanno votato per ciascuna delle parti in ogni circoscrizione).

    Tre giorni prima del voto, YouGov ha mostrato un vantaggio di due punti per il congedo. Alla vigilia del voto, il sondaggio ha mostrato troppo vicino alla chiamata (49-51 Remain). Lo studio finale on-the-day previsto 48/52 a favore di Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). In realtà, questa stima mancato il risultato finale (52-48 Leave) di quattro punti percentuali.

    1. Utilizzare il quadro errore sondaggio totale discusso in questo capitolo per valutare quello che poteva andare storto.
    2. La risposta di YouGov dopo le elezioni (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) ha spiegato: "Questo sembra in gran parte a causa di affluenza - qualcosa che abbiamo detto tutti insieme sarebbe cruciale per l'esito di una gara così finemente equilibrato. Il nostro modello di affluenza si è basata, in parte, dal fatto che gli intervistati avevano votato alle ultime elezioni generali e un livello di partecipazione superiore a quello delle elezioni generali sconvolgere il modello, in particolare nel Nord. "Questo cambia la vostra risposta a parte (a)?
  9. [ medio , richiede codifica ] Scrivere una simulazione per illustrare ciascuno dei errori di rappresentazione nella figura 3.1.

    1. Creare una situazione in cui questi errori in realtà si annullano.
    2. Creare una situazione in cui gli errori aggravano reciprocamente.
  10. [ molto difficile , richiede codifica ] La ricerca di Blumenstock e colleghi (2015) ha coinvolto la costruzione di un modello di apprendimento automatico che potrebbe usare i dati di traccia digitali per prevedere le risposte ai sondaggi. Ora, si sta andando a provare la stessa cosa con un set di dati diverso. Kosinski, Stillwell, and Graepel (2013) ha scoperto che Facebook ama in grado di prevedere i singoli tratti e gli attributi. Sorprendentemente, queste previsioni possono essere ancora più preciso di quelli di amici e colleghi (Youyou, Kosinski, and Stillwell 2015) .

    1. Leggi Kosinski, Stillwell, and Graepel (2013) , e replicare Figura 2. I loro dati sono disponibili qui: http://mypersonality.org/
    2. Ora, replicare figura 3.
    3. Infine, provare il loro modello da soli dati di Facebook: http://applymagicsauce.com/. Quanto bene funziona per voi?
  11. [ medio ] Toole et al. (2015) dettaglio l'uso di chiamata record (CDR) dai telefoni cellulari di prevedere le tendenze di disoccupazione aggregate.

    1. Confrontare e contrapporre la progettazione di Toole et al. (2015) con Blumenstock, Cadamuro, and On (2015) .
    2. Pensi CDR dovrebbero sostituire le indagini tradizionali, li integrano o no essere utilizzati a tutti per i politici di governo per monitorare la disoccupazione? Perché?
    3. Quali prove potrebbe convincervi che i CDR possono sostituire completamente le tradizionali misure del tasso di disoccupazione?