activitats

clau:

  • grau de dificultat: fàcil fàcil , mitja mitjà i dur dur , molt dur molt dur
  • requereix matemàtiques ( requereix matemàtiques )
  • requereix codificació ( requereix de codificació )
  • recopilació de dades ( recopilació de dades )
  • els meus favorits ( el meu preferit )
  1. [ dur , requereix matemàtiques ] En el capítol, que era molt positiu sobre el post-estratificació. No obstant això, no sempre millorar la qualitat de les estimacions. Construir una situació en la qual pot postestratificación pot disminuir la qualitat de les estimacions. (Per tenir una idea, veure Thomsen (1973) ).

  2. [ dur , recopilació de dades , requereix de codificació ] Disseny i la realització d'una enquesta no probabilístic en Amazon MTurk de preguntar sobre la propietat d'armes ( "Té vostè, o algú de la seva llar, posseir una pistola, rifle o pistola? És que vostè o algú més a casa?") I actituds cap al control d'armes ( "Quin creu vostè que és més important, per protegir el dret dels nord-americans a posseir armes, o per controlar la propietat d'armes?").

    1. Quant de temps dura l'enquesta? Quant costa? De quina manera les característiques demogràfiques de la mostra es comparen amb les dades demogràfiques de la població dels Estats Units?
    2. Quina és l'estimació bruta de la propietat d'armes amb el vostre mostra?
    3. Correcta per assegurar la no representativitat de la mostra usant postestratificación o alguna altra tècnica. Ara quin és l'estimació de la propietat d'armes?
    4. Com les seves estimacions es comparen amb l'última estimació del Pew Research Center? Què opines explicar les discrepàncies, si hi ha alguna?
    5. Repetiu l'exercici 2-5 per a les actituds cap al control d'armes. En què difereixen els resultats?
  3. [ molt dur , recopilació de dades , requereix de codificació ] Goel et al (2016) van administrar una enquesta basada en la no probabilístic que consta de 49 preguntes d'opció múltiple d'actitud extrets de l'Enquesta Social General (GSS) i seleccionar les enquestes del Centre d'Investigacions Pew a Amazon MTurk. A continuació, s'ajusten a la no representativitat de les dades utilitzant la base de models de post-estratificació (Mr. P), i comparar les estimacions ajustades amb els estimats a través d'enquestes GSS / Pew basats en la probabilitat. Dur a terme la mateixa enquesta a MTurk i intentar reproduir la figura 2a i Figura 2b mitjançant la comparació de les estimacions ajustades amb les estimacions dels més recents rondes de GSS / Pew (quadre annex A2 per a la llista de les 49 preguntes).

    1. Comparar i contrastar els seus resultats amb els resultats de Pew i GSS.
    2. Comparar i contrastar els seus resultats amb els resultats de l'enquesta MTurk en Goel, Obeng, and Rothschild (2016) .
  4. [ mitjà , recopilació de dades , requereix de codificació ] Molts estudis utilitzen mesures d'auto-informe de les dades d'activitat de telefonia mòbil. Es tracta d'un entorn interessant on els investigadors poden comparar el comportament d'auto-informe amb el comportament d'inici de sessió (vegeu, per exemple, Boase and Ling (2013) ). Dos comportaments comuns per preguntar sobre demanen i missatges de text, i dos marcs de temps són comuns "ahir" i "durant la setmana passada."

    1. Abans de la recollida de les dades, que de l'auto-informe de mesures creu que és més precís? Per què?
    2. Reclutar a 5 dels teus amics per estar en el seu enquesta. Breu resum de com es van prendre mostres d'aquests 5 amics. Podria aquest procediment de mostreig induir biaixos específics en les seves estimacions?
    3. Si us plau, demani que el següent micro-enquesta:
    • "Quantes vegades s'utilitza el telèfon mòbil per trucar a altres ahir?"
    • "Quants missatges de text vas enviar ahir?"
    • "Quantes vegades utilitza el seu telèfon mòbil per trucar a altres persones en els últims set dies?"
    • "Quantes vegades has fet servir el seu telèfon mòbil per enviar o rebre missatges de text / SMS en els últims set dies?" Una vegada que s'hagi completat l'enquesta, demani per comprovar les seves dades d'ús que ha iniciat sessió amb el proveïdor de telefonia o servei.
    1. Com es compara l'ús d'auto-informe de dades per iniciar la sessió? Què és més exacta, que és menys precisa?
    2. Ara es combinen les dades que s'han recollit amb les dades d'altres persones en la seva classe (si és que està fent aquesta activitat per a una classe). Amb aquest conjunt de dades més gran, repetir la part (d).
  5. [ mitjà , recopilació de dades ] Schuman i Presser (1996) sostenen que les ordres d'interrogació faria res per a dos tipus de relacions entre les preguntes: preguntes parcial de part en la qual dues preguntes són al mateix nivell d'especificitat (per exemple, les qualificacions de dos candidats presidencials); i preguntes part-tot en una qüestió general segueix una pregunta més específica (per exemple, preguntant "Què tan satisfet està vostè amb el seu treball?", seguit de "Què tan satisfet està amb la seva vida?").

    Es caracteritzen, a més, dos tipus d'efecte d'ordre pregunta: efectes de consistència es produeixen quan la resposta a una pregunta posterior s'acosten (del que serien d'una altra manera) a les donades a una pregunta anterior; contrastar els efectes es produeixen quan hi ha més diferències entre les respostes a dues preguntes.

    1. Crear un parell de preguntes-part de les peces que crec que va a tenir un gran efecte ordre de les preguntes, un parell de preguntes part-tot que creus que va a tenir un efecte d'ordre gran, i un altre parell de preguntes l'ordre creu que no tindria importància. Executar una prova enquesta sobre MTurk per posar a prova les seves preguntes.
    2. Què tan gran va ser l'efecte parcial de la part que van ser capaços de crear? Va ser un efecte consistència o el contrast?
    3. Què tan gran va ser l'efecte part-tot s'hagi pogut crear? Va ser un efecte consistència o el contrast?
    4. Hi va haver un efecte ordre de les preguntes del seu parell en el que no creia que la fi faria res?
  6. [ mitjà , recopilació de dades ] Sobre la base de l'obra de Schuman i Presser, Moore (2002) descriu una dimensió separada d'efecte ordre de les preguntes: additiva i subtractiva. Mentre contrast i consistència efectes es produeixen com a conseqüència de les avaluacions dels dos elements dels enquestats en relació l'un a l'altre, additiu i substractiu es produeixen efectes dels enquestats quan es fan més sensibles al marc més ampli dins el qual es plantegen les preguntes. Llegeix Moore (2002) , a continuació, dissenyar i executar un experiment enquesta sobre MTurk per demostrar additius o subtractius efectes.

  7. [ dur , recopilació de dades ] Christopher Antoun i els seus col·legues (2015) van realitzar un estudi comparant les mostres de conveniència obtinguts a partir de quatre diferents fonts de reclutament en línia: MTurk, Craigslist, AdWords de Google i Facebook. Dissenyar una enquesta simple i reclutar als participants a través d'almenys dues fonts de reclutament en línia diferents (que poden ser diferents fonts de les quatre fonts utilitzades en Antoun et al. (2015) ).

    1. Compareu el cost per recluta, en termes de diners i temps, entre les diferents fonts.
    2. Comparació de la composició de les mostres obtingudes de diferents fonts.
    3. Comparar la qualitat de les dades entre les mostres. Per obtenir idees sobre com mesurar la qualitat de les dades dels enquestats, veure Schober et al. (2015) .
    4. Quina és la seva font preferida? Per què?
  8. [ mitjà ] YouGov, una firma d'investigació de mercat basada en Internet, va realitzar enquestes en línia d'un grup d'uns 800.000 enquestats al Regne Unit i va utilitzar al Sr. P. per predir el resultat del referèndum de la UE (és a dir, Brexit), on els electors voten Regne Unit, ja sigui per romandre en o sortir de la Unió Europea.

    Una descripció detallada del model estadístic de YouGov aquí (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). En termes generals, YouGov particions dels votants en tipus basats en 2015 eleccions generals decisió de vot, edat, qualificacions, sexe, data de l'entrevista, així com la circumscripció en què viuen. En primer lloc, es van utilitzar les dades recollides dels panelistes de YouGov per estimar, entre els quals que voten, la proporció de persones de cada tipus de votant que tinguin la intenció de vot Deixar. Ells estimen la participació de cada tipus de votant mitjançant l'estudi de 2015 de l'elecció britànica (BES) enquesta cara a cara després de les eleccions, que va validar la participació de les llistes electorals. Finalment, estimen la quantitat de gent que hi ha de cada tipus de votant en l'electorat en base a l'últim Cens i Enquesta anual de la població (amb una mica d'informació, a més dels BES, dades de l'enquesta de YouGov de tot l'elecció general, i informació sobre el nombre de persones van votar per cada partit en cada circumscripció).

    Tres dies abans de la votació, YouGov va mostrar un avantatge de dos punts de vènia. La vigília de la votació, el sondeig va mostrar molt igualats (49-51 Romandre). L'estudi final sobre el dia va predir 48/52 a favor de la Romandre (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). De fet, aquesta estimació es va perdre el resultat final (52-48 Deixar) en quatre punts percentuals.

    1. Utilitzeu el marc d'error total de l'enquesta discutit en aquest capítol per avaluar el que podria haver anat malament.
    2. La resposta de YouGov després de l'elecció (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) va explicar: "Això sembla en gran part a causa de la participació - una cosa que hem dit des del principi que seria crucial per al resultat d'una carrera tan finament equilibrat. El nostre model de participació es basa, en part, de si els enquestats havien votat en l'última elecció general i un nivell de participació superior a la de les eleccions generals alterar el model, sobretot en el Nord. "¿Això canvia la seva resposta a l'apartat (a)?
  9. [ mitjà , requereix de codificació ] Escriure una simulació per il·lustrar cada un dels errors de representació a la figura 3.1.

    1. Crear una situació en què aquests errors de fet s'anul·len.
    2. Crear una situació en què els errors agreugen entre si.
  10. [ molt dur , requereix de codificació ] La investigació de Blumenstock i els seus col·legues (2015) va implicar la construcció d'un model d'aprenentatge de màquines que podrien utilitzar les dades de seguiment digitals per predir respostes de l'enquesta. Ara, vostè va a intentar fer el mateix amb un conjunt de dades diferent. Kosinski, Stillwell, and Graepel (2013) va trobar que Facebook li agrada pot predir trets i atributs individuals. Sorprenentment, aquestes prediccions poden ser encara més precisos que els d'amics i col·legues (Youyou, Kosinski, and Stillwell 2015) .

    1. Llegir Kosinski, Stillwell, and Graepel (2013) , i replicar Figura 2. Les seves dades estan disponibles aquí: http://mypersonality.org/
    2. Ara, replicar la Figura 3.
    3. Finalment, provar el seu model pel seu compte les dades de Facebook: http://applymagicsauce.com/. Què tan bé funciona per a vostè?
  11. [ mitjà ] Toole et al. (2015) registres de detalls d'ús de trucades (CDR) dels telèfons mòbils per a predir l'evolució de la desocupació agregats.

    1. Comparar i contrastar el disseny de Toole et al. (2015) amb Blumenstock, Cadamuro, and On (2015) .
    2. Creu que els CDR han de substituir les enquestes tradicionals, complementar-les o no s'utilitza en absolut per les autoritats governamentals per fer un seguiment d'atur? Per què?
    3. Quina evidència que convèncer els CDR poden substituir completament les mesures tradicionals de la taxa d'atur?