Ocupaciones

  • grado de dificultad: fácil fácil , medio medio , difícil difícil , muy duro muy duro
  • requiere matemática ( requiere matemática )
  • requiere codificación ( requiere codificación )
  • recopilación de datos ( recopilación de datos )
  • mis favoritos ( mi favorito )
  1. [ difícil , requiere matemática ] En el capítulo, estaba muy seguro de la post-estratificación. Sin embargo, esto no siempre mejora la calidad de las estimaciones. Construya una situación donde la post-estratificación puede disminuir la calidad de las estimaciones. (Para una indirecta, vea Thomsen (1973) .)

  2. [ difícil , recopilación de datos , requiere codificación ] Diseñar y realizar una encuesta no probabilística en Amazon Mechanical Turk para preguntar sobre la posesión de armas y las actitudes hacia el control de armas. Para que pueda comparar sus estimaciones con las derivadas de una muestra de probabilidad, copie el texto de la pregunta y las opciones de respuesta directamente de una encuesta de alta calidad, como las que realiza el Pew Research Center.

    1. ¿Cuánto tiempo toma su encuesta? ¿Cuanto cuesta? ¿Cómo se comparan los datos demográficos de su muestra con los datos demográficos de la población de los EE. UU.?
    2. ¿Cuál es la estimación aproximada de la posesión de armas con su muestra?
    3. Corrija la falta de representatividad de su muestra usando post-estratificación o alguna otra técnica. Ahora, ¿cuál es la estimación de la posesión de armas?
    4. ¿Cómo se comparan sus estimaciones con la última estimación de una muestra basada en la probabilidad? ¿Qué crees que explica las discrepancias, si hay alguna?
    5. Repita las preguntas (b) - (d) para las actitudes hacia el control de armas. ¿Cómo difieren tus hallazgos?
  3. [ muy duro , recopilación de datos , requiere codificación ] Goel y colegas (2016) administraron 49 preguntas actitudinales de opción múltiple extraídas de la Encuesta Social General (GSS) y encuestas seleccionadas por el Centro de Investigación Pew a una muestra no probabilística de encuestados extraídos de Amazon Mechanical Turk. A continuación, ajustaron por falta de representatividad de los datos utilizando post-estratificación basada en modelos y compararon sus estimaciones ajustadas con las de las encuestas GSS y Pew basadas en la probabilidad. Realice la misma encuesta en Amazon Mechanical Turk e intente replicar la figura 2a y la figura 2b comparando sus estimaciones ajustadas con las estimaciones de las rondas más recientes de las encuestas GSS y Pew. (Consulte la tabla A2 del apéndice para ver la lista de 49 preguntas).

    1. Compare y contraste sus resultados con los de Pew y GSS.
    2. Compare y contraste sus resultados con los de la encuesta Mechanical Turk en Goel, Obeng, and Rothschild (2016) .
  4. [ medio , recopilación de datos , requiere codificación ] Muchos estudios usan medidas autorreportadas del uso del teléfono móvil. Este es un entorno interesante en el que los investigadores pueden comparar el comportamiento autoinformado con el comportamiento registrado (véase, por ejemplo, Boase and Ling (2013) ). Dos comportamientos comunes para preguntar son llamadas y mensajes de texto, y dos marcos de tiempo comunes son "ayer" y "en la última semana".

    1. Antes de recopilar datos, ¿cuál de las medidas de autoinforme cree que es más precisa? ¿Por qué?
    2. Recluta a cinco de tus amigos para que participen en tu encuesta. Resuma brevemente cómo se tomaron muestras de estos cinco amigos. ¿Podría este procedimiento de muestreo inducir sesgos específicos en sus estimaciones?
    3. Pregúnteles las siguientes preguntas microsurvey:
    • "¿Cuántas veces usaste tu teléfono móvil para llamar a otros ayer?"
    • "¿Cuántos mensajes de texto enviaste ayer?"
    • "¿Cuántas veces usaste tu teléfono móvil para llamar a otros en los últimos siete días?"
    • "¿Cuántas veces usó su teléfono móvil para enviar o recibir mensajes de texto / SMS en los últimos siete días?"
    1. Una vez que se haya completado esta microencuesta, solicite verificar sus datos de uso registrados por su teléfono o proveedor de servicios. ¿Cómo se compara el uso de autoinforme con los datos de registro? ¿Cuál es más exacto, que es menos preciso?
    2. Ahora combine los datos que ha recopilado con los datos de otras personas en su clase (si está haciendo esta actividad para una clase). Con este conjunto de datos más grande, repita la parte (d).
  5. [ medio , recopilación de datos ] Schuman y Presser (1996) argumentan que las órdenes de preguntas serían importantes para dos tipos de preguntas: preguntas en parte donde dos preguntas tienen el mismo nivel de especificidad (p. Ej., Calificaciones de dos candidatos presidenciales); y preguntas de una parte donde una pregunta general sigue a una pregunta más específica (por ejemplo, preguntando "¿Qué tan satisfecho estás con tu trabajo?" seguido de "¿Qué tan satisfecho estás con tu vida?").

    Además caracterizan dos tipos de efecto de orden de preguntas: los efectos de coherencia ocurren cuando las respuestas a una pregunta posterior se aproximan (de lo contrario) a las respuestas a una pregunta anterior; los efectos de contraste ocurren cuando hay mayores diferencias entre las respuestas a dos preguntas.

    1. Cree un par de preguntas de partes que cree que tendrán un gran efecto de orden de preguntas; un par de preguntas de una parte que cree que tendrán un gran efecto de orden; y un par de preguntas cuyo orden crees que no importaría. Ejecute un experimento de encuesta en Amazon Mechanical Turk para evaluar sus preguntas.
    2. ¿Qué tan grande fue el efecto de parte de una pieza que fue capaz de crear? ¿Fue un efecto de consistencia o contraste?
    3. ¿Qué tan grande fue un efecto de parte-todo que fue capaz de crear? ¿Fue un efecto de consistencia o contraste?
    4. ¿Hubo un efecto de orden de pregunta en tu pareja en el que creías que el orden no importaría?
  6. [ medio , recopilación de datos ] Sobre la base del trabajo de Schuman y Presser, Moore (2002) describe una dimensión separada del efecto de orden de preguntas: efectos aditivos y sustractivos. Mientras que los efectos de contraste y consistencia se producen como consecuencia de las evaluaciones de los encuestados de los dos ítems en relación entre sí, los efectos aditivos y sustractivos se producen cuando los encuestados se vuelven más sensibles al marco más amplio dentro del cual se formulan las preguntas. Lea Moore (2002) , luego diseñe y ejecute un experimento de encuesta en MTurk para demostrar los efectos aditivos o sustractivos.

  7. [ difícil , recopilación de datos ] Christopher Antoun y sus colegas (2015) realizaron un estudio comparando las muestras de conveniencia obtenidas de cuatro fuentes diferentes de reclutamiento en línea: MTurk, Craigslist, Google AdWords y Facebook. Diseñe una encuesta simple y reclute participantes a través de al menos dos fuentes diferentes de reclutamiento en línea (estas fuentes pueden ser diferentes de las cuatro fuentes utilizadas en Antoun et al. (2015) ).

    1. Compare el costo por recluta, en términos de dinero y tiempo, entre diferentes fuentes.
    2. Compare la composición de las muestras obtenidas de diferentes fuentes.
    3. Compare la calidad de los datos entre las muestras. Para ideas sobre cómo medir la calidad de los datos de los encuestados, ver Schober et al. (2015) .
    4. ¿Cuál es tu fuente preferida? ¿Por qué?
  8. [ medio ] En un esfuerzo por predecir los resultados del Referéndum de la UE 2016 (es decir, Brexit), YouGov -una firma de investigación de mercado basada en Internet- realizó encuestas en línea de un panel de aproximadamente 800,000 encuestados en el Reino Unido.

    Puede encontrar una descripción detallada del modelo estadístico de YouGov en https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. En términos generales, YouGov dividió a los votantes en tipos en función de la elección del voto en las elecciones generales de 2015, la edad, las calificaciones, el género y la fecha de la entrevista, así como del electorado en el que vivían. En primer lugar, utilizaron los datos recopilados de los panelistas de YouGov para estimar, entre los que votaron, la proporción de personas de cada tipo de votante que tenían la intención de votar. Estimaron la participación de cada tipo de votante utilizando el Estudio de Elecciones Británico (BES) de 2015, una encuesta cara a cara posterior a las elecciones, que validó la participación en las listas electorales. Finalmente, calcularon cuántas personas había de cada tipo de votante en el electorado, con base en la última Encuesta Censo y Población Anual (con alguna información adicional de otras fuentes de datos).

    Tres días antes de la votación, YouGov mostró una ventaja de dos puntos para Leave. En la víspera de la votación, la encuesta indicó que el resultado estaba demasiado cerca para llamar (49/51 Permanecer). El estudio final sobre el día predijo 48/52 a favor de Permanecer (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). De hecho, esta estimación no alcanzó el resultado final (52/48 de permiso) en cuatro puntos porcentuales.

    1. Use el marco total de errores de encuesta que se analiza en este capítulo para evaluar qué podría haber salido mal.
    2. La respuesta de YouGov después de las elecciones (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) explicó: "Esto parece en gran parte debido a la participación, algo que hemos dicho todo el tiempo que sería crucial para el resultado de una raza tan equilibrada. Nuestro modelo de participación se basó, en parte, en si los encuestados habían votado en las últimas elecciones generales y un nivel de participación superior al de las elecciones generales alteró el modelo, particularmente en el Norte. "¿Cambia esto tu respuesta a la parte (a)?
  9. [ medio , requiere codificación ] Escribe una simulación para ilustrar cada uno de los errores de representación en la figura 3.2.

    1. Crea una situación en la que estos errores se cancelen.
    2. Crea una situación en la que los errores se combinen entre sí.
  10. [ muy duro , requiere codificación ] La investigación de Blumenstock y sus colegas (2015) implicó la construcción de un modelo de aprendizaje automático que podría usar datos de rastreo digital para predecir las respuestas de la encuesta. Ahora, intentarás lo mismo con un conjunto de datos diferente. Kosinski, Stillwell, and Graepel (2013) encontraron que los Me gusta de Facebook pueden predecir los rasgos y atributos individuales. Sorprendentemente, estas predicciones pueden ser incluso más precisas que las de amigos y colegas (Youyou, Kosinski, and Stillwell 2015) .

    1. Lea Kosinski, Stillwell, and Graepel (2013) y duplique la figura 2. Sus datos están disponibles en http://mypersonality.org/
    2. Ahora, replica la figura 3.
    3. Finalmente, pruebe su modelo en sus propios datos de Facebook: http://applymagicsauce.com/. ¿Qué tan bien funciona para usted?
  11. [ medio ] Toole et al. (2015) utilizaron registros de detalles de llamadas (CDR) de teléfonos móviles para predecir las tendencias agregadas de desempleo.

    1. Comparar y contrastar el diseño del estudio de Toole et al. (2015) con los de Blumenstock, Cadamuro, and On (2015) .
    2. ¿Cree que los CDR deberían reemplazar las encuestas tradicionales, complementarlas o no ser utilizadas en absoluto para que los responsables de formular políticas del gobierno rastreen el desempleo? ¿Por qué?
    3. ¿Qué evidencia lo convencería de que los CDR pueden reemplazar por completo las medidas tradicionales de la tasa de desempleo?