Ocupaciones

Llave:

  • grado de dificultad: fácil fácil , media medio , difícil difícil , muy duro muy duro
  • requiere matemáticas ( requiere matemáticas )
  • requiere codificación ( requiere de codificación )
  • recopilación de datos ( recopilación de datos )
  • mis favoritos ( mi favorito )
  1. [ difícil , requiere matemáticas ] En el capítulo, que era muy positivo sobre el post-estratificación. Sin embargo, no siempre mejorar la calidad de las estimaciones. Construir una situación en la que puede postestratificación puede disminuir la calidad de las estimaciones. (Para tener una idea, ver Thomsen (1973) ).

  2. [ difícil , recopilación de datos , requiere de codificación ] Diseño y la realización de una encuesta no probabilístico en Amazon MTurk de preguntar acerca de la propiedad de armas ( "¿Tiene usted, o alguien de su hogar, poseer una pistola, rifle o pistola? ¿Es que usted o alguien más en su casa?") Y actitudes hacia el control de armas ( "¿Cuál cree usted que es más importante, para proteger el derecho de los estadounidenses a poseer armas, o para controlar la propiedad de armas?").

    1. ¿Cuánto tiempo dura la encuesta? ¿Cuanto cuesta? ¿De qué manera las características demográficas de la muestra se comparan con los datos demográficos de la población de Estados Unidos?
    2. ¿Cuál es la estimación bruta de la propiedad de armas usando su muestra?
    3. Correcta para asegurar la no representatividad de la muestra usando postestratificación o alguna otra técnica. Ahora ¿cuál es la estimación de la propiedad de armas?
    4. ¿Cómo sus estimaciones se comparan con la última estimación del Pew Research Center? ¿Qué opinas explicar las discrepancias, si hay alguna?
    5. Repita el ejercicio 2-5 para las actitudes hacia el control de armas. ¿En qué difieren los resultados?
  3. [ muy duro , recopilación de datos , requiere de codificación ] Goel et al (2016) administraron una encuesta basada en la no probabilístico que consta de 49 preguntas de opción múltiple de actitud extraídos de la Encuesta Social General (GSS) y seleccionar las encuestas del Centro de Investigaciones Pew en Amazon MTurk. A continuación, se ajustan a la no representatividad de los datos utilizando la base de modelos de post-estratificación (Mr. P), y comparar las estimaciones ajustadas con los estimados a través de encuestas GSS / Pew basados ​​en la probabilidad. Llevar a cabo la misma encuesta en MTurk y tratar de replicar la figura 2a y Figura 2b mediante la comparación de las estimaciones ajustadas con las estimaciones de los más recientes rondas de GSS / Pew (Cuadro Anexo A2 para la lista de las 49 preguntas).

    1. Comparar y contrastar sus resultados con los resultados de Pew y GSS.
    2. Comparar y contrastar sus resultados con los resultados de la encuesta MTurk en Goel, Obeng, and Rothschild (2016) .
  4. [ medio , recopilación de datos , requiere de codificación ] Muchos estudios utilizan medidas de auto-informe de los datos de actividad de telefonía móvil. Se trata de un entorno interesante donde los investigadores pueden comparar el comportamiento de auto-reporte con el comportamiento de inicio de sesión (véase, por ejemplo, Boase and Ling (2013) ). Dos comportamientos comunes para preguntar sobre piden y mensajes de texto, y dos marcos de tiempo son comunes "ayer" y "durante la semana pasada."

    1. Antes de la recogida de los datos, que de la auto-informe de medidas cree que es más preciso? ¿Por qué?
    2. Reclutar a 5 de tus amigos para estar en su encuesta. Breve resumen de cómo se tomaron muestras de estos 5 amigos. Podría este procedimiento de muestreo inducir sesgos específicos en sus estimaciones?
    3. Por favor, pida que el siguiente micro-encuesta:
    • "¿Cuántas veces se utiliza el teléfono móvil para llamar a otros ayer?"
    • "¿Cuántos mensajes de texto enviaste ayer?"
    • "¿Cuántas veces utiliza su teléfono móvil para llamar a otras personas en los últimos siete días?"
    • "¿Cuántas veces has usado su teléfono móvil para enviar o recibir mensajes de texto / SMS en los últimos siete días?" Una vez que se haya completado la encuesta, pida para comprobar sus datos de uso que ha iniciado sesión con su proveedor de telefonía o servicio.
    1. ¿Cómo se compara el uso de auto-reporte de datos para iniciar la sesión? ¿Qué es más exacta, que es menos precisa?
    2. Ahora se combinan los datos que se han recogido con los datos de otras personas en su clase (si es que está haciendo esta actividad para una clase). Con este conjunto de datos más grande, repetir la parte (d).
  5. [ medio , recopilación de datos ] Schuman y Presser (1996) sostienen que las órdenes de interrogación importaría para dos tipos de relaciones entre las preguntas: preguntas parcial de parte en la que dos preguntas están en el mismo nivel de especificidad (por ejemplo, las calificaciones de dos candidatos presidenciales); y preguntas parte-todo en una cuestión general sigue una pregunta más específica (por ejemplo, preguntando "¿Qué tan satisfecho está usted con su trabajo?", seguido de "¿Qué tan satisfecho está con su vida?").

    Se caracterizan, además, dos tipos de efecto de orden pregunta: efectos de consistencia se producen cuando la respuesta a una pregunta posterior se acercan (de lo que serían de otra manera) a las dadas a una pregunta anterior; contrastar los efectos se producen cuando hay mayores diferencias entre las respuestas a dos preguntas.

    1. Crear un par de preguntas-parte de las piezas que creo que va a tener un gran efecto orden de las preguntas, un par de preguntas parte-todo que crees que va a tener un efecto de orden grande, y otro par de preguntas cuyo orden cree que no tendría importancia. Ejecutar una prueba encuesta sobre MTurk para poner a prueba sus preguntas.
    2. ¿Qué tan grande fue el efecto parcial de la parte que fueron capaces de crear? Fue un efecto consistencia o el contraste?
    3. ¿Qué tan grande fue el efecto parte-todo se haya podido crear? Fue un efecto consistencia o el contraste?
    4. Hubo un efecto orden de las preguntas de su par en el que no creía que el fin importaría?
  6. [ medio , recopilación de datos ] Sobre la base de la obra de Schuman y Presser, Moore (2002) describe una dimensión separada de efecto orden de las preguntas: aditiva y sustractiva. Mientras contraste y consistencia efectos se producen como consecuencia de las evaluaciones de los dos elementos de los encuestados en relación el uno al otro, aditivo y sustractivo se producen efectos de los encuestados cuando se hacen más sensibles al marco más amplio dentro del cual se plantean las preguntas. Lee Moore (2002) , a continuación, diseñar y ejecutar un experimento encuesta sobre MTurk para demostrar aditivos o sustractivos efectos.

  7. [ difícil , recopilación de datos ] Christopher Antoun y sus colegas (2015) realizaron un estudio comparando las muestras de conveniencia obtenidos a partir de cuatro diferentes fuentes de reclutamiento en línea: MTurk, Craigslist, Google AdWords y Facebook. Diseñar una encuesta simple y reclutar a los participantes a través de al menos dos fuentes de reclutamiento en línea diferentes (que pueden ser diferentes fuentes de las cuatro fuentes utilizadas en Antoun et al. (2015) ).

    1. Compare el costo por recluta, en términos de dinero y tiempo, entre las diferentes fuentes.
    2. Comparación de la composición de las muestras obtenidas de diferentes fuentes.
    3. Comparar la calidad de los datos entre las muestras. Para obtener ideas sobre cómo medir la calidad de los datos de los encuestados, ver Schober et al. (2015) .
    4. ¿Cuál es su fuente preferida? ¿Por qué?
  8. [ medio ] YouGov, una firma de investigación de mercado basada en Internet, realizó encuestas en línea de un grupo de alrededor de 800.000 encuestados en el Reino Unido y utilizó al Sr. P. para predecir el resultado del referéndum de la UE (es decir, Brexit), donde los electores votan Reino Unido, ya sea para permanecer en o salir de la Unión Europea.

    Una descripción detallada del modelo estadístico de YouGov está aquí (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). En términos generales, YouGov particiones de los votantes en tipos basados ​​en 2015 elecciones generales decisión de voto, edad, calificaciones, sexo, fecha de la entrevista, así como la circunscripción en que viven. En primer lugar, se utilizaron los datos recogidos de los panelistas de YouGov para estimar, entre los que que votan, la proporción de personas de cada tipo de votante que tengan la intención de voto Dejar. Ellos estiman la participación de cada tipo de votante mediante el estudio de 2015 de la elección británica (BES) encuesta cara a cara después de las elecciones, que validó la participación de las listas electorales. Por último, estiman la cantidad de gente que hay de cada tipo de votante en el electorado en base al último Censo y Encuesta anual de la población (con un poco de información, además de los BES, datos de la encuesta de YouGov de todo la elección general, e información sobre el número de personas votaron por cada partido en cada circunscripción).

    Tres días antes de la votación, YouGov mostró una ventaja de dos puntos de venia. En la víspera de la votación, el sondeo mostró muy igualados (49-51 Permanecer). El estudio final sobre el día predijo 48/52 a favor de la Permanecer (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). De hecho, esta estimación se perdió el resultado final (52-48 Dejar) en cuatro puntos porcentuales.

    1. Utilice el marco de error total de la encuesta discutido en este capítulo para evaluar lo que podría haber ido mal.
    2. La respuesta de YouGov después de la elección (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) explicó: "Esto parece en gran parte debido a la participación - algo que hemos dicho desde el principio que sería crucial para el resultado de una carrera tan finamente equilibrado. Nuestro modelo de participación se basa, en parte, de si los encuestados habían votado en la última elección general y un nivel de participación superior a la de las elecciones generales alterar el modelo, sobre todo en el Norte. "¿Esto cambia su respuesta a la parte (a)?
  9. [ medio , requiere de codificación ] Escribir una simulación para ilustrar cada uno de los errores de representación en la figura 3.1.

    1. Crear una situación en la que estos errores de hecho se anulan.
    2. Crear una situación en la que los errores agravan entre sí.
  10. [ muy duro , requiere de codificación ] La investigación de Blumenstock y sus colegas (2015) implicó la construcción de un modelo de aprendizaje de máquinas que podrían utilizar los datos de seguimiento digitales para predecir respuestas de la encuesta. Ahora, usted va a intentar hacer lo mismo con un conjunto de datos diferente. Kosinski, Stillwell, and Graepel (2013) encontró que Facebook le gusta puede predecir rasgos y atributos individuales. Sorprendentemente, estas predicciones pueden ser aún más precisos que los de amigos y colegas (Youyou, Kosinski, and Stillwell 2015) .

    1. Leer Kosinski, Stillwell, and Graepel (2013) , y replicar Figura 2. Sus datos están disponibles aquí: http://mypersonality.org/
    2. Ahora, replicar la Figura 3.
    3. Por último, probar su modelo por su cuenta los datos de Facebook: http://applymagicsauce.com/. ¿Qué tan bien funciona para usted?
  11. [ medio ] Toole et al. (2015) registros de detalles de uso de llamadas (CDR) de los teléfonos móviles para predecir la evolución del desempleo agregados.

    1. Comparar y contrastar el diseño de Toole et al. (2015) con Blumenstock, Cadamuro, and On (2015) .
    2. ¿Cree que los CDR deben sustituir las encuestas tradicionales, complementarlas o no se utiliza en absoluto para las autoridades gubernamentales para realizar un seguimiento de desempleo? ¿Por qué?
    3. ¿Qué evidencia que convencer a los CDR pueden sustituir por completo las medidas tradicionales de la tasa de desempleo?