actividades

Key:

  • Grado de dificultade: fácil fácil , medio medio , difícil difícil , moi duro moi duro
  • require matemáticas ( require matemáticas )
  • require codificación ( require codificación )
  • recollida de datos ( recollida de datos )
  • favoritos ( Meu favorito )
  1. [ difícil , require matemáticas ] O capítulo, quedei moi positiva sobre a post-estratificación. Con todo, isto non sempre mellorar a calidade das estimacións. Construír unha situación onde pode post-estratificación pode diminuír a calidade das estimacións. (Para unha información, consulte Thomsen (1973) ).

  2. [ difícil , recollida de datos , require codificación ] Proxecto e realizar unha investigación non-probabilística en Amazon MTurk para preguntar sobre a posesión de armas ( "Vostede, ou será que alguén da súa familia, posuír un arma, rifle ou pistola? É vostede ou alguén na súa casa?") E actitudes en relación ao control de armas ( "o que pensas que é máis importante, para protexer o dereito dos estadounidenses de posuír armas, ou para controlar a posesión de armas?").

    1. Canto tempo leva o seu levantamento tomar? Canto custa? Como a demografía da súa mostra comparar cos datos demográficos da poboación dos Estados Unidos?
    2. Cal é a estimación groseira de posesión de armas usando a súa mostra?
    3. Correcta para o non-representatividade da súa mostra usando post-estratificación ou algunha outra técnica. Agora, cal é a estimación de posesión de armas?
    4. Como as súas estimacións comparar coa última estimación do Pew Research Center? ¿Que pensas explicar as discrepancias, se hai algún?
    5. Repita o exercicio 2-5 para actitudes en relación ao control de armas. Como os seus resultados difiren?
  3. [ moi duro , recollida de datos , require codificación ] Goel e os seus colegas (2016) administrou unha enquisa de base non-probabilística composta de 49 preguntas de múltiple elección de actitude retirados do Survey Xeral Social (GSS) e seleccione investigacións polo Centro de Investigacións Pew en Amazon MTurk. Eles, entón, establecer para o non-representatividade dos datos utilizando baseado en modelo de post-estratificación (Mr P), e comparar as estimacións axustadas cos estimados usándose base de probabilidade investigacións GSS / Pew. Realizar a mesma investigación en MTurk e tentar replicar Figura 2a e Imaxe 2b, comparando as súas estimacións axustadas as estimacións dos recentes roldas de GSS / Pew (Ver apéndice Táboa A2 á lista de 49 preguntas).

    1. Comparar e contrastar os resultados cos resultados do Pew e GSS.
    2. Comparar e contrastar os resultados cos resultados da enquisa MTurk en Goel, Obeng, and Rothschild (2016) .
  4. [ medio , recollida de datos , require codificación ] Moitos estudos utilizan medidas de auto-relato de datos sobre a actividade de telefonía móbil. Este é un escenario interesante, onde os investigadores poden comparar o comportamento auto-relato co comportamento rexistrados (ver, por exemplo, Boase and Ling (2013) ). Dous comportamentos comúns a facer sobre están chamando e mensaxes de texto, e dous intervalos de tempo comúns son "onte" e "a semana pasada."

    1. Antes de recoller os datos, que do propio relato medidas pensas que é máis preciso? Por que?
    2. Contratar 5 dos seus amigos para a súa investigación. Resume brevemente como estes 5 amigos foron miniaturizados. Pode este procedemento de mostraxe inducir prexuízos específicos nas súas estimacións?
    3. Por favor, pregunta-lles o seguinte micro-busca:
    • "Cantas veces usa teléfono móbil para chamar os outros onte?"
    • "Cantas mensaxes de texto que mandou onte?"
    • "Cantas veces usou o seu teléfono móbil para chamar a outros nos últimos sete días?"
    • "Cantas veces usar o seu teléfono móbil para enviar ou recibir mensaxes de texto / SMS nos últimos sete días?" Xa que a investigación estea rematado, pedir para comprobar os seus datos de uso como rexistrado polo seu teléfono ou prestador de servizos.
    1. Como o uso de auto-relato comparar cos datos de rexistro? Que é máis preciso, que é menos precisa?
    2. Agora combinar os datos que recadou cos datos de outras persoas na súa clase (se está facendo esta actividade para unha clase). Con este conxunto de datos máis grande, repetir parte (d).
  5. [ medio , recollida de datos ] Schuman e Presser (1996) argumentan que as ordes de interrogación faría diferenza para dous tipos de relacións entre preguntas: preguntas pártese parte onde dúas preguntas están no mesmo nivel de especificidade (por exemplo, notacións de dous candidatos presidenciais); e as preguntas parte-todo, onde un tema xeral segue unha pregunta máis específica (por exemplo, pregunta: "Como está satisfeito co seu traballo?", seguido de "que está satisfeito coa súa vida?").

    Eles caracterizar dous tipos de efectos de orde pregunta: efectos de consistencia ocorrer cando respostas a unha pregunta despois se aproximan (do que sería doutra forma) para aquelas dadas a unha pregunta anterior; contrastan efectos ocorren cando hai grandes diferenzas entre as respostas ás dúas preguntas.

    1. Crear un par de preguntas pártese parte que pensas que vai ter un gran efecto orde das preguntas, un par de preguntas parte-todo que pensas que vai ter un efecto grande orde, e outro par de preguntas cuxa orde pensas que non tería importancia. Realizar unha experiencia levantamento sobre MTurk para probar as súas preguntas.
    2. O grande foi o efecto parcial parte foi capaz de crear? Foi un efecto consistencia ou contraste?
    3. O grande foi o efecto parte-todo foi capaz de crear? Foi un efecto consistencia ou contraste?
    4. Houbo un efecto orde das preguntas no seu par de onde non pensa que a orde tería importancia?
  6. [ medio , recollida de datos ] Baseado no traballo de Schuman e Presser, Moore (2002) describe unha dimensión separada do efecto de orde pregunta: aditivo e subtrativo. Aínda que os efectos de contraste e consistencia son producidos como consecuencia de valoración dos dous elementos dos entrevistados en relación uns ós outros, efectos aditivos e subtractive prodúcense cando os entrevistados son feitas máis sensible ao cadro máis amplo dentro do cal as cuestións son colocadas. Ler Moore (2002) , a continuación, deseñar e executar un experimento de investigación sobre MTurk para demostrar aditivas ou subtrativas efectos.

  7. [ difícil , recollida de datos ] Christopher Antoun e os seus colegas (2015) realizaron un estudo comparando as mostras de barrio obtidos a partir de catro diferentes fontes de contratación en liña: MTurk, Craigslist, AdWords e Facebook. Proxectar unha busca simple e contratar asistentes a través de polo menos dúas fontes de contratación en liña diferentes (poden ser diferentes fontes dos catro fontes utilizadas na Antoun et al. (2015) ).

    1. Comparar o custo por contratar, en termos de diñeiro e tempo, entre as distintas fontes.
    2. Comparar a composición das mostras obtidas a partir de diferentes fontes.
    3. Comparar a calidade dos datos entre as mostras. Para ideas sobre como medir a calidade dos datos de respondentes, ver Schober et al. (2015) .
    4. Cal é a súa fonte preferida? Por que?
  8. [ medio ] YouGov, unha empresa de investigación de mercado con base en Internet, realizado investigacións en liña dun panel de preto de 800.000 respondentes no Reino Unido e usar o Sr P. para prever o resultado referendo da UE (é dicir, Brexit) onde os electores británicos votan quere permanecer ou saír da Unión Europea.

    Unha descrición detallada do modelo estatístico de YouGov está aquí (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Grosso modo, YouGov particións electores en tipos en base a 2.015 elección voto elección xeral, idade, cualificacións, sexo, data de entrevista, así como a circunscrición na que viven. En primeiro lugar, eles usaron datos recollidos dos panel YouGov para estimar, entre aqueles que votan, a proporción de persoas de cada tipo de electores que pretenden votar licenza. Eles estiman participación de cada tipo de elector, mediante o británico Study 2015 Elección (BES) postelectoral cara a cara levantamento, que validou afluencia dos cadernos electorais. Finalmente, eles estimar cantas persoas hai de cada tipo de elector no electorado segundo o último censo e Busca da poboación anual (con información máis aló das BES, datos de investigacións YouGov arredor da elección xeral, e información sobre cantas persoas votaron a favor cada unha das partes en cada circunscrición).

    Tres días antes da votación, YouGov mostrou unha vantaxe de dous puntos para Leave. Na véspera da votación, a investigación mostrou moi preto de chamar (49-51 permanecen). O estudo final on-the-día previu 48/52 en favor do Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). De feito, esta estimación perdeu o resultado final (52-48 Leave) en catro puntos porcentuais.

    1. Usar a estrutura de erro levantamento total de discutidos neste capítulo para avaliar o que podería dar mal.
    2. A resposta de YouGov tras a elección (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) explicou: "Isto parece en gran parte debido á afluencia - algo que dixemos o tempo sería crucial para o resultado dunha carreira tan finamente equilibrado. O noso modelo de participación foi baseado, en parte, do feito de que os enquisados ​​votaran na última elección xeral e un nivel de afluencia superior ao de eleccións xerais perturbar o modelo, especialmente no norte. "Será que isto cambie a resposta á parte (a)?
  9. [ medio , require codificación ] Fai unha simulación para ilustrar cada un dos erros de representación na Figura 3.1.

    1. Crear unha situación onde estes erros, en realidade, se anulan.
    2. Crear unha situación onde os erros agravar o outro.
  10. [ moi duro , require codificación ] A procura de Blumenstock e os seus colegas (2015) implica a construción dun modelo de aprendizaxe máquina que podería usar datos de seguimento dixital para prever as respostas da investigación. Agora está indo a tentar o mesmo con un conxunto de datos diferente. Kosinski, Stillwell, and Graepel (2013) determinou que Facebook gusta pode prever trazos individuais e atributos. Sorprendentemente, estas previsións poden ser aínda máis preciso do que os de amigos e compañeiros (Youyou, Kosinski, and Stillwell 2015) .

    1. Ler Kosinski, Stillwell, and Graepel (2013) , e replicar Figura 2. dispoñibles seus datos aquí: http://mypersonality.org/
    2. Agora, a Figura 3 replicar.
    3. Finalmente, proba o seu modelo no seu propio datos Facebook: http://applymagicsauce.com/. Ben funciona para ti?
  11. [ medio ] Toole et al. (2015) rexistros de chamadas uso detalle (CDR) de teléfonos móbiles para prever as tendencias de desemprego agregados.

    1. Comparar e contrastar o proxecto de Toole et al. (2015) con Blumenstock, Cadamuro, and On (2015) .
    2. Pensas CDRs debe substituír as enquisas tradicionais, complementalo las ou non pode usar en todos os formuladores de políticas gobernamentais para controlar o desemprego? Por que?
    3. Que evidencia o convencería que CDRs pode substituír completamente as medidas tradicionais de que a taxa de desemprego?