actividades

  • grao de dificultade: fácil fácil , medio medio , duro duro , moi duro moi duro
  • require matemáticas ( require matemáticas )
  • require codificación ( require codificación )
  • recopilación de datos ( recollida de datos )
  • meus favoritos ( Meu favorito )
  1. [ duro , require matemáticas ] No capítulo, fun moi positivo sobre a postestratificación. Non obstante, isto non sempre mellora a calidade das estimacións. Construír unha situación na que a postestratificación pode diminuír a calidade das estimacións. (Para unha información, vexa Thomsen (1973) .)

  2. [ duro , recollida de datos , require codificación ] Deseña e realice unha enquisa non probábel sobre Amazon Mechanical Turk para preguntar sobre a posesión e as actitudes dos pistolas contra o control de armas. Para que poida comparar as súas estimacións con aquelas derivadas dun exemplo de probabilidade, cómpre copiar o texto da pregunta e as opcións de resposta directamente desde unha enquisa de alta calidade como as que exerce o Centro de Investigación Pew.

    1. Canto tempo leva a súa enquisa? Canto custa? Como se compara a demografía da túa mostra coas demográficas da poboación estadounidense?
    2. Cal é a estimación bruta da propiedade da arma usando o seu exemplo?
    3. Corrixir a representación non representativa da túa mostra usando postratación ou outra técnica. Agora cal é a estimación da posesión de armas?
    4. Como se comparan as estimacións coa última estimación dunha mostra baseada en probabilidades? ¿Que pensas que explica as discrepancias, se hai algún?
    5. Repita as preguntas (b) - (d) para as actitudes cara ao control de armas. Como difieren os teus resultados?
  3. [ moi duro , recollida de datos , require codificación ] Goel e colegas (2016) administraron 49 preguntas actuais de elección múltiple extraídas da Enquisa Social Xeral (GSS) e seleccionaron enquisas polo Centro de Investigación Pew a unha mostra de probas de probas extraídas de Amazon Mechanical Turk. A continuación, axústanse pola non representatividade dos datos mediante a postratalización baseada en modelos e compararon as súas estimacións axustadas con aquelas das enquisas GSS e Pew baseadas en probabilidades. Realizar a mesma enquisa sobre Amazon Mechanical Turk e tratar de replicar a figura 2a ea figura 2b ao comparar as estimacións axustadas coas estimacións das últimas roldas das enquisas PSS e GSS. (Vexa a táboa A2 do anexo para a lista de 49 preguntas).

    1. Compara e contrasta os resultados cos de Pew e GSS.
    2. Comparar e contrastar os resultados cos da encuesta Mechanical Turk en Goel, Obeng, and Rothschild (2016) .
  4. [ medio , recollida de datos , require codificación ] Moitos estudos usan medidas de auto-informe do uso do teléfono móbil. Este é un escenario interesante no que os investigadores poden comparar o comportamento auto-informar co comportamento rexistrado (ver por exemplo, Boase and Ling (2013) ). Dous comportamentos comúns para preguntar son chamar e mensaxes de texto, e dous cadros comúns son "onte" e "na última semana".

    1. Antes de recoller datos, cal das medidas de autoinformación cres que é máis precisa? Por que?
    2. Reclute cinco dos teus amigos para que estean na túa enquisa. Por favor resumir brevemente como se mostraban estes cinco amigos. Podería este proceso de mostraxe inducir prexuízos específicos nas súas estimacións?
    3. Preguntalles as seguintes preguntas de microsurvey:
    • "¿Cantas veces usabas o teu teléfono móbil para chamar a outros onte?"
    • "Cantas mensaxes de texto enviou onte?"
    • "Cantas veces usaches o teu teléfono móbil para chamar aos demais nos últimos sete días?"
    • "Cantas veces empregaches o teu teléfono móbil para enviar ou recibir mensaxes de texto / SMS nos últimos sete días?"
    1. Unha vez que se completa este microcirurxía, solicite consultar os seus datos de uso como está rexistrado polo seu teléfono ou proveedor de servizos. Como se compara o uso de autoinformación cos datos de rexistro? Cal é a máis precisa, que é a menos precisa?
    2. Agora combina os datos que recolleu cos datos de outras persoas da túa clase (se está a facer esta actividade para unha clase). Con este conxunto de datos máis grande, repita a parte (d).
  5. [ medio , recollida de datos ] Schuman e Presser (1996) sosteñen que os pedidos de preguntas importaríanse por dous tipos de preguntas: preguntas parcial cando dúas preguntas están ao mesmo nivel de especificidade (por exemplo, clasificacións de dous candidatos presidenciais); e cuestións en parte, onde unha pregunta xeral segue unha pregunta máis específica (por exemplo, preguntando "¿Como está satisfeito co seu traballo?" seguido de "¿Como está satisfeito coa súa vida?").

    Caracterizan ademais dous tipos de efecto de orde de preguntas: os efectos de consistencia prodúcense cando se achegan as respostas a unha pregunta posterior (do que sería doutro xeito) a aquelas que se deron a unha pregunta anterior; Os efectos de contraste ocorren cando hai maiores diferenzas entre as respostas a dúas preguntas.

    1. Crea un par de preguntas parcial que crees que terán un gran efecto de orde de pregunta; un par de preguntas de todo o que pensas terá un efecto de gran orde; e un par de preguntas cuxo orde pensas que non importa. Executar un experimento de enquisas en Amazon Mechanical Turk para probar as túas preguntas.
    2. ¿Canto podías crear un efecto de parte parcial? Era un efecto de consistencia ou contraste?
    3. ¿Canto podo crear un efecto parcial completo? Era un efecto de consistencia ou contraste?
    4. Houbo un efecto de orde de preguntas no seu par onde non pensaba que o pedido importaría?
  6. [ medio , recollida de datos ] Baseándose no traballo de Schuman e Presser, Moore (2002) describe unha dimensión separada do efecto da orde de preguntas: efectos aditivos e subtractivos. Mentres os efectos de contraste e consistencia prodúcense como consecuencia das avaliacións dos dous elementos entre parentes, os efectos aditivos e subtractivos prodúcense cando os enquisados ​​fanse máis sensibles ao marco máis amplo dentro do cal se formulan as preguntas. Ler Moore (2002) , entón deseñar e executar un experimento de enquisa sobre MTurk para demostrar efectos aditivos ou subtractivos.

  7. [ duro , recollida de datos ] Christopher Antoun e seus colegas (2015) realizaron un estudo que compara as mostras de conveniencia obtidas a partir de catro fontes de recrutamento en liña diferentes: MTurk, Craigslist, Google AdWords e Facebook. Deseña unha enquisa sinxela e reclente aos participantes a través de polo menos dúas fontes de recrutamento en liña diferentes (estas fontes poden ser diferentes das catro fontes utilizadas en Antoun et al. (2015) ).

    1. Compare o custo por recrutamento en termos de diñeiro e tempo entre diferentes fontes.
    2. Compare a composición das mostras obtidas a partir de distintas fontes.
    3. Compare a calidade dos datos entre as mostras. Para obter ideas sobre como medir a calidade de datos dos entrevistados, consulte Schober et al. (2015) .
    4. Cal é a túa fonte preferida? Por que?
  8. [ medio ] Nun esforzo para predecir os resultados do Referendo da UE 2016 (ou sexa, Brexit), YouGov-unha empresa de investigación de mercado baseada en Internet realizou enquisas en liña dun panel de preto de 800.000 entrevistados no Reino Unido.

    Pode atopar unha descrición detallada do modelo estatístico de YouGov en https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Ao redor de palabras, YouGov dividiu aos votantes en tipos baseados na elección xeral de votos electorais 2015, idade, cualificación, xénero e data da entrevista, así como a circunscrición na que viviron. En primeiro lugar, usaron os datos recollidos dos panelistas de YouGov para estimar, entre os que votaron, a proporción de persoas de cada votante que desexaban votar. Eles estimaron a participación de cada tipo de votante usando o 2015 British Election Study (BES), unha enquisa presencial cara a cara, que validou a participación dos roles electorais. Finalmente, estimaron cantas persoas existían de cada tipo de votante no electorado, baseado no último Censo e Enquisa de poboación anual (con algunha información adicional de outras fontes de datos).

    Tres días antes da votación, YouGov mostrou unha vantaxe de dous puntos para Leave. Na véspera da votación, a enquisa indicou que o resultado estaba moi preto de chamar (49/51 Permanecer). O estudo final do día prevé 48/52 a favor de Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). De feito, esta estimación perdeu o resultado final (52/48 de baixa) en catro puntos porcentuais.

    1. Use o cadro de erro da investigación total que se discute neste capítulo para avaliar o que podería ter mal.
    2. A resposta de YouGov logo das eleccións (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) explicou: "Isto parece en gran parte debido á participación: algo que dixemos que todo o tempo sería crucial para o resultado dunha carreira tan finamente equilibrada. O noso modelo de participación baseouse, en parte, en saber se os entrevistados votaron nas últimas eleccións xerais e un nivel de participación por encima das eleccións xerais molestaron o modelo, particularmente no Norte. "¿Cambia a túa resposta á parte (a)?
  9. [ medio , require codificación ] Escriba unha simulación para ilustrar cada un dos erros de representación na figura 3.2.

    1. Crea unha situación onde estes erros realmente cancelan.
    2. Crea unha situación onde os erros se compoñen.
  10. [ moi duro , require codificación ] A investigación de Blumenstock e colegas (2015) implicou a construción dun modelo de aprendizaxe automático que podería empregar datos de seguimento dixital para predecir respostas de enquisas. Agora, intentarás o mesmo con un conxunto de datos diferente. Kosinski, Stillwell, and Graepel (2013) descubriron que Facebook lles gusta pode predecir trazos e atributos individuais. Sorprendentemente, estas previsións poden ser aínda máis precisas que as de amigos e colegas (Youyou, Kosinski, and Stillwell 2015) .

    1. Ler Kosinski, Stillwell, and Graepel (2013) , e reproducir a figura 2. Os seus datos están dispoñibles en http://mypersonality.org/
    2. Agora, replique a figura 3.
    3. Finalmente, probe o seu modelo nos seus propios datos de Facebook: http://applymagicsauce.com/. Que bo funciona para ti?
  11. [ medio ] Toole et al. (2015) usaron rexistros de detalles de chamadas (CDR) desde teléfonos móbiles para predecir as tendencias agregadas de desemprego.

    1. Compare e contraste o deseño do estudo de Toole et al. (2015) coa de Blumenstock, Cadamuro, and On (2015) .
    2. ¿Creen que os CDR deberían substituír as enquisas tradicionais, complementá-las ou non se utilizarán para que os formuladores de políticas gobernamentais sigan o desemprego? Por que?
    3. Que probas vos convencerían de que os CDR poden substituír completamente as medidas tradicionais da taxa de desemprego?