atividades

  • grau de dificuldade: fácil fácil médio médio , Difícil Difícil , muito difícil muito difícil
  • requer matemática ( requer matemática )
  • requer codificação ( requer codificação )
  • coleção de dados ( coleção de dados )
  • meus favoritos ( meu favorito )
  1. [ Difícil , requer matemática No capítulo, fiquei muito otimista sobre a pós-estratificação. No entanto, isso nem sempre melhora a qualidade das estimativas. Construa uma situação em que a pós-estratificação possa diminuir a qualidade das estimativas. (Para uma sugestão, veja Thomsen (1973) .)

  2. [ Difícil , coleção de dados , requer codificação Projetar e conduzir uma pesquisa não-probabilística no Amazon Mechanical Turk para perguntar sobre a posse de armas e atitudes em relação ao controle de armas. Para que você possa comparar suas estimativas com aquelas derivadas de uma amostra probabilística, copie o texto da pergunta e as opções de resposta diretamente de uma pesquisa de alta qualidade, como aquelas executadas pelo Pew Research Center.

    1. Quanto tempo sua pesquisa leva? Quanto custa isso? Como os dados demográficos de sua amostra se comparam aos dados demográficos da população dos EUA?
    2. Qual é a estimativa bruta da posse de armas usando sua amostra?
    3. Correto para a não-representatividade de sua amostra usando pós-estratificação ou alguma outra técnica. Agora, qual é a estimativa da posse de armas?
    4. Como suas estimativas se comparam à última estimativa de uma amostra baseada em probabilidade? O que você acha que explica as discrepâncias, se houver alguma?
    5. Repita as perguntas (b) - (d) para atitudes em relação ao controle de armas. Como suas descobertas diferem?
  3. [ muito difícil , coleção de dados , requer codificação ] Goel e colegas (2016) administraram 49 questões atitudinais de múltipla escolha retiradas do General Social Survey (GSS) e selecionaram pesquisas do Pew Research Center para uma amostra não probabilística de entrevistados extraídos da Amazon Mechanical Turk. Em seguida, eles ajustaram a não representatividade dos dados usando a pós-estratificação baseada em modelo e compararam suas estimativas ajustadas com as das pesquisas GSS e Pew baseadas em probabilidades. Realize a mesma pesquisa no Amazon Mechanical Turk e tente replicar a figura 2a e a figura 2b comparando suas estimativas ajustadas com as estimativas das rodadas mais recentes das pesquisas GSS e Pew. (Veja a tabela A2 do apêndice para a lista de 49 perguntas.)

    1. Compare e contraste seus resultados com os do Pew e GSS.
    2. Compare e contraste seus resultados com os da pesquisa Mechanical Turk em Goel, Obeng, and Rothschild (2016) .
  4. [ médio , coleção de dados , requer codificação Muitos estudos utilizam medidas autorreferidas de uso de telefones celulares. Este é um cenário interessante em que os pesquisadores podem comparar o comportamento auto-relatado com o comportamento registrado (ver, por exemplo, Boase and Ling (2013) ). Dois comportamentos comuns para perguntar são chamando e mensagens de texto, e dois prazos comuns são "ontem" e "na semana passada".

    1. Antes de coletar quaisquer dados, qual das medidas de autorrelato você acha mais precisas? Por quê?
    2. Recrute cinco dos seus amigos para participar da sua pesquisa. Por favor, resumir brevemente como esses cinco amigos foram amostrados. Esse procedimento de amostragem pode induzir vieses específicos em suas estimativas?
    3. Faça as seguintes perguntas sobre o microsurvey:
    • "Quantas vezes você usou seu celular para ligar para outras pessoas ontem?"
    • "Quantas mensagens de texto você enviou ontem?"
    • "Quantas vezes você usou seu celular para ligar para outras pessoas nos últimos sete dias?"
    • "Quantas vezes você usou seu celular para enviar ou receber mensagens de texto / SMS nos últimos sete dias?"
    1. Assim que este microsurvey for concluído, peça para verificar os dados de uso registrados por seu telefone ou provedor de serviços. Como o uso de autorrelato se compara aos dados de registro? Qual é o mais preciso, o que é menos preciso?
    2. Agora combine os dados coletados com os dados de outras pessoas da sua turma (se você estiver fazendo essa atividade para uma turma). Com este conjunto de dados maior, repita a parte (d).
  5. [ médio , coleção de dados Schuman e Presser (1996) argumentam que as ordens de perguntas seriam importantes para dois tipos de perguntas: perguntas em partes, em que duas questões têm o mesmo nível de especificidade (por exemplo, classificações de dois candidatos à presidência); e perguntas parciais, em que uma pergunta geral segue uma pergunta mais específica (por exemplo, perguntando “Qual é seu nível de satisfação com o seu trabalho?”, seguido de “Quão satisfeito você está com a sua vida?”).

    Eles ainda caracterizam dois tipos de efeito de ordem de pergunta: efeitos de consistência ocorrem quando respostas a uma questão posterior são aproximadas (do que elas seriam de outra forma) àquelas dadas a uma questão anterior; efeitos de contraste ocorrem quando há diferenças maiores entre respostas a duas perguntas.

    1. Crie um par de perguntas de parte que você acha que terá um grande efeito de ordem de perguntas; um par de perguntas com partes inteiras que você acha que terá um grande efeito de pedido; e um par de perguntas cuja ordem você acha que não importaria. Execute um experimento de pesquisa no Amazon Mechanical Turk para testar suas dúvidas.
    2. Qual o tamanho do efeito de parte que você conseguiu criar? Foi um efeito de consistência ou contraste?
    3. Quão grande efeito você conseguiu criar? Foi um efeito de consistência ou contraste?
    4. Houve um efeito de ordem de pergunta no seu par em que você não achou que a ordem importaria?
  6. [ médio , coleção de dados Com base no trabalho de Schuman e Presser, Moore (2002) descreve uma dimensão separada do efeito da ordem de perguntas: efeitos aditivos e subtrativos. Enquanto os efeitos de contraste e consistência são produzidos como consequência das avaliações dos entrevistados sobre os dois itens em relação uns aos outros, efeitos aditivos e subtrativos são produzidos quando os respondentes são mais sensíveis à estrutura maior dentro da qual as questões são colocadas. Leia Moore (2002) , depois projete e execute um experimento de pesquisa no MTurk para demonstrar efeitos aditivos ou subtrativos.

  7. [ Difícil , coleção de dados Christopher Antoun e colegas (2015) realizaram um estudo comparando as amostras de conveniência obtidas de quatro diferentes fontes de recrutamento online: MTurk, Craigslist, Google AdWords e Facebook. Elabore uma pesquisa simples e recrute participantes através de pelo menos duas fontes diferentes de recrutamento online (essas fontes podem ser diferentes das quatro fontes usadas em Antoun et al. (2015) ).

    1. Compare o custo por recruta - em termos de dinheiro e tempo - entre diferentes fontes.
    2. Compare a composição das amostras obtidas de diferentes fontes.
    3. Compare a qualidade dos dados entre as amostras. Para idéias sobre como medir a qualidade dos dados dos entrevistados, ver Schober et al. (2015) .
    4. Qual é a sua fonte preferida? Por quê?
  8. [ médio Em um esforço para prever os resultados do referendo da UE de 2016 (Brexit), a YouGov - uma empresa de pesquisa de mercado baseada na Internet - realizou pesquisas on-line de um painel de cerca de 800.000 pessoas no Reino Unido.

    Uma descrição detalhada do modelo estatístico do YouGov pode ser encontrada em https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Grosso modo, o YouGov dividiu os eleitores em tipos com base na escolha de voto das eleições gerais de 2015, idade, qualificações, sexo e data da entrevista, bem como o círculo eleitoral em que viviam. Primeiro, eles usaram dados coletados dos membros do painel do YouGov para estimar, entre aqueles que votaram, a proporção de pessoas de cada tipo de eleitor que pretendiam votar. Eles estimaram a taxa de participação de cada tipo de eleitor usando o Estudo Eleitoral Britânico de 2015 (BES), uma pesquisa face-a-face pós-eleitoral, que validou o comparecimento às listas eleitorais. Finalmente, eles estimaram quantas pessoas havia de cada tipo de eleitor no eleitorado, com base no último Censo e Pesquisa Anual de População (com algumas informações adicionais de outras fontes de dados).

    Três dias antes da votação, YouGov mostrou uma vantagem de dois pontos para o Leave. Na véspera da votação, a enquete indicou que o resultado estava muito próximo para chamar (49/51 Permanecer). O último estudo sobre o dia previu 48/52 a favor de Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). De fato, essa estimativa perdeu o resultado final (52/48 Leave) em quatro pontos percentuais.

    1. Use a estrutura total de erros de pesquisa discutida neste capítulo para avaliar o que poderia ter dado errado.
    2. A resposta do YouGov após a eleição (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) explicou: “Isso parece em grande parte devido ao comparecimento - algo que Nós dissemos o tempo todo seria crucial para o resultado de uma corrida tão bem equilibrada. Nosso modelo de comparecimento foi baseado, em parte, em se os entrevistados haviam votado nas últimas eleições gerais e um nível de participação acima das eleições gerais perturbou o modelo, particularmente no Norte. ”Isso muda sua resposta para a parte (a)?
  9. [ médio , requer codificação ] Escreva uma simulação para ilustrar cada um dos erros de representação na figura 3.2.

    1. Crie uma situação em que esses erros realmente sejam cancelados.
    2. Crie uma situação em que os erros se combinem.
  10. [ muito difícil , requer codificação ] A pesquisa de Blumenstock e colegas (2015) envolveu a construção de um modelo de aprendizado de máquina que poderia usar dados de rastreamento digital para prever as respostas da pesquisa. Agora, você tentará a mesma coisa com um conjunto de dados diferente. Kosinski, Stillwell, and Graepel (2013) descobriram que os gostos do Facebook podem prever traços e atributos individuais. Surpreendentemente, essas previsões podem ser ainda mais precisas do que as de amigos e colegas (Youyou, Kosinski, and Stillwell 2015) .

    1. Leia Kosinski, Stillwell, and Graepel (2013) e replique a figura 2. Seus dados estão disponíveis em http://mypersonality.org/
    2. Agora, replique a figura 3.
    3. Por fim, experimente o modelo em seus próprios dados do Facebook: http://applymagicsauce.com/. Quão bem isso funciona para você?
  11. [ médio Toole et al. (2015) usaram registros de detalhes de chamadas (CDRs) de telefones celulares para prever as tendências agregadas de desemprego.

    1. Compare e contraste o desenho do estudo de Toole et al. (2015) com o de Blumenstock, Cadamuro, and On (2015) .
    2. Você acha que os CDRs deveriam substituir as pesquisas tradicionais, complementá-las ou não ser usadas de forma alguma para que os formuladores de políticas do governo acompanhem o desemprego? Por quê?
    3. Que evidência o convenceria de que os CDRs podem substituir completamente as medidas tradicionais da taxa de desemprego?