atividades

Chave:

  • grau de dificuldade: fácil fácil , médio médio , difícil difícil , muito difícil muito difícil
  • requer matemática ( requer matemática )
  • requer codificação ( requer codificação )
  • coleção de dados ( coleção de dados )
  • meus favoritos ( meu favorito )
  1. [ difícil , requer matemática ] No capítulo, fiquei muito positiva sobre a pós-estratificação. No entanto, isso nem sempre melhorar a qualidade das estimativas. Construir uma situação onde pode pós-estratificação pode diminuir a qualidade das estimativas. (Para uma dica, veja Thomsen (1973) ).

  2. [ difícil , coleção de dados , requer codificação ] Projeto e realizar uma pesquisa não-probabilística na Amazon MTurk para perguntar sobre a posse de armas ( "Você, ou será que alguém do seu agregado familiar, possuir uma arma, rifle ou pistola? É você ou alguém em sua casa?") E atitudes em relação ao controle de armas ( "o que você acha que é mais importante, para proteger o direito dos americanos de possuir armas, ou para controlar a posse de armas?").

    1. Quanto tempo demora o seu levantamento tomar? Quanto custa isso? Como a demografia de sua amostra comparar com os dados demográficos da população dos Estados Unidos?
    2. Qual é a estimativa grosseira de posse de armas usando sua amostra?
    3. Correta para o não-representatividade de sua amostra usando pós-estratificação ou alguma outra técnica. Agora, qual é a estimativa de posse de armas?
    4. Como suas estimativas comparar com a última estimativa do Pew Research Center? O que você acha explicar as discrepâncias, se houver algum?
    5. Repita o exercício 2-5 para atitudes em relação ao controle de armas. Como seus resultados diferem?
  3. [ muito difícil , coleção de dados , requer codificação ] Goel e seus colegas (2016) administrou um inquérito de base não-probabilística composta de 49 questões de múltipla escolha de atitude retirados do Survey Geral Social (GSS) e selecione pesquisas pelo Centro de Pesquisas Pew na Amazon MTurk. Eles, então, ajustar para o não-representatividade dos dados usando baseado em modelo de pós-estratificação (Mr. P), e comparar as estimativas ajustadas com os estimados usando-base de probabilidade pesquisas GSS / Pew. Realizar a mesma pesquisa em MTurk e tentar replicar Figura 2a e Figura 2b, comparando suas estimativas ajustadas com as estimativas dos mais recentes rodadas de GSS / Pew (Veja Apêndice Tabela A2 para a lista de 49 perguntas).

    1. Comparar e contrastar os resultados com os resultados do Pew e GSS.
    2. Comparar e contrastar os resultados com os resultados do inquérito MTurk em Goel, Obeng, and Rothschild (2016) .
  4. [ médio , coleção de dados , requer codificação ] Muitos estudos usam medidas de auto-relato de dados sobre a actividade de telefonia móvel. Este é um cenário interessante, onde os pesquisadores podem comparar o comportamento auto-relato com o comportamento registados (ver, por exemplo, Boase and Ling (2013) ). Dois comportamentos comuns a fazer sobre estão chamando e mensagens de texto, e dois intervalos de tempo comuns são "ontem" e "na semana passada."

    1. Antes de coletar os dados, que do auto-relato medidas você acha que é mais preciso? Por quê?
    2. Recrutar 5 de seus amigos para a sua pesquisa. Resuma brevemente como estes 5 amigos foram amostrados. Pode este procedimento de amostragem induzir preconceitos específicos em suas estimativas?
    3. Por favor, pergunte-lhes o seguinte micro-pesquisa:
    • "Quantas vezes você usa telefone celular para chamar os outros ontem?"
    • "Quantas mensagens de texto que você mandou ontem?"
    • "Quantas vezes você usou seu telefone celular para ligar para outros nos últimos sete dias?"
    • "Quantas vezes você usar seu telefone celular para enviar ou receber mensagens de texto / SMS nos últimos sete dias?" Uma vez que a pesquisa estiver concluída, pedir para verificar os seus dados de uso como registrado pelo seu telefone ou prestador de serviços.
    1. Como o uso de auto-relato comparar com os dados de registro? Que é mais preciso, que é menos precisa?
    2. Agora combinar os dados que você coletou com os dados de outras pessoas em sua classe (se você estiver fazendo esta actividade para uma classe). Com este conjunto de dados maior, repetir parte (d).
  5. [ médio , coleção de dados ] Schuman e Presser (1996) argumentam que as ordens de interrogação faria diferença para dois tipos de relações entre perguntas: perguntas parte-parte onde duas perguntas estão no mesmo nível de especificidade (por exemplo, notações de dois candidatos presidenciais); e as perguntas parte-todo, onde uma questão geral segue uma pergunta mais específica (por exemplo, perguntando: "Como você está satisfeito com o seu trabalho?", seguido de "quanto você está satisfeito com sua vida?").

    Eles caracterizar dois tipos de efeito de ordem pergunta: efeitos de consistência ocorrer quando respostas a uma pergunta depois se aproximam (do que seria de outra maneira) para aquelas dadas a uma pergunta anterior; contrastam efeitos ocorrem quando há maiores diferenças entre as respostas às duas perguntas.

    1. Criar um par de perguntas parte-parte que você acha que vai ter um grande efeito ordem das perguntas, um par de perguntas parte-todo que você acha que vai ter um efeito grande ordem, e outro par de perguntas cuja ordem você acha que não teria importância. Executar uma experiência levantamento sobre MTurk para testar suas perguntas.
    2. Quão grande foi o efeito parcial parte você foi capaz de criar? Foi um efeito consistência ou contraste?
    3. Quão grande foi o efeito parte-todo você foi capaz de criar? Foi um efeito consistência ou contraste?
    4. Houve um efeito ordem das perguntas em seu par de onde você não acha que a ordem teria importância?
  6. [ médio , coleção de dados ] Com base no trabalho de Schuman e Presser, Moore (2002) descreve uma dimensão separada do efeito de ordem pergunta: aditivo e subtrativo. Embora os efeitos de contraste e consistência são produzidos como consequência de avaliações dos dois itens dos entrevistados em relação uns aos outros, efeitos aditivos e subtractive são produzidos quando os entrevistados são feitas mais sensível ao quadro mais amplo dentro do qual as questões são colocadas. Leia Moore (2002) , em seguida, desenhar e executar um experimento de pesquisa sobre MTurk para demonstrar aditivas ou subtrativas efeitos.

  7. [ difícil , coleção de dados ] Christopher Antoun e seus colegas (2015) realizaram um estudo comparando as amostras de conveniência obtidos a partir de quatro diferentes fontes de recrutamento online: MTurk, Craigslist, Google AdWords e Facebook. Projetar uma pesquisa simples e recrutar participantes através de pelo menos duas fontes de recrutamento on-line diferentes (eles podem ser diferentes fontes dos quatro fontes utilizadas na Antoun et al. (2015) ).

    1. Comparar o custo por recruta, em termos de dinheiro e tempo, entre as diferentes fontes.
    2. Comparar a composição das amostras obtidas a partir de diferentes fontes.
    3. Comparar a qualidade dos dados entre as amostras. Para idéias sobre como medir a qualidade dos dados de respondentes, ver Schober et al. (2015) .
    4. Qual é a sua fonte preferida? Por quê?
  8. [ médio ] YouGov, uma empresa de pesquisa de mercado com base na Internet, realizado pesquisas on-line de um painel de cerca de 800.000 respondentes no Reino Unido e usado o Sr. P. para prever o resultado de referendo da UE (ou seja, Brexit) onde os eleitores britânicos votam quer permanecer ou sair da União Europeia.

    Uma descrição detalhada do modelo estatístico de YouGov está aqui (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Grosso modo, YouGov partições eleitores em tipos com base em 2.015 escolha voto eleição geral, idade, qualificações, sexo, data de entrevista, bem como a circunscrição em que vivem. Em primeiro lugar, eles usaram dados coletados dos painelistas YouGov para estimar, entre aqueles que votam, a proporção de pessoas de cada tipo de eleitores que pretendem votar licença. Eles estimam participação de cada tipo de eleitor, usando o britânico Study 2015 Eleição (BES) pós-eleitoral face-a-face levantamento, que validou afluência dos cadernos eleitorais. Finalmente, eles estimar quantas pessoas há de cada tipo de eleitor no eleitorado com base no último Censo e Pesquisa da população anual (com algumas informações além das BES, dados de pesquisas YouGov em torno da eleição geral, e informações sobre quantas pessoas votaram a favor cada uma das partes em cada circunscrição).

    Três dias antes da votação, YouGov mostrou uma vantagem de dois pontos para Leave. Na véspera da votação, a pesquisa mostrou muito perto de chamar (49-51 permanecem). O estudo final on-the-dia previu 48/52 em favor do Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Na verdade, esta estimativa perdeu o resultado final (52-48 Leave) em quatro pontos percentuais.

    1. Usar a estrutura de erro levantamento total de discutidos neste capítulo para avaliar o que poderia ter dado errado.
    2. A resposta de YouGov após a eleição (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) explicou: "Isto parece em grande parte devido à afluência - algo que temos dito o tempo todo seria crucial para o resultado de uma corrida tão finamente equilibrada. Nosso modelo de participação foi baseado, em parte, do facto de os inquiridos tinham votado na última eleição geral e um nível de afluência superior ao de eleições gerais perturbar o modelo, particularmente no Norte. "Será que isso altere a resposta para a parte (a)?
  9. [ médio , requer codificação ] Faça uma simulação para ilustrar cada um dos erros de representação na Figura 3.1.

    1. Criar uma situação onde estes erros, na verdade, se anulam.
    2. Criar uma situação onde os erros agravar o outro.
  10. [ muito difícil , requer codificação ] A pesquisa de Blumenstock e seus colegas (2015) envolveu a construção de um modelo de aprendizagem máquina que poderia usar dados de rastreio digital para prever as respostas da pesquisa. Agora, você está indo para tentar a mesma coisa com um conjunto de dados diferente. Kosinski, Stillwell, and Graepel (2013) constatou que Facebook gosta pode prever traços individuais e atributos. Surpreendentemente, estas previsões podem ser ainda mais preciso do que os de amigos e colegas (Youyou, Kosinski, and Stillwell 2015) .

    1. Leia Kosinski, Stillwell, and Graepel (2013) , e replicar Figura 2. estão disponíveis Seus dados aqui: http://mypersonality.org/
    2. Agora, a Figura 3 replicar.
    3. Finalmente, tente o seu modelo em seu próprio dados Facebook: http://applymagicsauce.com/. Quão bem ele funciona para você?
  11. [ médio ] Toole et al. (2015) registros de chamadas uso de detalhe (CDR) de telefones celulares para prever as tendências de desemprego agregados.

    1. Comparar e contrastar o projeto de Toole et al. (2015) com Blumenstock, Cadamuro, and On (2015) .
    2. Você acha CDRs deve substituir os inquéritos tradicionais, complementá-las ou não ser usado em todos para os formuladores de políticas governamentais para controlar o desemprego? Por quê?
    3. Que evidência o convenceria que CDRs pode substituir completamente as medidas tradicionais de a taxa de desemprego?