Este livro começou em 2005 em um porão na Universidade de Columbia. Na época, eu era um estudante de pós-graduação e estava fazendo uma experiência on-line que acabaria se tornando minha dissertação. Vou contar tudo sobre as partes científicas desse experimento no capítulo 4, mas agora vou falar sobre algo que não está em minha dissertação ou em nenhum de meus trabalhos. E é algo que mudou fundamentalmente como penso em pesquisa. Certa manhã, quando entrei no escritório do porão, descobri que, de um dia para o outro, cerca de cem pessoas do Brasil haviam participado do meu experimento. Essa experiência simples teve um efeito profundo em mim. Naquela época, eu tinha amigos que estavam fazendo experimentos de laboratório tradicionais e sabia o quanto eles precisavam trabalhar para recrutar, supervisionar e pagar pessoas para participar desses experimentos; se eles pudessem rodar 10 pessoas em um único dia, isso seria um bom progresso. No entanto, com o meu experimento on-line, 100 pessoas participaram enquanto eu estava dormindo . Fazendo sua pesquisa enquanto você está dormindo pode parecer bom demais para ser verdade, mas não é. Mudanças na tecnologia - especificamente a transição da era analógica para a era digital - significam que agora podemos coletar e analisar dados sociais de novas maneiras. Este livro é sobre fazer pesquisa social dessas novas maneiras.
Este livro é para cientistas sociais que querem fazer mais ciência de dados, cientistas de dados que querem fazer mais ciência social e qualquer pessoa interessada no híbrido desses dois campos. Para quem é este livro, não é preciso dizer que não é apenas para alunos e professores. Embora eu atualmente trabalhe em uma universidade (Princeton), eu também trabalhei no governo (no US Census Bureau) e na indústria de tecnologia (na Microsoft Research) então eu sei que há muita pesquisa excitante acontecendo fora de universidades. Se você pensa no que está fazendo como pesquisa social, este livro é para você, não importa onde você trabalhe ou que tipo de técnicas você usa atualmente.
Como você já deve ter notado, o tom deste livro é um pouco diferente do de muitos outros livros acadêmicos. Isso é intencional. Este livro surgiu de um seminário de pós-graduação em ciência social computacional que eu ensinei em Princeton no Departamento de Sociologia desde 2007, e gostaria de capturar um pouco da energia e emoção desse seminário. Em particular, quero que este livro tenha três características: quero que ele seja útil, orientado para o futuro e otimista.
Útil : Meu objetivo é escrever um livro que seja útil para você. Portanto, vou escrever em um estilo aberto, informal e orientado a exemplos. Isso porque a coisa mais importante que quero transmitir é uma maneira de pensar sobre pesquisa social. E minha experiência sugere que a melhor maneira de transmitir essa maneira de pensar é informal e com muitos exemplos. Além disso, no final de cada capítulo, tenho uma seção chamada "O que ler a seguir", que o ajudará na transição para leituras mais detalhadas e técnicas sobre muitos dos tópicos que introduzo. No final, espero que este livro ajude você a pesquisar e avaliar a pesquisa de outras pessoas.
Orientado para o futuro : este livro irá ajudá-lo a fazer pesquisas sociais usando os sistemas digitais que existem hoje e aqueles que serão criados no futuro. Comecei a fazer esse tipo de pesquisa em 2004 e, desde então, tenho visto muitas mudanças, e tenho certeza de que, ao longo de sua carreira, você também verá muitas mudanças. O truque para se manter relevante em face da mudança é a abstração . Por exemplo, este não será um livro que ensine exatamente como usar a API do Twitter como existe hoje; em vez disso, ele ensinará como aprender com fontes de big data (capítulo 2). Este não será um livro que forneça instruções passo a passo para a execução de experimentos no Amazon Mechanical Turk; em vez disso, ele vai ensinar como projetar e interpretar experimentos que dependem da infraestrutura da era digital (capítulo 4). Através do uso da abstração, espero que este seja um livro intemporal sobre um tópico oportuno.
Otimista : As duas comunidades envolvidas neste livro - cientistas sociais e cientistas de dados - têm origens e interesses muito diferentes. Além dessas diferenças relacionadas à ciência, sobre as quais falo no livro, também percebi que essas duas comunidades têm estilos diferentes. Os cientistas de dados são geralmente excitados; eles tendem a ver o copo meio cheio. Os cientistas sociais, por outro lado, são geralmente mais críticos; eles tendem a ver o copo meio vazio. Neste livro, vou adotar o tom otimista de um cientista de dados. Então, quando apresento exemplos, vou lhe contar o que amo nesses exemplos. E, quando eu mostro problemas com os exemplos - e farei isso porque nenhuma pesquisa é perfeita -, vou tentar apontar esses problemas de uma maneira positiva e otimista. Não vou ser crítico por ser crítico - vou ser crítico para ajudá-lo a criar uma pesquisa melhor.
Ainda estamos nos primórdios da pesquisa social na era digital, mas tenho visto alguns mal-entendidos tão comuns que faz sentido para mim abordá-los aqui, no prefácio. Dos cientistas de dados, vi dois mal-entendidos comuns. O primeiro é pensar que mais dados resolvem automaticamente os problemas. No entanto, para pesquisa social, essa não tem sido minha experiência. De fato, para pesquisas sociais, dados melhores - ao contrário de mais dados - parecem ser mais úteis. O segundo mal-entendido que eu vi de cientistas de dados é pensar que a ciência social é apenas um monte de conversas extravagantes envolvidas no senso comum. Naturalmente, como cientista social - mais especificamente como sociólogo - não concordo com isso. Pessoas espertas têm trabalhado duro para entender o comportamento humano por um longo tempo, e parece insensato ignorar a sabedoria que se acumulou com esse esforço. Minha esperança é que este livro ofereça a você um pouco dessa sabedoria de uma maneira fácil de entender.
Dos cientistas sociais, também vi dois mal-entendidos comuns. Primeiro, vi algumas pessoas escreverem toda a idéia de pesquisa social usando as ferramentas da era digital por causa de alguns documentos ruins. Se você está lendo este livro, provavelmente já leu um monte de artigos que usam dados de mídia social de maneira banal ou errada (ou ambos). Eu também tenho. No entanto, seria um grave erro concluir, a partir desses exemplos, que toda pesquisa social sobre a era digital é ruim. Na verdade, você provavelmente já leu um monte de artigos que usam dados de pesquisa de maneiras que são banais ou erradas, mas você não elimina todas as pesquisas usando pesquisas. Isso porque você sabe que há uma grande pesquisa feita com dados de pesquisa e, neste livro, mostrarei a você que há também uma grande pesquisa feita com as ferramentas da era digital.
O segundo mal-entendido comum que eu vi de cientistas sociais é confundir o presente com o futuro. Quando avaliamos a pesquisa social na era digital - a pesquisa que vou descrever - é importante fazer duas perguntas distintas: "Como esse estilo de pesquisa funciona bem agora?" E "Como esse estilo de trabalho de pesquisa no futuro? ”Os pesquisadores são treinados para responder à primeira pergunta, mas para este livro eu acho que a segunda pergunta é mais importante. Isto é, mesmo que a pesquisa social na era digital ainda não tenha produzido contribuições intelectuais maciças e que mudem de paradigma, a taxa de melhoria da pesquisa sobre a era digital é incrivelmente rápida. É essa taxa de mudança - mais do que o nível atual - que torna a pesquisa sobre a era digital tão excitante para mim.
Mesmo que esse último parágrafo possa parecer oferecer a você riquezas potenciais em algum momento não especificado no futuro, meu objetivo não é vender você em nenhum tipo particular de pesquisa. Eu pessoalmente não possuo ações no Twitter, Facebook, Google, Microsoft, Apple ou qualquer outra empresa de tecnologia (embora, por uma questão de divulgação completa, eu deva mencionar que eu trabalhei ou recebi financiamento de pesquisa da Microsoft, Google e Facebook). Por todo o livro, portanto, meu objetivo é continuar sendo um narrador crível, contando sobre todas as coisas excitantes que é possível, enquanto te guio para longe de algumas armadilhas nas quais eu vi outras pessoas caírem (e ocasionalmente caírem em mim) .
A intersecção entre ciência social e ciência de dados é às vezes chamada de ciência social computacional. Alguns consideram isso um campo técnico, mas isso não será um livro técnico no sentido tradicional. Por exemplo, não há equações no texto principal. Escolhi escrever o livro dessa maneira porque queria fornecer uma visão abrangente da pesquisa social na era digital, incluindo fontes de big data, pesquisas, experimentos, colaboração em massa e ética. Acabou sendo impossível cobrir todos esses tópicos e fornecer detalhes técnicos sobre cada um deles. Em vez disso, os ponteiros para o material mais técnico são fornecidos na seção “O que ler a seguir” no final de cada capítulo. Em outras palavras, este livro não foi projetado para ensinar como fazer qualquer cálculo específico; em vez disso, ele é projetado para mudar a maneira como você pensa sobre pesquisa social.
Como usar este livro em um curso
Como eu disse anteriormente, este livro surgiu em parte de um seminário de pós-graduação em ciências sociais computacionais que venho lecionando desde 2007 em Princeton. Como você pode estar pensando em usar este livro para ministrar um curso, achei que poderia ser útil explicar como ele surgiu do meu curso e como imagino que ele seja usado em outros cursos.
Durante vários anos, ensinei meu curso sem um livro; Eu acabei de atribuir uma coleção de artigos. Embora os alunos pudessem aprender com esses artigos, os artigos por si só não estavam levando a mudanças conceituais que eu esperava criar. Então, eu passava a maior parte do tempo na aula fornecendo perspectiva, contexto e conselhos para ajudar os alunos a ver o quadro geral. Este livro é minha tentativa de escrever toda essa perspectiva, contexto e conselho de uma forma que não tem pré-requisitos - em termos de ciência social ou ciência de dados.
Em um curso de um semestre, eu recomendaria emparelhar este livro com uma variedade de leituras adicionais. Por exemplo, esse curso pode levar duas semanas em experimentos e você pode emparelhar o capítulo 4 com leituras sobre tópicos como o papel das informações de pré-tratamento no projeto e na análise de experimentos; questões estatísticas e computacionais levantadas por testes A / B de larga escala nas empresas; desenho de experimentos especificamente focados em mecanismos; e questões práticas, científicas e éticas relacionadas ao uso de participantes de mercados de trabalho on-line, como o Amazon Mechanical Turk. Também poderia ser emparelhado com leituras e atividades relacionadas à programação. A escolha apropriada entre esses muitos pares possíveis depende dos alunos em seu curso (por exemplo, graduação, mestrado ou doutorado), seus históricos e objetivos.
Um curso de duração de semestre também pode incluir conjuntos de problemas semanais. Cada capítulo tem uma variedade de atividades que são rotuladas por grau de dificuldade: fácil ( ), médio ( ), Difícil ( ) e muito difícil ( ). Além disso, rotulei cada problema pelas habilidades que ele requer: matemática ( ), codificação ( ) e coleta de dados ( ). Finalmente, eu rotulei algumas das atividades que são meus favoritos pessoais ( ). Espero que, nesse conjunto diversificado de atividades, você encontre algumas que sejam apropriadas para seus alunos.
Para ajudar as pessoas que usam este livro em cursos, iniciei uma coleção de materiais de ensino, como planos de estudo, slides, emparelhamentos recomendados para cada capítulo e soluções para algumas atividades. Você pode encontrar esses materiais e contribuir para eles em http://www.bitbybitbook.com.