prólogo

Este libro comezou en 2005 nun sótano na Universidade de Columbia. Naquela época, era un estudante de posgrao, e estaba executando un experimento en liña que eventualmente sería a miña disertación. Vou falarvos sobre as partes científicas dese experimento no capítulo 4, pero agora vou falar sobre algo que non está na miña disertación nin en ningún dos meus traballos. E é algo que cambiou fundamentalmente como penso na investigación. Unha mañá, cando entrou na miña oficina de soto, descubrín que unha noite aproximadamente 100 persoas de Brasil participaran do meu experimento. Esta simple experiencia tivo un profundo efecto sobre min. Naquel tempo, tiña amigos que realizaban experimentos de laboratorio tradicionais e sabía o que tiñan que traballar para contratar, supervisar e pagar ás persoas para participar destes experimentos; se puideran executar 10 persoas nun só día, ese foi un bo progreso. Con todo, co meu experimento en liña, 100 persoas participaron mentres durmía . Facer a súa investigación mentres duerme pode parecer bo para ser verdade, pero non o é. Os cambios na tecnoloxía -especialmente a transición da idade analóxica á idade dixital- permiten agora recoller e analizar datos sociais de formas novas. Este libro trata de facer investigación social nestas novas formas.

Este libro é para os científicos sociais que desexan facer máis ciencia de datos, científicos de datos que desexan facer máis ciencias sociais e calquera persoa interesada no híbrido destes dous campos. Dado o que se refire este libro, non debería dicir que non sexa só para estudantes e profesores. Aínda que actualmente traballo nunha universidade (Princeton), tamén traballei no goberno (na Oficina do Censo de EE. UU.) E na industria de tecnoloxía (en Microsoft Research), entón sei que hai moita investigación emocionante que ocorre fóra de universidades. Se pensas no que estás facendo como investigación social, este libro é para ti, non importa onde traballo ou que tipo de técnicas empregas actualmente.

Como xa notou, o ton deste libro é un pouco diferente ao de moitos outros libros académicos. Isto é intencional. Este libro xurdiu dun seminario de posgrao sobre ciencias sociais computacionais que teño ensinado en Princeton no Departamento de Socioloxía desde o 2007, e gustaríame capturar parte da enerxía e emoción dese seminario. En particular, quero que este libro teña tres características: quero que sexa útil, orientado ao futuro e optimista.

Útil : O meu obxectivo é escribir un libro que sexa útil para ti. Polo tanto, vou escribir nun estilo aberto, informal e orientado a exemplos. Isto é porque o máis importante que quero transmitir é unha determinada forma de pensar sobre a investigación social. E a miña experiencia suxire que a mellor forma de transmitir esta forma de pensar é informal e con moitos exemplos. Ademais, ao final de cada capítulo, teño unha sección titulada "Que ler despois" que axudará a transición cara a lecturas máis detalladas e técnicas sobre moitos dos temas que presento. Ao final, espero que este libro che axude tanto a investigar como a avaliación da investigación dos demais.

Orientado ao futuro : este libro axudaralle a realizar investigacións sociais utilizando os sistemas dixitais que existen e os que se crearán no futuro. Comezou a facer este tipo de investigacións en 2004 e desde entón vin moitos cambios e estou seguro de que ao longo da súa carreira tamén verán moitos cambios. O truco para ser relevante ante o cambio é a abstracción . Por exemplo, este non vai ser un libro que lle ensine exactamente como usar a API de Twitter como existe hoxe; En cambio, vai ensinarche a aprender de grandes fontes de datos (capítulo 2). Este non vai ser un libro que lle proporcione instrucións paso a paso para executar experimentos en Amazon Mechanical Turk; En cambio, vai ensinarlle como deseñar e interpretar experiencias que dependen da infraestrutura de idade dixital (capítulo 4). A través do uso da abstracción, espero que este sexa un libro atemporal sobre un tema oportuno.

Optimista : as dúas comunidades que ocupa este libro: científicos sociais e científicos de datos, teñen antecedentes e intereses moi diferentes. Ademais destas diferenzas relacionadas coa ciencia, que falo no libro, tamén notei que estas dúas comunidades teñen estilos diferentes. Os científicos de datos xeralmente están emocionados; eles tenden a ver o vaso como medio cheo. Os científicos sociais, por outra banda, son xeralmente máis críticos; tenden a ver o vaso como medio baleiro. Neste libro, vou a adoptar o ton optimista dun científico de datos. Entón, cando presento exemplos, vou dicirche o que me encanta estes exemplos. E cando remito os problemas cos exemplos, e vou facer iso porque ningunha investigación é perfecta, vou intentar sinalar estes problemas dun xeito positivo e optimista. Non vou ser crítico por ser crítico. Vou ser crítico para que poida axudarche a crear unha mellor investigación.

Aínda nos atopamos nos primeiros días da investigación social na era dixital, pero vin algúns malentendidos que son tan comúns que ten sentido para min abordalos aquí, no prefacio. Dende os científicos de datos, vin dous malentendidos comúns. O primeiro é pensar que máis datos resolve problemas automaticamente. Non obstante, para a investigación social, esa non foi a miña experiencia. De feito, para a investigación social, mellores datos, en oposición a máis datos, parecen ser máis útiles. O segundo malentendido que vin de científicos de datos está pensando que a ciencia social é só un grupo de discusións fantasiosas envoltas ao sentido común. Por suposto, como científico social, máis concretamente como sociólogo, non estou de acordo con iso. As persoas intelixentes estiveron traballando arduamente para comprender o comportamento humano durante moito tempo, e parece imprudente ignorar a sabedoría que se acumulou a partir deste esforzo. A miña esperanza é que este libro che ofreza algunha desa sabedoría dun xeito que sexa fácil de entender.

Dende os científicos sociais, vin tamén dous malentendidos comúns. En primeiro lugar, vin que algunhas persoas escribe toda a idea de investigación social utilizando as ferramentas da era dixital por mor de algúns malos documentos. Se estás lendo este libro, probablemente xa teñas lido un monte de papeis que utilizan datos de redes sociais de xeito banal ou incorrecto (ou ambos). Eu teño tamén. Non obstante, sería un grave erro concluír con estes exemplos que toda a investigación social na era digital é mala. En realidade, probabelmente tamén leu unha morea de papeis que utilizan os datos da enquisa de maneira banal ou incorrecta, pero non escribe toda a investigación utilizando enquisas. Isto é porque sabes que hai unha boa investigación realizada cos datos da enquisa, e neste libro vou amosar que tamén hai unha gran investigación feita coas ferramentas da era dixital.

O segundo malentendido común que vin de científicos sociais é confundir o presente co futuro. Cando avaliamos as investigacións sociais na era dixital -a investigación que vou describir- é importante que formulemos dúas preguntas distintas: "¿Como funciona este tipo de investigación neste momento?" E "Que bo será este estilo de traballo de investigación no futuro? "Os investigadores están capacitados para responder a primeira pregunta, pero para este libro creo que a segunda cuestión é máis importante. É dicir, aínda que a investigación social na era dixital aínda non producise accións intelectuais masivas e cambiantes de paradigmas, a taxa de mellora da procura de idade dixital é incriblemente rápida. É esta taxa de cambio -máis que o nivel actual- que fai que a procura de idade dixital sexa tan emocionante para min.

Aínda que o último parágrafo pode parecer de ofrecerlle riquezas potenciais nun futuro non especificado no futuro, o meu obxectivo non é venderche en ningún tipo de investigación en particular. Non personalmente comparto accións en Twitter, Facebook, Google, Microsoft, Apple ou calquera outra empresa de tecnoloxía (aínda que, en aras da divulgación completa, debo mencionar que traballei ou recibín fondos de investigación de Microsoft, Google e Facebook). A través do libro, polo tanto, o meu obxectivo é seguir sendo un narrador credível, dicíndolle sobre todas as novidades emocionantes que son posibles, ao guiarte lonxe dunhas poucas trampas que vin caer noutros (e ocasionalmente caen en min mesmo) .

A intersección das ciencias sociais e as ciencias da información ás veces se denomina ciencia social computacional. Algúns consideran que este é un campo técnico, pero este non será un libro técnico no sentido tradicional. Por exemplo, non hai ecuacións no texto principal. Escolleime escribir o libro deste xeito porque quería proporcionar unha visión integral da investigación social na era dixital, incluíndo grandes fontes de datos, enquisas, experimentos, colaboración en masa e ética. Resultou imposible cubrir todos estes temas e proporcionar detalles técnicos sobre cada un deles. No seu canto, os punteiros para obter máis material técnico preséntanse na sección "¿Que ler a continuación" ao final de cada capítulo. Noutras palabras, este libro non está deseñado para lle ensinar como facer un cálculo específico; máis ben, está deseñado para cambiar a forma na que pensa sobre a investigación social.

Como usar este libro nun curso

Como dicía anteriormente, este libro xurdiu en parte dun seminario de posgrao sobre ciencias sociais computacionais que estiven ensinando dende 2007 en Princeton. Como podes estar pensando en utilizar este libro para impartir un curso, pensei que podería ser útil para min explicar como se creou do meu curso e como me imaxino que se usa noutros cursos.

Durante varios anos, ensinou o meu curso sen un libro; Eu só asignaría unha colección de artigos. Mentres os estudantes puideron aprender a partir destes artigos, os artigos por si só non estaban a levar a cambios conceptuais que esperaba crear. Así que pasaría a maior parte do tempo na aula ofrecendo perspectivas, contextos e consellos para axudar aos alumnos a ver a gran imaxe. Este libro é o meu intento de anotar toda esa perspectiva, contexto e consello dunha forma que non teña requisitos previos -en termos de ciencia social ou ciencia de datos.

Nun curso semestral, recomendaría emparejar este libro cunha variedade de lecturas adicionais. Por exemplo, un curso deste tipo pode pasar dúas semanas en experimentos e podes emparejar o capítulo 4 con lecturas sobre temas como o papel da información de pre-tratamento no deseño e análise de experimentos; Asuntos estatísticos e computacionais suscitados por probas a gran escala de A / B nas empresas. deseño de experimentos específicamente centrados en mecanismos; e cuestións prácticas, científicas e éticas relacionadas coa utilización de participantes nos mercados de traballo en liña, como Amazon Mechanical Turk. Tamén podería combinarse con lecturas e actividades relacionadas coa programación. A elección adecuada entre estes moitos pares posibles depende dos estudantes do teu curso (por exemplo, estudantes de posgrao, máster ou doctorado), os seus fondos e os seus obxectivos.

Un curso de semestre tamén pode incluír conxuntos semanais de problemas. Cada capítulo ten unha variedade de actividades que están marcadas por un grao de dificultade: fácil ( fácil ), medio ( medio ), duro ( duro ), e moi difícil ( moi duro ). Ademais, etiquetei cada problema coas habilidades que require: matemáticas ( require matemáticas ), codificación ( require codificación ) e recollida de datos ( recollida de datos ). Finalmente, etiquetei algunhas das actividades que son os meus favoritos persoais ( Meu favorito ). Espero que dentro desta diversa colección de actividades, atoparás algúns que sexan axeitados para os teus alumnos.

Para axudar ás persoas que usan este libro nos cursos, comecei unha colección de materiais didácticos como programas, diapositivas, combinacións recomendadas para cada capítulo e solucións para algunhas actividades. Podes atopar estes materiais e contribuír a eles en http://www.bitbybitbook.com.