Prefacio

Este libro comenzó en 2005 en un sótano de la Universidad de Columbia. En ese momento, yo era un estudiante graduado, y estaba ejecutando un experimento en línea que eventualmente se convertiría en mi disertación. Te contaré todo sobre las partes científicas de ese experimento en el capítulo 4, pero ahora voy a contarte acerca de algo que no está en mi disertación ni en ninguno de mis documentos. Y es algo que cambió fundamentalmente mi forma de pensar sobre la investigación. Una mañana, cuando entré en la oficina de mi sótano, descubrí que de la noche a la mañana, unas 100 personas de Brasil habían participado en mi experimento. Esta simple experiencia tuvo un profundo efecto en mí. En ese momento, tenía amigos que estaban realizando experimentos de laboratorio tradicionales, y sabía lo difícil que tenían que trabajar para reclutar, supervisar y pagar a las personas para que participaran en estos experimentos; si pudieran correr 10 personas en un solo día, eso fue un buen progreso. Sin embargo, con mi experimento en línea, 100 personas participaron mientras yo estaba durmiendo . Investigar mientras duerme puede parecer demasiado bueno para ser cierto, pero no lo es. Los cambios en la tecnología, específicamente la transición de la era analógica a la digital, significan que ahora podemos recopilar y analizar datos sociales de nuevas maneras. Este libro trata de hacer investigación social de estas nuevas maneras.

Este libro es para científicos sociales que quieren hacer más ciencia de datos, científicos de datos que quieren hacer más ciencias sociales y cualquier persona interesada en el híbrido de estos dos campos. Para quién es este libro, no hace falta decir que no es solo para estudiantes y profesores. Aunque, actualmente trabajo en una universidad (Princeton), también trabajé en el gobierno (en la Oficina del Censo de los EE. UU.) Y en la industria de la tecnología (en Microsoft Research), así que sé que hay muchas investigaciones interesantes fuera de universidades. Si piensas en lo que estás haciendo como investigación social, entonces este libro es para ti, sin importar dónde trabajas o qué tipo de técnicas usas actualmente.

Como ya habrán notado, el tono de este libro es un poco diferente al de muchos otros libros académicos. Eso es intencional. Este libro surgió de un seminario de postgrado en ciencias sociales computacionales que he enseñado en Princeton en el Departamento de Sociología desde 2007, y me gustaría que capte algo de la energía y la emoción de ese seminario. En particular, quiero que este libro tenga tres características: quiero que sea útil, orientado hacia el futuro y optimista.

Útil : Mi objetivo es escribir un libro que sea útil para ti. Por lo tanto, voy a escribir en un estilo abierto, informal y basado en ejemplos. Eso es porque lo más importante que quiero transmitir es una cierta manera de pensar acerca de la investigación social. Y, mi experiencia sugiere que la mejor manera de transmitir esta forma de pensar es informal y con muchos ejemplos. Además, al final de cada capítulo, tengo una sección llamada "Qué leer a continuación" que lo ayudará a realizar lecturas más detalladas y técnicas sobre muchos de los temas que presento. Al final, espero que este libro los ayude a investigar y evaluar la investigación de otros.

Orientado al futuro : este libro lo ayudará a hacer investigación social utilizando los sistemas digitales que existen hoy y los que se crearán en el futuro. Comencé a hacer este tipo de investigación en 2004, y desde entonces he visto muchos cambios, y estoy seguro de que a lo largo de tu carrera también verás muchos cambios. El truco para mantenerse relevante frente al cambio es la abstracción . Por ejemplo, este no va a ser un libro que te enseñe exactamente cómo usar la API de Twitter tal como existe hoy; en su lugar, te enseñará cómo aprender de las fuentes de big data (capítulo 2). No va a ser un libro que le proporcione instrucciones paso a paso para ejecutar experimentos en Amazon Mechanical Turk; en su lugar, le enseñará a diseñar e interpretar experimentos que se basan en la infraestructura de la era digital (capítulo 4). Mediante el uso de la abstracción, espero que este sea un libro intemporal sobre un tema oportuno.

Optimista : las dos comunidades con las que se relaciona este libro, científicos sociales y científicos de datos, tienen antecedentes e intereses muy diferentes. Además de estas diferencias relacionadas con la ciencia, de las que hablo en el libro, también he notado que estas dos comunidades tienen estilos diferentes. Los científicos de datos generalmente están entusiasmados; ellos tienden a ver el vaso medio lleno. Los científicos sociales, por otro lado, son generalmente más críticos; tienden a ver el vaso medio vacío. En este libro, voy a adoptar el tono optimista de un científico de datos. Entonces, cuando presente ejemplos, voy a contarte lo que amo sobre estos ejemplos. Y, cuando señalo problemas con los ejemplos, y lo haré porque ninguna investigación es perfecta, trataré de señalar estos problemas de una manera positiva y optimista. No voy a ser crítico por el simple hecho de ser crítico; voy a ser crítico para poder ayudarlo a crear una mejor investigación.

Todavía estamos en los primeros días de la investigación social en la era digital, pero he visto algunos malentendidos que son tan comunes que tiene sentido para mí abordarlos aquí, en el prefacio. De los científicos de datos, he visto dos malentendidos comunes. El primero es pensar que más datos resuelven problemas automáticamente. Sin embargo, para la investigación social, esa no ha sido mi experiencia. De hecho, para la investigación social, mejores datos, a diferencia de más datos, parecen ser más útiles. El segundo malentendido que he visto de los científicos de datos es pensar que las ciencias sociales son solo un montón de charlas envueltas en el sentido común. Por supuesto, como científico social, más específicamente como sociólogo, no estoy de acuerdo con eso. Las personas inteligentes han estado trabajando duro para comprender el comportamiento humano durante mucho tiempo, y parece imprudente ignorar la sabiduría que se ha acumulado a partir de este esfuerzo. Mi esperanza es que este libro te ofrezca algo de esa sabiduría de una manera que sea fácil de entender.

De los científicos sociales, también he visto dos malentendidos comunes. En primer lugar, he visto a algunas personas descartar toda la idea de la investigación social utilizando las herramientas de la era digital debido a algunos malos documentos. Si estás leyendo este libro, probablemente ya hayas leído un montón de documentos que usan los datos de las redes sociales de maneras banales o incorrectas (o ambas). Tengo también. Sin embargo, sería un grave error concluir de estos ejemplos que toda la investigación social en la era digital es mala. De hecho, probablemente también hayas leído un montón de documentos que usan datos de encuestas de forma banal o errónea, pero no cancelas todas las investigaciones mediante encuestas. Eso es porque usted sabe que hay una gran investigación hecha con los datos de la encuesta, y en este libro voy a mostrar que también hay una gran investigación realizada con las herramientas de la era digital.

El segundo malentendido común que he visto entre los científicos sociales es confundir el presente con el futuro. Cuando evaluamos la investigación social en la era digital, la investigación que voy a describir, es importante que formulemos dos preguntas distintas: "¿Qué tan bien funciona este estilo de investigación en este momento?" Y "¿Qué tan bien funcionará este estilo de investigación? ¿Los trabajos de investigación en el futuro? "Los investigadores están capacitados para responder la primera pregunta, pero para este libro creo que la segunda pregunta es más importante. Es decir, a pesar de que la investigación social en la era digital aún no ha producido contribuciones intelectuales masivas que cambien el paradigma, la tasa de mejora de la investigación de la era digital es increíblemente rápida. Es esta tasa de cambio, más que el nivel actual, lo que hace que la investigación de la era digital sea tan emocionante para mí.

Aunque el último párrafo parezca ofrecerle riquezas potenciales en algún momento no especificado en el futuro, mi objetivo no es venderle en ningún tipo de investigación en particular. Personalmente no poseo acciones en Twitter, Facebook, Google, Microsoft, Apple o cualquier otra compañía de tecnología (aunque, por el bien de la revelación completa, debo mencionar que he trabajado o recibido fondos de investigación de Microsoft, Google y Facebook). A lo largo del libro, por lo tanto, mi objetivo es seguir siendo un narrador creíble, contándole acerca de todo lo nuevo y emocionante que es posible, mientras te guío para alejarte de algunas trampas en las que he visto caer a otros (y ocasionalmente caer en mí mismo) .

La intersección de las ciencias sociales y la ciencia de datos a veces se llama ciencias sociales computacionales. Algunos consideran que se trata de un campo técnico, pero este no será un libro técnico en el sentido tradicional. Por ejemplo, no hay ecuaciones en el texto principal. Elegí escribir el libro de esta manera porque quería proporcionar una visión completa de la investigación social en la era digital, incluidas las fuentes de datos grandes, encuestas, experimentos, colaboración masiva y ética. Resultó imposible cubrir todos estos temas y proporcionar detalles técnicos sobre cada uno. En su lugar, se proporcionan sugerencias para obtener más material técnico en la sección "Qué leer a continuación" al final de cada capítulo. En otras palabras, este libro no está diseñado para enseñarle cómo hacer un cálculo específico; más bien, está diseñado para cambiar la forma en que piensas acerca de la investigación social.

Cómo usar este libro en un curso

Como dije antes, este libro surgió en parte de un seminario de postgrado en ciencias sociales computacionales que he estado enseñando desde 2007 en Princeton. Como podría estar pensando en usar este libro para enseñar un curso, pensé que podría ser útil para mí explicar cómo creció fuera de mi curso y cómo me imagino que se usa en otros cursos.

Durante varios años, enseñé mi curso sin un libro; Solo asignaría una colección de artículos. Si bien los estudiantes pudieron aprender de estos artículos, los artículos solos no conducían a los cambios conceptuales que yo esperaba crear. Así que pasaría la mayor parte del tiempo en clase proporcionando perspectiva, contexto y consejos para ayudar a los alumnos a ver el panorama general. Este libro es mi intento de escribir toda esa perspectiva, contexto y consejo de una manera que no tiene requisitos previos, en términos de ciencia social o ciencia de datos.

En un curso de un semestre, recomendaría emparejar este libro con una variedad de lecturas adicionales. Por ejemplo, un curso de este tipo podría durar dos semanas en experimentos, y podría emparejar el capítulo 4 con lecturas sobre temas tales como el papel de la información previa al tratamiento en el diseño y análisis de experimentos; problemas estadísticos y computacionales planteados por pruebas A / B a gran escala en empresas; diseño de experimentos específicamente enfocados en mecanismos; y cuestiones prácticas, científicas y éticas relacionadas con el uso de participantes de los mercados laborales en línea, como Amazon Mechanical Turk. También podría combinarse con lecturas y actividades relacionadas con la programación. La elección adecuada entre estas muchas parejas posibles depende de los estudiantes en su curso (por ejemplo, licenciatura, maestría o doctorado), sus antecedentes y sus objetivos.

Un curso de un semestre también podría incluir conjuntos de problemas semanales. Cada capítulo tiene una variedad de actividades que están etiquetadas por grado de dificultad: fácil ( fácil ), medio ( medio ), difícil ( difícil ) y muy difícil ( muy duro ) Además, he etiquetado cada problema por las habilidades que requiere: matemática ( requiere matemática ), codificación ( requiere codificación ), y recopilación de datos ( recopilación de datos ) Finalmente, he etiquetado algunas de las actividades que son mis favoritos personales ( mi favorito ) Espero que dentro de esta variada colección de actividades, encuentres algunas que sean apropiadas para tus alumnos.

Para ayudar a las personas que usan este libro en los cursos, he comenzado una colección de materiales de enseñanza, como planes de estudios, diapositivas, emparejamientos recomendados para cada capítulo y soluciones para algunas actividades. Puede encontrar estos materiales y contribuir a ellos en http://www.bitbybitbook.com.