En los enfoques abordados hasta ahora en este libro (comportamiento de observación (capítulo 2) y preguntas (capítulo 3), los investigadores recopilan datos sin cambiar el mundo de manera intencional y sistemática. El enfoque cubierto en este capítulo -realizar experimentos- es fundamentalmente diferente. Cuando los investigadores realizan experimentos, sistemáticamente intervienen en el mundo para crear datos que son ideales para responder preguntas sobre relaciones de causa y efecto.
Las preguntas de causa y efecto son muy comunes en la investigación social, y los ejemplos incluyen preguntas como: ¿El aumento de los salarios de los maestros aumenta el aprendizaje de los estudiantes? ¿Cuál es el efecto del salario mínimo en las tasas de empleo? ¿Cómo afecta la carrera de un solicitante de empleo la posibilidad de conseguir un trabajo? Además de estas preguntas explícitamente causales, a veces las preguntas de causa y efecto están implícitas en preguntas más generales sobre la maximización de alguna métrica de rendimiento. Por ejemplo, la pregunta "¿De qué color debería ser el botón de donación en el sitio web de una ONG?" Es realmente una gran cantidad de preguntas sobre el efecto de los diferentes colores de los botones en las donaciones.
Una forma de responder preguntas de causa y efecto es buscar patrones en los datos existentes. Por ejemplo, volviendo a la pregunta sobre el efecto de los salarios de los docentes en el aprendizaje de los estudiantes, puede calcular que los estudiantes aprenden más en las escuelas que ofrecen altos salarios de docentes. Pero, ¿esta correlación muestra que los salarios más altos hacen que los estudiantes aprendan más? Por supuesto no. Las escuelas donde los maestros ganan más pueden ser diferentes de muchas maneras. Por ejemplo, los estudiantes en las escuelas con altos salarios de maestros pueden provenir de familias más ricas. Por lo tanto, lo que parece ser un efecto de los maestros podría provenir simplemente de la comparación de diferentes tipos de estudiantes. Estas diferencias no medidas entre los estudiantes se denominan factores de confusión y, en general, la posibilidad de factores de confusión causa estragos en la capacidad de los investigadores para responder preguntas de causa y efecto mediante la búsqueda de patrones en los datos existentes.
Una solución al problema de los factores de confusión es tratar de hacer comparaciones justas ajustando las diferencias observables entre los grupos. Por ejemplo, es posible que pueda descargar datos de impuestos sobre la propiedad de varios sitios web del gobierno. Luego, puede comparar el rendimiento de los estudiantes en las escuelas donde los precios de las viviendas son similares, pero los salarios de los maestros son diferentes, y aún puede encontrar que los estudiantes aprenden más en las escuelas con un salario más alto para los maestros. Pero todavía hay muchos posibles factores de confusión. Tal vez los padres de estos estudiantes difieren en su nivel de educación. O tal vez las escuelas difieren en su cercanía a las bibliotecas públicas. O tal vez las escuelas con salarios más altos para maestros también tienen un pago más alto para los directores, y el pago principal, no el pago de maestros, es realmente lo que está aumentando el aprendizaje de los estudiantes. Podría tratar de medir y ajustar estos factores también, pero la lista de posibles factores de confusión es esencialmente interminable. En muchas situaciones, simplemente no puede medir y ajustar todos los posibles factores de confusión. En respuesta a este desafío, los investigadores han desarrollado una serie de técnicas para hacer estimaciones causales a partir de datos no experimentales -discutí algunos de ellos en el capítulo 2- pero, para ciertos tipos de preguntas, estas técnicas son limitadas, y los experimentos ofrecen una prometedora alternativa.
Los experimentos permiten a los investigadores ir más allá de las correlaciones en los datos que se producen de manera natural para responder de manera confiable a ciertas preguntas de causa y efecto. En la era analógica, los experimentos a menudo eran logísticamente difíciles y costosos. Ahora, en la era digital, las limitaciones logísticas se están desvaneciendo gradualmente. No solo es más fácil hacer experimentos como los realizados en el pasado, ahora es posible ejecutar nuevos tipos de experimentos.
En lo que he escrito hasta ahora he sido un poco flojo en mi lenguaje, pero es importante distinguir entre dos cosas: experimentos y experimentos controlados aleatorios. En un experimento , un investigador interviene en el mundo y luego mide un resultado. He escuchado este enfoque descrito como "perturbar y observar". En un experimento controlado aleatorizado, un investigador interviene para algunas personas y no para otras, y el investigador decide qué personas reciben la intervención por asignación al azar (por ejemplo, arrojando una moneda al aire). Los experimentos controlados aleatorios crean comparaciones justas entre dos grupos: uno que ha recibido la intervención y otro que no. En otras palabras, los experimentos controlados aleatorios son una solución a los problemas de los factores de confusión. Sin embargo, los experimentos de exploración y observación solo involucran a un solo grupo que ha recibido la intervención y, por lo tanto, los resultados pueden llevar a los investigadores a una conclusión incorrecta (como mostraré próximamente). A pesar de las diferencias importantes entre los experimentos y los experimentos controlados aleatorios, los investigadores sociales a menudo usan estos términos indistintamente. Seguiré esta convención, pero, en ciertos puntos, romperé la convención para enfatizar el valor de experimentos controlados aleatorios sobre experimentos sin aleatorización y un grupo de control.
Los experimentos aleatorizados controlados han demostrado ser una forma poderosa de aprender sobre el mundo social, y en este capítulo, le mostraré más acerca de cómo usarlos en su investigación. En la sección 4.2, ilustraré la lógica básica de la experimentación con un ejemplo de un experimento en Wikipedia. Luego, en la sección 4.3, describiré la diferencia entre los experimentos de laboratorio y los experimentos de campo y las diferencias entre los experimentos analógicos y los experimentos digitales. Además, argumentaré que los experimentos de campo digitales pueden ofrecer las mejores características de los experimentos de laboratorio analógico (control estricto) y los experimentos de campo analógico (realismo), todo a una escala que antes no era posible. A continuación, en la sección 4.4, describiré tres conceptos: validez, heterogeneidad de los efectos del tratamiento y mecanismos, que son fundamentales para diseñar experimentos enriquecidos. Con ese trasfondo, describiré las concesiones involucradas en las dos estrategias principales para realizar experimentos digitales: hacerlo usted mismo o asociarse con los poderosos. Finalmente, concluiré con algunos consejos de diseño sobre cómo puede aprovechar el poder real de los experimentos digitales (sección 4.6.1) y describir algunas de las responsabilidades que conlleva ese poder (sección 4.6.2).