Nos enfoques abordados ata agora neste comportamento observador de libros (capítulo 2) e facendo preguntas (capítulo 3), os buscadores recopilan datos sen modificar o mundo de forma intencionada e sistemática. O enfoque que se aborda neste capítulo -experimentos en execución- é fundamentalmente diferente. Cando os investigadores realizan experimentos, interveñen sistemáticamente no mundo para crear datos ideal para responder preguntas sobre as relacións causa-e-efecto.
As preguntas de causas e efectos son moi comúns na investigación social, e os exemplos inclúen preguntas como: ¿O incremento dos salarios dos profesores aumenta a aprendizaxe dos estudantes? Cal é o efecto do salario mínimo nas taxas de emprego? ¿Como afecta a raza do candidato do emprego a súa oportunidade de conseguir un emprego? Ademais destas preguntas explícitamente causais, ás veces as preguntas de causa e efecto están implícitas en cuestións máis xerais sobre a maximización dalgunha métrica de rendemento. Por exemplo, a pregunta "Que cor debe facer o botón de doar no sitio web dunha ONG?" É realmente moitas preguntas sobre o efecto das distintas cores do botón nas doazóns.
Unha forma de responder as preguntas de causa e efecto é buscar patróns nos datos existentes. Por exemplo, volvendo á pregunta sobre o efecto dos salarios dos profesores na aprendizaxe do alumno, podes calcular que os alumnos aprenden máis nas escolas que ofrecen salarios elevados para os profesores. Pero, esta correlación mostra que os salarios máis altos fan que os estudantes aprendan máis? Por suposto que non. As escolas onde os profesores gañan máis poderían ser diferentes en moitos sentidos. Por exemplo, os estudantes en escolas con elevados salarios de profesores poden provir de familias máis ricas. Así, o que parece un efecto dos profesores podería xurdir de comparar diferentes tipos de alumnos. Estas diferenzas non medibles entre os alumnos son chamados factores de confusión, e, en xeral, a posibilidade de confusión atrapalha a capacidade dos investigadores para responder a preguntas de causa e efecto, a buscar patróns nos datos existentes.
Unha solución ao problema dos confundidores é intentar facer comparacións xustas axustándose a diferenzas observables entre grupos. Por exemplo, pode que poida descargar datos de impostos sobre a propiedade a partir de varios sitios web do goberno. Entón, podes comparar o rendemento dos estudantes nas escolas onde os prezos das casas son similares, pero os salarios dos profesores son diferentes e aínda podes atopar que os alumnos aprendan máis nas escolas con maior remuneración do profesorado. Pero aínda hai moitos confusores posibles. Quizais os pais destes estudantes difiren no seu nivel de educación. Ou quizais as escolas difiren na súa proximidade coas bibliotecas públicas. Ou quizais as escolas con máis profesores pagan tamén teñen un salario máis elevado para os directores, e o salario principal, e non o salario do profesor, é realmente o que aumenta a aprendizaxe dos estudantes. Podería tratar de medir e axustarse tamén por estes factores, pero a lista de posibles confusores é esencialmente interminable. En moitas situacións, simplemente non se pode medir e axustar para todos os confundidores posibles. En resposta a este desafío, os investigadores desenvolveron unha serie de técnicas para facer estimacións causais a partir de datos non experimentais -exclamei algúns deles no capítulo 2- pero, para certos tipos de preguntas, estas técnicas son limitadas e os experimentos ofrecen un prometedor alternativa.
Os experimentos permiten aos investigadores superar as correlacións nos datos que se producen naturalmente para poder responder de forma fiable a determinadas preguntas sobre a causa e o efecto. Na idade análoga, os experimentos eran a miúdo logísticamente difíciles e caros. Agora, na era dixital, as restricións loxísticas vanse desvanecendo gradualmente. Non só é máis fácil facer experimentos como os realizados no pasado, agora é posible executar novos tipos de experimentos.
No que escribín ata agora estou un pouco solto na miña lingua, pero é importante distinguir entre dúas cousas: experimentos e experimentos controlados aleatorizados. Nun experimento , un investigador intervén no mundo e logo mide un resultado. Escoitei este enfoque descrito como "perturbar e observar". Nun experimento aleatorizado controlado, un investigador intervén para algunhas persoas e non para outros, eo investigador decide que persoas reciben a intervención por aleatorización (por exemplo, lanzando unha moeda). Os experimentos controlados aleatorizados crean comparacións xustas entre dous grupos: un que recibiu a intervención e outro que non o fixo. Noutras palabras, os experimentos controlados aleatorizados son unha solución aos problemas dos confundidores. Os experimentos de perturbação e observación, non obstante, impliquen só un único grupo que recibiu a intervención e, polo tanto, os resultados poden levar aos investigadores a unha conclusión incorrecta (como veremos pronto). A pesar das importantes diferenzas entre experimentos e experimentos controlados aleatorizados, os investigadores sociais adoitan empregar estes termos indistintamente. Vou seguir esta convención, pero, en certos puntos, romperé a convención para enfatizar o valor dos experimentos controlados aleatorizados a través de experimentos sen aleatorización e un grupo de control.
Os experimentos controlados aleatorizados demostraron ser unha forma poderosa de coñecer o mundo social, e neste capítulo mostrarémoslle máis información sobre como usalos na súa investigación. Na sección 4.2, ilustraré a lóxica básica da experimentación cun exemplo dun experimento en Wikipedia. Entón, na sección 4.3, describirei a diferenza entre experimentos de laboratorio e experimentos de campo e as diferenzas entre experimentos analóxicos e experimentos dixitais. Ademais, argumentarei que os experimentos de campo dixital poden ofrecer as mellores características dos experimentos de laboratorio analóxicos (control axustado) e experimentos de campo analógicos (realismo), todos a unha escala que antes non era posible. A continuación, na sección 4.4, describirei tres conceptos: validez, heteroxeneidade dos efectos do tratamento e mecanismos, que son críticos para o deseño de experimentos ricos. Con ese antecedente, describirei as compensacións implicadas nas dúas estratexias principais para a realización de experimentos dixitais: facelo só ou asociarse cos poderosos. Finalmente, conclúo con algúns consellos de deseño sobre como podes aproveitar o poder real dos experimentos dixitais (sección 4.6.1) e describir algunha responsabilidade que vén con esa potencia (sección 4.6.2).