Podemos achegar experiencias que non podemos facer. Dous enfoques que beneficiar especialmente a partir da era dixital están combinando e experimentos naturais.
Moitas cuestións científicas e políticas importantes son causal. Imos considerar, por exemplo, a seguinte pregunta: cal é o efecto dun programa de capacitación para o traballo sobre os salarios? Un xeito de responder a esta pregunta sería cun experimento controlado e randomizado, onde os traballadores foron aleatoriamente designados para recibir formación ou non recibir formación. A continuación, os investigadores poderían estimar o efecto do adestramento para estes participantes simplemente comparando os salarios de persoas que recibiron o adestramento para os que non recibilo.
A simple comparación é válida por mor de algo que pasa antes dos datos foi recadada mesmo: a randomização. Sen randomização, o problema é moito máis complicado. Un investigador podería comparar os salarios de persoas que asinaron voluntariamente para o adestramento para os que non inscribirse. Esta comparación probablemente mostran que as persoas que recibiron formación gañou máis, pero como iso é debido ao adestramento e como iso é porque a xente que se rexistrar para o adestramento son diferentes dos que non rexistrarte para o adestramento? Noutras palabras, non é xusto comparar o salario destes dous grupos de persoas?
Esta preocupación comparacións xustas leva uns investigadores a crer que é imposible facer estimacións causais sen realizar un experimento. Esta afirmación vai lonxe demais. Aínda que é certo que os experimentos fornecen a evidencia máis forte para efectos causais, existen outras estratexias que poden proporcionar estimacións causais valiosos. No canto de pensar que as estimacións causais son ou fácil (no caso de experimentos) ou imposible (no caso de pasivamente observada de datos), é mellor pensar en estratexias para facer estimacións causais situadas ao longo dun continuum do máis forte para o máis feble (Figura 2.4). Ao final máis forte continuo son randomizados experiencias controladas. Pero estes son moitas veces difíciles de facer en investigación social, porque moitos tratamentos requiren cantidades irreais de cooperación de gobernos ou empresas; simplemente hai moitas experiencias que non podemos facer. Vou dedicar todo o capítulo 4 para os puntos fortes e débiles de experimentos controlados e randomizados, e eu vou argumentar que, nalgúns casos, hai fortes razóns éticas para preferir observacional para métodos experimentais.
Movendo-se ao longo do continuum, hai situacións en que os investigadores non randomizados de forma explícita. É dicir, os investigadores están tentando aprender o coñecemento experimento semellante sen realmente facer unha experiencia; Por suposto, iso vai ser complicado, pero gran datos mellora significativamente a nosa capacidade de facer estimacións causais nestas situacións.
Ás veces, hai lugares onde a aleatoriedade no mundo pasa para crear algo así como un experimento para os investigadores. Estes proxectos son chamados de experimentos naturais, e eles serán analizados en detalle na sección 2.4.3.1. Dúas características das grandes fontes de-seus datos a natureza sempre-on eo seu tamaño aumenta moito a nosa capacidade de aprender a partir de experimentos naturais cando se producen.
Indo máis lonxe de experimentos aleatorios controlados, ás veces non hai nin sequera un evento na natureza que podemos usar para achegar un experimento natural. Nestes ambientes, podemos coidadosamente construír comparacións dentro datos non experimentais, nunha tentativa de achegar un experimento. Estes proxectos son chamados de correspondencia, e eles serán analizados en detalle na sección 2.4.3.2. Como experimentos naturais, de correspondencia é un proxecto que beneficia tamén de fontes de datos grandes. En particular, o tamaño, tanto en masa en termos de número de casos, o tipo de información por case-facilita enormemente correspondente. A principal diferenza entre experiencias naturais e de correspondencia é que, en experimentos naturais o investigador coñece o proceso a través do cal o tratamento asignado e cre que sexa aleatoria.
O concepto de comparacións xustas que motivaron os desexos de facer experimentos tamén está na base das dúas enfoques alternativas: experimentos naturais e combinando. Estas formulacións lle permitirá estimar os efectos causais a partir de datos pasivamente observados por descubrir comparacións xustas sentan-se dentro dos datos que xa ten.