Siamo in grado di approssimare esperimenti che non possiamo fare. Due approcci che beneficiano soprattutto nell'era digitale sono corrispondenti e gli esperimenti naturali.
Molte importanti questioni scientifiche e politiche sono causale. Consideriamo, per esempio, la seguente domanda: qual è l'effetto di un programma di formazione professionale sui salari? Un modo per rispondere a questa domanda sarebbe con un esperimento randomizzato controllato in cui i lavoratori sono stati assegnati in modo casuale a ricevere una formazione o no ricevere una formazione. Poi, i ricercatori potrebbero stimare l'effetto di formazione per questi partecipanti, semplicemente confrontando i salari di persone che hanno ricevuto la formazione a coloro che non hanno ricevuto esso.
Il semplice confronto è valido a causa di qualcosa che accade prima i dati sono stati raccolti anche: la randomizzazione. Senza randomizzazione, il problema è molto più complicato. Un ricercatore potrebbe confrontare il salario di persone che hanno firmato volontariamente per la formazione a coloro che non hanno firmato-up. Tale confronto sarebbe probabilmente mostrano che le persone che hanno ricevuto una formazione guadagnato di più, ma quanto di questo è a causa della formazione e quanto di questo è perché la gente che si iscrivono per la formazione sono diversi da quelli che non iscriversi per la formazione? In altre parole, è giusto confrontare il salario di questi due gruppi di persone?
Questa preoccupazione per i confronti equi porta alcuni ricercatori a credere che sia impossibile fare stime causali senza correre un esperimento. Questa affermazione va troppo lontano. Se è vero che gli esperimenti forniscono la prova più forte per effetti causali, ci sono altre strategie che possono fornire stime causali preziosi. Invece di pensare che le stime causali sono sia facile (nel caso di esperimenti) o impossibile (nel caso di passivamente osservato dati), è meglio pensare alle strategie per fare stime causali che si trovano lungo un continuum dal più forte al più debole (Figura 2.4). Alla fine più forte del continuum sono randomizzati esperimenti controllati. Ma, questi sono spesso difficili da fare nel campo della ricerca sociale, perché molti trattamenti richiedono quantità non realistiche di cooperazione da parte dei governi o aziende; semplicemente ci sono molti esperimenti che non possiamo fare. Dedicherò tutto il capitolo 4 a entrambi i punti di forza e di debolezza di esperimenti controllati randomizzati, e ti sostengono che, in alcuni casi, ci sono forti ragioni etiche per preferire osservazionale di metodi sperimentali.
Muovendosi lungo il continuum, ci sono situazioni in cui i ricercatori non hanno esplicitamente randomizzati. Cioè, i ricercatori stanno tentando di imparare la conoscenza esperimento simile, senza in realtà fare un esperimento; Naturalmente, questo sta per essere difficile, ma grande di dati migliora notevolmente la nostra capacità di effettuare stime causali in queste situazioni.
A volte ci sono ambienti in cui la casualità nel mondo avviene per creare qualcosa di simile a un esperimento per i ricercatori. Questi disegni sono chiamati esperimenti naturali, e saranno prese in considerazione in dettaglio nella sezione 2.4.3.1. Due caratteristiche di grandi fonti di-loro dati natura always-on e la loro dimensione, migliora notevolmente la nostra capacità di imparare dagli esperimenti naturali quando si verificano.
Spostamento di più lontano da esperimenti randomizzati controllati, a volte non c'è nemmeno un evento in natura che possiamo usare per approssimare un esperimento naturale. In queste impostazioni, possiamo costruire con attenzione i confronti all'interno dei dati non sperimentali nel tentativo di approssimare un esperimento. Questi disegni sono chiamati corrispondenza, e saranno prese in considerazione in dettaglio nella sezione 2.4.3.2. Come esperimenti naturali, matching è un progetto che beneficia anche di grandi fonti di dati. In particolare, le dimensioni, sia massiccia in termini di numero di casi e il tipo di informazioni per ogni caso, facilita notevolmente corrispondenza. La differenza fondamentale tra esperimenti naturali e di corrispondenza è che in esperimenti naturali il ricercatore conosce il processo attraverso il quale è stato assegnato e crede che sia casuale il trattamento.
Il concetto di confronti equi che hanno motivato i desideri di fare esperimenti è anche alla base dei due approcci alternativi: esperimenti naturali e di corrispondenza. Questi approcci vi permetterà di stimare gli effetti causali dai dati osservati passivamente scoprendo confronti equi siedono all'interno dei dati che hai già.