2.4.3 približnih eksperimenti

Možemo približan eksperimente koje ne možemo učiniti. Dva pristupa koji posebno koristi od digitalnog doba podudaranja i fizičke eksperimente.

Mnogi važni znanstveni i politika pitanja su uzročno. Razmotrimo, na primjer, slijedeće pitanje: što je učinak programa obuke za posao na plaće? Jedan od načina da se odgovor na ovo pitanje bi se sa randomiziranom kontroliranom pokusu u kojem su radnici bili nasumično dodijeljen ili obuku ili ne obuku. Zatim, istraživači su mogli procijeniti učinak treninga za te sudionike jednostavno uspoređujući plaće ljudi koji su primili obuku za one koji to nisu primili.

Jednostavna usporedba vrijedi zbog nečega što se događa prije nego što se podaci još se prikupljaju: od randomizacije. Bez randomizacije, problem je puno trickier. Istraživač može usporediti plaće ljudi koji su se dobrovoljno prijavili za obuku za one koji nisu registrirali. To usporedba će vjerojatno pokazati da su ljudi koji su dobili obuku zaradio više, ali koliko je to zbog treninga i koliko je to zato što ljudi koji prijave za trening su različiti od onih koji se ne prijave za trening? Drugim riječima, je li pošteno uspoređivati ​​plaće ove dvije skupine ljudi?

Ta briga o fer usporedbe dovodi neke znanstvenike da vjeruju da je to nemoguće napraviti uzročne procjene bez provođenja eksperimenta. Ova tvrdnja ide predaleko. Iako je istina da su pokusi daju najjači dokaz za uzročno-posljedičnih efekata, postoje i druge strategije koje mogu pružiti vrijedne uzročne procjene. Umjesto razmišljanja da uzročni Procjene su ili lako (u slučaju pokusa) ili nemoguće (u slučaju da pasivno promatrati podatke), bolje je razmišljati o strategijama za izradu uzročne procjene leže duž kontinuuma od najjače do najslabije (slika 2.4). U najjačoj kraju kontinuuma su randomiziranih kontroliranih pokusa. No, to su često teško raditi u društvenim istraživanjima jer mnogi tretmani zahtijevaju nerealne iznose suradnji s vladama ili poduzeća; jednostavno postoje mnogi eksperimenti koje ne možemo učiniti. Ja ću posvetiti sve poglavlju 4 na oba prednosti i slabosti randomiziranih kontroliranih pokusa, a ja ću reći da je u nekim slučajevima, postoje jaki etički razlozi da vole promatranja eksperimentalnim metodama.

Slika 2.4: Continuum istraživačkih strategija za procijenjene uzročnih učinaka.

Slika 2.4: Continuum istraživačkih strategija za procijenjene uzročnih učinaka.

Kretanje uz kontinuum, postoje situacije u kojima znanstvenici još nisu eksplicitno randomizirana. To je, znanstvenici pokušavaju naučiti eksperiment, kao što su znanje, bez zapravo radi eksperiment; naravno, ovo će biti lukav, ali velika podaci uvelike poboljšava našu sposobnost da uzročne procjene u takvim situacijama.

Ponekad postoje postavke u kojima slučajnost u svijetu događa stvoriti nešto poput eksperimenta za istraživače. Ovi dizajni su pozvani prirodne eksperimente, i oni će se smatrati detaljno u poglavlju 2.4.3.1. Dva obilježja velikih izvora-njihovi podaci uvijek na prirodu i njihovu veličinu-uvelike povećava našu sposobnost da uče od prirodnih eksperimenata kada se pojave.

Premještanje dalje iz randomiziranih kontroliranih pokusa, ponekad ne postoji ni jedan događaj u prirodi koje možemo koristiti za približno prirodni eksperiment. U tim postavkama, pažljivo može konstruirati usporedbe unutar ne-eksperimentalnim podacima u pokušaju približiti eksperiment. Ovi dizajni su pozvani podudaranja, i ​​oni će se smatrati detaljno u poglavlju 2.4.3.2. Poput prirodnih eksperimenata, slaganje je dizajn koji također koristi od velikih izvora podataka. Konkretno, masivni veličina kako u pogledu broja predmeta i vrsti informacija po predmetu-uvelike olakšava slaganje. Ključna razlika između prirodnih eksperimenata i podudaranja da je u prirodnim eksperimentima istraživač zna proces kroz koji je dodijeljen tretman i vjeruje da je to slučajno.

Koncept fer usporedbe koje motivirani želje raditi eksperimente i temelj dva alternativna pristupa: prirodne eksperimente i odgovara. Ovi pristupi omogućit će procijeniti uzročne posljedice od pasivnog promatranih podataka otkrivajući fer usporedbe sjedi unutar podataka koje već imate.