2.4.3 približevanjem poskusi

Mi lahko približno poskuse, da ne moremo storiti. Oba pristopa, ki zlasti koristi od digitalne dobe se ujemajo in naravni poskusi.

Veliko pomembnih znanstvenih in politična vprašanja so vzročno. Oglejmo si, na primer, naslednje vprašanje: kakšen je učinek programa usposabljanja delovnih mest na plače? Eden od načinov za odgovor na to vprašanje bi bilo z randomizirani nadzorovani poskus, kjer so delavci naključno dodeljena bodisi usposabljajo ali ne usposabljajo. Nato bi lahko raziskovalci ocenjujejo učinek usposabljanja za te udeležence samo s primerjavo plač ljudi, ki so prejeli usposabljanja za tiste, ki ga niso prejeli.

Preprosta primerjava velja zaradi nečesa, kar se dogaja, preden so bili podatki še zbirajo: v naključnih. Brez naključnih, problem je veliko težje. Raziskovalec lahko primerjamo plače ljudi, ki so se prostovoljno prijavili za usposabljanje za tiste, ki niso podpisali-up. Ta primerjava bi verjetno kažejo, da ljudje, ki so prejeli usposabljanje zaslužili več, vendar koliko od tega je zaradi usposabljanja in koliko je to zato, ker so ljudje, ki se prijavijo-up za usposabljanje drugačna od tiste, ki ne podpišejo-up za trening? Z drugimi besedami, ali je pošteno, da primerjati plače teh dveh skupin ljudi?

Ta skrb poštene primerjave vodi Nekateri raziskovalci verjamejo, da je nemogoče, da bi ocene vzročnih brez izvajanjem preizkusa. Ta trditev gre predaleč. Čeprav je res, da poskusi zagotoviti najmočnejši dokaz za vzročno učinkov, obstajajo tudi druge strategije, ki lahko zagotovijo dragocene ocene vzročne. Namesto razmišljanja, da so ocene vzročni so bodisi enostavno (v primeru poskusov) ali nemogoče (v primeru pasivno opazili podatkov), je bolje, da razmišljajo o strategijah za izdelavo vzročnih ocen, ki ležijo vzdolž kontinuuma od najmočnejše do najšibkejše (Slika 2,4). Na najmočnejši koncu kontinuuma so naključno nadzorovane eksperimente. Ampak, to so pogosto težko narediti v družboslovnega raziskovanja, saj je veliko zdravljenja zahtevajo nerealne zneske sodelovanja vlade ali podjetja; preprosto obstaja veliko poskusov, da ne moremo storiti. Bom posvetila vse poglavju 4, tako prednosti in slabosti randomiziranih kontroliranih poskusov, in bom trdijo, da so v nekaterih primerih močno etičnih razlogov, da raje opazovalna za eksperimentalne metode.

Slika 2.4: Continuum raziskovalnih strategij za pričakovane učinke vzročno.

Slika 2.4: Continuum raziskovalnih strategij za pričakovane učinke vzročno.

Premikanje po kontinuumu, obstajajo situacije, ko so raziskovalci niso izrecno randomizirani. To pomeni, da raziskovalci so poskušali naučiti poskusa podobno znanje, ne da bi dejansko šel poskusa; seveda, to se bo težavno, vendar veliko podatkov močno izboljšuje našo sposobnost, da vzročno ocene v teh situacijah.

Včasih obstajajo nastavitve, kjer naključnosti v svetu se zgodi, da ustvari nekaj podobnega poskusa za raziskovalce. Ti modeli se imenujejo naravne poskuse in bodo podrobno preučeni v oddelku 2.4.3.1. Dve lastnosti velikih virov-njihovi podatki vedno o naravi in ​​njihovi velikosti, močno poveča našo sposobnost, da se učijo iz naravnih poskusih, ko se pojavijo.

Premikanje dlje od randomiziranih kontroliranih poskusov, včasih ni niti dogodek v naravi, ki ga lahko uporabljamo za približevanje naravni eksperiment. V teh okoljih, bomo lahko natančno izdelati primerjave znotraj ne-eksperimentalnih podatkov v poskusu, da približevanju eksperiment. Ti modeli se imenujejo ujemanje, in bodo podrobneje obravnavan v poglavju 2.4.3.2. Kot naravni eksperimentov, ujemanje je model, ki prav tako koristi od velikih podatkovnih virov. Še posebej, ogromen velikosti, tako v smislu števila primerov in vrsto informacij, na primer, močno olajša usklajevanje. Ključna razlika med naravnimi poskusov in ujemanje je, da v naravnih poskusih raziskovalec pozna proces, skozi katerega je bilo zdravljenje z dodeljeno, in meni, da bi bilo naključno.

Koncept poštene primerjave, ki motivirani želje narediti poskuse podlaga tudi dva alternativna pristopa: naravni poskusov in ujemanje. Ti pristopi vas bo lahko ocenila vzročnih učinkov iz pasivno opazovanih podatkov, ki jih odkriva poštene primerjave sedel v notranjosti podatkov, ki jih že imajo.