Me võime ühtlustada eksperimente, et me ei saa seda teha. Kaks lähenemist, mis eriti kasu digitaalajastul on sobitamine ja looduslikud eksperimendid.
Paljud olulised teaduslikud ja poliitilised küsimused on põhjuslik. Vaatleme näiteks järgmise küsimuse: mis on toime tööalase koolituse programmi palk? Üks viis sellele küsimusele vastata oleks koos randomiseeritud kontrollitud eksperimendi, kus töötajad randomiseeriti kas koolitust saada või mitte saada koolitust. Seejärel said teadlased efekti hindamiseks koolitus need osalejad lihtsalt võrrelda palku inimesi, kes on saanud koolituse neile, kes ei saanud seda.
Lihtne võrreldes on kehtiv, sest midagi, mis juhtub enne andmeid isegi kogutud: randomiseerimisskeemile. Ilma Randomiseerimisele probleem on palju keerukam. Kui teadlane võiks võrrelda palku inimesi, kes vabatahtlikult registreerusin koolitus neile, kes ei sisse logida. See võrreldes ilmselt näitavad, et inimesed, kes on saanud väljaõppe teeninud rohkem, kuid kui palju see on, sest koolituse ja kui palju see on, sest inimesed, kes sisse logida koolitus erinevad nendest, mis ei sisse logida koolitust? Teisisõnu, see on õiglane võrrelda palku nende kahe rühma inimesi?
See muret õiglase võrdluse viib mõned teadlased usuvad, et see on võimatu teha põhjuslikku hinnanguid, katset. See väide läheb liiga kaugele. Kuigi on tõsi, et katsed annavad tugevamaid tõendeid põhjuslikku mõju, on olemas teisi strateegiaid, mis võivad anda väärtuslikku põhjuslik hinnanguid. Selle asemel, et mõelda, et põhjuslik hinnangud on kas lihtne (juhul eksperimentide) või võimatu (juhul, kui passiivselt jälgida andmed), siis on parem mõelda strateegiaid teha põhjuslikku hinnanguid lamades kontiinumis tugevaim nõrgim (joonis 2.4). Kell tugevaim äärmuses on randomiseeritud kontrollitud eksperimente. Aga need on sageli raske teha sotsiaalsed uuringud, sest palju ravimeid vajavad ebareaalne koguses koostööd valitsuste või ettevõtete; lihtsalt on palju eksperimente, et me ei saa seda teha. Pühendan kõik kasutatavad gruppi 4 nii tugevaid ja nõrku külgi randomiseeritud kontrollitud eksperimente, ja ma väita, et mõnel juhul on tugevad eetilised põhjused eelistada vaatlusandmeid eksperimentaalsete meetoditega.
Mööda katkematu, on olukordi, kus teadlased ei ole selgesõnaliselt juhuslik. See tähendab, et teadlased püüavad õppida eksperimendi moodi teadmisi ilma tegelikult seda eksperimenti; Loomulikult, see saab olema keeruline, kuid suur andmete parandab oluliselt meie võimet teha põhjuslikku hinnanguid sellistes olukordades.
Mõnikord on seaded, kus juhuslikkust maailmas juhtub, et luua midagi sellist eksperimenti teadlastele. Need kujundused on nn loomulik eksperimente ja neid käsitletakse üksikasjalikult jaos 2.4.3.1. Kaks funktsioonid big andmeallikate-oma alati-laadi ja nende suurus tugevdab meie võimet õppida looduslikust eksperimente, kui need tekivad.
Liikumine kaugemal randomiseeritud kontrollitud eksperimente, mõnikord ei ole isegi ürituse iseloomuga, et saame kasutada ühtlustada loomulik eksperiment. Nendel seaded, saame hoolikalt ehitada võrdluste mitte-katseandmed, püüdes lähendada eksperiment. Need kujundused on nn sobing ja neid käsitletakse üksikasjalikult jaos 2.4.3.2. Nagu loomulik eksperimente, sobitamine on disain, mis ka kasu suur allikatele. Eriti suur suurus nii juhtumite arv ja tüüp informatsiooni juhtumi kohta-lihtsustab oluliselt sobitamine. Oluline erinevus loomulik eksperimente ja sobitamine on, et loomulikku eksperimendid uurija teab protsess, mille kaudu ravi määrati, ning usub, et see on juhuslik.
Mõiste õiglane võrdlus, mis ajendas soove teha eksperimente aluseks ka kaks alternatiivset lähenemist: looduslikud eksperimendid ja sobitamine. Need lähenemised võimaldab teil hinnata põhjuslikku mõjud passiivselt jälgida andmete avastades õiglane võrrelda istub sees andmed, mis teil juba on.