Ni povas aproksimi eksperimentoj kiuj ni ne povas fari. Du aliroj kiuj speciale profitigis de la diĝita aĝo estas egalante kaj naturaj eksperimentoj.
Multaj gravaj sciencaj kaj politiko demandoj estas kaŭza. Ni konsideru, ekzemple, jena demando: kio estas la efiko de laboro trejnado programo sur salajroj? Unu maniero respondi tiun demandon estus kun randomigitaj kontrolitaj eksperimento kie laboristoj estis hazarde asignita al aŭ ricevi trejnadon aŭ ne ricevi trejnadon. Tiam, esploristoj povis taksi la efikon de trejnado por tiuj partoprenantoj simple komparante la salajroj de homoj kiu ricevis la trejnado por tiuj kiuj ne ricevis ĝin.
La simpla komparo estas valida pro io kiu okazas antaŭ la datumoj estis eĉ kolektis: la aleatorización. Sen aleatorización, la problemo estas multe pli delikata. La investigador povus kompari la salajrojn de homoj kiu libervole aliĝis al trejnado por tiuj kiuj ne subskribis funkciadon. Ke komparo estus probable montras ke homoj kiu ricevis trejnadon gajnis pli, sed kiom de tiu estas pro trejnado kaj kiom de tiu estas ĉar homoj kiuj subskribas-supre por trejnado estas malsamaj de tiuj kiuj ne subskribas-supre por trejnado? Alivorte, ĉu justa kompari la salajrojn de tiuj du grupoj de homoj?
Tiu maltrankvilo pri justa komparoj kondukas iuj esploristoj kredas ke estas neeble fari kaŭza taksoj sen kuri eksperimento. Tiu aserto iras tro longen. Kvankam estas vero kiu spertas provizi la plej forta evidenteco por kaŭza efektoj, estas aliaj strategioj kiuj povas havigi valorajn kaŭza taksoj. Anstataŭ pensi ke kaŭza taksoj estas aŭ facila (en la kazo de eksperimentoj) aŭ neebla (en la kazo de pasive observis datumoj), estas pli bone pensi pri la strategioj por fari kaŭza taksoj kuŝis kune kontinuumo de forta al la plej malforta (Figuro 2.4). Ĉe la plej forta fino de la kontinuaĵo estas randomigitaj kontrolitaj eksperimentoj. Sed tiuj estas ofte malfacile fari en sociaj esploroj ĉar multaj traktadoj postulas nerealisma kvantojn de kunlaboro de registaroj aŭ kompanioj; tute simple estas multaj eksperimentoj kiujn ni povas fari. Mi dediĉos ĉiujn Ĉapitro 4 al kaj la fortojn kaj malfortojn de randomigitaj kontrolitaj eksperimentoj, kaj mi argumentas ke en iuj kazoj, estas forta etikaj kialoj preferi observa al eksperimentaj metodoj.
Movanta kune la kontinuaĵo, estas situacioj kie esploristoj ne eksplicite randomigitaj. Kiu, esploristoj provas lerni eksperimento-similaj scion sen fakte fari eksperimenton; nature, tiu tuj estos malfacila, sed grandaj datumoj ege plibonigas nian kapablon fari kaŭza taksoj en tiuj situacioj.
Kelkfoje ekzistas agordojn kie hazardo en la mondo okazas krei ion kiel eksperimenton por esploristoj. Tiuj dezajnoj estas nomitaj naturaj eksperimentoj, kaj ili estos konsiderataj en detalo en Sekcio 2.4.3.1. Du karakterizaĵoj de grandaj datumoj fontoj-ilia ĉiam-sur naturo kaj ilia grandeco-ege plibonigas nian kapablon lerni de naturaj eksperimentoj kiam ili okazas.
Movanta cetere for de randomigitaj kontrolitaj eksperimentoj, kelkfoje ekzistas eĉ okazaĵo en naturo kiun ni povas uzi por aproksimi natura eksperimento. En tiuj difinoj, oni povas singarde konstrui komparojn ene ne- eksperimentaj datumoj en provo aproksimi eksperimento. Tiuj dezajnoj estas nomitaj trafa, kaj ili estos konsiderataj en detalo en Sekcio 2.4.3.2. Kiel naturaj eksperimentoj, trafaj estas dezajno kiu ankaŭ profitigas de grandaj datumoj fontoj. Aparte, la amasa grandeco-ambaŭ en terminoj de numero de kazoj kaj tipon de informo por kazo-ege faciligas trafa. La ŝlosila diferenco inter naturaj eksperimentoj kaj trafaj estas ke en naturaj eksperimentoj la esploristo scias la procezo tra kiu traktado estis asignita kaj kredas ĝin esti hazarda.
La koncepto de justa komparoj kiuj motivis la deziroj fari eksperimentojn ankaŭ subyace la du alternativaj aliroj: naturaj eksperimentoj kaj trafaj. Tiuj aliroj ebligos vin taksi kaŭza efikoj de pasive observis datumoj Nudigas justa komparoj sidas interne de la datumoj kiujn vi jam havas.