Gallwn amcangyfrif arbrofion na allwn ei wneud. Mae dau dulliau sy'n arbennig elwa o'r oes ddigidol yn cyfateb ac arbrofion naturiol.
Mae llawer o gwestiynau gwyddonol a pholisi pwysig yn achosol. Gadewch i ni ystyried, er enghraifft, y cwestiwn canlynol: beth yw effaith rhaglen hyfforddiant mewn swydd ar gyflogau? Un ffordd o ateb y cwestiwn hwn fod gyda arbrawf rheoledig ar hap lle mae gweithwyr yn neilltuo ar hap i naill ai derbyn hyfforddiant neu beidio cael hyfforddiant. Yna, gallai ymchwilwyr amcangyfrif effaith hyfforddiant ar gyfer cyfranogwyr hyn gan syml cymharu cyflogau o bobl sy'n derbyn yr hyfforddiant i'r rhai nad oeddent yn ei dderbyn.
Mae'r gymhariaeth syml yn ddilys oherwydd rhywbeth sy'n digwydd cyn y data ei gasglu hyd yn oed: mae'r randomization. Heb randomization, y broblem yn llawer anoddach. Gallai ymchwilydd gymharu cyflogau o bobl a arwyddodd yn wirfoddol ar gyfer hyfforddiant i'r rhai nad oedd yn arwyddo i fyny. Byddai hynny'n gymhariaeth yn ôl pob tebyg yn dangos bod pobl sy'n derbyn hyfforddiant ennill mwy, ond faint o hyn yw oherwydd hyfforddiant a faint o hyn yw oherwydd bod pobl sy'n gofrestru ar gyfer hyfforddiant yn wahanol i'r rhai nad ydynt yn arwyddo i fyny ar gyfer hyfforddiant? Mewn geiriau eraill, a yw'n deg cymharu cyflogau y ddau grŵp o bobl?
Mae'r pryder am gymariaethau teg yn arwain rhai ymchwilwyr i gredu ei bod yn amhosibl i wneud amcangyfrifon achosol heb redeg arbrawf. Mae'r cais yn mynd yn rhy bell. Er ei bod yn wir bod arbrofion darparu'r dystiolaeth gryfaf ar gyfer effeithiau achosol, mae strategaethau eraill sy'n gallu darparu amcangyfrifon achosol gwerthfawr. Yn hytrach na meddwl bod amcangyfrifon achosol naill ai'n hawdd (yn achos arbrofion) neu'n amhosibl (yn achos a welwyd data oddefol), mae'n well i feddwl o'r strategaethau ar gyfer gwneud amcangyfrifon achosol gorwedd ar hyd continwwm o cryfaf i gwanaf (Ffigur 2.4). Ar ddiwedd cryfaf o'r continwwm yn cael eu hap arbrofion rheoledig. Ond, mae'r rhain yn aml yn anodd i'w wneud mewn ymchwil gymdeithasol oherwydd bod llawer o driniaethau angen symiau afrealistig o gydweithrediad gan lywodraethau neu gwmnïau; yn syml mae llawer o arbrofion na allwn ei wneud. Byddaf yn neilltuo pob un Pennod 4 at y cryfderau a gwendidau o arbrofion rheoledig ar hap, a byddaf yn dadlau bod mewn rhai achosion, mae rhesymau moesegol cryf i well gan arsylwadol i ddulliau arbrofol.
Symud ar hyd y continwwm, mae yna sefyllfaoedd lle nad yw ymchwilwyr wedi hap benodol. Hynny yw, mae ymchwilwyr yn ceisio i ddysgu gwybodaeth arbrofi tebyg heb mewn gwirionedd yn gwneud arbrawf; yn naturiol, mae hyn yn mynd i fod yn anodd, ond mae data mawr yn gwella yn fawr ein gallu i wneud amcangyfrifon achosol yn y sefyllfaoedd hyn.
Weithiau, mae lleoliadau lle hap yn y byd yn digwydd i greu rhywbeth fel arbrawf ar gyfer ymchwilwyr. Gelwir y rhain yn cael eu dyluniadau arbrofion naturiol, a byddant yn cael eu hystyried yn fanwl yn Adran 2.4.3.1. Mae dwy nodwedd o ffynonellau-eu data mawr natur bob amser-ar ac mae eu maint-fawr yn gwella ein gallu i ddysgu o arbrofion naturiol pan fyddant yn digwydd.
Symud ymhellach i ffwrdd o arbrofion rheoledig ar hap, weithiau nid oes hyd yn oed digwyddiad yn natur y gallwn ei ddefnyddio i bras arbrawf naturiol. Yn y lleoliadau hyn, gallwn adeiladu yn ofalus cymariaethau o fewn data nad yw'n arbrofol mewn ymgais i amcangyfrif arbrawf. Gelwir y rhain yn cael eu dyluniadau paru, a byddant yn cael eu hystyried yn fanwl yn Adran 2.4.3.2. Fel arbrofion naturiol, cyfateb yn ddyluniad sydd hefyd yn elwa o ffynonellau data mawr. Yn benodol, mae'r enfawr maint-o ran nifer yr achosion a'r math o wybodaeth am bob achos yn fawr yn hwyluso cyfateb. Y gwahaniaeth allweddol rhwng arbrofion naturiol a pharu yw bod mewn arbrofion naturiol yr ymchwilydd yn gwybod y broses lle y driniaeth wedi ei neilltuo ac mae'n credu ei fod yn hap.
Mae'r cysyniad o cymariaethau teg sy'n cymell dyheadau i wneud arbrofion hefyd yn tanlinellu y ddau ddull arall: arbrofion naturiol a pharu. Bydd y dulliau hyn yn eich galluogi i amcangyfrif effeithiau achosol o ddata a arsylwyd yn oddefol drwy ddarganfod cymariaethau teg yn eistedd tu mewn i'r data sydd gennych yn barod.