Wy kinne approximate eksperiminten dat wy kinne net dwaan. Twa oanpakken dy't benammen profitearje fan de digitale leeftyd binne oerienkommende en natuerlike eksperiminten.
In soad wichtige wittenskiplike en belied fragen binne kausale. Litte wy beskôgje, bygelyks, de folgjende fraach: wat is it effekt fan in baan oplieding programma op lean? Ien manier om te beäntwurdzjen dizze fraach soe wêze mei in willekeurich kontrolearren eksperimint dêr't arbeiders waarden willekeurich tawiisd oan of ûntfange trening of net ûntfange trening. Doe, ûndersikers koe skatte de wurking fan de oplieding foar dy dielnimmers troch gewoan fergelykjen it lean fan minsken dy't krige de oplieding ta dyjingen dy't net krije it.
De ienfâldige ferliking is jildich fanwege eat dat bart foardat de gegevens waard sels sammele: de randomization. Sûnder randomization, it probleem is folle trickier. In ûndersiker koe fergelykje it lean fan minsken dy't frijwillich oanmelden foar oplieding oan dyjingen dy't net sign-up. Dat ferliking soe nei alle gedachten sjen litte dat minsken dy't krige oplieding fertsjinne mear, mar hoefolle fan dit is omdat de oplieding en hoefolle fan dit is omdat minsken dy't sign-up foar oplieding binne oars fan dyjingen dy't net oanmelde-up foar oplieding? Yn oare wurden, is it earlik te ferlykjen it lean fan dy twa groepen fan minsken?
Dizze soarch oer earlike ferlikings liedt guon ûndersikers te leauwen dat it ûnmooglik om kausale rûzingen sûnder rint in eksperimint. Dizze kleem giet te fier. Wylst it is wier dat eksperiminten jouwe de sterkste bewiis foar kausale effekten, der binne oare strategyen dy't kin soargje weardefolle kausale skattings. Yn stee fan tinken dat kausale skattings binne beide maklik (yn it gefal fan eksperiminten) of ûnmooglik (yn it gefal fan passyf observearre gegevens), is it better te tinken fan de strategyen foar it meitsjen fan kausale rûzingen lizzen lâns in kontinuümhypoteze fan sterkste nei swakste (Figure 2.4). Oan de sterkste ein fan de kontinuümhypoteze wurde willekeurich regele eksperiminten. Mar, dy binne faak net maklik te dwaan yn de sosjale ûndersyk, om't in soad behannelings easkje ûnrealistysk bedraggen fan de gearwurking fan oerheden of bedriuwen; hiel gewoan binne der in soad eksperiminten dat wy kinne net dwaan. Ik sil wije al fan haadstik 4 oan sawol de sterke en swakke punten fan willekeurich behearske eksperiminten, en ik stelle dat yn guon gefallen, binne der sterke etyske redenen om leaver waarnimming foar eksperimintele metoaden.
Moving lâns de kontinuümhypoteze, binne der situaasjes dêr't ûndersikers hawwe net eksplisyt willekeurich. Dat is, ûndersikers besykje te learen eksperimint-lykas kennis sûnder eins dwaan in eksperimint; fansels, dit giet te wêzen lestich, mar grutte gegevens sterk ferbetteret ús fermogen om kausale rûzings yn dizze situaasjes.
Soms binne der ynstellings dêr't randomness yn 'e wrâld bart te meitsjen wat as in eksperimint foar ûndersikers. Dizze ûntwerpen wurde neamd natuerlike eksperiminten, en hja sille wurde beskôge yn detail yn paragraaf 2.4.3.1. Twa eigenskippen fan grutte gegevens boarnen-harren altyd-op natuer en harren maat-sterk fersterket ús fermogen om te learen fan natuerlike eksperiminten as se foarkomme.
Moving fierder fuort út willekeurich kontrolearren eksperiminten, soms is der net sels in evenemint yn de natuer, dat wy kinne brûke te approximate in natuerlike eksperimint. Yn dizze ynstellings, kinne wy sekuer oanlizze ferlikings binnen net-eksperimintele gegevens yn in besykjen om approximate in eksperimint. Dizze ûntwerpen wurde neamd oerienkommende, en hja sille wurde beskôge yn detail yn paragraaf 2.4.3.2. Lykas natuerlike eksperiminten, oerienkommende is in ûntwerp dat ek profitearret fan grutte gegevens boarnen. Yn it bysûnder, de massive grutte-sawol op it mêd fan tal gefallen en soarte fan ynformaasje per gefal-sterk fasilitearret matching. De toets ferskil tusken natuerlike eksperiminten en oerienkommende is dat yn natuerlike eksperiminten de ûndersiker wit it proses troch hokker behanneling waard tawiisd en mient dat te wêzen random.
It konsept fan de earlike ferlikings dy't motivearre de begearten te dwaan eksperiminten ek te'n grûnslach de twa alternative oanpakken: natuerlike eksperiminten en bypassende. Dy oanpak sille ynskeakelje jo te skatten kausale effekten fan passyf waarnommen gegevens troch ûntdekking earlike ferlikings sitten binnenkant fan de gegevens dy't jo al hawwe.