Můžeme přiblížit experimenty, které nemůžeme dělat. Dva přístupy, které především těžit z digitálního věku jsou odpovídající a přírodní experimenty.
Mnoho důležitých vědeckých a politické otázky jsou kauzální. Uvažujme například následující otázka: jaký vliv výcvikového programu práce na mzdy? Jeden způsob, jak odpovědět na tuto otázku by se randomizované kontrolované experimentu, kdy bylo pracovníci náhodně přiřazen buď absolvovat školení, nebo ne proškoleni. Poté výzkumníci mohli odhadnout jejich účinek školení pro tyto účastníky jednoduchým porovnáním mzdy lidí, kteří obdrželi školení pro ty, kteří neobdrželi.
Jednoduchý srovnání je platný, protože něco, co se děje před data byla ještě shromážděny: na randomizaci. Bez randomizace, problém je mnohem složitější. Výzkumník by mohl porovnat mzdy lidí, kteří se dobrovolně přihlásili k výcviku pro ty, kteří neměli podepsat-up. Toto srovnání by pravděpodobně ukazují, že lidé, kteří prošli školením vydělal víc, ale kolik z toho je kvůli výcviku a kolik je to proto, že lidé, kteří Sign-up pro trénink jsou odlišné od těch, které nemají podepsat-up pro trénink? Jinými slovy, je to fér srovnávat platy těchto dvou skupin lidí?
Tato obava o spravedlivé srovnání vede některé vědce k domněnce, že je nemožné, aby se příčinné odhady bez spuštění experimentu. Toto tvrzení zachází příliš daleko. I když je pravda, že experimenty poskytují nejsilnější důkaz pro kauzální efekty, existují i jiné strategie, které mohou poskytnout cenné odhady kauzální. Místo přemýšlení, že kauzální odhady jsou buď jednoduché (v případě pokusů) nebo nemožné (v případě pasivně pozorovat dat), je lepší přemýšlet o strategiích pro vytváření kauzálních odhady ležící podél kontinua od nejsilnější do nejslabší (obr 2.4). Na nejsilnější konci kontinua jsou randomizované kontrolované experimenty. Ale tito jsou často obtížné dělat v sociálním výzkumu, protože mnoho způsobů léčby vyžadují nereálné částky spolupráce ze strany vlád nebo společností; prostě existuje mnoho experimentů, které nemůžeme dělat. Budu věnovat všechno kapitoly 4 na obou silných a slabých stránek randomizované kontrolované experimenty a budu argumentovat, že v některých případech existují silné etických důvodů raději pozorovací k experimentální metody.
Pohybující se podél kontinua, existují situace, kdy vědci nejsou explicitně randomizované. To znamená, že vědci se snaží naučit experimentu podobné znalosti, aniž by skutečně dělá experiment; Samozřejmě, že to bude složité, ale zpracování velkých objemů dat výrazně zlepšuje naši schopnost činit příčinné odhady v těchto situacích.
Někdy jsou zde nastavení, kde náhodnost ve světě stane vytvořit něco podobného experimentu pro výzkumné pracovníky. Tyto návrhy se nazývají přírodní experimenty, a oni budou považovány podrobně uvedeno v oddílu 2.4.3.1. Dva rysy velkých datových zdrojů-vždy-jejich, o ochraně přírody a jejich velikosti, výrazně zvyšuje naši schopnost učit se z přirozených experimentů, když k nim dojde.
Vzdaluje od randomizované kontrolované experimenty, někdy není ani událost v přírodě, které můžeme použít aproximovat přirozený experiment. V těchto nastaveních, můžeme opatrně postavit srovnání v rámci non-experimentálními daty ve snaze přiblížit experiment. Tyto návrhy se nazývají vyhovující, a oni budou považovány podrobně uvedeno v oddílu 2.4.3.2. Stejně jako přirozených experimentů, shoda je design, který také těží z velkých datových zdrojů. Zejména masivní velikosti a to jak z hlediska počtu případů a druhu informací, na jednotlivý případ, velmi usnadňuje přiřazování. Klíčový rozdíl mezi přírodními experimenty a shoda je, že v přirozených experimentů výzkumný pracovník ví, že proces, kterým byla léčba přiřazena a věří, že je náhodný.
Koncept reálné srovnání, která motivovala touhy dělat experimenty také základem dva alternativní přístupy: přírodní experimenty a zohledňování potřeb. Tyto přístupy vám umožní odhadnout kauzální efekty z pasivně pozorovaných dat objevením spravedlivé srovnání sedí uvnitř údajů, které již máte.