Ние може да се доближи експерименти, които не можем да направим. Два подхода, които особено се възползват от цифровата епоха са съвпадение и физически експерименти.
Много важни научни и политически въпроси са причинно-следствена. Нека разгледаме, например, следния въпрос: какъв е ефектът на програма за обучение на работни места за заплати? Един начин да се отговори на този въпрос ще бъде с рандомизирано контролирано експеримент, където работниците са били рандомизирани да било получават обучение или не получават обучение. След това, изследователите биха могли да се оцени ефектът на обучение за тези участници, като просто сравняване на заплатите на хората, които са получили обучение за тези, които не са я получили.
Простият сравнението е валидно, защото на нещо, което се случва, преди данните да се дори събрана: рандомизацията. Без рандомизацията, проблемът е много по-сложни. Изследовател може да се сравни заплатите на хората, които доброволно са се регистрирали за обучение за тези, които не се регистрирате. Това сравнение вероятно ще покаже, че хората, които са получили обучение спечелили повече, но колко от това е така, защото на обучение и колко от това е така, защото хората, че се регистрирате за обучение са различни от тези, които не се регистрирате за обучение? С други думи, това е справедливо да се сравни заплатата на тези две групи от хора?
Тази загриженост за честни сравнения кара някои учени да смятат, че е невъзможно да се направи приблизителна оценка причинни без провеждане на експеримент. Това твърдение отива твърде далеч. Макар да е вярно, че опитите да предоставят на силното доказателство за причинните ефекти, има и други стратегии, които могат да предоставят ценни оценки причинни. Вместо да мисли, че оценките, причинили са или лесно (в случая на опити) или невъзможно (в случай на пасивно наблюдават данни), по-добре е да се мисли за стратегиите за вземане на причинни оценки, разположени по континуум от силната към най-слабата (Фигура 2.4). В края на силната континуум са рандомизирани контролирани експерименти. Но, те често са трудно да се направи в социални изследвания, защото много лечения изискват нереалистични суми на сътрудничество от страна на правителства или фирми; просто има много експерименти, които не можем да направим. Аз ще посвети цялата глава 4 за двете силните и слабите страни на рандомизирани контролирани експерименти, и аз ще се спори, че в някои случаи, има силни етични причини да предпочитат наблюдателната да експериментални методи.
Движейки се по поречието на континуум, има ситуации, в които изследователите не са изрично рандомизирани. Това е, изследователите се опитват да научат експеримент, подобни знания, без всъщност прави един експеримент; Естествено, това ще бъде труден, но голяма данни значително подобрява способността ни да причинни оценки в тези ситуации.
Понякога има настройки, където случайността в света се случва да се създаде нещо като експеримент за изследователите. Тези проекти се наричат естествени експерименти, и те ще бъдат разгледани по-подробно в раздел 2.4.3.1. Две особености на големите източници-данните им винаги-на природата и техния размер, значително подобрява способността ни да се учат от естествени експерименти, когато те се появят.
Преместването по-далеч от рандомизирани контролирани експерименти, понякога дори не е събитие, в природата, които можем да използваме, за да се сближат естествен експеримент. В тези настройки, ние можем внимателно конструира сравнения в рамките на не-експериментални данни в опит да се сближи експеримент. Тези проекти се наричат съвпадение, и те ще бъдат разгледани по-подробно в раздел 2.4.3.2. Като естествен експеримент, съвпадение е дизайн, който също има полза от големите източници на данни. По-специално, масивна размера-както по отношение на броя на случаите и вид на информация за съдебната значително улеснява съвпадение. Основната разлика между физически експерименти и съвпадение е, че в естествени експерименти изследователят знае процес, чрез който е назначен лечение и смята, че да бъде на случаен принцип.
Концепцията за справедливата сравнения, които мотивирани желанията да правим експерименти също е в основата на два алтернативни подхода: природни експерименти и съвпадение. Тези подходи ще ви даде възможност да се оцени причинните ефекти от пасивно наблюдават данните от откриването честни сравнения седят вътре на данните, които вече имате.