אנחנו יכולים להתקרב ניסויים שאיננו יכולים לעשות. שתי גישות המיטיבות במיוחד בעידן הדיגיטלי הם תואמים ניסויים טבעיים.
שאלות מדעיות ומדיניות חשובות רבות הם סיבתי. הבה נבחן, למשל, על השאלה הבאה: מהי השפעת תוכנית הכשרה מקצועית על שכר? דרך אחת לענות על שאלה זו תהיה עם ניסוי אקראי מבוקר שבו עובדים חולקו באקראי או לקבל הכשרה או לא מקבל הכשרה. לאחר מכן, החוקרים יכלו להעריך את ההשפעה של אימון עבור משתתפים אלה פשוט על ידי השוואת שכרם של אנשים שקיבלו את ההכשרה לאלו שלא קיבלו אותו.
ההשוואה הפשוטה היא תקפה בשל משהו שקורה לפני הנתונים גם נאספו: הרנדומיזציה. ללא אקראיות, הבעיה היא הרבה יותר מסובכת. חוקר יכול להשוות את השכר של אנשים שנרשמו מרצון לאימונים לאלה שלא להירשם. השוואה זו בוודאי מראה כי אנשים שקבלו הכשרה הרוויחו יותר, אבל עד כמה זה בגלל אימונים וכמה זה בגלל אנשים להירשם לאימונים שונים מאלה שאינם להירשם לאימונים? במילים אחרות, האם זה הוגן להשוות את השכר של שתי הקבוצות האלה של אנשים?
חשש זה על השוואות הוגנות מוביל כמה חוקרים להאמין שזה בלתי אפשרי לבצע הערכות סיבתי מבלי להפעיל ניסוי. טענה זו הינה מרחיקת לכת. אמנם נכון כי ניסויים לספק את העדות החזקה ביותר תופעות סיבתי, ישנן אסטרטגיות אחרות שיכול לספק הערכות סיבתי יקרות. במקום לחשוב כי ערכות סיבתי הם או קלות (במקרה של ניסויים) או בלתי אפשריות (במקרה של שנצפה באופן פסיבי נתונים), עדיף לחשוב על האסטרטגיות להכנת אומדנים סיבתי השוכבים לאורך רצף שבין חזק ביותר חלש (איור 2.4). בסוף החזק של הרצף הם אקראיים ניסויים מבוקרים. אבל, אלה הם לעתים קרובות קשים לעשות מחקר חברתי כי טיפולים רבים דורשים כמויות לא מציאותיות של שיתוף פעולה מצד ממשלות או חברות; בפשטות יש ניסויים רבים שאנחנו לא יכולים לעשות. אקדיש כל פרק 4 הם החוזקות וחולשות של ניסויים אקראיים מבוקרים, ואני טוען כי במקרים מסוימים, ישנן סיבות אתיות חזקות להעדיף תצפיתי לשיטות ניסיוניות.
העברת לאורך הרצף, יש מצבים שבהם החוקרים לא באקראי במפורש. כלומר, חוקרים מנסים ללמוד ידע ניסוי דמוי מבלי לעשות ניסוי; באופן טבעי, זה הולך להיות מסובך, אבל נתונים גדולים מאוד משפרים את יכולתנו לבצע הערכות סיבתי במצבים אלה.
לפעמים יש הגדרות שבו אקראי בעולם קורית ליצור משהו כמו ניסוי לחוקרים. עיצובים אלו נקראים ניסויים טבעיים, והם ייחשבו בפירוט בסעיף 2.4.3.1. שתי תכונות של מקורות-שלהם נתוני טבע גדולים תמיד-על ו שלהם בגודל משפרות באופן משמעותי את היכולת שלנו ללמוד מניסויים טבעיים כאשר הן מתרחשות.
מתרחק ניסויים אקראיים מבוקרים, לפעמים אין אפילו אירוע בטבע שאנחנו יכולים להשתמש בו כדי לאמוד ניסוי טבעי. בהגדרות אלה, אנו יכולים לבנות השוואות בזהירות בתוך נתונים שאינם ניסיוניים בניסיון משוער ניסוי. עיצובים אלו נקראים התאמה, והם ייחשבו בפירוט בסעיף 2.4.3.2. כמו ניסויים טבעיים, התאמה היא עיצוב כי גם יתרונות ממקורות נתונים גדולים. בפרט, בגודל שני מהסיבים מבחינת מספר המקרים וסוג מידע לכל מקרה מאוד מקל התאמה. ההבדל העיקרי בין ניסויים טבעיים התאמה הוא כי ניסויים טבעיים החוקר יודע את התהליך שבו הטיפול הוטל ומאמין שזה יהיה אקראי.
הרעיון של השוואות הוגנות שהניעו את הרצונות לעשות ניסויים גם ביסוד שתי גישות חלופיות: ניסויים טבעיים והתאמה. גישות אלו תאפשרנה לך להעריך השפעות סיבתי מנתונים שנצפו באופן פסיבי על ידי גילוי השוואות הוגנות ישב הפנימי של הנתונים שכבר יש לך.