2.4.3.1 ניסויים טבעיים

ניסויים טבעיים לנצל אירועים אקראיים בעולם. אירוע מקרי + תמיד-על מערכת נתונים = ניסוי טבעי

מפתח ניסויים אקראיים מבוקרים המאפשרים השוואה הוגנת הוא אקראי. עם זאת, מדי פעם קורה משהו בעולם כי למעשה מקצה אנשים באופן אקראי או כמעט באקראי לטיפולים שונים. אחת דוגמאות הברורות ביותר של האסטרטגיה של שימוש ניסויים טבעיים באה מן המחקר של Angrist (1990) אשר מודד את ההשפעה של שירותים צבאיים על רווחים.

במהלך מלחמת וייטנאם, ארצות הברית הגדילה את הגודל של הכוחות המזוינים שלה באמצעות טיוטה. על מנת להחליט איזה אזרחים ייקרא לשירות, ממשלת ארה"ב קיימה הגרלה. כל תאריך לידה יוצגה על פיסת נייר, וניירות אלה הונחו בתוך צנצנת זכוכית גדולה. כפי שניתן לראות בתרשים 2.5, תלושי הנייר האלה נמשכו מהצנצנת אחת בכל פעם כדי לקבוע את הסדר כי צעיר ייקרא לשרת (נשים צעירות לא היו כפופות הטיוטה). על סמך התוצאות, גברים שנולדו ב -14 בספטמבר נקראו ראשון, גברים שנולדו ב -24 באפריל נקראו שני, וכן הלאה. בסופו של דבר, בהגרלה זו, גברים שנולדו על 195 ימים שונים נקראו לשירות בעוד גברים שנולדו על 171 ימים שלא נקראו.

איור 2.5: חבר הקונגרס אלכסנדר Pirnie (R-NY) ציור הקפסולה הראשונה בדראפט שירותים נבחרים ב -1 בדצמבר 1969. יהושע Angrist (1990) בשילוב בלוטו טיוטת עם נתוני הרווחים מהמינהל הביטוח הלאומי כדי לאמוד את השפעת השירות הצבאי על רווחים. זוהי דוגמה של מחקר באמצעות ניסוי טבעי. מקור: ויקיפדיה

איור 2.5: חבר הקונגרס אלכסנדר Pirnie (R-NY) ציור הקפסולה הראשונה בדראפט שירותים נבחרים ב -1 בדצמבר 1969. יהושע Angrist (1990) בשילוב בלוטו טיוטת עם נתוני הרווחים מהמינהל הביטוח הלאומי כדי לאמוד את השפעת השירות הצבאי על רווחים. זוהי דוגמה של מחקר באמצעות ניסוי טבעי. מקור: ויקיפדיה

למרות שזה לא יכול להיות ברור מייד, הגרלת טיוטה יש דמיון קריטי ניסוי אקראי מבוקר: בשני המצבים המשתתפים באופן אקראי לקבל טיפול. במקרה של הגרלת הטיוטה, אם אנו מעוניינים ללמוד על התופעות של טיוטה-כשירות לשירות צבאי על רווחים בשוק העבודה לאחר מכן, אנחנו יכולים להשוות את תוצאות עבור אנשי הלידה אשר היו מתחת לגבול התחתון ההגרלה (למשל, 14 בספטמבר, אפריל 24, וכו ') עם התוצאות עבור אנשי ההולדת אשר היו לאחר ההפסקה (למשל, 20 בפברואר, 2 בדצמבר, וכו').

בהתחשב בכך שטיפול זה מהגיוס הוקצה באופן אקראי, אז אנחנו יכולים למדוד את ההשפעה של טיפול זה לכל תוצאה אשר נמדדה. לדוגמא, Angrist (1990) בשילוב המידע על אשר נבחר באופן אקראי בטיוטה עם נתוני רווחים שנאספו על ידי המוסד לביטוח הלאומי כדי להסיק כי הרווחים של ותיק לבן היו כ -15% פחות מאשר ברווחי-ותיקים שאינם ברי השוואה . חוקרים אחרים השתמשו בתכסיס דומה גם כן. לדוגמה, Conley and Heerwig (2011) בשילוב המידע על אשר נבחר באופן אקראי בטיוטה עם נתונים ביתיים שנאספו במפקד של 2000 ו -2005 האמריקאי הקהילה סקר ומצא כי זמן כה רב לאחר הטיוטה חלה השפעה ארוכת טווח קטן של שירות צבאי על מגוון של תוצאות כגון קביעות דיור (בעלות מול שוכרים) ויציבות מגורים (סבירות שיש עבר בחמש שנים הקודמות).

כפי שמראה דוגמה זו, לפעמים כוחות ליצור ניסויים חברתיים, פוליטיים, או טבעי או כמעט ניסויים שניתן למנף על ידי החוקרים. לעתים קרובות ניסויים טבעיים הם הדרך הטובה ביותר להעריך יחסי סיבה ותוצאה במסגרות שבם הוא לא אתי או מעשי להריץ ניסויים אקראיים מבוקרים. הם אסטרטגיה חשובה לגילוי השוואות הוגנות נתונים שאינם ניסוי. ניתן לסכם אסטרטגית מחקר זה על ידי המשוואה:

\ [\ טקסט {אקראי (או כאילו אקראי) אירוע} + \ טקסט {תמיד-על זרם נתוני} = \ טקסט {ניסוי טבעי} \ qquad (2.1) \]

עם זאת, הניתוח של ניסויים טבעיים יכול להיות די מסובך. לדוגמא, במקרה של טיוטת וייטנאם, לא כל מי שהיה-זכאי טיוטה בסופו של דבר לשרת (היו מגוון פטורים). וגם, בו זמנית, יש אנשים שלא היו לנסח-זכאי התנדבו לשירות. זה היה כאילו בניסוי קליני של תרופה חדשה, יש אנשים בקבוצת הטיפול לא לקחת את התרופה שלהם חלק מהאנשים בקבוצת הביקורת איכשהו קבל את התרופה. בעיה זו, המכונית ציות דו-צדדי, כמו גם בעיות רבות אחרות מתוארות בפירוט רב יותר בחלק והקריאה המומלץ בסוף הפרק זה.

האסטרטגיה של ניצול המתרחש הקצאה אקראית טבעי מקדימה את העידן הדיגיטלי, אך השכיחות של נתונים גדולים עושה אסטרטגיה זו הרבה יותר קלה לשימוש. ברגע שאתה מבין שטיפול מסוים הוקצה באופן אקראי, מקורות נתונים גדולים יכולים לספק את נתוני התוצאה שאתה צריך כדי להשוות את התוצאות עבור אנשים בתנאי הטיפול וביקורת. לדוגמא, במחקרו את ההשפעות של השירות טיוטת והצבאי, Angrist עשה שימוש רשום הרווחים מן המוסד לביטוח הלאומי; ללא נתוני תוצאה זו, במחקרו לא היה אפשרי. במקרה זה, המוסד לביטוח לאומי הוא המקור תמיד-על נתונים גדול. ככל שיותר ויותר אוטומטיים שנאסף ממקורות נתונים קיימים, תהיה לנו נתוני תוצאה נוספים שיכול למדוד את ההשפעות של שינויים שנוצרו על ידי וריאציה אקסוגניים.

כדי להמחיש את האסטרטגיה הזו בעידן הדיגיטלי, הבה נבחן של Mas ומורטי (2009) מחקר אלגנטי על ההשפעה של עמיתים על הפריון. למרות שעל פני השטח זה עשוי להיראות אחר מאשר חדר העבודה של Angrist לגבי ההשפעות של טיוטת וייטנאם, במבנה שניהם מבצעים את התבנית ב EQ. 2.1.

Mas והמורטים מדדו כמה עמיתים להשפיע על הפרודוקטיביות של עובדים. מצד אחד, בעל עמיתי עבודה קשה עלול להוביל עובדים כדי להגדיל את התפוקה שלהם בגלל לחץ חברתי. או, מצד השני, עמיתי עבודה קשים עלולים להוביל עובדים אחרים להרפות עוד יותר. הדרך הברורה ביותר ללמוד תופעות עמיתים על הפרודוקטיביות יהיה ניסוי אקראי מבוקר שבו עובדים הם חולקו באקראי לטיפול משמרות עם עובדים של רמות תפוקה שונות ולאחר מכן הפרודוקטיביות נוצרת נמדדת לכולם. חוקרים, לעומת זאת, לא שולטים בלוח הזמנים של עובדים בכל עסק אמיתי, וכך Mas והמורטים נאלצו להסתמך על ניסוי טבעי שהתקיים בסופרמרקט.

בדיוק כמו EQ. 2.1, במחקרם היו שני חלקים. ראשית, הם השתמשו ביומנים ממערכת הקופה בסופרמרקט יש מדויק, בודד, ותמיד-על מדד הפריון: מספר הפריטים הסרוקים לשנייה. ודבר השני, בגלל הדרך שבה התזמון שנעשה בסופרמרקט הזה, יש להם ליד רכב אקראי של עמיתים. במילים אחרות, אף על פי תזמון של הקופאיות אינה נקבעת על ידי הגרלה, זה היה בעצם אקראי. בפועל, את הביטחון שיש לנו ניסויים טבעיים צירים בתדירות גבוה על אפשרות הקיום של זה "כמו-אם" טענה אקראית. הניצול של וריאציה אקראית זה, Mas והמורטים מצאו כי עבודה עם עמיתי תפוקה גבוהים יותר מגדילים את הפרודוקטיביות. יתר על כן, Mas והמורטים השתמשו הגודל והעושר של בסיס הנתונים שלהם כדי להתקדם מעבר להערכה ותוצאת סיבה לחקור שני נושאים חשובים יותר עדינים: ההטרוגניות של האפקט הזה (עבור אילו סוגים של עובדים גדולים את האפקט) ומנגנון מאחורי האפקט (מדוע שיש עמיתים פרודוקטיביות גבוהים להוביל תפוקה גבוהה יותר). נושבים לשתי סוגיות-ההטרוגניות חשובות אלו של שפעות טיפול ומנגנונים בפרק 5 כשנדונו ניסויים ביתר פירוט.

בהכללה מן המחקרים על השפעת טיוטת וייטנאם על רווחים בחקר השפעת העמיתים על הפרודוקטיביות, לוח 2.3 מסכם מחקרים אחרים שיש להם מבנה זהה זה: באמצעות תמיד על מקור נתונים כדי למדוד את ההשפעה של אירוע . כפי שניתן לראות בטבלה 2.3 מבהיר, ניסויים טבעיים נמצאים בכל מקום, אם אתה רק יודע איך לחפש אותם.

טבלה 2.3: דוגמאות של ניסויים טבעיים באמצעות מקורות נתונים גדולים. כל המחקרים הללו פעלו באותה מתכון בסיסי: random (או כאילו אקראי) אירוע + תמיד-על מערכת נתונים. ראה Dunning (2012) לדוגמאות נוספות.
מוקד מהותי מקור ניסוי טבעי תמיד-על נתוני מקור צִיטָטָה
Peer השפעות על הפרודוקטיביות תהליך תזמון נתוני לקוחות Mas and Moretti (2009)
היווצרות ידידות הוריקנים פייסבוק Phan and Airoldi (2015)
מורחים של רגשות גֶשֶׁם פייסבוק Coviello et al. (2014)
Peer to peer עברות כלכליות רעידת אדמה נתוני כסף ניידים Blumenstock, Fafchamps, and Eagle (2011)
התנהגות צריכה אישית 2013 כיבוי ממשלת ארה"ב נתונים אישיים האוצר Baker and Yannelis (2015)
השפעה כלכלית של מערכות הממליץ שׁוֹנִים נתוני גלישה ב Amazon Sharma, Hofman, and Watts (2015)
השפעת הלחץ על תינוקות שטרם נולדו מלחמת 2006 בין ישראל לחיזבאללה רשום לידה Torche and Shwed (2015)
קריאת התנהגות בוויקיפדיה גילויי Snowden יומני ויקיפדיה Penney (2016)

בפועל, חוקרים משתמשים בשתי אסטרטגיות שונות למציאת ניסויים טבעיים, אשר שניהם יכולים להיות פורה. חוקרים מסוימים מפעילים עם המקור תמיד-על נתונים ולחפש אירועים אקראיים בעולם; אחרים להתחיל עם אירועים אקראיים בעולם ולחפש מקורות נתונים הממחישים את השפעתם. לבסוף, שימו לב כי עוצמת ניסויים טבעיים אינה נובעת התחכום של הניתוח הסטטיסטי, אבל מן הטיפול בגילוי השוואה הוגנת נוצרה על ידי תאונת מזל של ההיסטוריה.