Σε αυτό το παράρτημα, θα συνοψίσω κάποιες ιδέες για τη δημιουργία αιτιώδους συμπερασμού από μη πειραματικά δεδομένα σε μια ελαφρώς πιο μαθηματική μορφή. Υπάρχουν δύο κύριες προσεγγίσεις: το πλαίσιο αιτιώδους γραφήματος, το μεγαλύτερο μέρος του οποίου συνδέεται με την Judea Pearl και τους συναδέλφους του, καθώς και το πλαίσιο των πιθανών αποτελεσμάτων, τα περισσότερα που σχετίζονται με τον Donald Rubin και τους συναδέλφους του. Θα εισαγάγω το πλαίσιο των δυνητικών αποτελεσμάτων επειδή είναι πιο στενά συνδεδεμένο με τις ιδέες στις μαθηματικές σημειώσεις στο τέλος των κεφαλαίων 3 και 4. Για περισσότερα σχετικά με το πλαίσιο των Pearl, Glymour, and Jewell (2016) γραφημάτων, συστήνω Pearl, Glymour, and Jewell (2016) (εισαγωγικό ) και το Pearl (2009) (προχωρημένο). Για μια θεραπευτική αντιμετώπιση του αιτιώδους συμπεράσματος που συνδυάζει το πλαίσιο των πιθανών αποτελεσμάτων και το πλαίσιο αιτιώδους γραφήματος, συστήνω το Morgan and Winship (2014) .
Ο στόχος αυτού του παραρτήματος είναι να σας βοηθήσει να εξοικειωθείτε με τη συμβολική συμβολοσειρά και το στυλ της παράδοσης των πιθανών αποτελεσμάτων, ώστε να μπορέσετε να μεταβείτε σε κάποιο από τα πιο τεχνικά υλικά που έχουν γραφτεί σε αυτό το θέμα. Πρώτον, θα περιγράψω το πιθανό πλαίσιο αποτελεσμάτων. Στη συνέχεια, θα το χρησιμοποιήσω για να συζητήσω περαιτέρω φυσικά πειράματα όπως αυτό του Angrist (1990) σχετικά με την επίδραση της στρατιωτικής θητείας στα κέρδη. Αυτό το παράρτημα προσελκύει έντονα τους Imbens and Rubin (2015) .
Πλαίσιο δυνητικών αποτελεσμάτων
Το πλαίσιο δυνητικών αποτελεσμάτων έχει τρία βασικά στοιχεία: μονάδες , θεραπείες και δυνητικά αποτελέσματα . Για να επεξηγήσουμε αυτά τα στοιχεία, ας εξετάσουμε μια τυποποιημένη εκδοχή του ερωτήματος που αναφέρεται στο Angrist (1990) : Ποια είναι η επίδραση της στρατιωτικής θητείας στα κέρδη; Σε αυτή την περίπτωση, μπορούμε να ορίσουμε τις μονάδες που είναι επιλέξιμες για το σχέδιο του 1970 στις Ηνωμένες Πολιτείες και μπορούμε να δείξουμε αυτούς τους ανθρώπους με \(i = 1, \ldots, N\) . Οι θεραπευτικές αγωγές σε αυτή την περίπτωση μπορούν να "εξυπηρετούν στον στρατό" ή "να μην υπηρετούν στον στρατό". Θα ονομάσω αυτές τις συνθήκες θεραπείας και ελέγχου και θα γράψω \(W_i = 1\) εάν το άτομο \(i\) βρίσκεται στην κατάσταση θεραπείας και \(W_i = 0\) εάν το άτομο \(i\) βρίσκεται στην κατάσταση ελέγχου. Τέλος, τα δυνητικά αποτελέσματα είναι λίγο πιο εννοιολογικά δύσκολα, επειδή περιλαμβάνουν "δυνητικά" αποτελέσματα. πράγματα που θα μπορούσαν να συμβούν. Για κάθε άτομο που είναι επιλέξιμο για το σχέδιο του 1970, μπορούμε να φανταστούμε το ποσό που θα είχαν κερδίσει το 1978 εάν υπηρετούσαν στο στρατό, το οποίο θα καλέσω \(Y_i(1)\) και το ποσό που θα είχαν κερδίσει 1978 αν δεν υπηρετούσαν στο στρατό, το οποίο θα καλέσω \(Y_i(0)\) . Στο πλαίσιο δυνητικών αποτελεσμάτων, \(Y_i(1)\) και \(Y_i(0)\) θεωρούνται σταθερές ποσότητες, ενώ \(W_i\) είναι μια τυχαία μεταβλητή.
Η επιλογή των μονάδων, των θεραπειών και των αποτελεσμάτων είναι καθοριστικής σημασίας διότι ορίζει τι μπορεί και δεν μπορεί να μάθει από τη μελέτη. Η επιλογή των μονάδων - προσώπων που είναι επιλέξιμα για το σχέδιο του 1970 - δεν περιλαμβάνει τις γυναίκες, και επομένως χωρίς πρόσθετες υποθέσεις, η μελέτη αυτή δεν θα μας πει τίποτα για την επίδραση της στρατιωτικής θητείας στις γυναίκες. Είναι επίσης σημαντικές οι αποφάσεις σχετικά με τον τρόπο καθορισμού των θεραπειών και των αποτελεσμάτων. Για παράδειγμα, εάν η θεραπεία ενδιαφέροντος επικεντρωθεί στην εξυπηρέτηση στο στρατό ή στη μάχη; Πρέπει το αποτέλεσμα ενδιαφέροντος να είναι κέρδος ή ικανοποίηση από την εργασία; Τελικά, η επιλογή των μονάδων, των θεραπειών και των αποτελεσμάτων θα πρέπει να καθοδηγείται από τους επιστημονικούς και πολιτικούς στόχους της μελέτης.
Δεδομένων των επιλογών μονάδων, θεραπειών και πιθανών αποτελεσμάτων, η αιτιώδης επίδραση της θεραπείας στο άτομο \(i\) , \(\tau_i\) , είναι
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Με άλλα λόγια, συγκρίνουμε πόσα άτομα θα \(i\) θα είχαν κερδίσει μετά την εξυπηρέτηση σε πόσα άτομα \(i\) θα είχαν κερδίσει χωρίς εξυπηρέτηση. Για μένα, eq. Ο 2.1 είναι ο σαφέστερος τρόπος για τον ορισμό μιας αιτιακής επίδρασης και παρόλο που είναι εξαιρετικά απλό, αυτό το πλαίσιο αποδεικνύεται γενικεύσιμο με πολλούς σημαντικούς και ενδιαφέροντες τρόπους (Imbens and Rubin 2015) .
Όταν χρησιμοποιούμε το πλαίσιο των πιθανών αποτελεσμάτων, συχνά θεωρώ χρήσιμο να συντάξω έναν πίνακα που να δείχνει τα πιθανά αποτελέσματα και τις επιπτώσεις της θεραπείας για όλες τις μονάδες (πίνακας 2.5). Εάν δεν μπορείτε να φανταστείτε ένα τραπέζι όπως αυτό για τη μελέτη σας, τότε ίσως χρειαστεί να είστε πιο ακριβείς στους ορισμούς σας για τις μονάδες, τις θεραπείες και τα πιθανά αποτελέσματά σας.
Πρόσωπο | Κέρδη υπό συνθήκες θεραπείας | Κέρδη υπό έλεγχο | Επεξεργασία |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Σημαίνω | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Ωστόσο, όταν καθορίζουμε την αιτιώδη επίδραση με αυτόν τον τρόπο, αντιμετωπίζουμε ένα πρόβλημα. Σε όλες σχεδόν τις περιπτώσεις, δεν παρατηρούμε και τα δυο πιθανά αποτελέσματα. Δηλαδή, ένα συγκεκριμένο άτομο που εξυπηρετείται ή δεν εξυπηρετεί. Επομένως, παρατηρούμε ένα από τα πιθανά αποτελέσματα - \(Y_i(1)\) ή \(Y_i(0)\) - αλλά όχι και τα δύο. Η αδυναμία να παρατηρηθούν και τα δύο δυνητικά αποτελέσματα είναι ένα τόσο μεγάλο πρόβλημα που ο Holland (1986) χαρακτήρισε ως το Θεμελιώδες Πρόβλημα της Αιτιώδους Συναγωγής .
Ευτυχώς, όταν κάνουμε έρευνα, δεν έχουμε μόνο ένα άτομο. μάλλον, έχουμε πολλούς ανθρώπους και αυτό προσφέρει έναν τρόπο γύρω από το Θεμελιώδες πρόβλημα της Αιτιώδους Συναγωγής. Αντί να προσπαθήσουμε να εκτιμήσουμε το αποτέλεσμα ατομικής θεραπείας, μπορούμε να υπολογίσουμε το μέσο όρο θεραπευτικής επίδρασης για όλες τις μονάδες:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Αυτή η εξίσωση εξακολουθεί να εκφράζεται με όρους \(\tau_i\) , οι οποίοι δεν είναι ορατοί, αλλά με κάποια άλγεβρα (eq 2.8 του Gerber and Green (2012) ), παίρνουμε
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Αυτό δείχνει ότι, αν μπορούμε να εκτιμήσουμε το πληθυσμό μέσος έκβαση υπό θεραπεία ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) και ο πληθυσμός μέσος αποτέλεσμα υπό έλεγχο ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), τότε μπορούμε να εκτιμήσουμε το μέσο αποτέλεσμα θεραπείας, ακόμη και χωρίς να υπολογίσουμε το αποτέλεσμα της θεραπείας για κάποιο συγκεκριμένο άτομο.
Τώρα που έχω καθορίσει την εκτίμηση μας - το πράγμα που προσπαθούμε να εκτιμήσουμε - θα στραφώ στον τρόπο με τον οποίο μπορούμε πραγματικά να το υπολογίσουμε με δεδομένα. Και εδώ τρέχουμε άμεσα στο πρόβλημα ότι παρατηρούμε μόνο ένα από τα δυνητικά αποτελέσματα για κάθε άτομο. βλέπουμε είτε \(Y_i(0)\) ή \(Y_i(1)\) (πίνακας 2.6). Θα μπορούσαμε να εκτιμήσουμε το μέσο αποτέλεσμα θεραπείας συγκρίνοντας τα κέρδη των ανθρώπων που χρησίμευαν για τα κέρδη των ανθρώπων που δεν εξυπηρετούσαν:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
όπου \(N_t\) και \(N_c\) είναι οι αριθμοί των ανθρώπων στις συνθήκες θεραπείας και ελέγχου. Αυτή η προσέγγιση θα λειτουργήσει καλά εάν η εκχώρηση θεραπείας είναι ανεξάρτητη από πιθανά αποτελέσματα, μια κατάσταση που μερικές φορές ονομάζεται αδιαφορία . Δυστυχώς, ελλείψει ενός πειράματος, η αδιαφορία δεν είναι συχνά ικανοποιημένη, πράγμα που σημαίνει ότι ο εκτιμητής στο eq. 2.4 δεν είναι πιθανό να παράγει καλή εκτίμηση. Ένας τρόπος να το σκεφτούμε είναι ότι, ελλείψει τυχαίας ανάθεσης θεραπείας, π.χ. 2.4 δεν συγκρίνεται με παρόμοια. συγκρίνει τα κέρδη διαφόρων ειδών ανθρώπων. Ή εκφράζεται ελαφρώς διαφορετική, χωρίς τυχαία ανάθεση της θεραπείας, η κατανομή της θεραπείας πιθανόν να σχετίζεται με πιθανά αποτελέσματα.
Στο κεφάλαιο 4, θα περιγράψω πώς τυχαιοποιημένα ελεγχόμενα πειράματα μπορούν να βοηθήσουν τους ερευνητές να κάνουν αιτιώδεις εκτιμήσεις και εδώ θα περιγράψω πώς οι ερευνητές μπορούν να επωφεληθούν από φυσικά πειράματα, όπως το σχέδιο λοταρίας.
Πρόσωπο | Κέρδη υπό συνθήκες θεραπείας | Κέρδη υπό έλεγχο | Επεξεργασία |
---|---|---|---|
1 | ; | \(Y_1(0)\) | ; |
2 | \(Y_2(1)\) | ; | ; |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ; | ; |
Σημαίνω | ; | ; | ; |
Φυσικά πειράματα
Μια προσέγγιση για να κάνετε αιτιώδεις εκτιμήσεις χωρίς να διεξαγάγετε ένα πείραμα είναι να αναζητήσετε κάτι που συμβαίνει στον κόσμο που έχει εκχωρήσει τυχαία μια θεραπεία για σας. Αυτή η προσέγγιση ονομάζεται φυσικά πειράματα . Σε πολλές περιπτώσεις, δυστυχώς, η φύση δεν παράγει τυχαία τη θεραπεία που θέλετε στον πληθυσμό που σας ενδιαφέρει. Αλλά μερικές φορές, η φύση παράγει τυχαία μια σχετική θεραπεία. Ειδικότερα, θα εξετάσω την περίπτωση όπου υπάρχει κάποια δευτεροβάθμια θεραπεία που ενθαρρύνει τους ανθρώπους να λάβουν την αρχική θεραπεία . Για παράδειγμα, το σχέδιο θα μπορούσε να θεωρηθεί ως τυχαία εκχωρημένη δευτεροβάθμια θεραπεία που ενθάρρυνε μερικούς ανθρώπους να λάβουν την αρχική θεραπεία, η οποία υπηρετούσε στο στρατό. Αυτό το σχέδιο ονομάζεται συχνά σχεδιασμός ενθάρρυνσης . Και η μέθοδος ανάλυσης που θα περιγράψω για να χειριστώ αυτή την κατάσταση ονομάζεται μερικές φορές οργανικές μεταβλητές . Σε αυτή τη ρύθμιση, με κάποιες υποθέσεις, οι ερευνητές μπορούν να χρησιμοποιήσουν την ενθάρρυνση για να μάθουν για την επίδραση της πρωτοβάθμιας θεραπείας για ένα συγκεκριμένο υποσύνολο μονάδων.
Για να χειριστούμε τις δύο διαφορετικές θεραπείες - την ενθάρρυνση και την πρωτογενή θεραπεία - χρειαζόμαστε κάποια νέα συμβολική αναφορά. Ας υποθέσουμε ότι ορισμένοι άνθρωποι είναι τυχαία διατυπωμένοι ( \(Z_i = 1\) ) ή δεν έχουν συνταχθεί ( \(Z_i = 0\) ); σε αυτή την περίπτωση, το \(Z_i\) ονομάζεται μερικές φορές ένα όργανο .
Μεταξύ αυτών που συντάχθηκαν, κάποιοι υπηρέτησαν ( \(Z_i = 1, W_i = 1\) ) και κάποιοι όχι ( \(Z_i = 1, W_i = 0\) ). Ομοίως, μεταξύ εκείνων που δεν είχαν συνταχθεί, κάποιοι υπηρέτησαν ( \(Z_i = 0, W_i = 1\) ) και κάποιοι δεν ( \(Z_i = 0, W_i = 0\) ). Τα πιθανά αποτελέσματα για κάθε άτομο μπορούν τώρα να επεκταθούν για να δείξουν την κατάστασή τους τόσο για την ενθάρρυνση όσο και για τη θεραπεία. Παραδείγματος χάριν, ας \(Y(1, W_i(1))\) είναι τα κέρδη του ατόμου \(i\) αν είχε συνταχθεί, όπου \(W_i(1)\) είναι η υπηρεσία του. Περαιτέρω, μπορούμε να χωρίσουμε τον πληθυσμό σε τέσσερις ομάδες: συμπαραγωγοί, μη ληπτέοι, καταθλιπτικοί και πάντοτε παραγωγοί (πίνακας 2.7).
Τύπος | Υπηρεσία αν συντάσσεται | Αν δεν συντάσσεται υπηρεσία |
---|---|---|
Compliers | Ναι, \(W_i(Z_i=1) = 1\) | Όχι, \(W_i(Z_i=0) = 0\) |
Ποτέ δεν παίρνουν | Όχι, \(W_i(Z_i=1) = 0\) | Όχι, \(W_i(Z_i=0) = 0\) |
Defiers | Όχι, \(W_i(Z_i=1) = 0\) | Ναι, \(W_i(Z_i=0) = 1\) |
Πάντα-κτήτορες | Ναι, \(W_i(Z_i=1) = 1\) | Ναι, \(W_i(Z_i=0) = 1\) |
Πριν συζητήσουμε για την εκτίμηση της επίδρασης της θεραπείας (δηλαδή, της στρατιωτικής θητείας), μπορούμε πρώτα να καθορίσουμε δύο επιδράσεις της ενθάρρυνσης (δηλαδή, που συντάσσονται). Πρώτον, μπορούμε να καθορίσουμε την επίδραση της ενθάρρυνσης στην πρωτογενή θεραπεία. Δεύτερον, μπορούμε να καθορίσουμε την επίδραση της ενθάρρυνσης στο αποτέλεσμα. Θα αποδειχθεί ότι αυτά τα δύο αποτελέσματα μπορούν να συνδυαστούν για να παράσχουν μια εκτίμηση της επίδρασης της θεραπείας σε μια συγκεκριμένη ομάδα ανθρώπων.
Πρώτον, η επίδραση της ενθάρρυνσης στη θεραπεία μπορεί να οριστεί για το άτομο \(i\) ως
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Επιπλέον, αυτή η ποσότητα μπορεί να οριστεί σε ολόκληρο τον πληθυσμό ως
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Τέλος, μπορούμε να εκτιμήσουμε \(\text{ITT} _{W}\) χρησιμοποιώντας δεδομένα:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
όπου \(\bar{W}^{\text{obs}}_1\) είναι ο παρατηρούμενος ρυθμός θεραπείας για όσους έχουν ενθαρρυνθεί και \(\bar{W}^{\text{obs}}_0\) το παρατηρούμενο ποσοστό θεραπείας για όσους δεν ενθαρρύνθηκαν. \(\text{ITT}_W\) ονομάζεται μερικές φορές και ο ρυθμός πρόσληψης .
Στη συνέχεια, το αποτέλεσμα της ενθάρρυνσης στο αποτέλεσμα μπορεί να οριστεί για το άτομο \(i\) ως εξής:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Επιπλέον, αυτή η ποσότητα μπορεί να οριστεί σε ολόκληρο τον πληθυσμό ως
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Τέλος, μπορούμε να εκτιμήσουμε \(\text{ITT}_{Y}\) χρησιμοποιώντας δεδομένα:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
όπου \(\bar{Y}^{\text{obs}}_1\) είναι το παρατηρούμενο αποτέλεσμα (π.χ., τα κέρδη) για όσους είχαν ενθαρρυνθεί (π.χ., σύνταξη) και \(\bar{W}^{\text{obs}}_0\) είναι το παρατηρούμενο αποτέλεσμα για όσους δεν ενθαρρύνθηκαν.
Τέλος, εφιστούμε την προσοχή μας στην επίδραση του ενδιαφέροντος: την επίδραση της αρχικής θεραπείας (π.χ. στρατιωτική θητεία) στο αποτέλεσμα (π.χ., τα κέρδη). Δυστυχώς, αποδεικνύεται ότι κανείς δεν μπορεί, γενικά, να εκτιμήσει αυτό το αποτέλεσμα σε όλες τις μονάδες. Ωστόσο, με κάποιες υποθέσεις, οι ερευνητές μπορούν να εκτιμήσουν την επίδραση της θεραπείας στους συμμορφούμενους (δηλαδή, οι άνθρωποι που θα εξυπηρετήσουν αν συντάξουν και οι άνθρωποι που δεν θα εξυπηρετούν εάν δεν συντάσσονται, πίνακας 2.7). Θα το ονομάσω αυτό το εκτιμώμενο μέσον αιτιατό αποτέλεσμα (CACE) (το οποίο επίσης μερικές φορές ονομάζεται τοπικό αποτέλεσμα μέσης θεραπείας , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
όπου \(G_i\) δίνει την ομάδα του ατόμου \(i\) (βλέπε πίνακα 2.7) και \(N_{\text{co}}\) είναι ο αριθμός των compliers. Με άλλα λόγια, η εξ. 2.11 συγκρίνει τα κέρδη των συντακτών που συντάχθηκαν \(Y_i(1, W_i(1))\) και δεν συντάχθηκαν \(Y_i(0, W_i(0))\) . Η εκτίμηση στο ισοδ. Το 2.11 φαίνεται δύσκολο να εκτιμηθεί από τα παρατηρούμενα δεδομένα, επειδή δεν είναι δυνατόν να προσδιοριστούν οι συμπαραγωγοί χρησιμοποιώντας μόνο τα παρατηρούμενα δεδομένα (για να γνωρίζετε εάν κάποιος είναι συντάκτης θα πρέπει να παρατηρήσετε αν χρησίμευσε όταν συντάχθηκε και αν εξυπηρετήθηκε όταν δεν συντάχθηκε).
Αποδεικνύεται - κάπως απροσδόκητα - ότι αν υπάρχουν κάποιοι συμπαραγωγοί, τότε με την προϋπόθεση ότι υπάρχουν τρεις επιπλέον παραδοχές, είναι δυνατόν να υπολογιστεί το CACE από τα παρατηρούμενα δεδομένα. Πρώτον, πρέπει να υποθέσουμε ότι η ανάθεση στη θεραπεία είναι τυχαία. Στην περίπτωση του σχεδίου λοταρίας αυτό είναι λογικό. Ωστόσο, σε ορισμένες ρυθμίσεις όπου τα φυσικά πειράματα δεν βασίζονται σε φυσική τυχαιοποίηση, αυτή η υπόθεση μπορεί να είναι πιο προβληματική. Δεύτερον, κάποιος πρέπει να υποθέσει ότι δεν είναι καθόλου καταθλιπτικά (αυτή η υπόθεση είναι επίσης μερικές φορές αποκαλείται η υπόθεση μονοτονίας). Στο πλαίσιο του σχεδίου φαίνεται εύλογο να υποθέσουμε ότι υπάρχουν πολύ λίγοι άνθρωποι που δεν θα υπηρετήσουν εάν συντάσσονται και θα υπηρετούν αν δεν συντάσσονται. Τρίτον, και τέλος, έρχεται η πιο σημαντική παραδοχή που ονομάζεται περιορισμός αποκλεισμού . Σύμφωνα με τον περιορισμό αποκλεισμού, πρέπει να υποθέσουμε ότι το σύνολο της επίδρασης της ανάθεσης θεραπείας περνάει από την ίδια τη θεραπεία. Με άλλα λόγια, πρέπει να υποθέσουμε ότι δεν υπάρχει άμεσο αποτέλεσμα ενθάρρυνσης στα αποτελέσματα. Στην περίπτωση του σχεδίου λαχειοφόρων αγορών, για παράδειγμα, πρέπει να υποθέσουμε ότι το σχέδιο καθεστώτος δεν έχει καμία επίδραση στα κέρδη εκτός από τη στρατιωτική υπηρεσία (εικόνα 2.11). Ο περιορισμός αποκλεισμού μπορεί να παραβιαστεί εάν, για παράδειγμα, οι συνταξιούχοι διανύσουν περισσότερο χρόνο στο σχολείο για να αποφύγουν την υπηρεσία ή εάν οι εργοδότες ήταν λιγότερο πιθανό να προσλάβουν άτομα που συντάχθηκαν.
Εάν πληρούνται οι τρεις αυτές προϋποθέσεις (τυχαία ανάθεση στη θεραπεία, καμία αποδιοργάνωση και περιορισμός αποκλεισμού) τότε
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
έτσι μπορούμε να εκτιμήσουμε το CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Ένας τρόπος να σκεφτούμε το CACE είναι ότι είναι η διαφορά στα αποτελέσματα μεταξύ εκείνων που ενθαρρύνθηκαν και εκείνων που δεν ενθαρρύνθηκαν, διογκωμένοι από το ποσοστό πρόσληψης.
Υπάρχουν δύο σημαντικές προειδοποιήσεις που πρέπει να θυμάστε. Πρώτον, ο περιορισμός αποκλεισμού αποτελεί ισχυρή υπόθεση και πρέπει να δικαιολογείται κατά περίπτωση, κάτι που συχνά απαιτεί εμπειρογνωμοσύνη. Ο περιορισμός αποκλεισμού δεν μπορεί να δικαιολογηθεί με την τυχαιοποίηση της ενθάρρυνσης. Δεύτερον, μια κοινή πρακτική πρόκληση με την ανάλυση των εργαλείων μεταβλητής έρχεται όταν η ενθάρρυνση έχει μικρή επίδραση στην πρόσληψη της θεραπείας (όταν \(\text{ITT}_W\) είναι μικρό). Αυτό ονομάζεται αδύναμο όργανο και οδηγεί σε μια ποικιλία προβλημάτων (Imbens and Rosenbaum 2005; Murray 2006) . Ένας τρόπος να σκεφτούμε το πρόβλημα με αδύναμα μέσα είναι ότι \(\widehat{\text{CACE}}\) μπορεί να είναι ευαίσθητος σε μικρές προκαταλήψεις στο \(\widehat{\text{ITT}_Y}\) - παραβιάσεις του περιορισμού αποκλεισμού-επειδή αυτές οι προκαταλήψεις μεγεθύνονται από ένα μικρό \(\widehat{\text{ITT}_W}\) (βλ. Σχεδόν εάν η θεραπεία που αποδίδει η φύση δεν έχει μεγάλο αντίκτυπο στη θεραπεία που σας ενδιαφέρει, τότε θα δυσκολευτείτε να μάθετε για τη θεραπεία που σας ενδιαφέρει.
Βλ. Κεφάλαια 23 και 24 των Imbens and Rubin (2015) για μια πιο επίσημη εκδοχή αυτής της συζήτησης. Η παραδοσιακή οικονομετρική προσέγγιση στις οργανικές μεταβλητές εκφράζεται συνήθως με την εκτίμηση των εξισώσεων και όχι με τα δυνητικά αποτελέσματα. Για μια εισαγωγή από αυτή την άλλη οπτική, βλ. Angrist and Pischke (2009) , και για σύγκριση μεταξύ των δύο προσεγγίσεων, βλ. Τμήμα 24.6 των Imbens and Rubin (2015) . Μια εναλλακτική, ελαφρώς λιγότερο επίσημη παρουσίαση της προσέγγισης των εργαλειολογικών μεταβλητών παρέχεται στο κεφάλαιο 6 του Gerber and Green (2012) . Για περισσότερες πληροφορίες σχετικά με τον περιορισμό αποκλεισμού, βλ D. Jones (2015) . Aronow and Carnegie (2013) περιγράφουν ένα επιπλέον σύνολο υποθέσεων που μπορούν να χρησιμοποιηθούν για την εκτίμηση της ΑΤΕ παρά της CACE. Για περισσότερα σχετικά με το πώς τα φυσικά πειράματα μπορούν να είναι πολύ δύσκολα να ερμηνευτούν, βλ. Sekhon and Titiunik (2012) . Για μια γενικότερη εισαγωγή στα φυσικά πειράματα - μία που ξεπερνά μόνο την προσέγγιση των εργαλειολογικών μεταβλητών και περιλαμβάνει σχέδια όπως η ασυνέχεια παλινδρόμησης - βλέπε Dunning (2012) .