2.4.3.1 Φυσικό πειράματα

Φυσικό πειράματα να επωφεληθούν από τυχαία γεγονότα στον κόσμο. τυχαίο συμβάν + always-on σύστημα δεδομένων = φυσικό πείραμα

Το κλειδί για την τυχαιοποιημένη ελεγχόμενη πειράματα επιτρέπουν δίκαιη σύγκριση είναι η τυχαιοποίηση. Ωστόσο, μερικές φορές κάτι συμβαίνει στον κόσμο που εκχωρεί ουσιαστικά οι άνθρωποι τυχαία ή σχεδόν τυχαία σε διαφορετικές θεραπείες. Ένα από τα σαφέστερα παραδείγματα της στρατηγικής της, χρησιμοποιώντας τα φυσικά πειράματα προέρχεται από την έρευνα του Angrist (1990) που μετρά την επίδραση των στρατιωτικών υπηρεσιών σχετικά με τις αποδοχές.

Κατά τη διάρκεια του πολέμου στο Βιετνάμ, οι Ηνωμένες Πολιτείες αύξησαν το μέγεθος των ενόπλων δυνάμεών της, μέσω ενός σχεδίου. Προκειμένου να αποφασίσει ποια πολίτες θα κληθούν σε υπηρεσία, η κυβέρνηση των ΗΠΑ πραγματοποιήθηκε μια λαχειοφόρο αγορά. Κάθε ημερομηνία γέννησης εκπροσωπήθηκε σε ένα κομμάτι χαρτί, και αυτά τα χαρτιά τοποθετήθηκαν σε ένα μεγάλο γυάλινο βάζο. Όπως φαίνεται στο Σχήμα 2.5, αυτά τα χαρτάκια αντλήθηκαν από το βάζο, ένα κάθε φορά για να καθορίσετε τη σειρά ότι οι νέοι άνδρες θα κληθούν να υπηρετήσουν (νεαρές γυναίκες δεν υπόκεινται στο σχέδιο). Με βάση τα αποτελέσματα, οι άνδρες που γεννήθηκαν στις 14 Σεπτεμβρίου κλήθηκαν πρώτη, άντρες που γεννήθηκαν στις 24 Απριλίου κλήθηκαν δεύτερο, και ούτω καθεξής. Τελικά, σε αυτή τη λαχειοφόρο αγορά, οι άνδρες που γεννήθηκαν σε 195 διαφορετικές ημέρες κλήθηκαν στην υπηρεσία, ενώ οι άνδρες που γεννήθηκαν σε 171 ημέρες δεν κλήθηκαν.

Σχήμα 2.5: Κογκρέσσου Αλέξανδρος Pirnie (R-NY), αντλώντας την πρώτη κάψουλα για το σχέδιο Επιλεκτική υπηρεσία την 1η Δεκεμβρίου, 1969. Joshua Angrist (1990), σε συνδυασμό το σχέδιο λαχείο με δεδομένα τα κέρδη από την Υπηρεσία Κοινωνικής Ασφάλισης για να εκτιμηθεί η επίδραση της στρατιωτικής θητείας σχετικά με τις αποδοχές. Αυτό είναι ένα παράδειγμα της έρευνας χρησιμοποιώντας ένα φυσικό πείραμα. Πηγή: Wikimedia Commons

Σχήμα 2.5: Κογκρέσσου Αλέξανδρος Pirnie (R-NY), αντλώντας την πρώτη κάψουλα για το σχέδιο Επιλεκτική υπηρεσία την 1η Δεκεμβρίου, 1969. Joshua Angrist (1990) σε συνδυασμό το σχέδιο λαχείο με δεδομένα τα κέρδη από την Υπηρεσία Κοινωνικής Ασφάλισης για να εκτιμηθεί η επίδραση της στρατιωτικής θητείας σχετικά με τις αποδοχές. Αυτό είναι ένα παράδειγμα της έρευνας χρησιμοποιώντας ένα φυσικό πείραμα. Πηγή: Wikimedia Commons

Αν και μπορεί να μην είναι αμέσως εμφανής, ένα σχέδιο λοταρία έχει μια κρίσιμη ομοιότητα με μια τυχαιοποιημένη ελεγχόμενη πείραμα: και στις δύο περιπτώσεις οι συμμετέχοντες τυχαία για να λάβουν μια θεραπεία. Στην περίπτωση του σχεδίου λαχείο, αν ενδιαφέρεστε να μάθετε σχετικά με τις επιπτώσεις του σχεδίου, την επιλεξιμότητα και την στρατιωτική θητεία στις επόμενες κέρδη από την αγορά εργασίας, μπορούμε να συγκρίνουμε τα αποτελέσματα για τα άτομα των οποίων οι ημερομηνίες γεννήσεως ήταν κάτω από το cutoff λαχειοφόρο αγορά (π.χ., 14 Σεπτεμβρίου, Απρίλιος 24, κλπ) με τα αποτελέσματα για τους ανθρώπους των οποίων τα γενέθλια ήταν μετά την αποκοπής (π.χ., 20 Φεβρουαρίου, 2 Δεκεμβρίου, κλπ).

Δεδομένου ότι αυτή η θεραπεία από τη σύνταξή της έχει τυχαία, τότε μπορούμε να μετρηθεί η επίδραση της επεξεργασίας αυτής για οποιοδήποτε αποτέλεσμα που έχει μετρηθεί. Για παράδειγμα, Angrist (1990) σε συνδυασμό τις πληροφορίες σχετικά με το ποιος ήταν τυχαία επιλεγμένο στο σχέδιο με τα στοιχεία τα κέρδη που συλλέγονται από την Υπηρεσία Κοινωνικής Ασφάλισης για να καταλήξει στο συμπέρασμα ότι οι αποδοχές των λευκών βετεράνων ήταν περίπου 15% λιγότερο από ό, τι τα κέρδη των συγκρίσιμων μη-βετεράνοι . Άλλοι ερευνητές έχουν χρησιμοποιήσει μια παρόμοια τέχνασμα, καθώς και. Για παράδειγμα, Conley and Heerwig (2011) σε συνδυασμό τις πληροφορίες σχετικά με το ποιος ήταν τυχαία επιλεγμένο στο σχέδιο με τα στοιχεία των νοικοκυριών που συλλέγονται από την έρευνα του 2000 Απογραφή και το 2005 American Κοινότητας και διαπίστωσαν ότι τόσο καιρό μετά το σχέδιο, υπήρξε μικρή μακροπρόθεσμη επίδραση της στρατιωτική θητεία με την ποικιλία των αποτελεσμάτων, όπως η θητεία της στέγασης (που κατέχουν έναντι ενοικίαση) και οικιστικών σταθερότητα (πιθανό να έχει μετακινηθεί κατά τα προηγούμενα πέντε έτη).

Δεδομένου ότι αυτό το παράδειγμα δείχνει, μερικές φορές κοινωνικές, πολιτικές ή φυσικές δυνάμεις να δημιουργήσουν πειράματα ή σχεδόν πειράματα που μπορούν να αξιοποιηθούν από τους ερευνητές. Συχνά τα φυσικά πειράματα είναι ο καλύτερος τρόπος για την εκτίμηση των σχέσεων αιτίας-αποτελέσματος σε περιβάλλον όπου δεν είναι ηθικά ή πρακτικά να τρέχει τυχαιοποιημένη ελεγχόμενη πειράματα. Πρόκειται για μια σημαντική στρατηγική για την ανακάλυψη δίκαιες συγκρίσεις σε μη πειραματικά δεδομένα. Αυτή η έρευνα στρατηγική μπορεί να συνοψιστεί με την παρούσα εξίσωση:

\ [\ κείμενο {τυχαία (ή σαν τυχαία) περίπτωση} + \ κειμένου {always-on ροή δεδομένων} = \ κείμενο {φυσικό πείραμα} \ qquad (2.1) \]

Ωστόσο, η ανάλυση των φυσικών πειραμάτων μπορεί να είναι αρκετά δύσκολη. Για παράδειγμα, στην περίπτωση του σχεδίου του Βιετνάμ, δεν είναι όλοι όσοι ήταν σχέδιο επιλέξιμες καταλήξαμε εξυπηρετούν (υπήρχαν μια σειρά από εξαιρέσεις). Και, την ίδια στιγμή, κάποιοι άνθρωποι που δεν είχαν συντάξει επιλέξιμες εθελοντικά για την υπηρεσία. Ήταν σαν σε μια κλινική δοκιμή ενός νέου φαρμάκου, κάποιοι άνθρωποι στην ομάδα θεραπείας δεν λαμβάνουν τα φάρμακά τους και μερικοί από τους ανθρώπους στην ομάδα ελέγχου που έλαβε κατά κάποιο τρόπο το φάρμακο. Αυτό το πρόβλημα, που ονομάζεται διπλής όψης μη συμμόρφωση, καθώς και πολλά άλλα προβλήματα περιγράφονται με μεγαλύτερη λεπτομέρεια σε ορισμένες από τις συνιστώμενες αναγνώσεις στο τέλος αυτού του κεφαλαίου.

Η στρατηγική της εκμεταλλευόμενοι φυσικά τυχαία ανάθεση προηγείται στην ψηφιακή εποχή, αλλά η επικράτηση των μεγάλων δεδομένων καθιστά αυτή η στρατηγική πολύ πιο εύκολο στη χρήση. Μόλις συνειδητοποιήσετε κάποια θεραπεία έχει ανατεθεί τυχαία, μεγάλη πηγές δεδομένων μπορούν να παρέχουν τα δεδομένα αποτέλεσμα που χρειάζεστε για να συγκριθούν τα αποτελέσματα για τους ανθρώπους στις συνθήκες επεξεργασίας και ελέγχου. Για παράδειγμα, στη μελέτη του για τα αποτελέσματα του σχεδίου και τη στρατιωτική θητεία, Angrist έκανε χρήση των εσόδων από τα αρχεία από την Υπηρεσία Κοινωνικής Ασφάλισης? Χωρίς αυτά τα δεδομένα έκβασης, η μελέτη του δεν θα ήταν δυνατή. Στην περίπτωση αυτή, η Διοίκηση Κοινωνικής Ασφάλισης είναι το always-on μεγάλη πηγή δεδομένων. Δεδομένου ότι υπάρχουν όλο και περισσότερες συλλέγονται αυτόματα πηγές δεδομένων, θα έχουμε περισσότερα δεδομένα αποτέλεσμα που μπορεί να μετρήσει τις επιπτώσεις των αλλαγών που δημιουργούνται από εξωγενή μεταβολή.

Για την απεικόνιση αυτής της στρατηγικής στην ψηφιακή εποχή, ας εξετάσουμε Mas και Moretti του (2009) το κομψό έρευνα σχετικά με την επίδραση των συνομηλίκων στην παραγωγικότητα. Αν και στην επιφάνεια θα μπορούσε να είναι διαφορετικό από ό, τι μελέτη Angrist σχετικά με τις επιπτώσεις του σχεδίου στο Βιετνάμ, στη δομή και οι δύο ακολουθούν το μοτίβο σε eq. 2.1.

Mas και Moretti μετριέται πώς τους συνομηλίκους επηρεάζουν την παραγωγικότητα των εργαζομένων. Από τη μία πλευρά, έχει ένα από ομοτίμους που εργάζονται σκληρά θα μπορούσε να οδηγήσει τους εργαζόμενους να αυξήσουν την παραγωγικότητά τους, λόγω της πίεσης από ομοτίμους. Ή, από την άλλη πλευρά, μια σκληρή από ομοτίμους εργασίας θα μπορούσε να οδηγήσει τους άλλους εργαζόμενους για να χαλαρώσετε μακριά ακόμη περισσότερο. Ο σαφέστερος τρόπος για να μελετήσει επιπτώσεις από ομοτίμους στην παραγωγικότητα θα ήταν μια τυχαιοποιημένη ελεγχόμενη πείραμα όπου οι εργαζόμενοι είναι τυχαία σε βάρδιες με τους εργαζόμενους των διαφορετικών επιπέδων παραγωγικότητας και, στη συνέχεια, με αποτέλεσμα η παραγωγικότητα μετράται για όλους. Οι ερευνητές, ωστόσο, δεν ελέγχουν το χρονοδιάγραμμα των εργαζομένων σε κάθε πραγματική επιχείρηση, και έτσι Mas και Moretti έπρεπε να βασίζονται σε ένα φυσικό πείραμα που πραγματοποιήθηκε σε ένα σούπερ μάρκετ.

Ακριβώς όπως eq. 2.1, η μελέτη τους είχε δύο μέρη. Κατ 'αρχάς, χρησιμοποίησαν τα αρχεία καταγραφής από το σύστημα ταμείο του σούπερ μάρκετ να έχουν μια ακριβή, ατομικά, και πάντα-on μέτρο της παραγωγικότητας: ο αριθμός των αντικειμένων σαρωθεί ανά δευτερόλεπτο. Και, δεύτερον, λόγω του τρόπου που ο προγραμματισμός έγινε σε αυτό το σούπερ-μάρκετ, έχουν σχεδόν τυχαία σύνθεση των συνομηλίκων. Με άλλα λόγια, ακόμα κι αν ο προγραμματισμός του ταμίες δεν καθορίζεται από μια λαχειοφόρο αγορά, ήταν ουσιαστικά τυχαία. Στην πράξη, η εμπιστοσύνη που έχουμε στη φυσική πειράματα εξαρτάται συχνά από την αληθοφάνεια του "ως εάν" τυχαία αξίωση. Εκμεταλλευόμενοι αυτή την τυχαία διακύμανση, Mas και Moretti διαπίστωσε ότι εργάζονται με μεγαλύτερη συμμαθητές της παραγωγικότητας αυξάνει την παραγωγικότητα. Περαιτέρω, Mas και Moretti χρησιμοποιείται το μέγεθος και τον πλούτο του συνόλου δεδομένων τους να προχωρήσουν πέρα από την εκτίμηση του αιτίου-αποτελέσματος να διερευνήσει δύο πιο σημαντικές και λεπτές θέματα: ετερογένεια της επίδρασης αυτής (για την οποία τα είδη των εργαζομένων είναι η επίδραση μεγαλύτερο) και ο μηχανισμός πίσω από το φαινόμενο (γιατί δεν έχει υψηλές τους συμμαθητές της παραγωγικότητας να οδηγήσει σε υψηλότερη παραγωγικότητα). Θα επιστρέψουμε σε αυτά τα δύο σημαντικά ζητήματα-ετερογένεια των αποτελεσμάτων της θεραπείας και των μηχανισμών, στο Κεφάλαιο 5, όταν συζητάμε για τα πειράματα με περισσότερες λεπτομέρειες.

Γενικεύοντας από τις μελέτες σχετικά με την επίδραση του σχεδίου Βιετνάμ σχετικά με τις αποδοχές και τη μελέτη της επίδρασης των συνομηλίκων στην παραγωγικότητα, Πίνακας 2.3 συνοψίζει άλλες μελέτες που έχουν ακριβώς την ίδια δομή: χρησιμοποιώντας ένα always-on πηγή δεδομένων για τη μέτρηση των επιπτώσεων της κάποιο γεγονός . Όπως φαίνεται στον Πίνακα 2.3 καθιστά σαφές, φυσικά πειράματα είναι παντού, αν ξέρετε ακριβώς πώς να τα αναζητήσει.

Πίνακας 2.3: Παραδείγματα των φυσικών πειραμάτων χρησιμοποιώντας μεγάλες πηγές δεδομένων. Όλες αυτές οι μελέτες ακολουθούν την ίδια βασική συνταγή: τυχαία (ή σαν τυχαία) εκδήλωση + always-on σύστημα δεδομένων. Δείτε Dunning (2012) για περισσότερα παραδείγματα.
ουσιαστικές εστίαση Πηγή του φυσικού πειράματος Always-on δεδομένων πηγής Παραπομπή
Peer επιδράσεις στην παραγωγικότητα διαδικασία προγραμματισμού checkout δεδομένων Mas and Moretti (2009)
σχηματισμό φιλίας τυφώνες Facebook Phan and Airoldi (2015)
Εξάπλωση των συναισθημάτων βροχή Facebook Coviello et al. (2014)
Peer to peer οικονομικές μεταφορές σεισμός δεδομένων κινητής χρήματα Blumenstock, Fafchamps, and Eagle (2011)
Προσωπική συμπεριφορά κατανάλωσης 2013 της κυβέρνησης των ΗΠΑ shutdown δεδομένων προσωπική χρηματοδότηση Baker and Yannelis (2015)
Οικονομικός αντίκτυπος των συστημάτων συστάσεων διάφορος δεδομένων περιήγησης στο Amazon Sharma, Hofman, and Watts (2015)
Επίδραση του στρες στα αγέννητα μωρά 2006 Ισραήλ-Χεζμπολάχ πόλεμο αρχεία γεννήσεων Torche and Shwed (2015)
Διαβάζοντας τη συμπεριφορά στην Wikipedia αποκαλύψεις Snowden κούτσουρα Wikipedia Penney (2016)

Στην πράξη, οι ερευνητές χρησιμοποιούν δύο διαφορετικές στρατηγικές για την εύρεση φυσικού πειράματα, δύο από τα οποία μπορεί να είναι γόνιμη. Μερικοί ερευνητές ξεκινήσουμε με το always-on πηγή δεδομένων και να αναζητήσουν τυχαία γεγονότα στον κόσμο? άλλοι αρχίζουν με τυχαία γεγονότα στον κόσμο και να αναζητήσουν πηγές δεδομένων που συλλάβει τον αντίκτυπό τους. Τέλος, παρατηρούμε ότι η δύναμη των φυσικών πειραμάτων που δεν προέρχεται από την πολυπλοκότητα της στατιστικής ανάλυσης, αλλά από την φροντίδα στην ανακάλυψη μιας δίκαιης σύγκρισης δημιουργήθηκε από μια τυχερή ατύχημα της ιστορίας.