Ένας ερευνητής που χρησιμοποιείται μεγάλο δεδομένα από ταξίμετρα για να μελετήσει τη λήψη αποφάσεων των οδηγών ταξί στη Νέα Υόρκη. Αυτά τα δεδομένα ταιριάζουν καλά για την έρευνα αυτή.
Ένα παράδειγμα της απλής δύναμη μετρώντας το σωστό προέρχεται από Henry Farber του (2015) μελέτη της συμπεριφοράς των οδηγών ταξί στη Νέα Υόρκη. Παρά το γεγονός ότι αυτή η ομάδα μπορεί να μην ακούγεται εγγενώς ενδιαφέρουσα είναι μια στρατηγική θέση της έρευνας για τον έλεγχο δύο ανταγωνιστικές θεωρίες στα οικονομικά της εργασίας. Για τους σκοπούς της έρευνας Farber, υπάρχουν δύο σημαντικά χαρακτηριστικά σχετικά με το περιβάλλον εργασίας των οδηγών ταξί: 1) ωρομισθίου τους κυμαίνεται από μέρα σε μέρα, που βασίζεται εν μέρει σε παράγοντες όπως ο καιρός και 2) τον αριθμό των ωρών που εργάζονται μπορεί να παρουσιάζει διακυμάνσεις κάθε μέρα με βάση τις αποφάσεις του οδηγού. Τα χαρακτηριστικά αυτά οδηγούν σε μια ενδιαφέρουσα ερώτηση για τη σχέση μεταξύ των ωριαίων μισθών και ωρών εργασίας. Νεοκλασικά μοντέλα στα οικονομικά προβλέπουν ότι οι οδηγοί ταξί θα μπορούσε να λειτουργήσει περισσότερο σε ημέρες όπου έχουν υψηλότερο ωρομίσθιο. Εναλλακτικά, τα μοντέλα από τα συμπεριφορικά οικονομικά προβλέψει ακριβώς το αντίθετο. Εάν οι οδηγοί που ένα συγκεκριμένο εισόδημα στόχου λένε $ 100 ανά ημέρα, και το έργο μέχρις ότου ικανοποιηθεί ο στόχος, τότε οι οδηγοί θα καταλήγουν να εργάζονται λιγότερες ώρες τις ημέρες ότι κερδίζουν περισσότερα. Για παράδειγμα, αν ήταν εργαζόμενος στόχο, μπορεί να καταλήγουν να εργάζονται τέσσερις ώρες σε μια καλή μέρα (25 $ ανά ώρα) και 5 ώρες σε μια κακή ημέρα ($ 20 ανά ώρα). Έτσι, μην οδηγοί εργάζονται περισσότερες ώρες τις ημέρες με τις υψηλότερες ωριαίες αποδοχές (όπως προβλέπεται από τα νεοκλασικά μοντέλα) ή περισσότερες ώρες τις ημέρες με χαμηλότερες ωριαίες αποδοχές (όπως προβλέπεται από συμπεριφορικά οικονομικά μοντέλα);
Για να απαντήσουμε σε αυτό το ερώτημα Farber δεδομένων που συγκεντρώθηκαν για κάθε ταξίδι με ταξί που λαμβάνονται από τις καμπίνες πόλη της Νέας Υόρκης από το 2009 - 2013, τα δεδομένα που είναι τώρα διαθέσιμες στο κοινό . Αυτά τα δεδομένα, τα οποία συλλέχθηκαν από ηλεκτρονικούς μετρητές που η πόλη χρειάζεται ταξί για να χρησιμοποιήσετε, περιλαμβάνει διάφορα κομμάτια των πληροφοριών για κάθε ταξίδι: ώρα έναρξης, ξεκινήστε την τοποθεσία, την ώρα λήξης, τέλος τοποθεσία, τιμή, και το άκρο (εάν η κορυφή πληρώθηκε με ένα πιστωτική κάρτα). Συνολικά, τα στοιχεία Farber περιείχε πληροφορίες για περίπου 900 εκατομμύρια ταξίδια που λαμβάνονται κατά τη διάρκεια της περίπου 40 εκατομμύρια βάρδιες (μια μετατόπιση είναι περίπου μία μέρα δουλειάς για έναν οδηγό). Στην πραγματικότητα, υπήρχε τόσο πολύ τα δεδομένα, ότι Farber χρησιμοποιείται μόνο ένα τυχαίο δείγμα για ανάλυση του. Χρησιμοποιώντας αυτά τα δεδομένα ταξίμετρο, Farber διαπίστωσε ότι οι περισσότεροι οδηγοί εργάζονται περισσότερο τις ημέρες, όταν οι μισθοί είναι υψηλότεροι, σύμφωνα με την νεοκλασική θεωρία. Εκτός από αυτό το κύριο εύρημα, Farber ήταν σε θέση να αξιοποιήσουν το μέγεθος των δεδομένων για την καλύτερη κατανόηση της ετερογένειας και της δυναμικής. Farber διαπίστωσε ότι την πάροδο του χρόνου νεότερα προγράμματα οδήγησης σταδιακά να μάθουν να εργάζονται περισσότερες ώρες για την υψηλή ημέρες μισθών (π.χ., μαθαίνουν να συμπεριφέρονται όπως τα νεοκλασικά μοντέλα προβλέπει). Και, νέοι οδηγοί οι οποίοι συμπεριφέρονται περισσότερο σαν μισθωτοί στόχο έχουν περισσότερες πιθανότητες να σταματήσουν το κάπνισμα είναι ένας οδηγός ταξί. Και οι δύο αυτές πιο λεπτή ευρήματα, τα οποία βοηθούν να εξηγήσει την παρατηρούμενη συμπεριφορά των σημερινών οδηγών, ήταν δυνατή μόνο λόγω του μεγέθους του συνόλου δεδομένων. Θα ήταν αδύνατο να ανιχνευθεί σε προηγούμενες μελέτες που χρησιμοποίησαν φύλλα ταξίδι χαρτί από ένα μικρό αριθμό οδηγών ταξί σε σύντομο χρονικό διάστημα (π.χ., Camerer et al. (1997) ).
μελέτη Farber ήταν κοντά σε μια καλύτερη περίπτωση για μια μελέτη με τη χρήση μεγάλων δεδομένων. Πρώτον, τα δεδομένα δεν ήταν μη-αντιπροσωπευτική, επειδή η πόλη χρειάζεται οι οδηγοί να χρησιμοποιούν ψηφιακές μέτρα. Και, τα δεδομένα δεν ήταν ελλιπή επειδή τα δεδομένα που συλλέχθηκαν από την πόλη ήταν αρκετά κοντά με τα στοιχεία που Farber θα έχουν συλλεχθεί, αν είχε την επιλογή (μία διαφορά είναι ότι Farber θα ήθελαν στοιχεία σχετικά με το σύνολο των μισθών-ναύλων + Συμβουλές- αλλά τα δεδομένα της πόλης περιλαμβάνονται μόνο συμβουλές που καταβάλλονται μέσω πιστωτικής κάρτας). Το κλειδί για την έρευνα Farber ήταν συνδυάζοντας μια καλή ερώτηση με καλά στοιχεία. Τα δεδομένα από μόνα τους δεν είναι αρκετά.