მკვლევარი გამოიყენება დიდი მონაცემების ტაქსის მეტრი შესწავლა გადაწყვეტილების მიღების ტაქსის მძღოლებს New York. ეს მონაცემები იყო კარგად შეეფერება ამ კვლევის.
ერთ-ერთი მაგალითია მარტივი ძალა იმედი სწორი მოდის Henry Farber ის (2015) სასწავლო ქცევის ნიუ იორკში ტაქსის მძღოლები. მიუხედავად იმისა, რომ ამ ჯგუფში შეიძლება არ ჟღერს, არსებითად საინტერესო ის არის, სტრატეგიული კვლევების საიტი ტესტირების ორი კონკურენტი თეორიები შრომის ეკონომიკა. მიზნებისათვის Farber კვლევის, არსებობს ორი მნიშვნელოვანი თვისებების შესახებ სამუშაო გარემო ტაქსის მძღოლებს: 1) მათი საათობრივი ხელფასი მერყეობს დღეში- to-day, ნაწილობრივ დაფუძნებულია ფაქტორები, როგორიცაა ამინდის და 2) საათების რაოდენობა ისინი მუშაობენ შეიძლება მერყეობს ყოველ დღე საფუძველზე მძღოლის გადაწყვეტილებები. ეს თვისებები გამოიწვიოს საინტერესო კითხვა შორის ურთიერთობა საათობრივი ხელფასი და საათი მუშაობდა. ნეოკლასიკური მოდელები ეკონომიკაში პროგნოზით, ტაქსის მძღოლებს იმუშავებს უფრო დღეებში, სადაც მათ აქვთ უმაღლესი საათობრივი ხელფასი. გარდა ამისა, მოდელები ქცევითი ეკონომიკის პროგნოზირება ზუსტად საპირისპირო. თუ მძღოლები მითითებული კონკრეტული შემოსავლის სამიზნე ვთქვა $ 100 დღეში და მუშაობა, სანამ, რომ სამიზნე შეხვდა, შემდეგ მძღოლები დასრულდება მუშაობა ნაკლები საათი დღის განმავლობაში, რომ ისინი რამაც მეტი. მაგალითად, თუ იყო სამიზნე earner, თქვენ შეიძლება დასრულდეს up მუშაობს 4 საათი კარგი ($ 25 საათში) და 5 საათი ცუდი დღე ($ 20 საათში). ასე რომ, არ მძღოლები მუშაობა უფრო საათი დღის უმაღლესი საათობრივი ხელფასი (როგორც იწინასწარმეტყველა მიერ ნეოკლასიკური მოდელები) ან მეტი საათი დღე ქვედა საათობრივი ხელფასი (როგორც იწინასწარმეტყველა მიერ ქცევითი ეკონომიკური მოდელები)?
ამ კითხვაზე პასუხის გაცემა Farber მიღებული მონაცემები ყოველი ტაქსის მოგზაურობა მიერ გადაღებული ნიუ იორკში კაბინები ეხლა 2009 - 2013, მონაცემები, რომლებიც ახლა საჯაროდ ხელმისაწვდომი . ეს მონაცემები იყო, რაც შეგროვებული ელექტრონული მრიცხველები, რომ ქალაქის მოითხოვს ტაქსი გამოიყენოთ-მოიცავს რამდენიმე ცალი ინფორმაციას თითოეული მოგზაურობა: დაწყების დრო, დაიწყოს ადგილმდებარეობა, ბოლოს დროს, ბოლოს ადგილმდებარეობა, მგზავრობის, და წვერი (თუ წვერი დაეთმო ერთად საკრედიტო ბარათი). საერთო ჯამში, Farber მონაცემები შეიცავდა ინფორმაციას დაახლოებით 900 მლნ მოგზაურობის დროს გადაღებული დაახლოებით 40 მილიონი ცვლაში (მიმარ დაახლოებით ერთი სამუშაო დღის ერთი მძღოლი). ფაქტობრივად, არ იყო იმდენად მონაცემები, რომ Farber გამოიყენება მხოლოდ შემთხვევითი ნიმუში, რომ ეს მისი ანალიზი. გამოყენება ამ ტაქსის მრიცხველის, Farber აღმოაჩინა, რომ მძღოლების უმეტესობა მუშაობა უფრო დღეები, როდესაც ანაზღაურება უფრო მაღალია, შეესაბამება ნეოკლასიკური თეორია. გარდა ამისა, მთავარი დასკვნა, Farber შეძლო ბერკეტები ზომა მონაცემების უკეთ არაერთგვაროვნება და დინამიკა. Farber აღმოაჩინა, რომ დროთა განმავლობაში უფრო მძღოლებს თანდათან ვისწავლოთ მუშაობა უფრო საათი მაღალი ხელფასი დღის (მაგალითად, ისინი სწავლობენ მოიქცევა, როგორც ნეოკლასიკური მოდელები პროგნოზით). და, ახალი მძღოლები, რომლებიც მოიქცეს უფრო სამიზნე წყარო უფრო სავარაუდოა, რომ დატოვა მყოფი ტაქსის მძღოლი. ორივე ეს უფრო დახვეწილი დასკვნები, რომელიც დაეხმარება ახსნას დაფიქსირდა ქცევის მიმდინარე მძღოლებს, მხოლოდ იმის გამო, რომ ზომა ნაკრებს. ისინი იქნებოდა იმის დადგენა, ადრე კვლევები, რომელიც გამოიყენება ქაღალდის მოგზაურობა ფურცლები მცირე რაოდენობის ტაქსის მძღოლებს მეტი მოკლე დროში (მაგალითად, Camerer et al. (1997) ).
Farber სასწავლო ახლოს იყო საუკეთესო შემთხვევაში სასწავლო გამოყენებით დიდი მონაცემები. პირველი, მონაცემები არ არასამთავრობო წარმომადგენელი რადგან ქალაქის საჭირო მძღოლები გამოყენება ციფრული მეტრი. და, მონაცემები არ არასრული, რადგან მონაცემები, რომელიც შეგროვებული ქალაქი იყო საკმაოდ ახლოს მონაცემები, რომ Farber არ შეგროვდა, თუ მას ჰქონდა არჩევანი (ერთი განსხვავება ის არის, რომ Farber სურდა მონაცემები სულ ხელფასები-fares პლუს tips- მაგრამ ქალაქის მონაცემები მხოლოდ შედის რჩევები გადახდილი საკრედიტო ბარათით). გასაღები Farber ის კვლევის აერთიანებს კარგი კითხვა კარგი მონაცემები. მონაცემები მარტო არ არის საკმარისი.