एक संशोधक अभ्यास न्यू यॉर्क मध्ये टॅक्सी ड्राइवर निर्णय टॅक्सी मीटर मोठा डेटा वापरला नाही. या डेटा तसेच या संशोधन उपयुक्त होते.
योग्य गोष्ट मोजणी सोपे शक्ती एक उदाहरण पासून हेन्री Farber च्या येतो (2015) न्यू यॉर्क शहर टॅक्सी ड्रायव्हर्स वर्तन अभ्यास. या गटात अंतर्निहित मनोरंजक आवाज नाही तरी तो श्रमिक अर्थशास्त्र दोन स्पर्धा सिद्धांत चाचणी करण्यासाठी एक मोक्याचा संशोधन साइट आहे. Farber संशोधन हेतूने, टॅक्सी ड्रायव्हर्स काम पर्यावरण दोन महत्त्वाची वैशिष्ट्ये आहेत: 1) त्यांच्या कोणत्याही क्षणी वेतन आणि दिवस-दिवस, हवामान घटक जसे भागांवर आधारित पासून चढ-उतार होतात ते काम तास 2) संख्या चालकाचा निर्णय आधारावर प्रत्येक दिवस चढ उतार करू शकता. ही वैशिष्ट्ये काम कोणत्याही क्षणी वेतन आणि तास संबंध एक स्वारस्यपूर्ण प्रश्न होऊ. अर्थशास्त्र neoclassical मॉडेल उच्च कोणत्याही क्षणी वेतन जेथे टॅक्सी ड्रायव्हर्स दिवस अधिक काम असे अंदाज. वैकल्पिकरित्या, वर्तणुकीशी अर्थशास्त्र पासून मॉडेल अगदी उलट अंदाज. ड्राइवर विशिष्ट उत्पन्न सेट केल्यास लक्ष्य-म्हणू $ 100 प्रति दिवस आणि काम होईपर्यंत उद्दिष्ट पूर्ण आहे, नंतर ड्राइवर अधिक कमाई आहेत की दिवशी कमी तास काम अप समाप्त होईल. उदाहरणार्थ, आपण लक्ष्य जगणारा होते तर, आपण काम एक चांगला दिवस ($ 25 प्रति तास) आणि एक वाईट दिवस ($ 20 प्रति तास) 5 तास 4 तास समाप्त कदाचित. त्यामुळे, (वर्तणुकीशी आर्थिक मॉडेल द्वारे अंदाज) ड्राइव्हर्स् कमी कायमचा वेतन दिवस उच्च कोणत्याही क्षणी वेतन (neoclassical मॉडेल द्वारे अंदाज) किंवा अधिक तास दिवस अधिक तास काम आहे का?
2013, आता जे डेटा - या प्रश्नाचे उत्तर Farber 2009 पासून न्यू यॉर्क शहर कॅब करून घेतले प्रत्येक टॅक्सी ट्रिप वर माहिती प्राप्त सार्वजनिकरित्या उपलब्ध . हा डेटा-जे शहरात टॅक्सी आवश्यक इलेक्ट्रॉनिक मीटर गोळा झाले प्रत्येक भेटीसाठी माहिती अनेक तुकडे वापर-समाविष्टीत आहे: प्रारंभ वेळ, टीप मोबदला होते तर स्थान, शेवटी वेळ, शेवटी स्थान भाडे, आणि टीप (सुरू क्रेडीट कार्ड). एकूण मध्ये, Farber डेटा दरम्यान अंदाजे 40 दशलक्ष बदल घेतले अंदाजे 900 दशलक्ष ट्रिप वर माहिती (एक शिफ्ट अंदाजे एक ड्राइव्हर एक दिवस काम आहे). खरं तर, तेथे, त्यामुळे जास्त डेटा होते Farber फक्त त्याच्या विश्लेषण तो एक यादृच्छिक नमुना वापरलेला. या टॅक्सी मीटर डेटा वापरून, Farber वेतन neoclassical सिद्धांत उच्च, सुसंगत आहेत तेव्हा बहुतांश ड्राइव्हर्स् दिवशी अधिक काम असे आढळले. या मुख्य शोध व्यतिरिक्त, Farber धक्का बसला असून रहिवासातील आणि प्रेरक शक्ती चांगल्या प्रकारे समजून डेटा आकार फायदा सक्षम होते. Farber आढळले वेळ नवीन ड्राइव्हर्स् हळूहळू उच्च वेतन दिवस अधिक तास काम जाणून घ्या (उदा, ते neoclassical मॉडेल अंदाज वर्तन ते जाणून घ्या). आणि, अधिक लक्ष्य कमावती सारखे वागणे नवीन ड्राइव्हर्स् एक टॅक्सी ड्रायव्हर असल्याने राजीनामा होण्याची अधिक शक्यता असते. चालू ड्राइवर साजरा वर्तन हे स्पष्ट करण्यास मदत या अधिक सूक्ष्म निष्कर्ष, दोन्ही, कारण डेटाबेसच्या आकार केवळ शक्य होते. त्यांना वेळ अल्प कालावधीत (उदा, प्रती टॅक्सी ड्रायव्हर्स एक लहान संख्या वापरले की ते कागद ट्रिप पत्रके पूर्वी अभ्यास शोधण्यात अशक्य आहे Camerer et al. (1997) ).
Farber अभ्यास मोठे डेटा वापरून अभ्यास सर्वोत्तम-केस बंद होते. प्रथम, डेटा शहर डिजिटल मीटर वापर ड्राइवर आवश्यक कारण बिगर प्रतिनिधी नाही. आणि, डेटा शहर गोळा होते डेटा तो पर्याय होता तर Farber गोळा आहे की डेटा तेही बंद असल्यामुळे अपूर्ण होते (एक फरक Farber एकूण वेतनवाढ भाडे अधिक tips- वर होते डेटा असे आहे पण शहर डेटा केवळ क्रेडिट कार्ड दिले टिपा समाविष्ट). Farber संशोधन की चांगले डेटा एक चांगला प्रश्न यात होते. फक्त डेटा पुरेसे नाहीत.