2.4.1.1 تاکسی در شهر نیویورک

محقق داده های بزرگ از تاکسی متر استفاده برای مطالعه تصمیم گیری از رانندگان تاکسی در نیویورک. این داده ها به خوبی برای این تحقیق مناسب بود.

یک نمونه از قدرت ساده از شمارش درست از هنری فاربر می آید (2015) مطالعه رفتار از رانندگان تاکسی شهر نیویورک است. اگر چه این گروه صدا ممکن است ذاتا جالب آن را یک سایت تحقیقات استراتژیک برای تست دو تئوری رقیب در اقتصاد کار است. برای اهداف تحقیقاتی فاربر، دو ویژگی مهم در مورد محیط کار از رانندگان تاکسی وجود دارد: 1) دستمزد ساعتی نوسان از روز به روز، به عواملی مانند آب و هوا در بخش و 2) تعداد ساعت کار می کنند می توانید هر روز در نوسان است بر اساس تصمیمات راننده است. این ویژگی به یک سوال جالب در مورد رابطه بین دستمزد ساعتی و ساعات کار منجر شود. مدل های نئوکلاسیک در اقتصاد پیش بینی است که رانندگان تاکسی را در روز کار که در آن آنها دستمزدهای ساعتی بالاتر است. روش دیگر، مدل های از اقتصاد رفتاری پیش بینی دقیقا برعکس است. اگر رانندگان تنظیم یک درآمد خاص هدف می گویند 100 $ در هر روز، و کار تا زمانی که هدف ملاقات کرده است، پس از آن رانندگان تا پایان ساعات کار کمتر در روز است که آنها درآمد بیشتر است. به عنوان مثال، اگر شما یک نان آور هدف بودند، شما ممکن است تا پایان کار 4 ساعت در یک روز خوب (25 $ در هر ساعت) و 5 ساعت در یک روز بد (20 $ در ساعت). بنابراین، آیا رانندگان کار اضافی در روز با دستمزد بالاتر ساعتی (که توسط مدل های نئوکلاسیک پیش بینی) و یا ساعات بیشتری در روز با دستمزد ساعتی پایین تر (به عنوان مدل های اقتصادی رفتاری پیش بینی)؟

2013، داده که در حال حاضر - پاسخ به این سوال فاربر داده در هر سفر تاکسی با تاکسی های شهر نیویورک گرفته شده از 2009 به دست آمده در دسترس عموم . این داده ها که توسط متر الکترونیکی است که در شهرستان نیاز به تاکسی به جمع آوری شد استفاده-شامل چند قطعه از اطلاعات برای هر سفر: زمان شروع، شروع محل، زمان پایان، محل پایان، کرایه، و نوک (اگر نوک با یک پرداخت شد کارت اعتباری). در مجموع، داده فاربر اطلاعات در حدود 900 میلیون سفر گرفته شده در طول حدود 40 میلیون شیفت شامل (یک تغییر است که تقریبا کار یک روز برای یک راننده). در واقع، داده های بسیار وجود دارد، که فاربر تنها یک نمونه تصادفی از آن را برای تجزیه و تحلیل خود استفاده می شود. با استفاده از این داده تاکسی متر، فاربر نشان داد که اکثر رانندگان کار بیشتر در روزهایی که دستمزد بالاتر، مطابق با نظریه نئوکلاسیک هستند. علاوه بر این یافته اصلی، فاربر قادر به اهرم اندازه داده ها را برای درک بهتر از عدم تجانس و پویایی بود. فاربر پیدا شده است که در طول زمان رانندگان جدیدتر به تدریج یاد بگیرند به ساعات کار بیشتر در روز دستمزد بالا (به عنوان مثال، آنها یاد بگیرند به رفتار به عنوان مدل های نئوکلاسیک پیش بینی). و، درایور جدید که بیشتر شبیه افراد هدف رفتار هستند بیشتر احتمال دارد به ترک یک راننده تاکسی. هر دو از این یافته ها ظریف تر، که کمک به توضیح رفتار مشاهده شده از رانندگان فعلی، به دلیل اندازه از مجموعه داده تنها ممکن بود. آنها غیر ممکن بود برای شناسایی در مطالعات قبلی که ورق های سفر کاغذ از تعداد کمی از رانندگان تاکسی در طی یک دوره کوتاه از زمان (به عنوان مثال، استفاده Camerer et al. (1997) ).

مطالعه فاربر نزدیک به یک بهترین حالت برای مطالعه با استفاده از داده های بزرگ بود. اول، داده بودند غیر نماینده نیست چرا که شهرستان مورد نیاز رانندگان به استفاده از متر های دیجیتال است. و، داده بودند ناقص نمی کند چرا که داده هایی را که توسط این شهرستان جمع آوری شد بسیار نزدیک به داده هایی را که فاربر می جمع آوری کرده اند اگر او تا به حال انتخاب شد (یکی تفاوت این است که فاربر می داده خواستم در کل دستمزد-کرایه علاوه tips- دارند اما داده های شهرستان تنها شامل راهنمایی پرداخت از طریق کارت اعتباری). کلید به تحقیقات فاربر یک سوال خوب با داده های خوب ترکیب شده است. داده به تنهایی کافی نیست.