2.4.1.1 سيارات الأجرة في مدينة نيويورك

استخدم الباحث بيانات كبيرة من عدادات سيارات الأجرة لدراسة اتخاذ القرارات من سائقي سيارات الأجرة في نيويورك. هذه البيانات ومناسبة تماما لهذا البحث.

وأحد الأمثلة على قوة بسيطة من عد الشيء الصحيح يأتي من هنري فاربر (2015) دراسة سلوك سائقي سيارات الأجرة في مدينة نيويورك. على الرغم من أن هذه المجموعة قد لا تبدو مثيرة للاهتمام في حد ذاتها وهو موقع البحوث الاستراتيجية لاختبار نظريتين في اقتصاديات العمل. لأغراض البحوث فاربر، وهناك نوعان من الميزات الهامة حول بيئة العمل من سائقي سيارات الأجرة: 1) يتقلب أجرهم بالساعة من يوم إلى يوم، ومقرها في جزء منها على عوامل مثل الطقس و2) عدد الساعات التي عمل يمكن أن تتقلب كل يوم على أساس قرارات السائق. هذه الميزات تؤدي إلى مسألة مثيرة للاهتمام حول العلاقة بين الأجور بالساعة وساعات العمل. النماذج الكلاسيكية الجديدة في الاقتصاد يتوقع أن سائقي سيارات الأجرة ستعمل أكثر في أيام حيث لديهم ارتفاع الأجور بالساعة. بدلا من ذلك، ونماذج من الاقتصاد السلوكي تتنبأ عكس ذلك تماما. إذا وضعت السائقين دخل معين المستهدفة نقول 100 $ في اليوم الواحد، والعمل حتى يتحقق هذا الهدف، ثم السائقين سوف ينتهي العمل ساعات أقل في الأيام أنهم يحصلون على أكثر. على سبيل المثال، إذا كنت أحد الروافد الهدف، قد ينتهي بك المطاف إلى العمل 4 ساعات في يوم جيد (25 $ للساعة الواحدة) و 5 ساعات في يوم سيء (20 $ للساعة الواحدة). لذلك، لا السائقين العمل ساعات أكثر في الأيام مع ارتفاع الأجور بالساعة (كما تنبأ النماذج الكلاسيكية الجديدة) ساعات أو أكثر في أيام مع انخفاض الأجور بالساعة (كما تنبأ به النماذج الاقتصادية السلوكية)؟

للإجابة على هذا السؤال فاربر الحصول على بيانات في كل رحلة سيارة أجرة من سيارات الأجرة في مدينة نيويورك مأخوذة من 2009 - 2013، والبيانات التي هي الآن متاحة للجمهور . ، ويشمل استخدام تم جمعها من قبل متر الإلكترونية أن المدينة تحتاج سيارات الأجرة إلى هذا الذي بيانات عدة قطع من المعلومات عن كل رحلة: وقت البدء، بدء الموقع، نهاية الوقت، نهاية المكان، أجرة، وطرف (إذا تم دفع طرف مع بطاقة ائتمان). في المجموع، وتضمنت البيانات فاربر المعلومات على ما يقرب من 900 مليون الرحلات التي تتم خلال ما يقرب من 40 مليون التحولات (أ التحول نحو العمل ليوم واحد للسائق واحد). في الواقع، كان هناك الكثير من البيانات، التي فاربر تستخدم فقط عينة عشوائية منها لتحليله. باستخدام هذه البيانات متر سيارات الأجرة، وجدت فاربر أن معظم السائقين تعمل أكثر في الأيام التي ترتفع معدلات الأجور، بما يتفق مع النظرية الكلاسيكية الجديدة. وبالإضافة إلى هذا الاستنتاج الرئيسي، وكان قادرا على الاستفادة من حجم البيانات لفهم أفضل من عدم التجانس وديناميات فاربر. وجدت فاربر أنه بمرور الوقت برامج تشغيل أحدث يتعلم تدريجيا إلى العمل ساعات أكثر في الأيام أجور عالية (على سبيل المثال، فإنها تتعلم كيف تتصرف كما تتوقع النماذج الكلاسيكية الجديدة). والسائقين الجدد الذين يتصرفون أشبه أصحاب المستهدفة هي أكثر عرضة لإنهاء كونه سائق سيارة أجرة. كل من هذه النتائج أكثر دقة، والتي تساعد في تفسير سلوك لاحظ من برامج التشغيل الحالية، من الممكن فقط بسبب حجم البيانات. أنها كان من المستحيل للكشف في دراسات سابقة أن تستخدم ورقة رحلة ورقة من عدد صغير من سائقي سيارات الأجرة خلال فترة قصيرة من الزمن (على سبيل المثال، Camerer et al. (1997) ).

وكانت دراسة فاربر على مقربة من أفضل الحالات للدراسة باستخدام بيانات كبيرة. أولا، كانت البيانات لا غير ممثلة لأن المدينة المطلوبة السائقين على استخدام عدادات رقمية. وكانت البيانات غير مكتملة لأن البيانات التي تم جمعها من قبل مدينة كان قريبا جدا إلى البيانات التي فاربر قد جمعت إذا كان لديه خيار (فارق واحد هو أن فاربر أن لديها بيانات المطلوبين على مجموع الأجور من نوعها بالإضافة إلى tips- ولكن البيانات المدينة شملت فقط نصائح دفع بواسطة بطاقة الائتمان). المفتاح لبحث فاربر كان الجمع سؤال جيد مع بيانات جيدة. البيانات وحدها ليست كافية.