2.4.1.1 Таксі в Нью - Йорку

Дослідник використовували великі дані від лічильників таксі , щоб вивчити процес прийняття рішень водіїв таксі в Нью - Йорку. Ці дані добре підходять для цього дослідження.

Одним з прикладів простого підрахунку сили правильно виходить від Генрі Фарбера (2015) дослідження поведінки водіїв Нью - Йорка таксі. Хоча ця група не може звучати по своїй суті цікаво це стратегічний дослідницький сайт для тестування двох конкуруючих теорій в економіці праці. Для цілей дослідження Фарбера, є дві важливі особливості робочого середовища водіїв таксі: 1) їх погодинної заробітної плати коливається від день у день, частково на основі таких факторів, як погода і 2) кількість годин, в яких вони працюють може коливатися щодня на підставі рішень водія. Ці особливості призводять до цікавих питання про відносини між погодинної заробітної плати і відпрацьованих годин. Неокласичні моделі в економіці прогнозують, що водії таксі будуть працювати більше на ті дні, коли вони мають більш високу погодинну заробітну плату. В якості альтернативи, моделі від поведінкової економіки передбачити з точністю до навпаки. Якщо водії встановити конкретний дохід цілі, скажімо, $ 100 в день, і працювати, поки ця мета не буде досягнута, то водії будуть в кінцевому підсумку працювати менше годин на ті дні, що вони заробляють більше. Наприклад, якщо ви були мішенню добувачем, ви можете в кінцевому підсумку працює 4 години на хороший день (25 $ за годину) і 5 годин на поганий день ($ 20 в годину). Так що, водії працюють більше годин в дні з більш високою погодинної заробітної плати (за прогнозом неокласичних моделей) або більше годин на дні з низьким погодинної заробітної плати (як і передбачали поведінкових економічних моделей)?

Щоб відповісти на це питання Фарбер отримані дані про кожну поїздку на таксі , прийнятих Нью - Йорка кабінами з 2009 - 2013 року , дані, які в даний час в відкритому доступі . Ці дані, яка була зібрана за допомогою електронних лічильників, що місто вимагає таксі, щоб використовувати, включає в себе кілька елементів інформації для кожної поїздки: час початку, почати розташування, час закінчення, кінцеве місце розташування, транспортні витрати і чайові (якщо кінчик була виплачена з кредитна карта). В цілому дані Фарбер містила інформацію про приблизно 900 мільйонів поїздок, прийнятих протягом приблизно 40 мільйонів змін (зрушення приблизно одного дня роботи для одного водія). Насправді, там було так багато даних, що Фарбер тільки використовували випадкову вибірку з нього для його аналізу. Використовуючи ці дані таксі метр, Фарбер виявили, що більшість водіїв працюють більше на ті дні, коли заробітна плата вище, відповідно до неокласичної теорією. На додаток до цього основний висновок, Фарбер був в змозі використати розмір даних для кращого розуміння неоднорідності і динаміки. Фарбер виявили, що протягом довгого часу нові драйвери поступово навчитися працювати більше годин на високих днів заробітної плати (наприклад, вони вчаться поводитися як неокласичні моделі пророкує). І, нові драйвери, які ведуть себе більше як цільових видобувачів, ймовірніше, перестати бути водієм таксі. Обидва цих більш тонких висновків, які допомагають пояснити бачимо поведінка нинішніх водіїв, було можливо тільки через розмір набору даних. Вони б неможливо виявити в більш ранніх дослідженнях , які використовували папір поїздки листів з невеликої кількості водіїв таксі в протягом короткого періоду часу (наприклад, Camerer et al. (1997) і Camerer et al. (1997) ).

Дослідження Фарбера був близький до кращому випадку для дослідження з використанням великих даних. По-перше, дані не були нерепрезентативна, тому що місто потрібно водіям використовувати цифрові вимірювальні прилади. І ці дані не були неповними, так як дані, які були зібрані міста було досить близько до даних, які Фарбер б зібрали, якщо у нього був вибір (одна різниця в тому, що Фарбер б хотіли дані по загальній суми заробітної плати-тарифами плюс tips- але дані міста включені тільки поради, оплачені за допомогою кредитної картки). Ключ до досліджень Фарбера поєднував хороший питання з хорошими даними. Одних даних недостатньо.