2.4.1.1 Taksówki w Nowym Jorku

Badacz używane duże ilości danych z liczników taksówek uczyć podejmowania decyzji przez taksówkarzy w Nowym Jorku. Dane te dobrze nadają się do tego badania.

Przykładem prostego mocy licząc słusznie pochodzi od Henry'ego za Farber (2015) badaniu zachowania kierowców nowojorskich taksówek. Choć grupa ta może nie brzmi naturalnie interesujące jest strategicznym miejscu badania do testowania dwa konkurujące teorie ekonomii pracy. Do celów badań Farber, istnieją dwie ważne funkcje dotyczące środowiska pracy taksówkarzy: 1) ich stawka godzinowa zmienia się z dnia na dzień, częściowo na podstawie takich czynników jak pogoda i 2) liczba godzin w których pracują może wahać się każdego dnia na podstawie decyzji kierowcy. Te cechy prowadzą do ciekawego pytania o relacje między płac godzinowych i liczby przepracowanych godzin. Neoklasyczne modele w ekonomii przewidują, że taksówkarze będzie działać tylko na dni, gdy mają wyższe stawki godzinowe. Alternatywnie, modele od ekonomii behawioralnej przewidzieć dokładnie odwrotnie. Jeżeli kierowcy ustawić szczególności dochodów cel powiedzmy 100 $ dziennie, i pracować dopóki ten cel zostanie osiągnięty, to kierowcy nie skończy się pracuje mniej godzin w dni, które są zarabiających. Na przykład, jeśli były zarabia docelowej, może skończyć się pracuje 4 godziny na dzień dobry (25 dolarów za godzinę) i 5 godzin na zły dzień (20 dolarów za godzinę). Więc, czy kierowcy pracować więcej godzin w dni o wyższych płac godzinowych (zgodnie z przewidywaniami neoklasycznych modelach) lub więcej godzin w dni o niższych płacach godzinowych (zgodnie z przewidywaniami behawioralnych modeli ekonomicznych)?

Aby odpowiedzieć na to pytanie Farber uzyskano dane na temat każdej podróży podjętej przez taksówki taksówki w Nowym Jorku od 2009 - 2013, dane, które są obecnie dostępne publicznie . Te dane, które zostały zebrane przez liczników elektronicznych, że miasto wymaga taksówki do wykorzystania, obejmuje kilka informacji dla każdego rejsu: start czasie rozpocząć lokalizację, czas zakończenia, lokalizację końcową, Posiłek i końcówkę (jeżeli końcówka została wypłacona z karta kredytowa). W sumie, dane Farber zawierały informacje o około 900 milionów podróży podejmowanych przez około 40 milionów zmian (zmiana jest mniej więcej jeden dzień pracy dla jednego kierowcy). W rzeczywistości nie było tak dużo danych, które Farber używane tylko losową próbkę nim dla jego analizy. Korzystając z tej taksówki danych pomiarowych, Farber okazało się, że większość kierowców pracować w dniach, kiedy płace są wyższe, zgodne z teorii neoklasycznej. Oprócz tej głównej ustalenia, Farber mógł wykorzystać wielkość danych dla lepszego zrozumienia niejednorodności i dynamiki. Farber okazało się, że z biegiem czasu nowsze sterowniki stopniowo uczą się pracować więcej godzin na wysokich płac dni (np uczą się zachowywać jak neoklasyczne modele przewiduje). A nowi kierowcy, którzy zachowują się bardziej jak zarabiających docelowymi są bardziej prawdopodobne, aby rzucić bycia taksówkarzem. Oba te bardziej subtelnych danymi, które pomagają wyjaśnić obserwowane zachowanie obecnych kierowców było możliwe tylko z powodu rozmiaru zestawu danych. Będą niemożliwe do wykrycia we wcześniejszych badaniach, stosowane arkusze papieru wyzwalania z niewielkiej liczby taksówkarzy w krótkim okresie czasu (np Camerer et al. (1997) ).

Badanie Farber był blisko najlepszym przypadku do badania z użyciem dużych danych. Po pierwsze, dane te nie były reprezentatywne, ponieważ nie wymaga miasto kierowców do korzystania metrów cyfrowych. A dane nie były niekompletne, ponieważ dane, które zostały zebrane przez miasto było całkiem blisko danych Farber byłyby gromadzone, gdyby miał do wyboru (jedna różnica polega na tym, że Farber chciałby dane dotyczące łącznej wartości wynagrodzeń-taryf powiększonej TIPS lecz tylko dane zawarte wskazówki miejskie płatnych kartą kredytową). Kluczem do badań Farber została łącząc dobre pytanie z dobrymi danymi. Same dane nie są wystarczające.