2.4.1.1 Taxis u New Yorku

Istraživač koristiti velike podatke iz taksija metara na studij odlučivanje taksista u New Yorku. Ovi podaci su dobro pogodna za ovo istraživanje.

Jedan primjer jednostavnog moć računajući pravu stvar dolazi od Henryja Farber je (2015) proučavanje ponašanja New York City taksista. Iako je ova skupina možda ne zvuči po sebi zanimljivo je to strateški istraživanje lokacija za testiranje dva konkurentna teorija u ekonomiji rada. Za potrebe Farber istraživanjima, postoje dvije važne značajke o radnom okruženju taksista: 1) njihova satnica varira iz dana u dan, sa sjedištem u dijelu o čimbenicima kao što su vrijeme i 2), broj sati u kojima rade može se mijenjati svaki dan na temelju vozača odluka. Ove značajke dovesti do zanimljivog pitanja o odnosu između satnih plaća i radnih sati. Neoklasicistički modeli u ekonomiji predviđaju da taksisti bi više raditi na dane u kojima imaju veće plaća po satu. Alternativno, modeli iz bihevioralne ekonomije predviđaju upravo suprotno. Ako vozači postavili određeni dohodak cilj, recimo 100 $ po danu-i rade sve da se cilj je ispunjen, onda vozači će na kraju raditi manje sati na dan da su oni koji zarađuju više. Na primjer, ako ste bili meta radnik, možda ćete završiti radeći 4 sata na dobar dan ($ 25 po satu) i 5 sati na loš dan ($ 20 po satu). Dakle, da li vozači raditi više sati na dan s većim plaća po satu (kao što je predvidio neoklasične modele) ili više sati na dan s nižim plaća po satu (kao što je predviđeno u ponašanju ekonomskih modela)?

Za odgovor na to pitanje Farber dobiti podatke o svakom taksi putovanje donese New York City kabine od 2009. - 2013. godine, podaci koji su sada dostupni javnosti . Ovi podaci-koja je sakupljena elektroničkih brojila da grad zahtijeva taksi za korištenje-uključuje nekoliko komada informacije za svako putovanje: vrijeme početka, početak mjesto, vrijeme završetka, krajnji položaj, vozarinu i savjet (ako je tip bio plaćen s kreditna kartica). Ukupno, Farber Podaci sadržani podaci o oko 900 milijuna putovanja snimljene tijekom približno 40 milijuna smjene (pomak je otprilike jedan dan raditi za jednog vozača). U stvari, bilo je toliko mnogo podataka, koji Farber koristiti samo slučajni uzorak od toga za njegovu analizu. Koristeći ove podatke taxi metar, Farber pokazalo je da većina vozača više raditi na dane kada su plaće veće, u skladu s neoklasičnom teorije. Osim ovog glavnog nalaza, Farber je u stanju utjecati na veličinu podataka za bolje razumijevanje heterogenosti i dinamike. Farber otkrili da se s vremenom novije drivere postupno naučiti raditi više sati na visokim dana plaća (primjerice, oni uče da se ponašaju kao neoklasičnom modela predviđa). A, novi vozači koji se ponašaju više kao ciljne zarađuju više vjerojatno da će prestati biti taksista. Oba ova suptilnijim nalaza, koje pomažu objasniti promatrane ponašanje sadašnjih vozača, bilo moguće samo zbog veličine podataka. Oni bi bilo nemoguće otkriti u ranijim studijama koje koriste papir putovanje listova iz malog broja taksista u kratkom vremenskom razdoblju (npr Camerer et al. (1997) ).

Farber je studija bila blizu najboljem slučaju za proučavanje pomoću velikih podataka. Prvo, ti podaci nisu bili ne-reprezentativan jer je grad dužan vozača da koriste digitalne metara. A, ti podaci nisu bili nepotpuni jer su podaci koji su prikupljeni od strane grada bila je prilično blizu podataka koji bi Farber su prikupljeni i ako je mogao birati (jedna razlika je u tome što bi Farber želio podatke o ukupnim plaće-karata plus Savjeti- ali podaci grad uključen samo savjete plaćene kreditnom karticom). Ključ Farber istraživanju je kombinirajući dobro pitanje s dobrim podacima. sami Podaci nisu dovoljni.