2.4.1.1 Drosje i New York by

En forsker brukt store data fra taksameter å studere beslutningsprosesser av drosjesjåfører i New York. Disse dataene ble godt egnet for denne forskningen.

Et eksempel på den enkle kraften i å telle den riktige tingen kommer fra Henry Farber s (2015) studie av atferd av New Yorks taxisjåfører. Selv om denne gruppen ikke kan høres iboende interessant er det et strategisk forsknings-område for å teste to konkurrerende teorier i arbeidsmarkedsøkonomi. Ved anvendelsen av Farber forskning, er det to viktige funksjoner om arbeidsmiljøet for drosjesjåfører: 1) sin timelønn varierer fra dag til dag, delvis basert på faktorer som vær og 2) det antall timer de arbeider kan svinge hver dag basert på førerens beslutninger. Disse funksjonene føre til et interessant spørsmål om forholdet mellom timelønn og arbeidstid. Neoklassiske modeller i økonomi spår at drosjesjåfører ville fungere mer på dager hvor de har høyere timelønn. Alternativt modeller fra atferdsøkonomi forutsi nøyaktig det motsatte. Hvis driverne satt en bestemt inntekt target-si $ 100 per dag-og strikk til det målet er oppfylt, så sjåførene ville ende opp med å jobbe færre timer på dager som de tjener mer. For eksempel, hvis du var et mål earner, kan du ende opp med å jobbe 4 timer på en god dag ($ 25 per time) og 5 timer på en dårlig dag ($ 20 per time). Så, drivere arbeide flere timer på dager med høyere timelønn (som spådd av de neoklassiske modellene) eller flere timer på dager med lavere timelønn (som spådd av atferdsøkonomiske modeller)?

For å besvare dette spørsmålet Farber innhentet data på hver taxi tur tatt av New York City-drosjer fra 2009 - 2013, data som nå er offentlig tilgjengelig . Dette data som ble samlet av elektroniske målere som byen krever drosjer å bruke-inneholder flere biter av informasjon for hver tur: starttid, start sted, sluttid, sluttsted, fare, og tips (hvis spissen ble betalt med en kredittkort). Totalt Farber data inneholdt informasjon om lag 900 millioner reiser foretatt i løpet av cirka 40 millioner skift (et skifte er omtrent en dags arbeid for en driver). Faktisk var det så mye data, som Farber bare brukt et tilfeldig utvalg av den for hans analyse. Ved hjelp av denne taxi meter data, Farber funnet at de fleste sjåførene jobbe mer på dager når lønningene er høyere, i samsvar med neoklassisk teori. I tillegg til dette viktigste funnet, Farber var i stand til å utnytte størrelsen av data for en bedre forståelse av heterogenitet og dynamikk. Farber fant at over tid nyere drivere gradvis lære å arbeide flere timer på høye lønns dager (f.eks, de lærer å oppføre seg som de neoklassiske modellene forutsier). Og nye drivere som oppfører seg mer som mål inntekter er mer sannsynlig å slutte å være en drosjesjåfør. Begge disse mer sparsomme funn, som bidrar til å forklare den observerte oppførselen til dagens drivere, var bare mulig på grunn av størrelsen på datasettet. De ville ha vært umulig å oppdage i tidligere studier som brukte papir tur ark fra et lite antall drosjesjåfører over en kort periode (f.eks Camerer et al. (1997) ).

Farber studie var nær en best-case for en studie med store data. Først dataene var ikke ikke-representativt fordi byen pålagt sjåfører å bruke digitale meter. Og dataene ikke var ufullstendige fordi dataene som ble samlet inn av byen var ganske nær til data som Farber ville ha samlet inn om han hadde valget (ene forskjellen er at Farber ville ha ønsket data om totale lønns-priser pluss tips- men byen data inkludert tips betalt med kredittkort). Nøkkelen til Farber forskning var å kombinere et godt spørsmål med gode data. Dataene alene er ikke nok.