Un investigador va utilitzar dades de grans dimensions dels taxímetres per estudiar la presa de decisions dels taxistes de Nova York. Aquestes dades s'adapten bé per a aquesta investigació.
Un exemple de la simple poder d'explicar el correcte prové d'Henry Farber (2015) estudi del comportament dels conductors de taxi de Nova York. Encara que aquest grup no pot sonar interessant és inherentment un lloc estratègic de recerca per provar dues teories que competeixen en l'economia del treball. A l'efecte de la investigació de Farber, hi ha dues característiques importants sobre l'ambient de treball dels conductors de taxi: 1) el seu salari per hora fluctua dia a dia, basat en part en factors com el clima i 2) el nombre d'hores que treballen pot fluctuar cada dia sobre la base de les decisions del conductor. Aquestes característiques condueixen a una qüestió interessant sobre la relació entre els salaris per hora i les hores treballades. models neoclàssics en economia prediuen que els taxistes treballarien més en els dies en què tenen majors salaris per hora. D'altra banda, els models de l'economia del comportament prediuen exactament el contrari. Si els conductors estableixen un ingrés especial al seu objectiu, diguem $ 100 per dia-i el treball fins que es compleixi aquest objectiu, a continuació, els conductors podrien acabar treballant menys hores en els dies que estan guanyant més. Per exemple, si vostè fos un perceptor de destinació, és possible que acabis treballant 4 hores en un dia bo ($ 25 per hora) i 5 hores en un mal dia ($ 20 per hora). Per tant, no conductors treballen més hores en els dies de major salari per hora (segons el predit pels models neoclàssics) o més hores en els dies amb salaris per hora inferiors (segons el predit pels models econòmics del comportament)?
Per respondre a aquesta pregunta Farber va obtenir dades en cada viatge en taxi presa per les cabines de la ciutat de Nova York des de 2009 - 2013, dades que ja estan a disposició del públic . Aquestes dades, que es va recollir per comptadors electrònics que la ciutat requereix taxis per utilitzar-inclou diverses peces d'informació per a cada viatge: hora d'inici, s'inicia la ubicació, hora de finalització, la ubicació final, tarifa, i la punta (si la punta es va pagar amb una targeta de crèdit). En total, les dades de Farber contenien informació sobre aproximadament 900 milions de viatges preses durant aproximadament 40 milions de desplaçaments (un canvi és aproximadament un dia de treball d'un conductor). De fet, no hi havia tantes dades, que Farber utilitzat una mostra aleatòria de la mateixa per a la seva anàlisi. Usant aquestes dades taxímetre, Farber va trobar que la majoria dels conductors treballen més en els dies en què els salaris són més alts, d'acord amb la teoria neoclàssica. A més d'aquesta troballa principal, Farber va ser capaç d'aprofitar la mida de les dades per a una millor comprensió de l'heterogeneïtat i la dinàmica. Farber va trobar que amb el temps els conductors nous aprenen gradualment a treballar més hores als dies de salaris (per exemple, aprenen a comportar-se com els models neoclàssics prediu). I, els nous conductors que es comporten més com a perceptors de destinació són més propensos a deixar de ser un conductor de taxi. Aquests dos resultats més subtils, que ajuden a explicar el comportament observat dels conductors actuals, eren només és possible causa de la grandària del conjunt de dades. Ells haurien estat impossibles de detectar en estudis anteriors que utilitzen fulls de viatge paper a partir d'un petit nombre de conductors de taxi en un curt període de temps (per exemple, Camerer et al. (1997) ).
L'estudi de Farber estava a prop d'un millor dels casos per a un estudi basat en dades grans. En primer lloc, les dades no eren no representativa perquè la ciutat requereix que els conductors utilitzin mesuradors digitals. I, les dades no estaven incompletes perquè les dades que es va recollir per la ciutat estava bastant a prop de les dades que Farber hagués percebut si hagués l'elecció (una diferència és que Farber tindria les dades buscats en el total dels salaris tarifes més consells- però les dades de la ciutat només s'inclouen consells pagats amb targeta de crèdit). La clau per a la investigació de Farber va ser combinar una bona pregunta amb bones dades. Les dades per si sols no són suficients.