En forsker brugte store data fra taxametre til at studere beslutningstagning taxachauffører i New York. Disse data var velegnet til denne forskning.
Et eksempel på den simple magt tælle det rigtige kommer fra Henry Farber (2015) studie af adfærd New York taxachauffører. Selv om denne gruppe ikke lyder måske sagens natur interessant det er et strategisk forskning site for at teste to konkurrerende teorier i arbejdskraft økonomi. Med henblik på Farber forskning, er der to vigtige funktioner om arbejdsmiljøet for taxachauffører: 1) deres timeløn svinger fra dag til dag, delvist baseret på faktorer som vejret og 2) det antal timer, de arbejder kan svinge hver dag baseret på førerens beslutninger. Disse funktioner fører til et interessant spørgsmål om forholdet mellem timeløn og arbejdstimer. Neoklassiske modeller i økonomi forudsiger, at taxachauffører ville arbejde mere på dage, hvor de har højere timeløn. Alternativt modeller fra adfærdsøkonomi forudsige præcis det modsatte. Hvis bilister sat en bestemt indkomst target-sige $ 100 per dag og arbejde, indtil dette mål er opfyldt, så chauffører ville ender med at arbejde færre timer om dagen, at de tjener mere. For eksempel, hvis du var et mål lønmodtager, kan du ende med at arbejde 4 timer på en god dag ($ 25 per time) og 5 timer på en dårlig dag ($ 20 per time). Så behøver drivere arbejde flere timer om dagen med højere timeløn (som forudsagt af de neoklassiske modeller) eller flere timer på dagen med lavere timeløn (som forudsagt af adfærdsmæssige økonomiske modeller)?
For at besvare dette spørgsmål Farber opnåede data på hver taxi tur taget af New York førerhuse fra 2009 - 2013, data, der nu offentligt tilgængelige . Disse data-som blev indsamlet af elektroniske målere, at byen kræver taxier til at bruge-omfatter flere stykker information for hver tur: starttidspunkt, start placering, sluttidspunkt, ende placering, billetpris, og tip (hvis spidsen blev betalt med en kreditkort). I alt Farber data indeholdt oplysninger om ca. 900 millioner rejser løbende cirka 40 millioner skift (et skift er omtrent en dags arbejde for en driver). Faktisk var der så mange data, at Farber kun brugt en stikprøve af det for hans analyse. Ved hjælp af denne taxameter data, Farber fandt, at de fleste bilister arbejde mere på dage, hvor lønningerne er højere, i overensstemmelse med den neoklassiske teori. Ud over dette primære fund, Farber var i stand til at udnytte størrelsen af data for en bedre forståelse af heterogenitet og dynamik. Farber fandt, at tiden nyere drivere gradvist lære at arbejde flere timer på høje løn dag (f.eks, de lærer at opføre sig som de neoklassiske modeller forudsiger). Og, nye drivere, der opfører sig mere som mål lønmodtagere er mere tilbøjelige til at holde op at være en taxachauffør. Begge disse mere subtile resultater, som hjælper med at forklare den observerede adfærd aktuelle drivere, var kun mulig på grund af størrelsen af datasættet. De ville have været umuligt at opdage i tidligere undersøgelser, der bruges papir tur ark fra et lille antal taxachauffører over en kort periode (f.eks Camerer et al. (1997) ).
Farber undersøgelse var tæt på en best-case for et studie med store data. Først data var ikke ikke-repræsentative, fordi byen krævede drivere til at bruge digitale målere. Og oplysningerne ikke var ufuldstændige, fordi de data, der blev indsamlet af byen var temmelig tæt på de data, som Farber ville have indsamlet, hvis han havde valget (en forskel er, at Farber ville have ønsket oplysninger om de samlede lønninger-billetpriser plus Tips- men byen data, der indgår kun tips betalt med kreditkort). Nøglen til Farber forskning var at kombinere et godt spørgsmål med gode data. Dataene alene er ikke nok.