Raziskovalec uporablja veliko podatkov iz taksi metrov, naj preuči odločanje o taksisti v New Yorku. Ti podatki so bili primerni za to raziskavo.
En primer preprostega moči štetje pravo stvar prihaja iz Henry Farber je (2015) študijo obnašanja New York City taksisti. Čeprav ta skupina ne zveni po sebi zanimivo, da je strateški raziskovalni mesto za testiranje dveh konkurenčnih teorij v delovnih ekonomije. Za namene raziskav Farber je, obstajata dve pomembni lastnosti o delovnem okolju taksisti: 1) je njihova urna postavka giblje od dneva v dan, ki delno temelji na dejavnikih, kot so vreme in 2), število ur, ki jih delajo lahko niha vsak dan glede na voznikove odločitve. Te lastnosti vodijo na zanimivo vprašanje o odnosu med urnimi plač in delovnih ur. Neoklasične modele na področju ekonomije napovedujejo, da bi taksisti več delati na dan, ko so višje urne plače. Druga možnost je, modeli iz vedenjske ekonomije napovedati, ravno nasprotno. Če vozniki določi zlasti dohodek cilj, pravijo 100 $ na dan, in dela, dokler je izpolnjen ta cilj, potem bi vozniki na koncu delajo manj ur na dneve, ki so jih zaslužijo več. Na primer, če ste bili tarča hranilca, boste morda na koncu dela 4 ure na dober dan (25 $ na uro) in 5 ur na slab dan (20 $ na uro). Torej, ne vozniki delajo več ur v dneh višje urne plače (kot je v neoklasični model napovedanih) ali več ur na dnevih z nižjimi urnih plačil (kot napovedujejo vedenjskih ekonomskih modelov)?
Za odgovor na to vprašanje Farber dobimo podatke o vseh taksi potovanja, ki so jo New York City kabine od 2009 - 2013, podatki, ki so zdaj na voljo javnosti . To, podatki, ki so bili zbrani s elektronskih števcev, da je mesto zahteva taksi za uporabo, vključuje več informacijami za vsako potovanje: začeti pravočasno, se lokacijo, končni čas, končni položaj, fare, in konico (če je tip plačal z kreditna kartica). V celoti, podatki Farber je vsebovala informacije o približno 900 milijonov potovanj, odvzetih med približno 40 milijonov izmen (premik je približno za en dan dela za enega voznika). Dejstvo je, da je toliko podatkov, da Farber uporablja le naključni vzorec njega za njegovo analizo. Z uporabo te taksi podatke metrov, Farber je pokazala, da večina voznikov delati več na dneve, ko so plače višje, v skladu z neoklasično teorijo. Poleg te glavne ugotovitve, je Farber lahko vzvod velikost podatkov za boljše razumevanje raznolikosti in dinamike. Farber je ugotovila, da se sčasoma novejši vozniki postopoma naučiti delati več ur na visokih dni plače (na primer, se naučijo, da se obnašajo kot neoklasični modeli napoveduje). In nove voznike, ki se obnašajo bolj kot ciljne dohodki so bolj verjetno, da nehal biti taksist. Oba bolj subtilnih spoznanj, ki pomagajo pojasniti opaženo obnašanje trenutnih voznikov, je bilo mogoče samo zaradi velikosti nabora podatkov. Prav bi bilo mogoče odkriti v prejšnjih študijah, ki uporabljajo potovanja papir listov iz majhnega števila taksisti v kratkem časovnem obdobju (npr Camerer et al. (1997) ).
Študija Farber je bil blizu najboljšim-gre za študijo z uporabo velikih podatkov. Prvič, podatki niso bili niso reprezentativni, saj je mesto zahteva gonilnike za uporabo digitalnih metrov. In, da podatki niso bili nepopolni, ker so podatki, ki so zbrani v mestu zelo blizu podatkov, ki bi Farber zbranih če bi imel na izbiro (ena razlika je, da bi imeli Farber želel podatke o celotnih plač-vozovnic plus Nasveti, vendar mestne podatki vključeni le nasvete s kreditno kartico plačane). Ključnega pomena za raziskave Farber je bil združuje dobro vprašanje z dobrimi podatki. Sami podatki niso dovolj.