A kutató használt big adatok taxi méter tanulni döntéshozatal taxisok New Yorkban. Ezek az adatok jól alkalmas erre a kutatás.
Egy példa az egyszerű erejét számítva a helyes származik Henry Farber a (2015) viselkedésének tanulmányozása a New York-i taxisok. Bár ez a csoport nem hangzik eleve érdekes ez egy stratégiai kutatási helyszínen tesztelésére két versengő elméletek Labor Economics. Céljára a Farber kutatási, van két fontos jellemzői a munkakörnyezet taxisok: 1) az órabér ingadozik napról-napra, amely részben az olyan tényezők, mint az időjárás, és 2) az órák számát dolgoznak ingadozhat nap alapján a vezető döntéseit. Ezek a jellemzők vezetnek egy érdekes kérdés a kapcsolatát órabérek és a munkaórák. A neoklasszikus modell közgazdasági azt jósolják, hogy a taxisok is többet dolgozni nap, ahol magasabb órabér. Alternatív modellek viselkedési közgazdaságtan megjósolni pontosan az ellenkezője. Amennyiben a járművezetők meg egy bizonyos jövedelem cél mondjuk 100 $ naponta, és a munka, amíg ez a cél teljesül, akkor a járművezetők végén dolgozik kevesebb órát napokon azok keresnek többet. Például, ha volt a cél kereső, akkor lehet, hogy a végén működik 4 óra egy jó nap ($ 25 óránként), és 5 órán át egy rossz nap ($ 20 óránként). Szóval, a járművezetők több órát dolgozni a nap magasabb órabér (ahogy megjósolta a neoklasszikus modell), vagy több óra időtartam alacsonyabb órabért (ahogy megjósolta viselkedési gazdasági modellek)?
Ahhoz, hogy erre a kérdésre válaszolni Farber kapott adatokat minden taxi út által hozott New York-i taxik a következőtől: 2009 - 2013, adatok, amelyek most nyilvánosan hozzáférhető . Ez az adat-, amit összegyűjtöttünk elektronikus méter, hogy a város igényli taxi felhasználhatóság tartalmaz több információt minden út: a kezdési időpontot, start helyét, befejezésének időpontját, vége helyen, viteldíj, és csúcsa (ha a hegyét fizettek egy hitelkártya). Összesen Farber azon szereplő adatok információ megközelítőleg 900 millió utazások során mintegy 40 millió műszakban (a léptetés nagyjából egy napi munka egy driver). Tény, hogy nem volt annyi adatot, hogy Farber csak használt mintából azt az elemzést. Ezzel a taxióra adatok, Farber úgy találta, hogy a legtöbb vezető munka több olyan napokon, amikor a bérek magasabbak, összhangban a neoklasszikus elmélet. Amellett, hogy ez a fő megállapítása, Farber képes volt mozgósítani a mérete az adatok jobb megértését heterogenitás és a dinamika. Farber megállapította, hogy idővel újabb vezetők fokozatosan megtanulják, hogy több órát dolgozni a magas bérek napon (pl megtanulnak viselkedni, mint a neoklasszikus modell azt jósolja). És az új vezetők, akik úgy viselkednek, mint a több célt keresők nagyobb valószínűséggel leszokni, hogy egy taxisofőr. Mindkét finomabb megállapításokat, amelyek segítenek megmagyarázni a megfigyelt viselkedést a jelenlegi vezetők, csak azért lehetséges, mert az az adatállomány nagysága. Úgy lett volna lehetetlen felismerni a korábbi vizsgálatokban használt papír utazás lapok a kisszámú taxisok egy rövid ideig (pl Camerer et al. (1997) ).
Farber tanulmánya közel volt a legjobb esetben egy vizsgálatban nagy adatokkal. Először is, az adatok nem voltak, nem reprezentatív, mert a város a szükséges illesztőprogramok használható digitális méter. És az adatok nem voltak hiányosak, mivel az adatok által összegyűjtött, a város volt elég közel az adatokat, Farber volna gyűjteni, ha ő volt a választás (egyetlen különbség az, hogy Farber akarta volna adatokat teljes bér-viteldíjak plusz Tippek- de a város csak adatokat tartalmaz tippeket fizetett bankkártyával). A legfontosabb, hogy Farber kutatási volt ötvözi egy jó kérdés, jó adatokat. Az adatok önmagukban nem elegendőek.