Výskumník používa veľkých objemov dát z taxi metrov k štúdiu rozhodovanie taxikári v New Yorku. Tieto údaje sa dobre hodí pre tento výskum.
Jeden príklad jednoduchého môcť počítať správnu vec pochádza z Henry Farber je (2015) štúdium správania vodičov New York City Taxi. Hoci táto skupina nemusí znieť zo svojej podstaty zaujímavé, to je strategickým výskumné pracovisko pre testovanie dve konkurenčné teórie v pracovných ekonómiu. Na účely Farber výskumu spoločnosti, sú tam dva dôležité črty o pracovnom prostredí taxikárov: 1) ich hodinová mzda kolíše zo dňa na deň, ktorá sa zakladá na faktoroch, ako je počasie, a 2) počet odpracovaných hodín sa môže meniť každý deň na základe rozhodnutia vodiča. Tieto vlastnosti vedú k zaujímavé otázky o vzťahu medzi hodinovej mzdy a odpracovaných hodín. Neoklasicistická modely v ekonómii predpovedajú, že taxikári by viac spolupracovať v dňoch, kedy majú vyššie hodinovej mzdy. Alternatívne modely z behaviorálnej ekonómie predpovedať presný opak. Ak vodiči nastaviť konkrétny cieľ príjmov, hovoria $ 100 za deň a pracovné kým nie je splnená, že cieľ, potom by vodiči skončiť pracovný menej hodín v dňoch, ktoré sú zarábať viac. Napríklad, ak ste boli terčom činná, môžete skončiť pracovať 4 hodiny na dobrý deň (25 $ za hodinu) a 5 hodín na zlý deň (20 $ za hodinu). Áno, vodiči pracujú viac hodín, v dňoch s vyššími hodinovej mzdy (ako predpovedal neoklasicistická modelov), alebo viac hodín v dňoch s nižšou hodinovej mzdy (ako predpovedal chovanie ekonomických modelov)?
Ak chcete odpovedať na túto otázku Farber získať údaje o každom taxi výlet urobená New York City kabín v rokoch 2009 - 2013, údaje, ktoré sú teraz verejne dostupné . Tieto dáta, ktorá bola zhromaždená elektronické elektromery, že mesto si vyžaduje taxi používať, zahŕňa niekoľko informácií pre každú cestu: Start Time jazyku umiestnenie, koncový čas, miesto koniec, cestovné, a špičku (ak je špička bola vyplatená s kreditná karta). Celkovo, Farber sú údaje obsiahnuté informácie o približne 900 miliónov ciest odobratých počas približne 40 miliónov smien (posun je zhruba jeden deň práce pre jedného vodiča). V skutočnosti, tam bolo toľko dát, že Farber používa iba náhodný vzorka ňom pre svojej analýze. Pri použití tohto meter údaje taxi, Farber zistil, že väčšina vodičov pracovať v dňoch, kedy sú mzdy vyššie, v súlade s neoklasickej teórie. Okrem tejto hlavnej zistenie, Farber bol schopný využiť veľkosť dát pre lepšie pochopenie heterogénnosti a dynamiky. Farber zistené, že v priebehu času novšie ovládače sa postupne učia pracovať viac hodín na vysokých mzdových dní (napr naučia sa správať ako neoklasicistická modely predpovedá). A noví vodiči, ktorí sa správajú skôr ako cieľovej príjmy majú väčšiu šancu prestať byť taxikár. Oba tieto jemnejších nálezov, ktoré pomáhajú vysvetliť pozorované správanie bežných vodičov, bolo možné len vďaka veľkosti dátovej sady. Že by nebolo možné detekovať v skorších štúdiách, ktoré používali papier výlet listy z malého počtu taxikárov počas krátkeho časového obdobia (napr Camerer et al. (1997) ).
Farber študijné bol blízko k najlepším-case pre štúdium s využitím veľkých objemov dát. Po prvé, údaje neboli nereprezentatívne, pretože mesto požaduje, aby vodič použil digitálny metrov. A tieto údaje neboli neúplné, pretože dáta, ktorá bola zhromaždená mesta bol dosť blízko, aby údaje, ktoré Farber by sa zhromažďujú keby mal na výber (jeden Rozdiel je v tom, že Farber by si prial údaje o celkových miezd-cestovné plus tips- ale dáta mestskej zahrnuté len tipy platené kreditnou kartou). Kľúčom k Farber výskum bol kombináciou je dobrá otázka s dobrými dátami. Samotné údaje sú nestačí.