Mokslininkas naudojamas didelis duomenis iš taksometruose studijuoti sprendimų priėmimą taksi vairuotojų Niujorke. Šie duomenys buvo gerai tinka šio tyrimo.
Vienas iš pavyzdžių paprasto galios skaičiavimas teisingus dalykus ateina iš Henry Färber anketa (2015) tyrimo dėl Niujorko taksi vairuotojai elgesį. Nors ši grupė gali skambėti natūraliai įdomu tai strateginę mokslinių tyrimų svetainė išbandyti dviejų konkuruojančių teorijų darbo ekonomika. Taikant Färber mokslinių tyrimų tikslais, yra du svarbūs bruožai apie darbo aplinkoje taksi vairuotojai: 1) jų valandinis atlygis svyruoja nuo dienos į dieną, iš dalies pagrįsta veiksnių, tokių kaip oro ir 2) valandų jie dirba numeris gali svyruoti kiekvieną dieną, remiantis vairuotojo sprendimus. Šios savybės sukelti įdomų klausimą apie tarp valandinių atlyginimų ir dirbtas valandas santykius. Neoklasikinė modeliai ekonomika prognozuoja, kad taksi vairuotojai dirbtų daugiau dienų, jeigu jie turi didesnį valandinį darbo užmokestį. Arba modeliai elgesio ekonomikos prognozuoti visiškai priešingai. Jei vairuotojai nustatyti konkrečių pajamų tikslinių pasakyti už 100 $ dienos-ir dirbti, kol tas tikslas būtų pasiektas, tada vairuotojai galų gale dirba mažiau valandų dienomis, kad jie uždirba daugiau. Pavyzdžiui, jei buvo taikinys ir pajamas gaunantis asmuo, jums gali baigtis darbo 4 valandas geros dienos (25 $ per valandą) ir 5 valandų bloga diena (20 $ per valandą). Taigi, nereikia vairuotojai dirbti daugiau valandų, dienomis su didesnį valandinį darbo užmokestį (kaip ir buvo numatyta neoklasikinės modelių) ar daugiau valandų dienų mažesniais valandinio darbo užmokesčio (kaip pranašavo elgesio ekonominių modelių)?
Norint atsakyti į šį klausimą Farber gauti duomenis apie kiekvieną taksi kelionės priimtą Niujorko kabinas nuo 2009 - 2013, duomenis, kurie dabar viešai prieinama . Ši duomenų, kurie buvo surinkti elektroninių skaitiklių kad miestas reikalauja taksi naudoti-apima keletą gabaliukų informacijos Kiekviena kelionė: Starto laikas, pradėti vietą, pabaigos laiką, pabaigos vieta, bilieto kaina, ir patarimas (jei galiukas buvo skiriamas su Kreditinė kortelė). Iš viso Färber "duomenų pateikiama informacija apie maždaug 900 milijonų kelionių metu paimtų maždaug 40 mln pamainomis (perėjimas yra maždaug vienos dienos darbas vienas vairuotojas). Tiesą sakant, ten buvo tiek daug duomenų, kad Farber naudojamas tik atsitiktinę imtį jį už jo analizė. Naudojant šią taksi metrų duomenis, Farber nustatyta, kad dauguma vairuotojų dirbti tomis dienomis, kai darbo užmokestis yra didesnis, suderinamas su neoklasikine teorija. Be šios pagrindinės išvados, Farber galėjo panaudoti duomenų dydį geriau suprasti heterogeniškumo ir dinamika. Farber nustatė, kad laikui bėgant naujesnių vairuotojai palaipsniui išmokti dirbti daugiau valandų didžiausių atlyginimų dienų (pavyzdžiui, jie mokosi elgtis taip, kaip neoklasikinė modeliai prognozuoja). Ir, naujos vairuotojai, kurie elgiasi daugiau kaip tikslinės uždirbantiems yra labiau linkę mesti yra taksi vairuotojas. Abu šie subtilesnių duomenimis, kurie padeda paaiškinti stebimą elgesį dabartinių vairuotojų, buvo įmanoma tik dėl to, kad į rinkinį dydžio. Jie būtų buvę neįmanoma aptikti ankstesnių tyrimų, kad naudojamas popierius, kelionės lapus iš nedidelio skaičiaus taksi vairuotojai per trumpą laiką (pvz, Camerer et al. (1997) ).
Färber studijų buvo artimas geriausiu atveju už tyrimą, naudojant didelius duomenis. Pirma, duomenys nebuvo ne atstovas nes miestas reikalingas tvarkykles naudoti skaitmeninius metrų. Ir duomenys nebuvo neišsami, nes duomenų, kad buvo surinkta miesto buvo gana arti duomenimis, Farber būtų surinkta, jei jis turėjo pasirinkimą (vienas skirtumas yra tas, kad Farber būtų norėjusi duomenis apie visų su darbo užmokesčiu kainas plius tips- bet miestas duomenys įtraukti tik patarimų kreditine kortele mokama). Raktas į Färber mokslinių tyrimų buvo derinant gerą klausimą su gerais duomenimis. Vien duomenų nepakanka.