A so ricerca usatu grande dati da tassì metri da studià a decisione di segne tassì in New York. Sti dati era sempri adattu per sta ricerca.
Un esempiu di i simplici putenza di a cuntari la cosa dirittu vene da l'Henry Farber (2015) studiu di u cumpurtamentu di segne tassì New York City. Puru stu gruppu pudia micca sonu inherently bellu, hè un locu strategicu di ricerca di alessandria dui tiurii munzeddu nta l 'econumìa di travagghiu. Di u prugettu di a ricerca d'Farber, ùn ci sò dui features, mpurtanti pi l 'ambienti travagliu di segne tassì: 1) a so cinquinu Conditions fluctuates da jornu-di-ghjornu, basatu in parte in u fattori cum'è u golf è 2) lu nummaru d' uri ca travagghiamu pudete fluctuate in ogni ghjornu si basa nantu à e decisioni di u cunduttore. Sti features, a purtari a na dumanna ntirissanti supra lu rapportu tra solda Conditions e uri travagliatu. mudeli pà Baroque nta l 'econumìa predict chì segne tassì chì travaglià di più nantu à ghjorni, unni si hannu solda Conditions supiriuri. O sinnò, pà priveda da l 'econumìa cultura predict esattamente u cuntrariu. S'è segne crià un particulari rèdditu testu-dì 100 $ € per ghjornu-e travagghiu finu a ddu testu si scontra, tandu segne fineva ghjunghja pocu uri supra ghjorni ch'elli sò pigghiari a più. Per esempiu, s'ellu ci era un RELIQUA testu, scuntrareti finiscinu cu la u travagliu di 4 ore nant'à una bona ghjurnata ($ 25 € per ora) è 5 ore nantu à un tintu ghjornu ($ 20 € per ora). Cusì, ùn segne travaglià di più ore à nantu à ghjorni, cu n'àutu solda Conditions (comu putìa prividiri da i mudelli ebbica) o di più ore à u ghjornu cù solda Précipitations: bascia (comu putìa prividiri da mudelli ecunomica cultura)?
Per risponde à sta quistione di Farber uttinni di dati nantu à ogni viaghju tassì pigliata da cabs New York City da 2009 - 2013, data, chì sò avà dispunibbili pubbricamenti . Stu dati-ca vinni di folklori metri ilittronica chì a cità hè ubligatoriu TAXI à aduprà-cumprenni diversi pezzi di nfurmazzioni p'ogni viaghju: principiatu tempu, location, tempu fini, stage fini, solo, e punta (principiatu siddu la punta fu pagò cù una carta di creditu). In totale, di dati di Farber cuntatu infurmazione nantu à pocu pressu à 900 millioni d 'affare pigliatu durante circa 40 miliuna di spicciava (a passata di eni chiddu ca un jornu l'opara di unu cunduttore). In fatti, ci era tantu data, chì Farber usatu sulu un campionu incerta di lu per a so analisi. Aduprendu stu dati metre tassì, Farber trovu chì a più segne travaglià di più nantu à ghjorni quandu piccati sunnu sempri cchiù, la fiducia cu la tiurìa di ebbica. 'N agghiunta a chistu nun truvannu lu menu, Farber, rinisciu a leverage a taglia di i dati di una megliu cunniscenza di a heterogeneity è dinamica. Farber trovu chì cù u tempu segne robba à pocu à pocu à amparà à travaglià di più ore à nantu à ghjorni altu ghjornu (per esempiu, si 'mpara a addivintari un picciottu comu lu mudeli pà priveda, ebbica). È, nova segne chì si cumportanu più cum'è earners testu sò più atta à sgagiatu da essa un cunduttore tassì. Tutti dui di sti scuperti di più suttili, ca m'aiuti a spiegari u cumpurtamentu osservatu di segne realità, era pussibbili sulu a causa di la grannizza di lu dataset. Ci avissi statu mpussibbili detect in studi nanzu chì usatu linzola viaghju di carta da un nùmmaru nicu di segne tassì nantu à un cortu piriudu di tempu (per esempiu, Camerer et al. (1997) ).
studiu di Farber era vicinu a na megghiu-casu di un studiu cù grande dati. Prima, quannu li dati ùn eranu non-riprisentante picchì la cità nicissarii segne à aduprà metri numerica. E, quannu li dati ùn eranu micca sanu parchì i dati chì fù racolta da a cità era abbastanza vicinu a quannu li dati ca Farber putìssiru aviri lu studiusu s'ellu ùn avia u so editore (una diffarenza hè chì Farber un'è dati recherche su nu tutali solda-tariffi aimé tips- ma quannu li dati a cità facía solu punte pagatu da carta di crèditu). La chiavi di a ricerca d'Farber fu ca cummina 'na bona quistioni cu bona dati. sulu la data, ùn sò micca abbastanza.