2.4.1.1 Taxis yn New York City

In ûndersiker brûkt grut gegevens fan taxi meter te studearjen beslútfoarming fan taxichauffeurs yn New York. Dy gegevens waard goed geskikt foar dit ûndersyk.

Ien foarbyld fan de ienfâldige krêft fan tellen fan it rjocht ding komt út Henry Keiswetter s (2015) stúdzje fan it hâlden en dragen fan New York City taxichauffeurs. Hoewol't dizze groep miskien net klinke djip nijsgjirrich is it in strategysk ûndersyk site foar it testen fan twa konkurrearjende teoryen yn arbeid ekonomy. Foar it tapassen fan Keiswetter syn ûndersyk, der binne twa wichtige funksjes oer it wurk omjouwing fan taxichauffeurs: 1) harren stündlich lean skommelet fan dei-nei-dei, in part basearre op faktoaren lykas it waar en 2) it tal fan oeren sy wurkje kin skommelje eltse dei basearre op de bestjoerder fan besluten. Dy funksjes liede ta in nijsgjirrige fraach oer de relaasje tusken stündlich lean en oeren wurke. Neoklassisistyske modellen yn ekonomy foarsizze dat taxichauffeurs soe wurkje mear op dagen dêr't se hawwe hegere stündlich lean. As alternatyf, modellen fan gedrachsproblemen ekonomy foarsizze krekt it tsjinoerstelde. As drivers set in bepaalde ynkommen target-sizze $ 100 per dag-en wurk oant dat doel wurdt mei, dan sjauffeurs soe ein omheech wurke minder oeren op dagen dat se fertsjinne mear. Bygelyks, as jo waarden in doelgroep earner, jo miskien ein omheech wurke 4 oeren op in goede dei ($ 25 per oere) en 5 oeren op in minne dei ($ 20 per oere). Dus, do sjauffeurs wurkje mear oeren op dagen mei hegere stündlich lean (as foarsein troch de neoklassisistyske modellen) of mear oeren op dagen mei legere stündlich lean (as foarsein troch gedrachsproblemen ekonomyske modellen)?

Om antwurd op dizze fraach Keiswetter krigen gegevens op alle taksy reis nommen troch New York City cabs fan 2009 - 2013, gegevens dy't no publyk beskikber . Dizze data-dat waard sammele troch elektroanyske meter dy't de stêd freget taksy 's te brûken-omfiemet ferskate stikken fan ynformaasje foar elke reis: begjintiid, begjinne lokaasje, ein tiid, ein lokaasje, fare, en tip (as de tip waard betelle mei in Kredytkaart). Yn totaal, Keiswetter fan gegevens opnommen ynformaasje op likernôch 900 miljoen reizen nommen yn likernôch 40 miljoen ferskowings (in ferskowing is rûchwei ien dei syn wurk foar ien bestjoerder). Yndie, der wie safolle gegevens, dat Keiswetter allinnich brûkt in willekeurige stekproef fan it foar syn analyze. Mei help fan dizze taksy meter gegevens, Keiswetter fûn dat de measte bestjoerders wurkje mear op dagen as lean binne heger, oerien mei de neoklassisistysk teory. Neist dizze wichtichste finding, Keiswetter koe Leverage de grutte fan de gegevens foar in better begryp fan heterogeneity en dynamyk. Keiswetter fûn dat oer tiid nijere sjauffeurs stadichoan leare te wurkjen mear oeren op hege lean dagen (bygelyks, se leare te gedragen as de neoklassisistyske modellen foarseit). En, nije bestjoerders dy't gedrage mear as doelgroep earners binne mear kâns te hâlden wêzen in taxi sjauffeur. Beide fan dy mear subtyl befinings, dy't helpe ferklearjen de waarnommen gedrach fan hjoeddeistige bestjoerders, wiene allinne mooglik fanwege de grutte fan 'e dataset. Se soe hawwe west ûnmooglik te spoaren yn eardere ûndersiken dy't brûkt papier trip lekkens út in lyts tal fan taxichauffeurs oer in koarte perioade fan tiid (bygelyks, Camerer et al. (1997) ).

Keiswetter syn stúdzje wie ticht by in bêste-saak foar in stúdzje mei help fan grutte gegevens. Earste, de gegevens wienen net net-represintatyf, omdat de stêd nedich sjauffeurs te brûken digitale meter. En, de gegevens wienen net kompleet, omdat de gegevens dy't waard sammele troch de stêd wie moai ticht by de gegevens dy't Keiswetter soe hawwe sammele as hy hie de kar (ien ferskil is dat Keiswetter soe hawwe woe gegevens op totaal lean-Fares plus tips- mar de stêd gegevens allinnich opnaam tips betelle troch credit card). De kaai nei Keiswetter syn ûndersyk waard kombinearjen in goede fraach mei goede gegevens. De gegevens allinne binne net genôch.