2.4.1.1 Taxis in New York

'N Navorser gebruik groot data van taxi meter tot besluitneming van taxibestuurders in New York studeer. Hierdie data is uiters geskik vir hierdie navorsing.

Een voorbeeld van die eenvoudige krag van die tel van die regte ding is afkomstig van Henry Farber se (2015) studie van die gedrag van New York City taxibestuurders. Hoewel hierdie groep nie inherent interessant klink dit 'n strategiese navorsing terrein vir die toets van twee mededingende teorieë in arbeidsekonomie. Vir die doeleindes van navorsing Farber se, is daar twee belangrike kenmerke van die werksomgewing van taxibestuurders: 1) hul uurlikse loon verskil van dag-tot-dag, gebaseer gedeeltelik op faktore soos die weer en 2) die aantal ure wat hulle werk kan elke dag wissel gebaseer op besluite van die bestuurder se. Hierdie eienskappe lei tot 'n interessante vraag oor die verhouding tussen uurlikse lone en ure gewerk. Neoklassieke modelle in die ekonomie voorspel dat taxibestuurders meer sou werk op dae waar hulle hoër uurlikse lone. Alternatiewelik, modelle van gedrags- ekonomie voorspel presies die teenoorgestelde. As bestuurders stel 'n spesifieke inkomste teiken-sê $ 100 per dag en werk tot op daardie teiken voldoen, dan bestuurders sou beland werk minder ure op dae wat hulle verdien meer. Byvoorbeeld, as jy 'n teiken verdiener, kan jy uiteindelik werk 4 uur op 'n goeie dag ($ 25 per uur) en 5 uur op 'n slegte dag ($ 20 per uur). So, moenie bestuurders werk meer ure op dae met 'n hoër lone uurlikse (soos voorspel deur die neo-klassieke modelle) of meer ure op dae met 'n laer uurlikse lone (soos voorspel deur gedragsverandering ekonomiese modelle)?

Om hierdie vraag te beantwoord Farber verkry data op elke taxi rit deur die stad New York taxi vanaf 2009 - 2013, data wat nou publiek sigbaar . Dit-data wat ingesamel is deur elektroniese meters wat die stad vereis taxi's te gebruik-sluit 'n paar stukkies van inligting vir elke reis: begin tyd, begin plek, eindtyd, einde plek, prys, en punt (indien die punt betaal met 'n kredietkaart). In totaal, Farber se data bevat inligting oor ongeveer 900,000,000 reise geneem tydens ongeveer 40.000.000 skofte ( 'n verskuiwing is min of meer 'n dag se werk vir 'n bestuurder). Trouens, daar was soveel data, wat Farber net gebruik om 'n ewekansige steekproef van dit vir sy ontleding. Die gebruik van hierdie taxi meter data, Farber het bevind dat die meeste bestuurders werk meer op dae wanneer lone hoër, in ooreenstemming met die neo-klassieke teorie. Benewens hierdie belangrikste bevinding, Farber was in staat om die grootte van die data hefboom vir 'n beter begrip van heterogeniteit en dinamika. Farber het bevind dat met verloop van tyd nuwer bestuurders geleidelik leer om meer ure op 'n hoë loon dae werk (bv, leer hulle om op te tree as die neo-klassieke modelle voorspel). En, nuwe bestuurders wat optree meer soos teiken verdieners is meer geneig om op te hou om 'n taxi-bestuurder. Beide van hierdie meer subtiele bevindings, wat help om die waargeneem gedrag van huidige bestuurders te verduidelik, was slegs moontlik as gevolg van die grootte van die datastel. Hulle sou onmoontlik gewees het om op te spoor in vorige studies wat papier reis velle gebruik van 'n klein aantal taxibestuurders oor 'n kort tydperk van die tyd (bv Camerer et al. (1997) ).

Farber se studie was naby aan 'n beste-geval vir 'n studie met behulp van groot data. In die eerste plek die data was nie nie-verteenwoordigende omdat die stad nodig bestuurders om digitale meter gebruik. En, die data is nie onvolledig omdat die data wat ingesamel is deur die stad was 'n bietjie naby aan die data wat Farber sou versamel het as hy die keuse gehad (een verskil is dat Farber wou data op totale lone-tariewe plus tips- sou hê maar die stad data ingesluit net wenke met 'n kredietkaart betaal). Die sleutel tot navorsing Farber se kombinasie van 'n goeie vraag met 'n goeie data. Die data alleen is nie genoeg nie.