2.4.1.1 Taxi i New York

En forskare som används big data från taxametrar för att studera beslutsfattande taxichaufförer i New York. Dessa uppgifter var väl lämpad för denna forskning.

Ett exempel på det enkla makt att räkna det rätta kommer från Henry Farber s (2015) studie av hur New York taxichaufförer. Även om denna grupp inte kan låta sig intressant det är en strategisk forsknings plats för att testa två konkurrerande teorier i arbetsmarknadsekonomi. Vid tillämpning av Farber forskning, finns det två viktiga funktioner om arbetsmiljön för taxichaufförer: 1) sin timlön varierar från dag till dag, delvis baserad på faktorer som väder och 2) det antal timmar de arbetar kan variera varje dag baserat på förarens beslut. Dessa egenskaper leder till en intressant fråga om förhållandet mellan timlöner och arbetade timmar. Neoklassiska modeller inom ekonomi förutspår att taxichaufförer skulle arbeta mer på dagar där de har högre timlön. Alternativt modeller från beteendeekonomi förutsäga exakt motsatsen. Om förare ställa in en viss inkomst mål-säga $ 100 per dag och arbeta tills det målet är uppfyllt, då förare skulle sluta arbeta färre timmar på dagar som de tjänar mer. Till exempel, om du var ett mål löntagare, kan du sluta arbeta 4 timmar på en bra dag ($ 25 per timme) och 5 timmar på en dålig dag ($ 20 per timme). Så, förare arbeta fler timmar på dagar med högre timlön (som förutsägs av neoklassiska modeller) eller fler timmar på dagarna med lägre timlön (som förutspåtts av beteende ekonomiska modeller)?

För att besvara denna fråga Farber erhållna uppgifter om varje taxi resa fattas av New York hytter från 2009 - 2013, uppgifter som finns nu tillgängliga för allmänheten . Denna data som tillvaratogs genom elektroniska mätare som staden kräver taxi att använda-innehåller flera bitar av information för varje resa: starttid, startplats, sluttid, slutet läge, pris och spets (om spetsen betalades med en kreditkort). Totalt Farber data innehöll information om cirka 900 miljoner resor tagna under ca 40 miljoner skift (en förskjutning är ungefär en dags arbete för en förare). Faktum är att det var så mycket data att Farber endast ett slumpmässigt urval av det för hans analys. Med hjälp av denna taxametern uppgifter, Farber fann att de flesta förare arbeta mer på dagar då lönerna är högre, i linje med den neoklassiska teorin. Utöver denna huvud slutsats var Farber kunna utnyttja storleken på data för en bättre förståelse av heterogenitet och dynamik. Farber fann att över tiden nyare förare successivt lära sig att arbeta fler timmar på höga löne dagar (t.ex., de lär sig att bete sig som de neoklassiska modeller förutsäger). Och nya förare som beter sig mer som mål arbetare är mer benägna att sluta vara en taxichaufför. Båda dessa mer subtila iakttagelser, som bidrar till att förklara den observerade beteendet hos dagens förare, var endast möjlig på grund av storleken av datamängden. De skulle ha varit omöjligt att upptäcka i tidigare studier som använt papper resa ark från ett litet antal taxiförare under en kort tidsperiod (t.ex. Camerer et al. (1997) ).

Farber studie var nära en bästa fall för en studie med stora uppgifter. Först inte uppgifterna var icke-representativa eftersom staden krävs förare att använda digitala mätare. Och uppgifterna inte var ofullständiga, eftersom de data som samlades in av staden var ganska nära till de data som Farber skulle ha samlat om han hade valet (en skillnad är att Farber skulle ha velat uppgifter om lönesumman-priser plus tips- men data staden ingår bara tips som betalas med kreditkort). Nyckeln till Farber forskning var att kombinera en bra fråga med bra data. Uppgifterna räcker inte.