2.4.1.1 Os taxis de Nova York

Un investigador utilizou datos grandes de taxi metros para estudar a toma de decisións dos condutores de taxi de Nova York. Estes datos foi ben adaptado para esta busca.

Un exemplo do poder simple de contar as cousas ben vén de Henry Farber (2015) estudo do comportamento dos condutores de taxi de Nova York. Aínda que este grupo pode non soar inherentemente interesante, é un sitio de busca estratéxica para probar dúas teorías competidores en economía do traballo. Para efectos de investigación de Farber, hai dúas características importantes sobre o escritorio dos condutores de taxi: 1) o seu salario por hora varía de día a día, con base, en parte, de factores como o tempo e 2) o número de horas de traballo pode variar cada día en base a decisións do condutor. Estas características levan a unha cuestión interesante sobre a relación entre os salarios por hora e horas traballadas. modelos neoclásicos en economía prevén que os condutores de taxi vai traballar máis nos días en que eles teñen os salarios por hora máis elevados. Alternativamente, os modelos de economía comportamental prever exactamente o contrario. Os condutores definir un determinado rendemento obxectivo dicir $ 100 por día e traballar ata que a meta é alcanzada, entón condutores acaban traballando menos horas en días que están gañando máis. Por exemplo, se fose un gañador de destino, pode acabar traballando 4 horas en un bo día (US $ 25 por hora) e 5 horas nun día malo (US $ 20 por hora). Así, os condutores traballan máis horas en días con maiores salarios por hora (conforme previsto polos modelos neoclásicos) ou máis horas en días con salarios por hora inferiores (como previsto por modelos económicos de comportamento)?

Para responder a esta pregunta Farber obtidos datos en cada viaxe de taxi tomada por taxis Nova York desde 2009 - 2013, datos que están dispoñibles ao público . Este foi recollido por Medidores electrónicos que a cidade necesita taxis para o cal a datos úsanse inclúe varias pezas de información para cada viaxe: a hora de inicio, comezar a localización, hora de final, a situación final, tarifa, e de punta (se a punta foi pagado cun tarxeta de crédito). En total, os datos de Farber contiña información sobre preto de 900 millóns de viaxes feitas durante aproximadamente 40 millóns de quendas (o cambio é preto de un día de traballo para un condutor). De feito, non había tantos datos, que Farber usado só unha mostra aleatoria del para a súa análise. Usando estes datos taxímetro, Farber descubriu que a maioría dos condutores traballar máis nos días en que os salarios son máis elevados, consistentes coa teoría neoclásica. En adición a este descubrimento principal, Farber soubo explotar o tamaño dos datos para unha mellor comprensión da heteroxeneidade e dinámica. Farber descubriu que co paso do tempo os controladores máis recentes gradualmente aprender a traballar máis horas en días de salarios altos (por exemplo, aprenden a comportarse como os modelos neoclásicos prevé). E, os novos condutores que se comportan máis como asalariados obxectivo son máis propensos a deixar de ser un condutor de taxi. Ambos os resultados máis sutís, que axudan a explicar o comportamento observado de controladores actuais, só foron posibles por mor do tamaño do conxunto de datos. Eles sería imposible detectar en estudos anteriores que utilizaron follas de papel de disparo dende un pequeno número de condutores de taxi ao longo dun curto período de tempo (por exemplo, Camerer et al. (1997) ).

O estudo de Farber estaba preto dun best-se para un estudo utilizando datos grandes. En primeiro lugar, os datos non eran non-representativo porque a cidade é necesario que os condutores utilicen Medidores dixitais. E, os datos non estaban incompletos porque os datos que foron recollidos pola cidade foi moi preto de datos que Farber recollería se tivese a opción (unha diferenza é que Farber tería datos querían sobre o total de salarios-Fares máis dicas- pero os datos da cidade só incluíu consellos pagadas con tarxeta de crédito). A clave para a investigación de Farber foi a combinación de unha boa pregunta con bos datos. Os datos por si só non son suficientes.