Un investigador utilizó datos de gran tamaño de los taxímetros para estudiar la toma de decisiones de los taxistas de Nueva York. Estos datos se adaptan bien para esta investigación.
Un ejemplo de la simple poder de contar lo correcto proviene de Henry Farber (2015) estudio del comportamiento de los conductores de taxi de Nueva York. Aunque este grupo no puede sonar interesante es inherentemente un sitio estratégico de investigación para probar dos teorías que compiten en la economía del trabajo. A los efectos de la investigación de Farber, hay dos características importantes sobre el ambiente de trabajo de los conductores de taxi: 1) su salario por hora fluctúa día a día, basado en parte en factores como el clima y 2) el número de horas que trabajan puede fluctuar cada día sobre la base de las decisiones del conductor. Estas características conducen a una cuestión interesante sobre la relación entre los salarios por hora y las horas trabajadas. modelos neoclásicos en economía predicen que los taxistas trabajarían más en los días en los que tienen mayores salarios por hora. Por otra parte, los modelos de la economía del comportamiento predicen exactamente lo contrario. Si los conductores establecen un ingreso especial a su objetivo, digamos $ 100 por día-y el trabajo hasta que se cumpla ese objetivo, a continuación, los conductores podrían terminar trabajando menos horas en los días que están ganando más. Por ejemplo, si usted fuera un perceptor de destino, es posible que termines trabajando 4 horas en un día bueno ($ 25 por hora) y 5 horas en un mal día ($ 20 por hora). Por lo tanto, no conductores trabajan más horas en los días de mayor salario por hora (según lo predicho por los modelos neoclásicos) o más horas en los días con salarios por hora inferiores (según lo predicho por los modelos económicos del comportamiento)?
Para responder a esta pregunta Farber obtuvo datos en cada viaje en taxi tomada por las cabinas de la ciudad de Nueva York desde 2009 - 2013, datos que ya están a disposición del público . Estos datos, que se recogió por contadores electrónicos que la ciudad requiere taxis para utilizar-incluye varias piezas de información para cada viaje: hora de inicio, se inicia la ubicación, hora de finalización, la ubicación final, tarifa, y la punta (si la punta se pagó con una tarjeta de crédito). En total, los datos de Farber contenían información sobre aproximadamente 900 millones de viajes tomadas durante aproximadamente 40 millones de desplazamientos (un cambio es aproximadamente un día de trabajo de un conductor). De hecho, no había tantos datos, que Farber utilizado una muestra aleatoria de la misma para su análisis. Usando estos datos taxímetro, Farber encontró que la mayoría de los conductores trabajan más en los días en que los salarios son más altos, en consonancia con la teoría neoclásica. Además de este hallazgo principal, Farber fue capaz de aprovechar el tamaño de los datos para una mejor comprensión de la heterogeneidad y la dinámica. Farber encontró que con el tiempo los conductores nuevos aprenden gradualmente a trabajar más horas a los días de salarios (por ejemplo, aprenden a comportarse como los modelos neoclásicos predice). Y, los nuevos conductores que se comportan más como perceptores de destino son más propensos a dejar de ser un conductor de taxi. Estos dos resultados más sutiles, que ayudan a explicar el comportamiento observado de los conductores actuales, eran sólo es posible debido al tamaño del conjunto de datos. Ellos habrían sido imposibles de detectar en estudios anteriores que utilizan hojas de viaje papel a partir de un pequeño número de conductores de taxi en un corto período de tiempo (por ejemplo, Camerer et al. (1997) ).
El estudio de Farber estaba cerca de un mejor de los casos para un estudio basado en datos grandes. En primer lugar, los datos no eran no representativa porque la ciudad requiere que los conductores utilicen medidores digitales. Y, los datos no estaban incompletos porque los datos que se recogió por la ciudad estaba bastante cerca de los datos que Farber hubiera percibido si tuviera la elección (una diferencia es que Farber tendría los datos buscados en el total de los salarios tarifas más consejos- pero los datos de la ciudad sólo se incluyen consejos pagados con tarjeta de crédito). La clave para la investigación de Farber fue combinar una buena pregunta con buenos datos. Los datos por sí solos no son suficientes.