2.4.1.1 Taxis à New York

Un chercheur a utilisé les données de grandes de mètres de taxi pour étudier la prise de décision des chauffeurs de taxi à New York. Ces données ont été bien adaptés pour cette recherche.

Un exemple de la simple pouvoir de compter la bonne chose provient de Henry Farber (2015) étude du comportement des chauffeurs de taxi de New York City. Bien que ce groupe pourrait ne pas sembler intrinsèquement intéressante est un site de recherche stratégique pour tester deux théories concurrentes dans l' économie du travail. Aux fins de la recherche de Farber, il y a deux éléments importants sur l'environnement de travail des chauffeurs de taxi: 1) leur salaire horaire varie d'une base en partie sur des facteurs comme la météo au jour le jour, et 2) le nombre d'heures de travail peut fluctuer chaque jour en fonction des décisions du conducteur. Ces caractéristiques conduisent à une question intéressante à propos de la relation entre les salaires horaires et les heures travaillées. modèles néoclassiques en économie prédisent que les chauffeurs de taxi travailleraient plus les jours où ils ont des salaires horaires plus élevés. Alternativement, les modèles de l'économie comportementale prédisent exactement le contraire. Si les pilotes mis un revenu particulier cible dire 100 $ par jour et le travail jusqu'à ce que cet objectif soit atteint, puis les pilotes finiraient travailler moins d'heures les jours où ils gagnent plus. Par exemple, si vous étiez un salarié cible, vous pourriez finir par travailler 4 heures sur une bonne journée (25 $ par heure) et 5 heures sur une mauvaise journée (20 $ par heure). Alors, ne les conducteurs travaillent plus d'heures les jours avec des salaires plus élevés horaire (comme prédit par les modèles néoclassiques) heures ou plus les jours avec des salaires horaires inférieurs (comme prédit par les modèles économiques de comportement)?

Pour répondre à cette question Farber a obtenu des données sur chaque voyage de taxi prises par les taxis de New York City 2009-2013, les données qui sont maintenant accessibles au public . Ces données, qui ont été recueillies par les compteurs électroniques que la ville a besoin de taxis à utiliser-comprend plusieurs éléments d'information pour chaque voyage: heure de début, emplacement de départ, heure de fin, l'emplacement final, tarif, les pourboires (si la pointe a été payé avec un carte de crédit). Au total, les données de Farber contenaient des informations sur environ 900 millions de voyages effectués pendant environ 40 millions de déplacements (un changement est à peu près le travail d'un jour pour un conducteur). En fait, il y avait tellement de données que Farber utilisé un échantillon aléatoire de celui-ci pour son analyse. Grâce à ces données de compteur de taxi, Farber a constaté que la plupart des conducteurs travaillent plus les jours où les salaires sont plus élevés, en accord avec la théorie néoclassique. En plus de cette conclusion principale, Farber a été en mesure de tirer parti de la taille des données pour une meilleure compréhension de l'hétérogénéité et de la dynamique. Farber a constaté que le temps de nouveaux pilotes apprennent progressivement à travailler plus d'heures, les jours de salaires élevés (par exemple, ils apprennent à se comporter comme les modèles néoclassiques prédit). Et, les nouveaux conducteurs qui se comportent plus comme salariés cibles sont plus susceptibles de cesser d'être un chauffeur de taxi. Ces deux résultats plus subtils, qui aident à expliquer le comportement observé des pilotes actuels, étaient seulement possible en raison de la taille de l'ensemble de données. Ils auraient été impossibles à détecter dans des études antérieures qui ont utilisé voyage de papier feuilles à partir d' un petit nombre de chauffeurs de taxi sur une courte période de temps (par exemple, Camerer et al. (1997) ).

L'étude de Farber était proche d'un meilleur des cas pour une étude utilisant des données importantes. Premièrement, les données ne sont pas non représentatif parce que la ville nécessaire aux conducteurs d'utiliser des compteurs numériques. Et, les données ne sont pas incomplète parce que les données qui ont été recueillies par la ville était assez proche de données que Farber aurait perçu s'il avait le choix (une différence est que Farber aurait voulu des données sur les salaires-prix totaux plus Tips- mais les données de la ville seulement inclus des conseils payés par carte de crédit). La clé de la recherche de Farber combinait une bonne question avec de bonnes données. Les données seules ne suffisent pas.