Um pesquisador utilizou dados grandes de táxi metros para estudar a tomada de decisões dos motoristas de táxi de Nova York. Estes dados foi bem adaptado para esta pesquisa.
Um exemplo do poder simples de contar a coisa certa vem de Henry Farber (2015) estudo do comportamento dos motoristas de táxi de Nova York. Embora este grupo pode não soar inerentemente interessante, é um site de pesquisa estratégica para testar duas teorias concorrentes em economia do trabalho. Para efeitos de investigação de Farber, há duas características importantes sobre o ambiente de trabalho dos motoristas de táxi: 1) o seu salário por hora varia de dia-a-dia, com base, em parte, de fatores como o tempo e 2) o número de horas de trabalho pode variar a cada dia com base em decisões do condutor. Estas características levam a uma questão interessante sobre a relação entre os salários por hora e horas trabalhadas. modelos neoclássicos em economia prevêem que os motoristas de táxi iria trabalhar mais nos dias em que eles têm os salários por hora mais elevados. Como alternativa, os modelos de economia comportamental prever exatamente o oposto. Se os motoristas definir um determinado rendimento-alvo dizer $ 100 por dia e trabalhar até que a meta é atingida, então motoristas acabam trabalhando menos horas em dias que eles estão ganhando mais. Por exemplo, se você fosse um ganhador de alvo, você pode acabar trabalhando 4 horas em um bom dia (US $ 25 por hora) e 5 horas em um dia ruim (US $ 20 por hora). Assim, os motoristas trabalham mais horas em dias com maiores salários por hora (conforme previsto pelos modelos neoclássicos) ou mais horas em dias com salários por hora inferiores (como previsto por modelos econômicos comportamentais)?
Para responder a esta pergunta Farber obtidos dados em cada viagem de táxi tomada por táxis New York City a partir de 2009 - 2013, dados que estão agora disponíveis ao público . Este foi recolhido por medidores eletrônicos que a cidade necessita táxis para o qual a dados usam-inclui várias peças de informação para cada viagem: a hora de início, começar a localização, hora de fim, a localização final, tarifa, e de ponta (se a ponta foi pago com um cartão de crédito). No total, os dados de Farber continha informações sobre cerca de 900 milhões de viagens feitas durante aproximadamente 40 milhões de turnos (a mudança é cerca de um dia de trabalho para um motorista). Na verdade, não havia tantos dados, que Farber usado apenas uma amostra aleatória dele para sua análise. Usando esses dados taxímetro, Farber descobriu que a maioria dos motoristas trabalhar mais nos dias em que os salários são mais elevados, consistentes com a teoria neoclássica. Em adição a esta descoberta principal, Farber foi capaz de explorar o tamanho dos dados para uma melhor compreensão da heterogeneidade e dinâmica. Farber descobriu que ao longo do tempo os drivers mais recentes gradualmente aprender a trabalhar mais horas em dias de salários elevados (por exemplo, aprendem a se comportar como os modelos neoclássicos prevê). E, os novos motoristas que se comportam mais como assalariados alvo são mais propensos a deixar de ser um motorista de táxi. Ambos os resultados mais sutis, que ajudam a explicar o comportamento observado de drivers atuais, só foram possíveis por causa do tamanho do conjunto de dados. Eles teria sido impossível detectar em estudos anteriores que utilizaram folhas de papel de disparo a partir de um pequeno número de condutores de táxi ao longo de um curto período de tempo (por exemplo, Camerer et al. (1997) ).
O estudo de Farber estava perto de um best-caso para um estudo utilizando dados grandes. Em primeiro lugar, os dados não eram não-representativo porque a cidade necessário que os condutores utilizem medidores digitais. E, os dados não estavam incompletos porque os dados que foram coletados pela cidade foi muito perto de os dados que Farber teria recolhido se tivesse a escolha (uma diferença é que Farber teria dados queriam sobre o total de salários-fares mais dicas- mas os dados da cidade só incluiu dicas pagas por cartão de crédito). A chave para a pesquisa de Farber foi a combinação de uma boa pergunta com bons dados. Os dados por si só não são suficientes.