2.4.1.1 I taxi a New York

Un ricercatore usato big data da tassametri per studiare il processo decisionale dei tassisti di New York. Questi dati sono stati adatto per questa ricerca.

Un esempio del semplice potere di contare la cosa giusta viene da Henry Farber (2015) studio del comportamento dei tassisti di New York City. Anche se questo gruppo potrebbe non sembrare di per sé interessante si tratta di un sito di ricerca strategica per testare due teorie in competizione in economia del lavoro. Ai fini della ricerca di Farber, ci sono due caratteristiche importanti per l'ambiente di lavoro dei tassisti: 1) la loro retribuzione oraria oscilla dal primo giorno per giorno, basata in parte su fattori come il tempo e 2) il numero di ore di lavoro può variare ogni giorno in base alle decisioni del conducente. Queste caratteristiche portano ad una domanda interessante circa il rapporto tra salari orari e le ore lavorate. modelli neoclassici in economia prevedono che i tassisti dovrebbero lavorare di più nei giorni in cui hanno salari orari più alti. In alternativa, i modelli da economia comportamentale prevedono esattamente il contrario. Se i driver impostare un particolare bersaglio reddito-dire 100 $ al giorno, e lavorare fino a quando tale obiettivo venga raggiunto, quindi i conducenti sarebbero finiscono per lavorare meno ore nei giorni che sono a guadagnare di più. Ad esempio, se tu fossi un percettore di destinazione, si potrebbe finire per lavorare 4 ore in una buona giornata ($ 25 all'ora) e 5 ore in una brutta giornata ($ 20 all'ora). Quindi, fare driver funzionano più ore nei giorni con elevati salari orari (come previsto dai modelli neoclassici) o più ore nei giorni con salari orari più bassi (come previsto dai modelli economici di comportamento)?

Per rispondere a questa domanda Farber ottenuto i dati su ogni viaggio in taxi presa dal taxi di New York 2.009-2.013, i dati che sono ora a disposizione del pubblico . Questa scheda che è stato raccolto dai contatori elettronici che la città richiede un taxi per usare-comprende diversi pezzi di informazioni per ogni viaggio: iniziare ora, luogo, ora di fine, la posizione finale, piatti, e punta (inizio se la punta è stato pagato con un carta di credito). In totale, i dati di Farber contenevano informazioni su circa 900 milioni di viaggi effettuati durante circa 40 milioni di turni (uno spostamento è di circa un giorno di lavoro per un driver). In effetti, c'era tanto di dati, che Farber utilizzato solo un campione casuale di esso per la sua analisi. Utilizzando questi dati tassametro, Farber ha scoperto che la maggior parte dei driver funzionano più nei giorni in cui i salari sono più elevati, in linea con la teoria neoclassica. In aggiunta a questa scoperta principale, Farber era in grado di sfruttare la dimensione dei dati per una migliore comprensione della eterogeneità e dinamiche. Farber ha rilevato che nel corso del tempo i conducenti più recenti imparano gradualmente a lavorare più ore nei giorni alti salari (ad esempio, imparano a comportarsi come i modelli neoclassici predice). E, i nuovi driver che si comportano più come percettori di destinazione sono più probabilità di smettere di essere un tassista. Entrambi questi risultati più sottili, che aiutano a spiegare il comportamento osservato dei driver correnti, erano possibili solo a causa delle dimensioni del set di dati. Sarebbero stato impossibile rilevare in studi precedenti che utilizzavano fogli viaggio carta da un piccolo numero di tassisti in un breve periodo di tempo (ad esempio, Camerer et al. (1997) ).

Lo studio di Farber era vicino a un caso migliore per uno studio con dati di grandi dimensioni. In primo luogo, i dati non erano non rappresentativo perché la città richiesto driver per utilizzare contatori digitali. E, i dati non erano incompleti in quanto i dati sono stati raccolti dal Comune era abbastanza vicino ai dati che Farber sarebbe hanno raccolto se avesse la scelta (una differenza è che Farber avrebbe voluto i dati sul totale salari-tariffe più Tips ma i dati della città inclusi solo suggerimenti pagati con carta di credito). La chiave per la ricerca di Farber è combinare una buona domanda con buoni dati. I dati da soli non sono sufficienti.