2.4.1.1 Taxiuri în New York City

Un cercetator folosit date mari de la contoarele de taxi pentru a studia procesul de luare a deciziilor șoferilor de taxi din New York. Aceste date au fost foarte potrivit pentru această cercetare.

Un exemplu de simplu puterea de numărare lucru corect vine de la Henry Farber (2015) studiul comportamentului șoferilor de taxi din New York City. Cu toate că acest grup s - ar putea să nu sune în mod inerent interesant este un site de cercetare strategică pentru testarea două teorii concurente în economia muncii. În scopul cercetării Farber, există două caracteristici importante despre mediul de lucru al șoferilor de taxi: 1) salariul orar fluctuează de la o zi cu zi, bazată parțial pe factori, cum ar fi vremea și 2) numărul de ore lucrate poate fluctua în fiecare zi, pe baza deciziilor șoferului. Aceste caracteristici conduc la o întrebare interesantă cu privire la relația dintre salarii pe oră și ore lucrate. Modelele neoclasice în economie prezice că șoferii de taxi vor lucra în zilele în cazul în care acestea au salarii mai mari pe oră. În mod alternativ, modelele de la economia comportamentală prezice exact contrariul. În cazul în care conducătorii auto a stabilit un venit anumit țintă spune $ 100 pe zi și de muncă până la îndeplinirea acestui obiectiv, atunci șoferii s-ar ajunge să lucreze mai puține ore în zilele în care sunt câștigă mai. De exemplu, dacă ați fost o țintă earner, s-ar putea termina de lucru 4 ore pe o zi buna (25 $ pe oră) și 5 ore pe o zi proastă (20 $ pe oră). Deci acolo drivers lucreze mai multe ore în zilele with salarii mai mari pe oră (așa cum au prezis modelele neoclasice) sau mai multe ore, în zilele cu salarii orare mai mici (așa cum a prezis modele economice comportamentale)?

Pentru a răspunde la această întrebare Farber obținute date cu privire la fiecare excursie cu taxiul luate de New York City taxiuri din parte 2009 - 2013, datele care sunt acum disponibile în mod public . Aceste date-care au fost colectate prin contoare electronice că orașul necesită taxiuri de a utiliza-include mai multe bucăți de informații pentru fiecare călătorie: ora începerii, locația de pornire, ora de încheiere, sfârșit de locație, tarif, și vârful (în cazul în care vârful a fost plătit cu un card de credit). In total, datele Farber conțineau informații cu privire la aproximativ 900 de milioane de călătorii luate în timpul de aproximativ 40 de milioane de ture (o deplasare este de aproximativ o zi de lucru pentru un singur șofer). De fapt, a existat atât de multe date, care Farber folosit doar un eșantion aleatoriu de ea pentru analiza lui. Prin utilizarea acestor date contor de taxi, Farber a constatat că majoritatea șoferilor lucreze mai mult în zilele în care salariile sunt mai mari, în concordanță cu teoria neoclasică. În plus față de această constatare principală, Farber a fost în măsură să pârghie de dimensiunea datelor pentru o mai bună înțelegere a eterogenității și a dinamicii. Farber a constatat ca, in timp drivere mai noi, să învețe treptat să lucreze mai multe ore în zilele de salarii ridicate (de exemplu, ei învață să se comporte ca modelele neoclasic prezice). Și, drivere noi care comportă mai degrabă ca persoanele cu venituri tinta sunt mai susceptibile de a fi un șofer renunțe la taxi. Ambele aceste descoperiri mai subtile, care ajuta la explicarea comportamentul observat al șoferilor curente, au fost posibile numai datorită dimensiunii setului de date. Ei ar fi fost imposibil de detectat în studiile anterioare care au folosit foi de hârtie de călătorie dintr - un număr mic de șoferi de taxi pe o perioadă scurtă de timp ( de exemplu, Camerer et al. (1997) , Camerer et al. (1997) ).

Studiul Farber a fost aproape de cel mai bun caz pentru un studiu folosind date mari. În primul rând, datele nu au fost non-reprezentative, deoarece orașul cerut șoferilor să folosească contoare digitale. Si, datele nu au fost incomplete, deoarece datele care au fost colectate de către oraș a fost destul de aproape de datele pe care Farber ar fi colectat dacă ar avea posibilitatea de a alege (o singură diferență este că Farber ar fi date cu privire la totalul salariilor vrut-plus tarifele tips- dar datele despre oraș incluse numai sfaturi plătite prin card de credit). Cheia pentru a cercetarii Farber a fost combinarea o întrebare bună cu date bune. Numai datele nu sunt suficiente.