2.4.1.1 Такси во Њујорк

Еден истражувач од големи податоци од такси метри да учат на донесување одлуки на таксисти во Њујорк. Овие податоци се добро прилагодени за ова истражување.

Еден пример за едноставен моќ на броење на вистинската работа доаѓа од Хенри Farber е (2015) проучување на однесувањето на Њујорк таксисти. Иако оваа група би можело да звучи инхерентно интересен тоа е стратешки истражување сајт за тестирање на две спротивставени теории за труд економија. За потребите на истражувањето Farber, постојат две важни функции во врска со работата на животната средина на такси возачи: 1) нивната плата од час варира од ден-за-ден, со седиште во дел на фактори како што се времето и 2) на бројот на часови тие работат може да се менува секој ден врз основа на одлука на возачот. Овие карактеристики доведе до едно интересно прашање за односот помеѓу платите на час и часови. Неокласичен модели во економијата предвидуваат дека таксисти ќе работат повеќе во деновите кога тие имаат повисоки час плати. Алтернативно, моделите од однесувањето економија предвидуваат токму спротивното. Доколку возачите се постави одреден приход целна велат $ 100 дневно-и работа до тој цел е исполнет, тогаш возачи ќе завршат работат помалку часови дена дека тие заработуваат повеќе. На пример, ако сте биле жртва носител, може да заврши работа од 4 часа на добар ден ($ 25 на час) и 5 ​​часа на лош ден ($ 20 на час). Значи, не возачите работат повеќе часови во деновите со повисоки платите на час (како што е предвидено од страна на неокласичната модели) или повеќе часа на деновите со пониски час платите (како што е предвидено од страна на однесувањето економски модели)?

За да одговориме на ова прашање Farber добиените податоци за секој такси патување преземени од страна на Њујорк кабини од 2009 - 2013, податоците кои сега се достапни за јавноста . Оваа податоци кои се собрани со помош на електронски мерачи на градот бара такси за користење, вклучува неколку парчиња на информации за секоја посета: Почетно време, почнете локација, крајот на времето, на крајот локација, цена, и бакшиш (ако на врвот е платен со кредитна картичка). Севкупно, податоци Farber содржани информации за околу 900 милиони патувања преземени во текот на околу 40 милиони смени (промена е приближно работа еден ден за еден возач). Всушност, имаше толку многу податоци, кои Farber користат само случаен примерок од него за неговата анализа. Користејќи ги овие податоци такси метар, Farber покажа дека повеќето возачи да работат повеќе во деновите кога платите се повисоки, во согласност со неокласичната теорија. Во прилог на ова Главниот заклучок, Farber беше во можност да се потпора на големината на податоците, за подобро разбирање на хетерогеност и динамика. Farber покажа дека со текот на времето понови драјвери постепено научат да работат повеќе часови на високо дена плата (на пример, тие да научат да се однесуваат како неокласичен модели предвидува). И, новите возачи кои се однесуваат како цел заработуваат најмногу се со поголема веројатност да престанам да се биде таксист. И двете од овие посуптилно наоди, кои помагаат да се објасни забележани однесување на сегашните возачи, се е можно само поради големината на базата. Тие би било невозможно да се открие во претходните студии кои се користат хартија патување листови од мал број на таксисти во текот на еден краток временски период (на пример, Camerer et al. (1997) ).

студија Farber беше блиску до најдобар случај за студија со користење на големи податоци. Прво, податоците не се нерепрезентативен, бидејќи градот е потребно на возачите да користат дигитална метри. И, податоците не се непотполна, затоа што податоците кои се собрани од страна на градот беше многу блиску до податоците кои Farber би се прибрале ако имал избор (една разлика е во тоа што Farber би сакал податоци за вкупните плати-на цените плус совети- но податоците градот вклучени само совети плаќа со кредитна картичка). Клучот за истражување Farber беше комбинирање добро прашање со добри податоци. сам податоците не се доволни.