2.4.1.1 Teksi katika New York City

Mtafiti kutumika data big kutoka mita teksi kujifunza kufanya maamuzi ya madereva wa teksi mjini New York. Hizi data ilikuwa vizuri inafaa kwa ajili ya utafiti huu.

Mfano mmoja wa nguvu rahisi ya kuhesabu jambo sahihi linatokana na Henry Farber ya (2015) uchunguzi wa tabia ya New York City madereva wa teksi. Ingawa kundi hili wanaweza sauti asili ya kuvutia ni utafiti wa kimkakati tovuti kwa ajili ya kupima mashindano nadharia mbili katika uchumi kazi. Kwa madhumuni ya utafiti Farber, kuna makala mbili muhimu kuhusu mazingira ya kazi ya madereva wa teksi: 1) mshahara wao hourly hushuka kutoka siku hadi siku, msingi katika sehemu ya mambo kama hali ya hewa na 2) idadi ya masaa kazi unaweza fluctuate kila siku kulingana na maamuzi ya dereva. Makala haya kusababisha swali kuvutia kuhusu uhusiano kati ya mshahara hourly na masaa kazi. mifano neoclassical katika uchumi kutabiri kwamba madereva wa teksi ingekuwa kazi zaidi juu ya siku ambapo wana mishahara ya juu hourly. Vinginevyo, mifano kutoka uchumi wa kitabia kutabiri kinyume kabisa. Kama madereva kuweka mapato hasa lengo-kusema $ 100 kwa siku-na kazi mpaka kwamba lengo ni alikutana, basi madereva itakuwa kuishia kufanya kazi masaa machache juu ya siku kwamba wao ni kupata zaidi. Kwa mfano, kama ungekuwa Lengo earner, unaweza kuishia kufanya kazi masaa 4 juu ya siku nzuri ($ 25 kwa saa) na masaa 5 juu ya siku mbaya ($ 20 kwa saa). Hivyo, madereva kazi masaa zaidi juu ya siku na mishahara ya juu hourly (kama ilivyotabiriwa na mifano neoclassical) au masaa zaidi juu ya siku na mishahara ya chini hourly (kama ilivyotabiriwa na mifano ya kitabia kiuchumi)?

Ili kujibu swali hili Farber kupatikana data katika safari kila taxi zilizochukuliwa na New York City cabs kutoka 2009 - 2013, takwimu ambazo ni sasa hadharani . Hii data-ambayo zilikusanywa na mita ya umeme ambayo mji inahitaji teksi kutumia-, ni pamoja na vipande kadhaa ya habari kwa kila safari: kuanza muda, kuanza eneo, wakati wa mwisho, mwisho eneo, nauli, na ncha (kama ncha zililipwa kwa kadi ya mikopo). Kwa jumla, data Farber ya habari zilizomo katika takriban milioni 900 safari zilizochukuliwa wakati wa takriban milioni 40 mabadiliko (kuhama ni takribani kazi ya siku moja kwa ajili ya dereva mmoja). Kwa kweli, kulikuwa na data sana, kwamba Farber tu kutumika sampuli ya majaribio ya ni kwa ajili ya uchambuzi wake. Kwa kutumia hii mita teksi data, Farber iligundua kuwa madereva wengi kazi zaidi kwa siku kadhaa wakati mishahara ni ya juu, sambamba na nadharia ya urasimimpya. Mbali na kutafuta hii kuu, Farber alikuwa na uwezo wa kujiinua ukubwa wa data kwa uelewa mzuri wa utofauti na mienendo. Farber iligundua kuwa baada ya muda madereva karibu zaidi hatua kwa hatua kujifunza kufanya kazi masaa zaidi juu ya siku ya juu mshahara (kwa mfano, wanajifunza kuishi kama mifano ya neoclassical anahisi). Na, madereva wapya ambao kuishi zaidi kama watu wa kipato Lengo ni zaidi kujiondoa kuwa dereva wa teksi. Wote hawa matokeo mwerevu, ambayo kusaidia kueleza tabia aliona ya madereva wa sasa, ikiwezekana tu kwa sababu ya ukubwa wa data. Wao ingekuwa vigumu kuchunguza katika masomo ya awali kwamba kutumika shuka karatasi safari kutoka idadi ndogo ya madereva wa teksi zaidi ya kipindi cha muda mfupi (kwa mfano, Camerer et al. (1997) ).

utafiti Farber aliitwa karibu na bora kesi kwa ajili ya utafiti kwa kutumia data kubwa. Kwanza, data hawakuwa zisizo mwakilishi kwa sababu mji required madereva kutumia mita digital. Na, data hawakuwa haujakamilika kwa sababu data kwamba zilikusanywa na mji ilikuwa pretty karibu na data kwamba Farber ingekuwa zilizokusanywa kama alikuwa chaguo (tofauti moja ni kwamba Farber ingekuwa data alitaka juu ya jumla ya mishahara-nauli pamoja tips- lakini data mji pamoja na tu tips kulipwa kwa kadi). muhimu kwa utafiti Farber ilikuwa kuchanganya swali mzuri na data nzuri. data peke yake hazitoshi.