Ikertzaile batek big datuak erabiliko taxi metro taxi New York-en erabakiak hartzeko aukera aztertzeko. Datuok zen bai ikerketa honetan egokitzen.
Eskubidea gauza kontatuta boterea simple adibide Henry Farber dator (2015) New York City taxi-gidariak portaera azterketa. Baliteke talde honek ez du soinua berez interesgarria den arren estrategiko ikerketa bi lehian lan-ekonomiako teoriek probatzeko gune bat da. Farber ikerketa honen helburuak lortzeko, buruz lana taxi-gidariak ingurumena bi ezaugarri garrantzitsu daude: 1) bere hourly egun-eguneko, zati batean oinarritzen da eguraldi bezalako faktoreen batetik gorabeherak eta 2) egiten dute lan ordu kopurua egun bakoitzean aldaketarik oinarritzen gidariaren erabakiez. Ezaugarri horiek soldatak hourly eta orduz aritu arteko harremanari buruzko galdera interesgarri bat ekarriko. ekonomia ereduak Neoklasikoa iragartzea taxi gidarien gehiago lan litzateke egunetan non hourly soldata handiagoa dute. Bestela, jokabidearen ekonomia eredu aurreikusteko zehazki kontrakoa. gidariak ezarritako errenta jakin bat, helburu-esan $ 100 per day-eta lan helburu hori bete arte, orduan gidariak amaituko litzateke ordu gutxiago lan egunak direla gehiago irabazten. Esate baterako, helburu eta hartzaile bat izanez gero, agian amaituko duzu 4 ordu lan egun ona ($ 25 orduko) eta 5 ordu egun txarra ($ 20 orduko) an. Beraz, ez-gidariak lan ordu gehiago handiagorik hourly soldatak (iragarri du modelo neoklasikoak by bezala) edo ordu gehiago hourly soldata txikiagoa egun on, egun on (eredu ekonomiko jokabidearen aurreikusitakoa)?
Galdera honi erantzuteko Farber lortutako datuak taxi bidaia bakoitzean 2009tik New York City kabinen hartutako on - 2013, dira gaur egun datuak publikoki eskuragarri . Datu-zen metro elektronikoak hirian taxiak eskatzen duen ek jasotzen honek erabil-includes bidaia bakoitzeko informazioa hainbat pieza: hasteko ordua, hasteko kokapena, amaiera ordua, amaiera kokapena, tarifa, eta punta (punta batekin ordaindu zen bada kreditu txartela). Guztira, Farber datuak txandatan 40 milioi inguru zehar hartutako 900 milioi inguru bidaietan informazio jasotako (aldaketa bat da, gutxi gorabehera, egun bateko gidari bat lan). Izan ere, ez zen hainbeste datuak, Farber hori bakarrik erabiliko da ausazko lagin bat bere azterketa egiteko. hau taxi metro datuak erabiliz, Farber aurki gidariak gehien duten lan gehiago egunetan soldata handiagoa, teoria neoklasikoak koherentea. Aurkikuntza nagusiak horretaz gain, Farber datuen tamaina leverage heterogeneotasuna eta dinamika hobeto ulertzeko gai izan. Farber aurkitu duten denboran zehar berriagoak gidariak pixkanaka ikasten soldatapeko handiko egunetan, ordu gehiago lan egiteko (adibidez, eredu neoklasikoak iragartzen bezala portatzen ikasiko dute). Eta, gidariak new gehiago helburu langileak bezala jokatzen duten gehiago egongo dira, taxi-gidari bat izateaz irten. sotilagoak aurkikuntza hauek, ikusitako egungo gidariak portaera azaldu lagun horietatik Bai, izan ziren bakarrik posible delako multzoaren tamainaren. Dute izan ezinezkoa lehenago ikasketak erabiltzen duten paper bidaia-orriak taxi-gidariak kopuru txiki bat, denbora epe labur bat (adibidez, baino gehiago detektatzen Camerer et al. (1997) ).
Farber azterketa bat best-kasuan hurbil dagoen big datuak erabiliz azterketa bat izan zen. Lehenik eta behin, datuak ez ziren ez adierazgarri hiriko beharrezkoa delako gidariak metro digital erabili. Eta, datuak ez ziren osatu gabe dagoela zen hirian bildutako datuak nahiko duten Farber bildu nahi aukerarik balu datuak oso hurbil zegoelako (alde bat: Farber duten guztira soldatak-tarifak plus tips- on nahi datuen izango luke baina hiriaren datuak bakarrik sartzen kreditu txartelarekin ordaindu aholkuak). Farber ikerketa gakoa galdera ona datu onekin konbinatuz zen. Datuak bakarrik ez dira nahikoa.