Mae ymchwilydd yn defnyddio data mawr o mesuryddion tacsis i astudio prosesau gwneud penderfyniadau o yrwyr tacsi yn Efrog Newydd. Mae'r data yn addas iawn ar gyfer yr ymchwil hon.
Un enghraifft o'r pŵer syml o gyfrif y peth iawn yn dod oddi wrth Henry Farber yn (2015) astudiaeth o ymddygiad gyrwyr tacsi Dinas Efrog Newydd. Er efallai na fydd y grŵp hwn yn swnio'n ddiddorol gynhenid mae'n safle ymchwil strategol ar gyfer profi dau damcaniaethau sy'n cystadlu mewn economeg llafur. At ddibenion ymchwil Farber yn, mae yna ddwy nodwedd bwysig am yr amgylchedd gwaith o yrwyr tacsi: 1) eu cyflog fesul awr yn amrywio o ddydd i ddydd, yn seiliedig yn rhannol ar ffactorau fel y tywydd a 2) y nifer o oriau maent yn gweithio gall amrywio bob dydd yn seiliedig ar y penderfyniadau y gyrrwr. Mae'r nodweddion hyn yn arwain at gwestiwn diddorol am y berthynas rhwng cyflogau ac oriau fesul awr a weithiwyd. modelau neo-glasurol mewn economeg yn rhagweld y byddai gyrwyr tacsi yn gweithio mwy ar ddiwrnodau lle mae ganddynt cyflogau uwch fesul awr. Fel arall, modelau o economeg ymddygiadol rhagweld yn union i'r gwrthwyneb. Os gyrwyr gosod incwm penodol darged-ddweud $ 100 y dydd-a gwaith hyd nes y targed yn cael ei fodloni, yna byddai gyrwyr yn y pen draw yn gweithio llai o oriau ar ddiwrnodau eu bod yn ennill mwy. Er enghraifft, os oeddech yn ennill cyflog targed, efallai y byddwch yn darfod i fyny yn gweithio 4 awr ar ddiwrnod da ($ 25 yr awr) a 5 awr ar ddiwrnod gwael ($ 20 yr awr). Felly, peidiwch gyrwyr yn gweithio mwy o oriau ar ddiwrnodau gyda chyflogau uwch fesul awr (fel y rhagwelwyd gan y modelau neo-glasurol) neu fwy o oriau ar ddyddiau gyda chyflogau is fesul awr (fel y rhagwelwyd gan fodelau economaidd ymddygiadol)?
Er mwyn ateb y cwestiwn hwn Farber a gafwyd data ar bob taith tacsi a gymerwyd gan cabiau Dinas Efrog newydd gan 2009 - 2013, data sydd bellach ar gael yn gyhoeddus . Mae'r data-a gafodd ei gasglu gan mesuryddion electronig y mae'r ddinas yn ofynnol tacsis i ddefnyddio-yn cynnwys sawl darn o wybodaeth ar gyfer pob taith: amser dechrau, dechrau lleoliad, amser diwedd, lleoliad diwedd, pris, a tip (os yw'r domen talwyd gyda cerdyn credyd). Yn gyfan gwbl, mae data Farber yn cynnwys gwybodaeth am oddeutu 900 miliwn o deithiau a dynnwyd yn ystod tua 40 miliwn o sifftiau (symudiad yn fras un diwrnod o waith ar gyfer un gyrrwr). Yn wir, roedd data cymaint, bod Farber ond yn defnyddio sampl ar hap o iddo am ei ddadansoddiad. Defnyddio'r data mesurydd tacsi, canfu Farber fod y rhan fwyaf o yrwyr yn gweithio mwy ar ddiwrnodau pan cyflogau yn uwch, yn gyson â'r ddamcaniaeth neo-glasurol. Yn ogystal â hyn prif ganfyddiad, Farber yn gallu trosoledd maint y data ar gyfer gwell dealltwriaeth o heterogenedd a deinameg. Canfu Farber dros amser yrwyr mwy newydd yn raddol yn dysgu i weithio mwy o oriau ar ddiwrnodau cyflog uchel (ee, maent yn dysgu i ymddwyn fel modelau neo-glasurol yn rhagweld). Ac, gyrwyr newydd sy'n ymddwyn yn fwy fel enillwyr targed yn fwy tebygol o roi'r gorau iddi fod yn yrrwr tacsi. Y ddau o'r rhain canfyddiadau mwy cynnil, sy'n helpu i esbonio ymddygiad a welwyd o yrwyr presennol, oedd ond yn bosibl oherwydd maint y set ddata. Byddent wedi bod yn amhosibl i ganfod mewn astudiaethau cynharach bod defnyddio taflenni taith papur o nifer fach o yrwyr tacsi dros gyfnod byr o amser (ee, Camerer et al. (1997) ).
Astudiaeth Farber yn agos at gorau ar-achos ar gyfer astudiaeth gan ddefnyddio data mawr. Yn gyntaf, nid yw'r data heb fod yn gynrychiolydd oherwydd bod y ddinas yn ofynnol gyrwyr i ddefnyddio mesuryddion digidol. Ac, nid yw'r data yn anghyflawn oherwydd bod y data a gasglwyd gan y ddinas yn eithaf agos at y data y byddai Farber wedi casglu pe bai wedi dewis (un gwahaniaeth yw y byddai Farber ddata eisiau ar gyfanswm cyflogau-prisiau a mwy tips- ond mae'r data ddinas yn unig yn cynnwys cynghorion talu â cherdyn credyd). Yr allwedd i ymchwil Farber yn cael ei gyfuno yn gwestiwn da gyda data da. Mae'r data ei ben ei hun yn ddigon.