A panalungtik dipaké data gedé ti taksi méter pikeun diajar kaputusan-pembuatan tina drivers taksi di New York. Data ieu ieu ogé cocog pikeun ieu panalungtikan.
Salah sahiji conto tina kakawasaan sederhana cacah hal katuhu asalna ti Henry Farber urang (2015) ulikan ngeunaan paripolah drivers taksi New York City. Sanajan ieu grup bisa jadi teu disada inherently metot eta situs panalungtikan strategis pikeun nguji dua téori competing di ékonomi tanaga gawé. Pikeun tujuan panalungtikan Farber urang, aya dua fitur penting ngeunaan lingkungan karya drivers taksi: 1) upah hourly maranéhanana fluctuates ti poé-ka poé, dumasar sabagian dina faktor kawas cuaca jeung 2) jumlah jam sabab tiasa dianggo bisa turun naek unggal poé dumasar kana kaputusan supir sacara. fitur ieu ngakibatkeun hiji Patarosan metot ngeunaan hubungan antara gajih hourly jeung jam digawé. model neoklasik di ékonomi ngaduga yén drivers taksi bakal digawe leuwih dina poé mana maranéhanana geus gajih hourly luhur. Alternatipna, model ti ékonomi behavioral ngaduga persis sabalikna. Lamun drivers nangtukeun hiji panghasilan husus target-ngomong $ 100 per poé-jeung karya nepi ka target anu papanggih, mangka drivers bakal mungkas nepi gawe jam pangsaeutikna dina poé nu sipatna earning deui. Contona, lamun éta earner target, Anjeun bisa ngeureunkeun nepi gawe 4 jam dina sapoé alus ($ 25 per jam) jeung 5 jam dina hiji poé bad ($ 20 per jam). Jadi, ulah drivers digawé leuwih jam dina poe jeung gajih luhur hourly (saperti diprediksi ku model neoklasik) atawa leuwih jam dina poe jeung gajih hourly handap (saperti diprediksi ku model ékonomi behavioral)?
Pikeun ngajawab pertanyaan ieu Farber dicandak data dina unggal lalampahan taksi dicokot ku cabs New York City ti 2009 - 2013, data anu ayeuna aya masarakat awam . data-nu ieu dikumpulkeun ku méter éléktronik anu kota merlukeun taksi ngagunakeun-ngawengku sababaraha lembar informasi keur unggal lalampahan: ngamimitian waktu, mimitian lokasi, waktu ahir, lokasi ahir, ongkos, sarta tip (upami tip ieu mayar jeung kartu kiridit). Dina total, data Farber urang dikandung informasi kurang 900 juta lalampahan dicokot salila kurang leuwih 40 juta shifts (shift nyaéta kasarna karya hiji poé pikeun hiji supir). Kanyataanna, aya jadi loba data, nu Farber ngan dipaké sampel random eta pikeun analisis-Na. Maké taksi meter data ieu, Farber manggihan yén paling drivers digawé leuwih dina poé lamun gajih anu luhur, konsisten jeung téori neoklasik. Salian Pananjung utama ieu, Farber ieu bisa ngungkit ukuran data keur pamahaman leuwih alus heterogeneity jeung dinamika. Farber manggihan yén kana waktu drivers anyar saeutik demi saeutik diajar digawé leuwih jam dina poe upah luhur (misalna, maranéhanana diajar kalakuanana salaku model neoklasik prédiksi). Jeung, drivers anyar anu kalakuanana leuwih kawas earners target nu leuwih gampang kaluar keur supir taksi. Boh ieu papanggihan leuwih halus, anu mantuan ngajelaskeun paripolah observasi tina drivers kiwari, éta ngan mungkin alatan ukuran dataset teh. Maranéhanana geus tangtu teu mungkin keur ngadeteksi di studi saméméhna anu dipaké kertas lalampahan cadar ti sajumlah leutik drivers taksi liwat hiji periode pondok waktu (misalna Camerer et al. (1997) ).
ulikan Farber sacara ieu deukeut ka-kasus pangalusna pikeun ulikan ngagunakeun data gedé. Kahiji, data éta teu non-wakil sabab kota diperlukeun drivers ngagunakeun méter digital. Jeung, data éta teu lengkep sabab data nu dikumpulkeun ku kota ieu geulis deukeut ka data nu Farber bakal dikumpulkeun lamun manéhna pilihan (hiji beda nyaeta Farber bakal mibanda data hayang dina total gajih-ongkosna ditambah tips- tapi data kota ngan kaasup tips dibayar ku kartu kiridit). Kenop panalungtikan Farber sacara ieu ngagabungkeun pertanyaan alus jeung data alus. Data sorangan teu cukup.