2.4.1.1 Teksi di New York City

Seorang penyelidik menggunakan data yang besar daripada meter teksi untuk belajar membuat keputusan pemandu teksi di New York. Data-data ini telah amat sesuai untuk kajian ini.

Satu contoh kuasa mudah untuk mengira perkara yang betul datang dari Henry Farber ini (2015) kajian tingkah laku New York City pemandu teksi. Walaupun kumpulan ini tidak mungkin bunyi memang menarik ia adalah sebuah laman web penyelidikan strategik untuk menguji dua teori bersaing dalam bidang ekonomi buruh. Bagi maksud penyelidikan Farber ini, terdapat dua ciri-ciri penting mengenai persekitaran kerja pemandu teksi: 1) upah setiap jam mereka turun naik dari hari ke hari, berdasarkan sebahagian faktor seperti cuaca dan 2) bilangan jam mereka bekerja boleh berubah-ubah setiap hari berdasarkan keputusan pemandu. Ciri-ciri ini membawa kepada satu persoalan yang menarik tentang hubungan antara upah dan jam bekerja. model neoklasik dalam bidang ekonomi meramalkan bahawa pemandu teksi akan bekerja lebih pada hari-hari di mana mereka mempunyai upah yang lebih tinggi. Sebagai alternatif, model dari ekonomi tingkah laku meramalkan sebaliknya. Jika pemandu menetapkan pendapatan tertentu sasaran mengatakan $ 100 setiap hari dan kerja sehingga sasaran yang dipenuhi, maka pemandu akan akan bekerja kurang jam pada hari bahawa mereka yang berpendapatan lebih. Sebagai contoh, jika anda adalah seorang sumber pendapatan sasaran, anda mungkin akan bekerja 4 jam pada hari yang baik ($ 25 sejam) dan jam 5 pada hari yang buruk ($ 20 sejam). Jadi, jangan pemandu bekerja lebih jam pada hari dengan gaji yang lebih tinggi setiap jam (seperti yang dijangkakan oleh model neoklasik) jam atau lebih pada hari dengan upah yang lebih rendah (seperti yang diramalkan oleh model ekonomi tingkah laku)?

Untuk menjawab soalan ini Farber diperolehi data pada setiap perjalanan teksi yang diambil oleh teksi New York City dari 2009 - 2013, data yang kini boleh didapati secara umum . data yang dikumpul oleh meter elektronik yang bandar memerlukan teksi untuk kegunaan ini-termasuk beberapa maklumat bagi setiap perjalanan: masa mula, mula lokasi, masa tamat, lokasi akhir, tambang, dan tip (jika hujung telah dibayar dengan kad kredit). Secara keseluruhan, data Farber yang terkandung maklumat mengenai kira-kira 900 juta perjalanan yang diambil semasa kira-kira 40 juta syif (peralihan adalah lebih kurang kerja satu hari untuk satu pemandu). Malah, terdapat begitu banyak data, yang Farber hanya menggunakan sampel rawak ia untuk analisis beliau. Menggunakan ini meter data teksi, Farber mendapati bahawa kebanyakan pemandu bekerja lebih pada hari-hari apabila gaji yang lebih tinggi, selaras dengan teori neoklasik. Selain dapatan utama ini, Farber dapat memanfaatkan saiz data untuk lebih memahami kepelbagaian dan dinamik. Farber mendapati bahawa lebih masa pemandu baru secara beransur-ansur belajar untuk bekerja lebih lanjut mengenai hari gaji tinggi (contoh, mereka belajar untuk bertindak sebagai model neoklasik meramalkan). Dan, pemandu baru yang berkelakuan lebih seperti golongan sasaran lebih cenderung untuk berhenti menjadi seorang pemandu teksi. Kedua-dua hasil yang lebih halus, yang membantu menjelaskan tingkah laku yang diperhatikan pemandu semasa, hanya mungkin kerana saiz set data. Mereka akan menjadi mustahil untuk mengesan dalam kajian awal yang digunakan lembaran perjalanan kertas dari sebilangan kecil pemandu teksi dalam tempoh yang singkat (contohnya, Camerer et al. (1997) ).

kajian Farber adalah berhampiran kes terbaik untuk kajian yang menggunakan data yang besar. Pertama, data tidak bukan wakil kerana bandar yang diperlukan pemandu untuk menggunakan meter digital. Dan, data tidak lengkap kerana data yang telah dikumpul oleh kota itu cukup dekat dengan data yang Farber akan dikumpulkan jika dia mempunyai pilihan (satu perbezaan adalah bahawa Farber akan mempunyai data mahukan pada jumlah upah-tambang ditambah tips- tetapi data bandar hanya termasuk tips dibayar dengan kad kredit). Kunci kepada penyelidikan Farber telah menggabungkan satu soalan yang baik dengan data yang baik. Data yang semata-mata tidak mencukupi.