Seorang peneliti menggunakan data besar dari taksi meter untuk mempelajari pengambilan keputusan dari sopir taksi di New York. Data ini baik cocok untuk penelitian ini.
Salah satu contoh dari kekuatan sederhana dari menghitung hal yang benar berasal dari Henry Farber (2015) studi tentang perilaku supir taksi New York City. Meskipun kelompok ini mungkin tidak terdengar inheren menarik itu adalah situs riset strategis untuk menguji dua teori yang bersaing di ekonomi tenaga kerja. Untuk keperluan penelitian Farber ini, ada dua fitur penting tentang lingkungan kerja sopir taksi: 1) upah per jam mereka berfluktuasi dari hari-hari, sebagian didasarkan pada faktor-faktor seperti cuaca dan 2) jumlah jam mereka bekerja dapat berfluktuasi setiap hari berdasarkan keputusan pengemudi. Fitur-fitur ini menyebabkan pertanyaan yang menarik tentang hubungan antara upah per jam dan jam kerja. model neoklasik ekonomi memprediksi bahwa sopir taksi akan bekerja lebih pada hari-hari di mana mereka memiliki upah per jam lebih tinggi. Atau, model dari perilaku ekonomi memprediksi justru sebaliknya. Jika driver menetapkan penghasilan tertentu target mengatakan $ 100 per hari-dan bekerja sampai target yang terpenuhi, maka driver akan berakhir bekerja jam lebih sedikit pada hari-hari yang mereka mendapatkan lebih. Misalnya, jika Anda adalah seorang pencari nafkah sasaran, Anda mungkin berakhir bekerja 4 jam pada hari yang baik ($ 25 per jam) dan 5 jam pada hari yang buruk ($ 20 per jam). Jadi, jangan driver bekerja lebih jam pada hari dengan upah yang lebih tinggi per jam (seperti yang diperkirakan oleh model neoklasik) jam atau lebih pada hari dengan upah per jam yang lebih rendah (seperti yang diperkirakan oleh model ekonomi perilaku)?
Untuk menjawab pertanyaan ini Farber diperoleh data pada setiap perjalanan taksi yang diambil oleh taksi New York City 2009 - 2013, data yang sekarang tersedia untuk umum . Data-yang ini dikumpulkan oleh meter elektronik bahwa kota membutuhkan taksi untuk menggunakan-termasuk beberapa potongan informasi untuk setiap perjalanan: waktu mulai, mulai lokasi, waktu akhir, lokasi akhir, tarif, dan tip (jika ujung dibayar dengan kartu kredit). Secara total, data yang Farber terkandung informasi di sekitar 900 juta perjalanan yang diambil selama sekitar 40 juta shift (pergeseran kira-kira pekerjaan satu hari untuk satu driver). Bahkan, ada begitu banyak data, yang Farber hanya menggunakan sampel acak untuk analisisnya. Menggunakan taksi meteran data ini, Farber menemukan bahwa sebagian besar driver bekerja lebih pada hari-hari ketika upah yang lebih tinggi, konsisten dengan teori neoklasik. Selain temuan utama ini, Farber mampu memanfaatkan ukuran data untuk pemahaman yang lebih baik dari heterogenitas dan dinamika. Farber menemukan bahwa dari waktu ke waktu driver baru secara bertahap belajar untuk bekerja lebih jam pada hari upah yang tinggi (misalnya, mereka belajar untuk berperilaku sebagai model neoklasik memprediksi). Dan, driver baru yang berperilaku lebih seperti penerima sasaran lebih mungkin untuk berhenti menjadi sopir taksi. Kedua temuan yang lebih halus, yang membantu menjelaskan perilaku yang diamati dari driver saat ini, hanya mungkin karena ukuran dataset. Mereka tidak mungkin untuk mendeteksi dalam studi sebelumnya yang menggunakan kertas perjalanan lembar dari sejumlah kecil sopir taksi selama periode waktu yang singkat (misalnya, Camerer et al. (1997) ).
Penelitian Farber adalah dekat dengan-kasus terbaik untuk studi menggunakan data besar. Pertama, data tidak non-representatif karena kota yang dibutuhkan driver untuk menggunakan meter digital. Dan, data tidak lengkap karena data yang dikumpulkan oleh kota itu cukup dekat dengan data yang Farber akan dikumpulkan jika ia punya pilihan (satu perbedaan adalah bahwa Farber akan memiliki data ingin total upah-tarif ditambah tips- namun data kota hanya termasuk kiat dibayar dengan kartu kredit). Kunci untuk penelitian Farber itu menggabungkan pertanyaan yang bagus dengan data yang baik. Data saja tidak cukup.