2.4.1.1出租車在紐約市

一位研究人員使用從出租車米的大數據研究紐約出租車司機的決策。這些數據是非常適合這項研究。

計算正確的事情的簡單的電源的一個例子來自亨利·法伯的(2015)紐約市出租車司機的行為研究。雖然這組可能不健全固有有趣的是一個戰略研究網站測試中勞動經濟學兩個相互競爭的理論。對於法伯的研究而言,大約有出租車司機的工作環境兩個重要特徵:1)他們的小時工資從一天到一天,部分基於如天氣因素波動和2)他們的工作小時數可基於駕駛員的決定每天波動。這些特點導致對工作每小時工資和工作時間之間的關係一個有趣的問題。在新古典經濟學模型預測認為,的士司機工作更上幾天,他們有更高的計時工資。或者,從行為經濟學模型預測完全相反。如果驅動程序設置一個特定的收益目標,比如說$ 100天工作,直到目標被滿足,則驅動程序最終會天,他們賺取更多的工作時間少。例如,如果你是一個目標收入來源,你可能最終在一個好日子(每小時$ 25)和一個糟糕的一天(每小時$ 20)5.小時的工作4小時。那麼,司機工作時間上具有較高的小時工資(由新古典模型預測)以上小時較低的小時工資日天(由行為經濟學模型作為預測的)?

要回答這個問題,法伯獲得從2009年採取的紐約市出租車每輛出租車之旅的數據- 2013年,是目前數據公開發布 。此數據這是由這個城市需要出租車電子儀表收集的使用,包括幾件每次出行信息:開始時間,起始地點,結束時間,結束位置,票價和小費(如果提示用支付信用卡)。總之,法伯的數據包含在中約4000萬班次採取了約900萬人次的信息(換檔大約是一天的一個驅動程序的工作)。事實上,有這麼多的數據,該法伯只用它的一個隨機抽樣進行他的分析。使用該出租車計價器的數據,法伯發現,大多數司機的工作更多的日子,工資上漲,新古典主義的理論相一致。除了這個主要發現,法伯能夠利用數據的大小,以便更好地理解異質性和動態。法伯發現,隨著時間的推移更新的驅動程序逐漸學會工作高工資的日子更長時間(例如,他們學會做人為新古典模型預測)。而且,新的驅動程序誰更像目標者更有可能戒菸是一個出租車司機。這兩個更細微的發現,這些發現有助於解釋電流驅動器觀察到的行為,只是可能的,因為數據集的大小。他們就不可能在早期研究中,超過一個短的時間週期(例如,廢紙跳閘片從少數的出租車司機,以檢測Camerer et al. (1997)

法伯的研究是接近最好的情況,使用大數據的研究。首先,由於城市所需的驅動程序使用數字電錶的數據不是不具有代表性。而且,數據不完整的,因為這是由城市收集的數據是相當接近,如果他有選擇法伯將收集到的數據(一個區別是,法伯會對工資總額,票價加tips-想數據但城市的數據只包括通過信用卡支付的小費)。以法伯的研究,關鍵是結合良好的數據一個很好的問題。單獨的數據是不夠的。