연구원은 뉴욕의 택시 운전사의 의사 결정을 연구하기 위해 택시 미터에서 빅 데이터를 사용했다. 이 데이터는 잘 연구에 적합했다.
옳은 일을 계산하는 간단한 전력의 한 예는 헨리 파버의에서 온다 (2015) 뉴욕시 택시 드라이버의 동작의 연구. 이 그룹은 본질적으로 흥미로운 소리하지 않을 수도 있지만 그것은 노동 경제학이 경쟁 이론을 테스트하기위한 전략적 연구 사이트입니다. 파버의 연구의 목적을 위해, 택시 드라이버의 작업 환경에 대한 두 가지 중요한 특징이 있습니다 : 1) 자신의 시간당 임금은 일상, 날씨 등의 요인에 부분적으로 기초에서 변동하고 작업 시간 2) 수 드라이버의 결정에 따라 매일 변동 할 수 있습니다. 이러한 기능은 근무 시간당 임금과 시간 사이의 관계에 대한 흥미로운 질문으로 이어집니다. 경제학 신고전주의 모델은 높은 시간당 임금이 어디 택시 드라이버가 일에 대한 일 것이라고 예측하고있다. 또한, 행동 경제학의 모델은 정확히 그 반대를 예측하고있다. 드라이버는 특정 소득으로 설정하면 100 $ 목표를-말을 하루-작업이 대상이 충족 될 때까지 다음 드라이버들이 더 많은 수입되는 일에 적은 근무 시간 끝날 것입니다. 당신이 목표 소득자 인 경우 예를 들어, 당신은 좋은 날 (시 건당 $ 25를)과 나쁜 일 (시간당 $ (20))에 5시간에 4 시간 작업을 끝낼 수 있습니다. (행동 경제 모델에 의해 예측으로) 그래서, 드라이버는 낮은 시간당 임금으로 일에 (신고 전파 모델에 의해 예측대로)보다 높은 시간당 임금 이상의 시간과 일에 더 많은 시간을 작동합니까?
2013 년 지금 데이터 -이 질문에 대답하기 위해 파버는 2009 년 뉴욕시 택시 취한 모든 택시 여행에 대한 데이터를 얻을 공개 . 팁이 함께 지급 된 경우 위치, 종료 시간, 종료 위치, 요금 및 팁 (시작, 시작 시간이 데이터 도시하는 택시 필요 전자 미터에 의해 수집 된 각 여행을위한 정보의 여러 조각을 사용하여이-포함 신용 카드). 총, 파버의 데이터는 (변화는 약 1 드라이버에 대한 일일의 일이다) 약 4000 만 이동 중에 찍은 약 900,000,000 여행에 대한 정보가 포함되어 있습니다. 사실, 파버는 자신의 분석을 위해 그것의 무작위 표본을 사용하는 것이, 너무 많은 데이터가 있었다. 이 택시 미터 데이터를 사용하여, 파버는 임금이 신고전주의 이론과 일치, 더 높은 경우 대부분의 드라이버는 일에 더 많은 작업을 한 것으로 나타났습니다. 이 메인 찾기 이외에, 파버은 이질 및 역학의 이해를위한 데이터의 크기를 이용할 수 있었다. 파버는 시간이 지남에 최신 드라이버가 점차 높은 임금의 일에 더 많은 시간 일을 배울 것을 발견 (예를들은 신고 전파 모델이 예측대로 작동하는 법을 배워야). 그리고, 더 많은 대상 근로자처럼 행동 새로운 드라이버는 택시 운전사 인 종료 가능성이 더 높습니다. 전류 드라이버의 관찰 동작을 설명하는데 도움이 미묘한 결과, 모두 때문에 데이터 세트의 크기 만이 가능 하였다. 그들은 짧은 기간 (예를 들면, 위에 택시 드라이버 소수의 용지 트립 시트를 사용한 이전 연구에서 검출 불가능했을 Camerer et al. (1997) ).
파버의 연구는 빅 데이터를 사용하여 연구를위한 최선의 경우에 가까웠다. 도시 디지털 미터를 사용하여 드라이버가 필요하므로 우선, 데이터는 비 대표 없었다. 시에서 수집 된 데이터를 자신이 선택의 여지가있는 경우 파버가 수집 한 것 데이터에 매우 가까이 있기 때문에, 데이터가 완전하지 않았다 (한 차이는 파버는 총 임금-요금 플러스 tips-에 원 데이터를해야한다는 것입니다 하지만 도시의 데이터는) 신용 카드로 지불 팁을 포함. 파버의 연구의 핵심은 좋은 데이터가있는 좋은 질문을 결합했다. 혼자 데이터는 충분하지 않습니다.