2.4.1.1 Таксі ў Нью - Ёрку

Даследчык выкарыстоўвалі вялікія дадзеныя ад лічыльнікаў таксі , каб вывучыць працэс прыняцця рашэнняў кіроўцаў таксі ў Нью - Ёрку. Гэтыя дадзеныя добра падыходзяць для гэтага даследавання.

Адным з прыкладаў простага падліку сілы правільна зыходзіць ад Генры Фарбэр (2015) даследаванні паводзін кіроўцаў Нью - Ёрка таксі. Хоць гэтая група не можа гучаць па сваёй сутнасці цікава гэта стратэгічны даследчы сайт для тэставання двух канкуруючых тэорый ў эканоміцы працы. Для мэт даследавання Фарбэр, ёсць дзве важныя асаблівасці аб рабочай асяроддзі кіроўцаў таксі: 1) іх пагадзіннай заработнай платы вагаецца ад з дня ў дзень, часткова на аснове такіх фактараў, як надвор'е і 2) колькасць гадзін, у якіх яны працуюць можа вагацца кожны дзень на падставе рашэнняў кіроўцы. Гэтыя асаблівасці прыводзяць да цікавых пытанне аб адносінах паміж пагадзіннай заработнай платы і адпрацаваных гадзін. Неакласічны мадэлі ў эканоміцы прагназуюць, што кіроўцы таксі будуць працаваць больш на тыя дні, калі яны маюць больш высокую пагадзінную заработную плату. У якасці альтэрнатывы, мадэлі ад паводніцкай эканомікі прадказаць з дакладнасцю да наадварот. Калі вадзіцелі устанавіць канкрэтны даход мэты, скажам, $ 100 у дзень, і працаваць, пакуль гэтая мэта не будзе дасягнутая, то вадзіцелі будуць у канчатковым выніку працаваць менш гадзін у тыя дні, што яны зарабляюць больш. Напрыклад, калі вы былі мішэнню здабытчыкам, вы можаце ў канчатковым выніку працуе 4 гадзіны ў добры дзень (25 $ у гадзіну) і 5-й гадзіне на дрэнны дзень ($ 20 у гадзіну). Так што, кіроўцы працуюць больш гадзін у дні з больш высокай пагадзіннай заработнай платы (паводле прагнозу неакласічнага мадэляў) або больш гадзін у дні з нізкім пагадзіннай заработнай платы (як і прадказвалі паводніцкіх эканамічных мадэляў)?

Каб адказаць на гэтае пытанне Фарбэр атрыманы дадзеныя аб кожнай паездцы на таксі , прынятых Нью - Ёрка кабінамі з 2009 - 2013 года , дадзеныя, якія ў цяперашні час у адкрытым доступе . Гэтыя дадзеныя, якая была сабрана з дапамогай электронных лічыльнікаў, што горад патрабуе таксі, каб выкарыстоўваць, уключае ў сябе некалькі элементаў інфармацыі для кожнай паездкі: час пачатку, пачаць месцазнаходжанне, час заканчэння, канчатковае месцазнаходжанне, транспартныя выдаткі і гасцінец (калі кончык была выплачана з крэдытная картка). У агульнай складанасці дадзеныя Фарбэр ўтрымлівала інфармацыю аб прыблізна 900 млн паездак, прынятых на працягу прыкладна 40 мільёнаў змен (зрух прыкладна аднаго дня працы для аднаго кіроўцы). На самай справе, там было так шмат дадзеных, што Фарбэр толькі выкарыстоўвалі выпадковую выбарку з яго для яго аналізу. Выкарыстоўваючы гэтыя дадзеныя таксі метр, Фарбэр выявілі, што большасць кіроўцаў працуюць больш на тыя дні, калі заработная плата вышэй, у адпаведнасці з неакласічнага тэорыяй. У дадатак да гэтага асноўная выснова, Фарбэр быў у стане выкарыстаць памер дадзеных для лепшага разумення неаднастайнасці і дынамікі. Фарбэр выявілі, што на працягу доўгага часу новыя драйверы паступова навучыцца працаваць больш гадзін на высокіх дзён заработнай платы (напрыклад, яны вучацца паводзіць сябе як Неакласічны мадэлі прадказвае). І, новыя драйверы, якія вядуць сябе больш як мэтавых здабытчыкаў, больш верагодна, перастаць быць кіроўцам таксі. Абодва гэтых больш тонкіх высноў, якія дапамагаюць растлумачыць назіранае паводзіны цяперашніх кіроўцаў, было магчыма толькі з-за памеру набору дадзеных. Яны б немагчыма выявіць у больш ранніх даследаваннях , якія выкарыстоўвалі паперу паездкі лістоў з невялікай колькасці вадзіцеляў таксі ў працягу кароткага перыяду часу (напрыклад, Camerer et al. (1997) і Camerer et al. (1997) ).

Даследаванне Фарбэр быў блізкі да лепшым выпадку для даследавання з выкарыстаннем вялікіх дадзеных. Па-першае, дадзеныя не былі нерепрезентативная, таму што горад патрабуецца кіроўцам выкарыстоўваць лічбавыя вымяральныя прыборы. І гэтыя дадзеныя не былі няпоўнымі, так як дадзеныя, якія былі сабраныя горада было даволі блізка да дадзеных, якія Фарбэр б сабралі, калі ў яго быў выбар (адна розніца ў тым, што Фарбэр б хацелі дадзеныя па агульнай сумы заработнай платы-тарыфах плюс tips- але дадзеныя горада ўключаны толькі парады, аплачаныя крэдытнай картай). Ключ да даследаванняў Фарбэр спалучаў добры пытанне з добрымі дадзенымі. Адных дадзеных недастаткова.