2.4.3.2 Matching

Адпаведныя стварыць справядлівыя параўнання абразаючы прэч выпадкаў.

Кірмаш параўнання можа прыйсці небудзь з рандомізірованный кантраляваных эксперыментаў або натуральных эксперыментаў. Але, ёсць шмат сітуацый, калі вы не можаце запусціць ідэальны эксперымент і прырода не прадаставіў натуральны эксперымент. У гэтых умовах, лепшы спосаб стварыць справядлівае параўнанне адпаведнасці. У адпаведнасці, даследчык праглядае неэкспериментальных дадзеных для стварэння пары людзей, якія падобныя за выключэннем таго, што адзін атрымаў лячэнне, і ніхто не мае. У працэсе ўзгаднення, даследчыкі на самай справе таксама абразанне; гэта значыць, адкідаючы выпадкі, калі няма ніякіх відавочных параўнанне. Такім чынам, гэты метад будзе больш дакладна называецца супастаўленнем-і-абразанні, але я буду прытрымлівацца традыцыйнага тэрміна: ўзгадненне.

Выдатны прыклад сілы ўзгаднення стратэгіі з масіўнымі неэкспериментальных крыніцамі дадзеных адбываюцца з даследавання паводзінаў спажыўцоў з дапамогай Liran Эйнав і яго калегі (2015) . Эйнав і яго калегі былі зацікаўленыя ў аўкцыёнах, якія праходзяць на eBay, і ў апісанні сваёй працы, я спынюся на адным канкрэтным аспекце: эфект аўкцыёну стартавы кошт на вынікі, такія як кошт продажу або верагоднасці продажу аўкцыёну.

Самы наіўны спосаб адказаць на пытанне пра ўплыў стартавай цэны на кошт продажу было б проста вылічыць канчатковую цану для аўкцыёнаў з рознымі коштамі, якія пачынаюцца. Такі падыход быў бы добра, калі вы проста хочаце, каб прадказаць кошт продажу дадзенага пункта, які быў пастаўлены на eBay з зададзенай стартавым кошце. Але, калі ваш пытанне , што з'яўляецца следствам пачатковай цаны на рынкавых вынікаў такі падыход не будзе працаваць , паколькі ён не заснаваны на справядлівых параўнанняў; аўкцыёны з больш нізкімі цэнамі, якія пачынаюцца можа моцна адрознівацца ад аўкцыёнаў з больш высокімі коштамі, якія пачынаюцца (напрыклад, яны могуць быць для розных відаў тавараў або ўключаць у сябе розныя тыпы прадаўцоў).

Калі вы ўжо занепакоеныя зрабіць справядлівыя параўнання, вы можаце прапусціць наіўны падыход і разгледзець магчымасць запуску палявой эксперымент, у якім вы б прадаць канкрэтны пункт, скажам, гольф-клуб-з фіксаваным наборам аўкцыённых параметраў, скажам, бясплатная дастаўка, аўкцыён адкрыты на працягу двух тыдняў, і г.д., але з адвольна ўсталёўваць стартавыя цэны. Параўноўваючы атрыманыя вынікі на рынку, гэта палявой эксперымент будзе прапаноўваць вельмі дакладнае вымярэнне ўплыву пачатковай цаны на кошт продажу. Але гэта вымярэнне будзе прымяняцца толькі да аднаго канкрэтнаму прадукту і набор параметраў аўкцыёну. Вынікі могуць быць рознымі, напрыклад, для розных відаў прадукцыі. Без моцнай тэорыі, цяжка экстрапаляваць з гэтага аднаго эксперыменту поўны спектр магчымых эксперыментаў, якія маглі б працаваць. Акрамя таго, палявыя эксперыменты з'яўляюцца досыць дарагімі, што было б няажыццяўляльна запусціць іх у дастатковай колькасці, каб прыкрыць увесь прастору параметраў прадуктаў і тыпаў аўкцыёнаў.

У адрозненне ад простай падыход і эксперыментальны падыход, Эйнав і яго калегі прымаюць трэці падыход: супастаўленне. Асноўная хітрасць іх стратэгіі заключаецца ў тым, каб выявіць рэчы, падобныя на палявых эксперыментаў, якія ўжо адбыліся на eBay. Напрыклад, на малюнку 2.6 паказаны некаторыя з 31 спісаў для сапраўды такі ж гольф-клуб-A Taylormade гарэлкі 09 Драйвер прадаюцца сапраўды такім жа "budgetgolfer продавцом-». Тым не менш, гэтыя спісы маюць крыху розныя характарыстыкі. Адзінаццаць з іх прапаноўваюць кіроўцу для фіксаванай цане $ 124,99, у той час як астатнія 20 аўкцыёнаў з рознымі датамі канца. Акрамя таго, спісы маюць розныя зборы дастаўкі, альбо $ 7.99 або $ 9.99. Іншымі словамі, гэта як быццам "budgetgolfer" працуе эксперыменты для даследчыкаў.

Прапановы аб Taylormade гарэлкі 09 драйвера прадаюцца "budgetgolfer" з'яўляюцца адным з прыкладаў ўзгодненага набору спісаў, дзе дакладна такі ж элемент прадаюцца сапраўды такі ж тавар, але кожны раз з некалькі іншымі характарыстыкамі. У масіўных бярвення eBay ёсць літаральна сотні тысяч падабраных набораў, якія ўключаюць мільёны спісаў. Такім чынам, замест таго, каб параўноўваць канчатковую цану для ўсіх аўкцыёнаў у рамках дадзенай стартавым кошце, Эйнав і яго калегі робяць параўнання ў рамках ўзгодненых набораў. Для таго, каб аб'яднаць вынікі ад параўнанняў у межах гэтых сотняў тысяч падабраных набораў, Эйнав і яго калегі зноў выказаць стартавую цану і канчатковую цану з пункту гледжання эталоннага значэння кожнага элемента (напрыклад, яго сярэдняя цана продажу). Напрыклад, калі Taylormade гарэлкі 09 Драйвер мае апорнае значэнне $ 100 (на аснове яе продажаў), то стартавы кошт $ 10 будзе выяўляцца як 0.1 і канчатковая цана $ 120 будзе выяўляцца ў 1.2.

Малюнак 2.6: Прыклад ўзгодненага набору. Гэта сапраўды такі ж гольф-клуб (а Taylormade гарэлкі 09 Driver) прадаюцца сапраўды такі ж чалавек (budgetgolfer), але некаторыя з гэтых продажаў былі выкананы розныя ўмовы (напрыклад, розныя стартавыя цэны). Малюнак узяты з Эйнав і соавт. (2015).

Малюнак 2.6: Прыклад ўзгодненага набору. Гэта сапраўды такі ж гольф-клуб (а Taylormade гарэлкі 09 Driver) прадаюцца дакладна тым жа чалавекам ( "budgetgolfer"), але некаторыя з гэтых продажаў былі выкананы розныя ўмовы (напрыклад, розныя стартавыя цэны). Малюнак узяты з Einav et al. (2015) і Einav et al. (2015) .

Нагадаем, што Эйнав і яго калегі былі зацікаўленыя ў эфекце стартавы кошт на вынікі аўкцыёну. Па-першае, з дапамогай лінейнай рэгрэсіі па іх ацэнках, больш высокія цэны на стартавыя паменшыць верагоднасць продажу, і што больш высокія цэны на стартавыя павялічваюць канчатковую цану продажу, ўмоўнае на продаж адбываецца. Самі па сабе гэтыя ацэнкі, якія-асераднёныя ўсе прадукты і мяркуюць лінейную залежнасць паміж пачатковай цаной і канчатковыя вынікі, не ўсё, што цікава. Але, Эйнав і яго калегі таксама выкарыстоўваць масіўны памер сваіх дадзеных, каб ацаніць разнастайнасць больш тонкіх высноў. Па-першае, Эйнав і яго калегі зрабілі гэтыя ацэнкі асобна для найменняў розных коштаў і без выкарыстання лінейнай рэгрэсіі. Яны выявілі, што ў той час як суадносіны паміж коштам і пачатковай верагоднасцю продажу лінейная, суадносіны паміж пачатковай цаной продажу і цаной відавочна нелінейных (мал 2.7). У прыватнасці, для пачатку кошты ў дыяпазоне ад 0,05 да 0,85, стартавы кошт мае вельмі нязначнае ўплыў на кошт продажу, знаходжання, якая была завершана прапусцілі ў аналізе, які мяркуецца лінейная залежнасць.

Малюнак 2.7: Сувязь паміж аўкцыёну стартавы кошт і верагоднасць продажу (левая панэль) і цаной продажу (правая панэль). Існуе прыкладна лінейная залежнасць паміж цаной пачатку і верагоднасць продажу, але ёсць нелінейнае суадносіны паміж коштам і пачатковай цаной продажу; для пачатку кошты ў дыяпазоне ад 0,05 да 0,85, стартавы кошт мае вельмі нязначнае ўплыў на кошт продажу. У абодвух выпадках адносіны ў асноўным залежыць ад кошту тавару. Гэтыя графікі прайграваюць Фиг.4А і 4В Эйнав і соавт. (2015).

Малюнак 2.7: Сувязь паміж аўкцыёну стартавы кошт і верагоднасць продажу (левая панэль) і цаной продажу (правая панэль). Існуе прыкладна лінейная залежнасць паміж цаной пачатку і верагоднасць продажу, але ёсць нелінейнае суадносіны паміж коштам і пачатковай цаной продажу; для пачатку кошты ў дыяпазоне ад 0,05 да 0,85, стартавы кошт мае вельмі нязначнае ўплыў на кошт продажу. У абодвух выпадках адносіны ў асноўным залежыць ад кошту тавару. Гэтыя графікі прайграваюць Фиг.4А і 4В Einav et al. (2015) і Einav et al. (2015) .

Па-другое, замест асерадненні па ўсіх пунктаў, Эйнав і яго калегі таксама выкарыстоўваць масавы маштаб сваіх дадзеных, каб ацаніць уплыў пачатковай цаны на 23 розных катэгорый прадметаў (напрыклад, тавараў для хатніх жывёл, электронікі і спартыўных памятных рэчаў) (Малюнак 2.8). Гэтыя ацэнкі паказваюць, што для больш адметных элементаў, такіх, як кошт памятных рэчаў старту мае меншы ўплыў на верагоднасць продажу і большы ўплыў на канчатковую цану продажу. Акрамя таго, для больш коммодифицированной элементы, такія як DVD-дыскі і відэа-стартавы кошт практычна не аказвае ўплыву на канчатковую цану. Іншымі словамі, у сярэднім, што спалучае ў сабе вынікі з 23 розных катэгорый прадметаў хавае важную інфармацыю пра адрозненні паміж гэтымі прадметамі.

Малюнак 2.8: Вынікі паказалі ацэнкі з кожнай катэгорыі паасобку; цвёрдая кропка ў ацэнцы для ўсіх катэгорый аб'яднаныя разам, Табліца 11 (Эйнав і інш. 2015, табліца 11). Гэтыя ацэнкі паказваюць, што для больш адметных элементаў, такіх як памятныя рэчы, стартавая цана мае меншы ўплыў на верагоднасць продажу (вось х) і большы ўплыў на канчатковую цану продажу (вось).

Малюнак 2.8: Вынікі паказалі ацэнкі з кожнай катэгорыі паасобку; цвёрдая кропка ў ацэнцы для ўсіх катэгорый аб'яднаных разам (Einav et al. 2015, Table 11) і (Einav et al. 2015, Table 11) . Гэтыя ацэнкі паказваюць, што для больш адметных элементаў, такіх як памятныя рэчы, стартавая цана мае меншы ўплыў на верагоднасць продажу (вось х) і большы ўплыў на канчатковую цану продажу (вось).

Нават калі вы не асабліва зацікаўлены ў аўкцыёнах на eBay, вы павінны захапляцца такім чынам, што Малюнак 2.7 і Малюнак 2.8 прапануюць багацей разумення eBay, чым простыя ацэнкі лінейнай рэгрэсіі, якія бяруць на сябе лінейныя адносіны і спалучаюць у сабе мноства розных катэгорый элементаў. Гэтыя больш тонкія ацэнкі ілюструюць сілу адпаведнасці ў масіўных даных; гэтыя ацэнкі былі б немагчымыя без вялікай колькасці палявых эксперыментаў, якая была б занадта дорага.

Вядома, мы павінны мець менш упэўненасці ў выніках якога-небудзь канкрэтнага даследавання адпаведнасці, чым мы былі б у выніках супастаўнага эксперыменту. Пры ацэнцы вынікаў з любога згодай даследаванні, ёсць дзве важныя праблемы. Па-першае, мы павінны памятаць, што мы можам толькі забяспечыць справядлівыя параўнання на рэчы, якія былі выкарыстаныя для параўнання. У іх асноўныя вынікі, Эйнав і яго калегі так і дакладнае адпаведнасць на чатыры характарыстыкі: прадавец ідэнтыфікацыйны нумар, катэгорыі тавару, назва пункта, і субтытраў. Калі элементы былі рознымі спосабамі, якія не былі выкарыстаныя для супастаўлення, якія маглі б стварыць несправядлівае параўнанне. Напрыклад, калі "budgetgolfer" знізіў цэны на Taylormade гарэлкі 09 Driver ў зімовы перыяд (калі гольф-клубы менш папулярныя), то гэта можа здацца, што больш нізкія цэны на стартавыя прыводзяць да зніжэння канчатковых цэн, калі на самай справе гэта было б артэфакт сезоннага змяненне попыту. Увогуле, лепшы падыход да гэтай праблемы, здаецца, спрабуе шмат розных відаў адпаведнасці. Напрыклад, Эйнав і яго калегі паўтараюць іх аналіз, дзе якая супадае наборы былі ўключаны пункты продажу на працягу аднаго года, на працягу аднаго месяца і адначасова. Стварэнне часовага акна тужэй памяншае колькасць падабраных набораў, але памяншае турботу з нагоды сезонных змяненняў. На шчасце, яны лічаць, што вынікі не змяняюцца гэтымі зменамі ў адпаведных крытэраў. У згодай літаратуры гэты тып турботы звычайна выяўляецца ў тэрмінах назіраных і ненаблюдаемых, але ключавая ідэя сапраўды , што даследчыкі ствараюць толькі справядлівыя параўнання пра асаблівасці якія выкарыстоўваюцца ў ўзгадненні.

Другі сур'ёзнай праблемай пры інтэрпрэтацыі адпаведных вынікаў з'яўляецца тое, што яны ўжываюцца толькі да супадальным дадзеных; яны не прымяняюцца да выпадкаў, якія не могуць быць узгоднены. Напрыклад, абмяжоўваючы свае даследаванні прадметаў, якія мелі некалькі спісаў Эйнав і яго калегі з акцэнтам на прафесійных і паўпрафесійных прадаўцоў. Такім чынам, пры інтэрпрэтацыі гэтых параўнанняў мы павінны памятаць, што яны ўжываюцца толькі да гэтага падмноства eBay.

Супадзенне гэта магутная стратэгія для знаходжання справядлівага параўнання ў вялікіх наборах дадзеных. Для многіх сацыёлагаў, ўзгадненне адчувае, як другі лепшы ў эксперыментах, але гэта перакананне, што трэба перагледзець, злёгку. Супадзенне ў масіўных дадзеных можа быць лепш, чым невялікі лік палявых эксперыментаў, калі: 1) гетэрагеннасць эфектаў мае важнае значэнне, і 2) існуюць добрыя назіранымі для параўнання. У табліцы 2.4 прадстаўлены некаторыя іншыя прыклады таго, як супастаўлення можа быць выкарыстаны з вялікімі крыніцамі дадзеных.

Табліца 2.4: Прыклады даследаванняў, якія выкарыстоўваюць супастаўлення, каб знайсці справядлівыя параўнання ў лічбавых слядоў.
Асноўная накіраванасць Вялікі крыніца дадзеных цытаванне
Ўплыў здымак на паліцэйскага гвалту Стоп-і-FRISK запісу Legewie (2016)
Эфект ад 11 верасня 2001 году на членаў сям'і і суседзяў запісу голасу і ахвяраваннях Hersh (2013)
сацыяльны заразы Сувязь і прыняцце прадукту дадзеных Aral, Muchnik, and Sundararajan (2009)

У заключэнне, наіўныя падыходы да ацэнкі прычынна-следчых эфектаў ад неэкспериментальных дадзеных небяспечныя. Тым не менш, стратэгіі для стварэння прычынных ацэнкі, якія ляжаць уздоўж кантынууму ад самага моцнага да самага слабога, і даследчыкі могуць выявіць справядлівыя параўнання ўнутры неэкспериментальных дадзеных. Рост заўсёды на, вялікіх сістэм дадзеных павялічвае нашу здольнасць эфектыўна выкарыстоўваць два існуючых метаду: натуральныя эксперыменты і ўзгадненне.