Соответствующие создать справедливые сравнения обрезая прочь случаев.
Ярмарка сравнения может прийти либо из рандомизированных контролируемых экспериментов или естественных экспериментов. Но, есть много ситуаций, когда вы не можете запустить идеальный эксперимент и природа не предоставил естественный эксперимент. В этих условиях, лучший способ создать справедливое сравнение соответствия. В согласовании, исследователь просматривает неэкспериментальных данных для создания пары людей, которые похожи за исключением того, что один получил лечение, и никто не имеет. В процессе согласования, исследователи на самом деле также обрезку; то есть, отбрасывая случаи, когда нет никаких очевидных сравнение. Таким образом, этот метод будет более точно называется сопоставлением-и-обрезке, но я буду придерживаться традиционного термина: согласование.
Прекрасный пример силы согласования стратегии с массивными неэкспериментальных источниками данных происходят из исследования поведения потребителей с помощью Liran Эйнав и его коллеги (2015) . Эйнав и его коллеги были заинтересованы в аукционах, проходящих на eBay, и в описании своей работы, я остановлюсь на одном конкретном аспекте: эффект аукциона стартовая цена на результаты, такие как цена продажи или вероятности продажи аукциона.
Самый наивный способ ответить на вопрос о влиянии стартовой цены на цену продажи было бы просто вычислить окончательную цену для аукционов с разными ценами, начинающимися. Такой подход был бы хорошо, если вы просто хотите, чтобы предсказать цену продажи данного пункта, который был поставлен на eBay с заданной стартовой цене. Но, если ваш вопрос , что является следствием начальной цены на рыночных результатов такой подход не будет работать , поскольку он не основан на справедливых сравнений; аукционы с более низкими ценами, начинающимися может сильно отличаться от аукционов с более высокими ценами, начинающимися (например, они могут быть для разных видов товаров или включать в себя различные типы продавцов).
Если вы уже обеспокоены сделать справедливые сравнения, вы можете пропустить наивный подход и рассмотреть возможность запуска полевой эксперимент, в котором вы бы продать конкретный пункт, скажем, гольф-клуб-с фиксированным набором аукционных параметров, скажем, бесплатная доставка, аукцион открыт в течение двух недель, и т.д., но с произвольно устанавливать стартовые цены. Сравнивая полученные результаты на рынке, это полевой эксперимент будет предлагать очень четкое измерение влияния начальной цены на цену продажи. Но это измерение будет применяться только к одному конкретному продукту и набор параметров аукциона. Результаты могут быть разными, например, для различных видов продукции. Без сильной теории, трудно экстраполировать из этого одного эксперимента полный спектр возможных экспериментов, которые могли бы работать. Кроме того, полевые эксперименты являются достаточно дорогими, что было бы неосуществимо запустить их в достаточном количестве, чтобы прикрыть весь пространство параметров продуктов и типов аукционов.
В отличие от простой подход и экспериментальный подход, Эйнав и его коллеги принимают третий подход: сопоставление. Основная хитрость их стратегии заключается в том, чтобы обнаружить вещи, похожие на полевых экспериментов, которые уже произошли на eBay. Например, на рисунке 2.6 показаны некоторые из 31 списков для точно такой же гольф-клуб-A Taylormade горелки 09 Драйвер продаются точно таким же "budgetgolfer продавцом-». Тем не менее, эти списки имеют немного разные характеристики. Одиннадцать из них предлагают водителю для фиксированной цене $ 124,99, в то время как остальные 20 аукционов с разными датами конца. Кроме того, списки имеют различные сборы доставки, либо $ 7.99 или $ 9.99. Другими словами, это как будто "budgetgolfer" работает эксперименты для исследователей.
Предложения о Taylormade горелки 09 драйвера продаются "budgetgolfer" являются одним из примеров согласованного набора списков, где точно такой же элемент продаются точно такой же товар, но каждый раз с несколько иными характеристиками. В массивных бревен eBay есть буквально сотни тысяч подобранных наборов, включающих миллионы списков. Таким образом, вместо того, чтобы сравнивать окончательную цену для всех аукционов в рамках данной стартовой цене, Эйнав и его коллеги делают сравнения в рамках согласованных наборов. Для того, чтобы объединить результаты от сравнений в пределах этих сотен тысяч подобранных наборов, Эйнав и его коллеги вновь выразить стартовую цену и окончательную цену с точки зрения эталонного значения каждого элемента (например, его средняя цена продажи). Например, если Taylormade горелки 09 Драйвер имеет опорное значение $ 100 (на основе ее продаж), то стартовая цена $ 10 будет выражаться как 0.1 и окончательная цена $ 120 будет выражаться в 1.2.
Напомним, что Эйнав и его коллеги были заинтересованы в эффекте стартовая цена на результаты аукциона. Во-первых, с помощью линейной регрессии по их оценкам, более высокие цены на стартовые уменьшить вероятность продажи, и что более высокие цены на стартовые увеличивают конечную цену продажи, условное на продажу происходит. Сами по себе эти оценки, которые-усредненные все продукты и предполагают линейную зависимость между начальной ценой и конечные результаты, не все, что интересно. Но, Эйнав и его коллеги также использовать массивный размер своих данных, чтобы оценить разнообразие более тонких выводов. Во-первых, Эйнав и его коллеги сделали эти оценки отдельно для наименований различных цен и без использования линейной регрессии. Они обнаружили, что в то время как соотношение между ценой и начальной вероятностью продажи линейна, соотношение между начальной ценой продажи и ценой явно нелинейна (рис 2.7). В частности, для начала цены в диапазоне от 0,05 до 0,85, стартовая цена имеет очень незначительное влияние на цену продажи, нахождения, которая была завершена пропустили в анализе, который предполагается линейная зависимость.
Во-вторых, вместо усреднения по всем пунктов, Эйнав и его коллеги также использовать массовый масштаб своих данных, чтобы оценить влияние начальной цены на 23 различных категорий предметов (например, товаров для домашних животных, электроники и спортивных памятных вещей) (Рисунок 2.8). Эти оценки показывают, что для более отличительных элементов, таких, как цена памятных вещей старта имеет меньшее влияние на вероятность продажи и большее влияние на конечную цену продажи. Кроме того, для более коммодифицированной элементы, такие как DVD-диски и видео-стартовая цена практически не оказывает влияния на конечную цену. Другими словами, в среднем, что сочетает в себе результаты из 23 различных категорий предметов скрывает важную информацию о различиях между этими предметами.
Даже если вы не особенно заинтересованы в аукционах на eBay, вы должны восхищаться таким образом, что Рисунок 2.7 и Рисунок 2.8 предлагают богаче понимания eBay, чем простые оценки линейной регрессии, которые берут на себя линейные отношения и сочетают в себе множество различных категорий элементов. Эти более тонкие оценки иллюстрируют силу соответствия в массивных данных; эти оценки были бы невозможны без огромного числа полевых экспериментов, которая была бы слишком дорого.
Конечно, мы должны иметь меньше уверенности в результатах какого-либо конкретного исследования соответствия, чем мы были бы в результатах сопоставимого эксперимента. При оценке результатов из любого согласующего исследования, есть две важные проблемы. Во-первых, мы должны помнить, что мы можем только обеспечить справедливые сравнения на вещи, которые были использованы для сравнения. В их основные результаты, Эйнав и его коллеги так и точное соответствие на четыре характеристики: продавец идентификационный номер, категории товара, название пункта, и субтитров. Если элементы были разными способами, которые не были использованы для сопоставления, которые могли бы создать несправедливое сравнение. Например, если "budgetgolfer" снизил цены на Taylormade горелки 09 Driver в зимний период (когда гольф-клубы менее популярны), то это может показаться, что более низкие цены на стартовые приводят к снижению окончательных цен, когда на самом деле это было бы артефакт сезонного изменение спроса. В общем, лучший подход к этой проблеме, кажется, пытается много различных видов соответствия. Например, Эйнав и его коллеги повторяют их анализ, где совпадающая наборы были включены пункты продажи в течение одного года, в течение одного месяца и одновременно. Создание временного окна туже уменьшает количество подобранных наборов, но уменьшает беспокойство по поводу сезонных изменений. К счастью, они считают, что результаты не изменяются этими изменениями в соответствующих критериев. В согласующего литературе этот тип беспокойства обычно выражается в терминах наблюдаемых и ненаблюдаемых, но ключевая идея действительно , что исследователи создают только справедливые сравнения об особенностях используемых в согласовании.
Второй серьезной проблемой при интерпретации соответствующих результатов является то, что они применяются только к совпадающим данным; они не применяются к случаям, которые не могут быть согласованы. Например, ограничивая свои исследования предметов, которые имели несколько списков Эйнав и его коллеги с акцентом на профессиональных и полупрофессиональных продавцов. Таким образом, при интерпретации этих сравнений мы должны помнить, что они применяются только к этому подмножеству eBay.
Совпадение это мощная стратегия для нахождения справедливого сравнения в больших наборах данных. Для многих социологов, согласование чувствует, как второй лучший в экспериментах, но это убеждение, что следует пересмотреть, слегка. Совпадение в массивных данных может быть лучше, чем небольшое число полевых экспериментов, когда: 1) гетерогенность эффектов имеет важное значение, и 2) существуют хорошие наблюдаемыми для сравнения. В таблице 2.4 представлены некоторые другие примеры того, как сопоставления может быть использован с большими источниками данных.
Основная направленность | Большой источник данных | цитирование |
---|---|---|
Влияние съемок на полицейского насилия | Стоп-и-FRISK записи | Legewie (2016) |
Эффект от 11 сентября 2001 года на членов семьи и соседей | записи голоса и пожертвованиях | Hersh (2013) |
Социальный заразы | Связь и принятие продукта данных | Aral, Muchnik, and Sundararajan (2009) |
В заключение, наивные подходы к оценке причинно-следственных эффектов от неэкспериментальных данных опасны. Тем не менее, стратегии для создания причинных оценки, лежащие вдоль континуума от самого сильного до самого слабого, и исследователи могут обнаружить справедливые сравнения внутри неэкспериментальных данных. Рост всегда на, больших систем данных увеличивает нашу способность эффективно использовать два существующих метода: естественные эксперименты и согласование.