2.4.3.2匹配

匹配通过切削的情况下创造公平的比较。

公平的比较可以来自随机对照实验或自然实验。但是,有,你不能运行理想实验和性质并没有提供一个自然实验很多情况下。在这些情况下,最好的办法创造一个公平的比较是匹配 。在匹配时,研究人员通过查找非实验数据来创建对人的不同之处在于一个人受到的待遇是类似的,一个也没有。在匹配过程中,研究人员居然还修剪 ;也就是说,丢弃在没有明显的比较情况。因此,这种方法会更准确地称为匹配和修剪,但我会与传统的长期坚持:匹配。

匹配进行大规模的非实验数据源的战略力量的一个美丽的例子来自对丽然Einav和同事们的消费行为研究(2015) 。 Einav和他的同事有兴趣发生在eBay上拍卖,并在描述他们的工作,我会专注于一个特定的方面:拍卖起拍价拍卖的结果,如销售价格或销售的可能性的效果。

最天真的方式来回答关于销售价格起始价的影响的问题是简单地计算出最终价格与不同的起始价格拍卖。这种方法就可以了,如果你只是想预测已经被提上易趣与给定的起拍价定项目的销售价格。但是,如果你的问题是什么是对市场结果的起拍价这种方法,因为它不是基于公平比较,将无法正常工作的效果 ;与较低的起始价格拍卖可能会从更高的起点价格(例如,它们可能是不同类型的商品,包括不同类型的卖家)拍卖完全不同。

如果你已经担心使得公平的比较,你可能会跳过天真的方法,并考虑运行现场实验,你会卖的特定项目,比如说,一个高尔夫俱乐部以一组固定的拍卖参数,比如说,免费送货,拍卖开了两个星期,等,但随机设定起始价格。通过比较产生的市场结果,这一领域的实验将提供关于销售价格起始价的效果非常明显的测量。但是,这种测量只适用于一个特定的产品和设置的拍卖参数。结果可能是不同的,例如,对于不同类型的产品。如果没有强有力的理论,很难从这个单一实验中,可能已经在运行全方位的实验可能推断。此外,现场实验足够昂贵,这将是不可行的运行它们的足够高达覆盖产品和拍卖类型整个参数空间。

与此相反的天真的方法和实验方法,Einav和同事采取了第三种方法:匹配。他们的战略的主要伎俩是发现的东西类似于已经发生在eBay上现场实验。例如,图2.6显示了一些完全相同的高尔夫俱乐部一个泰勒梅燃烧09驱动被完全一样出卖人“budgetgolfer”出售的31房源。然而,这些上市略有不同的特点。他们中的十一个提供为$ 124.99的固定价格的驱动程序,而其他20是具有不同的结束日期的拍卖。此外,上市有不同的运费,无论是$ 7.99或$ 9.99换句话说,这是因为如果“budgetgolfer”运行为研究者实验。

泰勒梅燃烧器09驱动的列表被“budgetgolfer”出售的一组匹配列表,其中完全相同的项目是由完全相同的卖方售出的但具有略微不同特性的每个时间的一个例子。易趣的海量日志中有数以百计十万几百万,涉及房源匹配套。因此,而不是比较的最终价格为给定的起拍价内的所有拍卖,Einav和他的同事做匹配集内的比较。为了结果从这些数十万匹配套内的比较结合,Einav和同事重新表达的起始价格和最终价格中的每一项(例如,它的平均销售价格)的基准值的角度。例如,如果泰勒梅燃烧09驱动器具有100 $的参考值(根据其销售),那么$ 10起拍价将被表示为0.1和$ 120最终价格将被表示为1.2。

图2.6:一套匹配的例子。这是完全相同的人(budgetgolfer)正在出售完全相同的高尔夫俱乐部(一泰勒梅燃烧09驱动程序),但这些交易进行不同条件(例如,不同的起始价)。图从Einav等服用。 (2015)。

图2.6:一套匹配的例子。这是完全相同的人(“budgetgolfer”)正在出售完全相同的高尔夫俱乐部(一泰勒梅燃烧09驱动程序),但这些交易进行不同条件(例如,不同的起始价)。图取自Einav et al. (2015)

回想一下,Einav和他的同事有兴趣启动价格对拍卖结果的影响。首先,使用线性回归他们估计更高的起点价格降低销售的可能性,以及更高的起点价格上涨的最终销售价格,对销售产生的条件。由自己,这些估计,这是平均的所有产品,并承担起拍价和最终的线性关系的结果,是不是所有的有趣。但是,Einav和他的同事也使用其数据的海量规模估算各种更微妙的发现。首先,Einav和他的同事做这些估计分别制定不同的价格的项目,不使用线性回归。他们发现,尽管开始价格和概率的销售之间的关系是线性的,起始价格和销售价格之间的关系是清楚的非线性(图2.7)。特别是,对于在0.05和0.85之间开始价格,起始价格对销售价格,这是完成错过了假定的线性关系,该分析的发现非常小的影响。

图2.7:关系起拍价和概率销售(左图)和销售价格(右图)之间。有大致起始价格和销售的概率之间的线性关系,但有起始价格和销售价格之间的非线性关系;为0.05和0.85之间的起步价,起步价对销售价格的影响非常小。在这两种情况下,该关系基本上是独立项目的价值。这些图重现图4a和4b Einav等。 (2015)。

图2.7:关系起拍价和概率销售(左图)和销售价格(右图)之间。有大致起始价格和销售的概率之间的线性关系,但有起始价格和销售价格之间的非线性关系;为0.05和0.85之间的起步价,起步价对销售价格的影响非常小。在这两种情况下,该关系基本上是独立项目的价值。这些图重现图4a和4b Einav et al. (2015)

其次,而不是平均超过所有项目,Einav和他的同事也使用其数据的大规模估计起拍价为23种不同类别的项目(例如,宠物用品,电子产品,和体育纪念品)(图2.8)的影响。这些估算表明,比较有特色的项目,如纪念品启动价格对销售的可能性和最终销售价格影响较大影响较小。此外,对于更商品化的项目,如DVD和视频的起始价格对最终价格几乎没有影响。换句话说,结合的结果,从23个不同的类别项的平均隐藏有关这些项目之间的差异的重要信息。

图2.8:研究结果表明,从每个类别分别估计;在估计所有类别的实心点集中在一起,表11(Einav等。2015年,表11)。这些估算表明,比较有特色的项目,如纪念品,启动价格对销售(X轴)和最终的销售价格(Y轴)更大影响的可能性更小的效果。

图2.8:研究结果表明,从每个类别分别估计;在估计汇集起来的所有类别的实心圆点(Einav et al. 2015, Table 11)这些估算表明,比较有特色的项目,如纪念品,启动价格对销售(X轴)和最终的销售价格(Y轴)更大影响的可能性更小的效果。

即使你是不是在eBay拍卖特别感兴趣,你不得不佩服该图2.7和图2.8提供了更丰富的理解易趣的不是简单的线性回归估计假设的线性关系,并结合许多不同类别项目的方式。这些更微妙的估计表明在海量数据匹配的权力;这些估计将没有数量庞大的田间试验,这将是昂贵是不可能的。

当然,我们应该有任何特别的匹配研究的结果缺乏信心比我们会在一个可比的实验结果。当评估来自任何匹配研究的结果,有两个重要的关切。首先,我们要记住,我们只能确保被用于匹配事情公平的比较。在他们的主要结果,Einav和他的同事没有精确匹配的四个特点:卖家ID号,项目类别,项目标题和字幕。如果项目是在不用于匹配的方式,这可能会造成不公平的比较不同。例如,如果“budgetgolfer”冬天调低泰勒梅燃烧09驱动程序的价格(当高尔夫俱乐部是不太受欢迎的),那么它可能出现的较低的起始价格上涨导致更低的最终价格,而事实上,这将是季节性的神器需求的变化。在一般情况下,对这个问题的最佳方法似乎试图许多不同种类的匹配。例如,Einav和同事重复他们的分析,其中匹配集包括在一年内出售的物品,在一个月内,以及同时。使得时间窗更紧减小匹配组的数量,但会降低约季节变化的担忧。幸运的是,他们发现的结果是受这些变化的匹配标准不变。在匹配文献中,这种关注在观测不可观察的角度通常表示,但关键的想法是真的,研究人员只建立在匹配使用的功能比较公平。

解释匹配的结果,当第二个主要的担心是,它们只适用于匹配的数据;它们并不适用于不能匹配的情况。例如,通过他们的研究限制于有多个列表Einav和同事们正专注于专业和半专业卖家的物品。因此,解释这些比较时,我们必须记住,它们只适用于易趣的子集。

匹配是在大型数据集中寻找公平的比较强大的战略。对许多社会科学家,匹配感觉就像第二个最好的实验,但是这是一种信念,应予以修订,略有下降。匹配海量数据可能比少数田间试验时更好:1)影响的异质性是很重要的; 2)有进行匹配良好的观测。表2.4提供了如何可以用大的数据源被用来匹配的一些其它实例。

表2.4:中使用匹配的数字轨迹中寻求公平的比较研究案例。
实质性重点 大数据源 引文
对警察暴力枪击事件的影响 停止和搜身记录 Legewie (2016)
2001年9月11日,对家庭和邻居的影响 投票记录和献血记录 Hersh (2013)
社会传染 通讯和产品的推广数据 Aral, Muchnik, and Sundararajan (2009)

总之,幼稚的方法来从非实验数据估计因果效应是危险的。然而,为了使因果估计沿着从最强到最弱的连续撒谎策略,研究人员可以发现在非实验数据比较公平。永远在线,大数据系统的发展增强了我们有效地利用现有的两个方法的能力:自然实验和匹配。