2.4.3.2匹配

匹配通過切削的情況下創造公平的比較。

公平的比較可以來自隨機對照實驗或自然實驗。但是,有,你不能運行理想實驗和性質並沒有提供一個自然實驗很多情況下。在這些情況 ​​下,最好的辦法創造一個公平的比較是匹配 。在匹配時,研究人員通過查找非實驗數據來創建對人的不同之處在於一個人受到的待遇是類似的,一個也沒有。在匹配過程中,研究人員居然還修剪 ;也就是說,丟棄在沒有明顯的比較情況。因此,這種方法會更準確地稱為匹配和修剪,但我會與傳統的長期堅持:匹配。

匹配進行大規模的非實驗數據源的戰略力量的一個美麗的例子來自對麗然Einav和同事們的消費行為研究(2015) 。 Einav和他的同事有興趣發生在eBay上拍賣,並在描述他們的工作,我會專注於一個特定的方面:拍賣起拍價拍賣的結果,如銷售價格或銷售的可能性的效果。

最天真的方式來回答關於銷售價格起始價的影響的問題是簡單地計算出最終價格與不同的起始價格拍賣。這種方法就可以了,如果你只是想預測已經被提上易趣與給定的起拍價定項目的銷售價格。但是,如果你的問題是什麼是對市場結果的起拍價這種方法,因為它不是基於公平比較,將無法正常工作的效果 ;與較低的起始價格拍賣可能會從更高的起點價格(例如,它們可能是不同類型的商品,包括不同類型的賣家)拍賣完全不同。

如果你已經擔心使得公平的比較,你可能會跳過天真的方法,並考慮運行現場實驗,你會賣的特定項目,比如說,一個高爾夫俱樂部以一組固定的拍賣參數,比如說,免費送貨,拍賣開了兩個星期,等,但隨機設定起始價格。通過比較產生的市場結果,這一領域的實驗將提供關於銷售價格起始價的效果非常明顯的測量。但是,這種測量只適用於一個特定的產品和設置的拍賣參數。結果可能是不同的,例如,對於不同類型的產品。如果沒有強有力的理論,很難從這個單一實驗中,可能已經在運行全方位的實驗可能推斷。此外,現場實驗足夠昂貴,這將是不可行的運行它們的足夠高達覆蓋產品和拍賣類型整個參數空間。

與此相反的天真的方法和實驗方法,Einav和同事採取了第三種方法:匹配。他們的戰略的主要伎倆是發現的東西類似於已經發生在eBay上現場實驗。例如,圖2.6顯示了一些完全相同的高爾夫俱樂部一個泰勒梅燃燒09驅動被完全一樣出賣人“budgetgolfer”出售的31房源。然而,這些上市略有不同的特點。他們中的十一個提供為$ 124.99的固定價格的驅動程序,而其他20是具有不同的結束日期的拍賣。此外,上市有不同的運費,無論是$ 7.99或$ 9.99換句話說,這是因為如果“budgetgolfer”運行為研究者實驗。

泰勒梅燃燒器09驅動的列表被“budgetgolfer”出售的一組匹配列表,其中完全相同的項目是由完全相同的賣方售出的但具有略微不同特性的每個時間的一個例子。易趣的海量日誌中有數以百計十萬幾百萬,涉及房源匹配套。因此,而不是比較的最終價格為給定的起拍價內的所有拍賣,Einav和他的同事做匹配集內的比較。為了結果從這些數十萬匹配套內的比較結合,Einav和同事重新表達的起始價格和最終價格中的每一項(例如,它的平均銷售價格)的基準值的角度。例如,如果泰勒梅燃燒09驅動器具有100 $的參考值(根據其銷售),那麼$ 10起拍價將被表示為0.1和$ 120最終價格將被表示為1.2。

圖2.6:一套匹配的例子。這是完全相同的人(budgetgolfer)正在出售完全相同的高爾夫俱樂部(一泰勒梅燃燒09驅動程序),但這些交易進行不同條件(例如,不同的起始價)。圖從Einav等服用。 (2015)。

圖2.6:一套匹配的例子。這是完全相同的人(“budgetgolfer”)正在出售完全相同的高爾夫俱樂部(一泰勒梅燃燒09驅動程序),但這些交易進行不同條件(例如,不同的起始價)。圖取自Einav et al. (2015)

回想一下,Einav和他的同事有興趣啟動價格對拍賣結果的影響。首先,使用線性回歸他們估計更高的起點價格降低銷售的可能性,以及更高的起點價格上漲的最終銷售價格,對銷售產生的條件。由自己,這些估計,這是平均的所有產品,並承擔起拍價和最終的線性關係的結果,是不是所有的有趣。但是,Einav和他的同事也使用其數據的海量規模估算各種更微妙的發現。首先,Einav和他的同事做這些估計分別制定不同的價格的項目,不使用線性回歸。他們發現,儘管開始價格和概率的銷售之間的關係是線性的,起始價格和銷售價格之間的關係是清楚的非線性(圖2.7)。特別是,對於在0.05和0.85之間開始價格,起始價格對銷售價格,這是完成錯過了假定的線性關係,該分析的發現非常小的影響。

圖2.7:關係起拍價和概率銷售(左圖)和銷售價格(右圖)之間。有大致起始價格和銷售的概率之間的線性關係,但有起始價格和銷售價格之間的非線性關係;為0.05和0.85之間的起步價,起步價對銷售價格的影響非常小。在這兩種情況下,該關係基本上是獨立項目的價值。這些圖重現圖4a和4b Einav等。 (2015)。

圖2.7:關係起拍價和概率銷售(左圖)和銷售價格(右圖)之間。有大致起始價格和銷售的概率之間的線性關係,但有起始價格和銷售價格之間的非線性關係;為0.05和0.85之間的起步價,起步價對銷售價格的影響非常小。在這兩種情況下,該關係基本上是獨立項目的價值。這些圖重現圖4a和4b Einav et al. (2015)

其次,而不是平均超過所有項目,Einav和他的同事也使用其數據的大規模估計起拍價為23種不同類別的項目(例如,寵物用品,電子產品,和體育紀念品)(圖2.8)的影響。這些估算表明,比較有特色的項目,如紀念品啟動價格對銷售的可能性和最終銷售價格影響較大影響較小。此外,對於更商品化的項目,如DVD和視頻的起始價格對最終價格幾乎沒有影響。換句話說,結合的結果,從23個不同的類別項的平均隱藏有關這些項目之間的差異的重要信息。

圖2.8:研究結果表明,從每個類別分別估計;在估計所有類別的實心點集中在一起,表11(Einav等。2015年,表11)。這些估算表明,比較有特色的項目,如紀念品,啟動價格對銷售(X軸)和最終的銷售價格(Y軸)更大影響的可能性更小的效果。

圖2.8:研究結果表明,從每個類別分別估計;在估計匯集起來的所有類別的實心圓點(Einav et al. 2015, Table 11)這些估算表明,比較有特色的項目,如紀念品,啟動價格對銷售(X軸)和最終的銷售價格(Y軸)更大影響的可能性更小的效果。

即使你是不是在eBay拍賣特別感興趣,你不得不佩服該圖2.7和圖2.8提供了更豐富的理解易趣的不是簡單的線性回歸估計假設的線性關係,並結合許多不同類別項目的方式。這些更微妙的估計表明在海量數據匹配的權力;這些估計將沒有數量龐大的田間試驗,這將是昂貴是不可能的。

當然,我們應該有任何特別的匹配研究的結果缺乏信心比我們會在一個可比的實驗結果。當評估來自任何匹配研究的結果,有兩個重要的關切。首先,我們要記住,我們只能確保被用於匹配事情公平的比較。在他們的主要結果,Einav和他的同事沒有精確匹配的四個特點:賣家ID號,項目類別,項目標題和字幕。如果項目是在不用於匹配的方式,這可能會造成不公平的比較不同。例如,如果“budgetgolfer”冬天調低泰勒梅燃燒09驅動程序的價格(當高爾夫俱樂部是不太受歡迎的),那麼它可能出現的較低的起始價格上漲導致更低的最終價格,而事實上,這將是季節性的神器需求的變化。在一般情況下,對這個問題的最佳方法似乎試圖許多不同種類的匹配。例如,Einav和同事重複他們的分析,其中匹配集包括在一年內出售的物品,在一個月內,以及同時。使得時間窗更緊減小匹配組的數量,但會降低約季節變化的擔憂。幸運的是,他們發現的結果是受這些變化的匹配標準不變。在匹配文獻中,這種關注在觀測不可觀察的角度通常表示,但關鍵的想法是真的,研究人員只建立在匹配使用的功能比較公平。

解釋匹配的結果,當第二個主要的擔心是,它們只適用於匹配的數據;它們並不適用於不能匹配的情況。例如,通過他們的研究限制於有多個列表Einav和同事們正專注於專業和半專業賣家的物品。因此,解釋這些比較時,我們必須記住,它們只適用於易趣的子集。

匹配是在大型數據集中尋找公平的比較強大的戰略。對許多社會科學家,匹配感覺就像第二個最好的實驗,但是這是一種信念,應予以修訂,略有下降。匹配海量數據可能比少數田間試驗時更好:1)影響的異質性是很重要的; 2)有進行匹配良好的觀測。表2.4提供了如何可以用大的數據源被用來匹配的一些其它實例。

表2.4:中使用匹配的數字軌跡中尋求公平的比較研究案例。
實質性重點 大數據源 引文
對警察暴力槍擊事件的影響 停止和搜身記錄 Legewie (2016)
2001年9月11日,對家庭和鄰居的影響 投票記錄和獻血記錄 Hersh (2013)
社會傳染 通訊和產品的推廣數據 Aral, Muchnik, and Sundararajan (2009)

總之,幼稚的方法來從非實驗數據估計因果效應是危險的。然而,為了使因果估計沿著從最強到最弱的連續撒謊策略,研究人員可以發現在非實驗數據比較公平。永遠在線,大數據系統的發展增強了我們有效地利用現有的兩個方法的能力:自然實驗和匹配。