2.4.3.2 Eşleştirme

Eşleştirme davaları uzakta budama yoluyla adil karşılaştırmalar oluşturun.

Adil karşılaştırmalar randomize kontrollü deneyler veya doğal deneyler ya gelebilir. Ancak, ideal bir denemeyi koşamam ve doğa doğal deney sunmamıştır pek çok durum vardır. Bu ayarlarda, en iyi yolu adil bir karşılaştırma eşleşen oluşturmak için. eşleştirme, araştırmacı bir tedavi aldı dışında benzer insanların çiftleri oluşturmak için olmayan deneysel verilere bakar ve biri değil vardır. Eşleştirme sürecinde, araştırmacılar aslında aynı zamanda budama; Bu belirgin bir karşılaştırma vardır vakaları atarak vardır. Böylece, bu yöntem daha doğru eşleme-ve-budama denir, ama ben geleneksel terim çakacağım: eşleştirme.

Masif olmayan deneysel veri kaynakları ile stratejiler eşleşen gücü güzel bir örnek Liran einav ve meslektaşları tarafından tüketici davranışları üzerindeki araştırmaların gelen (2015) . Einav ve arkadaşları eBay yer alan ihaleleri ile ilgilenen ve onların çalışmalarını açıklayan, ben belirli bir yönü üzerinde odaklanmak gerekir: Böyle satış fiyatı ya da bir satış olasılığı olarak açık artırma sonuçları, açık artırma başlangıç ​​fiyatı etkisi.

satış fiyatı başlangıç ​​fiyatı etkileri hakkında soruyu cevaplamak için en naif yolu sadece farklı başlangıç ​​fiyatları ile ihaleleri için nihai fiyat hesaplamak olacaktır. sadece belirli bir başlangıç ​​fiyatı ile eBay koymuştu belirli bir öğenin satış fiyatı tahmin etmek istiyorsanız bu yaklaşım iyi olurdu. Ama, soru adil karşılaştırmalara dayalı değildir çünkü işe yaramaz piyasa sonuçları üzerinde bu yaklaşımı başlangıç ​​fiyatı etkisi ne ise; düşük başlangıç ​​fiyatları ile ihaleleri yüksek başlangıç ​​fiyatları (örneğin, onlar mal farklı türleri için olabilir ya da satıcıların farklı türde içerebilir) ile ihaleleri oldukça farklı olabilir.

adil karşılaştırmalar yapma konusunda zaten endişe varsa, naif bir yaklaşım atlamak ve ihale sabit bir set ile kulüp-Belirli bir öğe demek golf satacağını alan deney çalışan düşünebilirsiniz parametreleri-say, ücretsiz kargo, açık artırma iki hafta boyunca açık vb ama rastgele başlayan fiyatlar ayarlanmış. Ortaya çıkan piyasa sonuçlarını karşılaştırarak, bu alan deney satış fiyatı başlangıç ​​fiyatı etkisinin çok net bir ölçüm sunacak. Ancak bu ölçüm sadece belirli bir ürün için geçerli ve ihale parametrelerinin açardı. Sonuçlar, farklı ürün tipleri için, örneğin, farklı olabilir. Güçlü teori olmadan, bu tek bir deney çalıştırmak olabilirdi olası deneylerin dizi çıkarım yapmanın zor. Dahası, saha deneyleri, ürünlere ve açık artırma türlerinin tüm parametre alanını kapsayacak şekilde onları yeterince kadar çalıştırmak için olanaksız olacağını yeterince pahalı.

naif yaklaşım ve deneysel yaklaşımın aksine, einav ve arkadaşları üçüncü bir yaklaşım: eşleme. kendi stratejisinin ana hile zaten eBay olmuş tarla denemeleri de benzer şeyler keşfetmektir. Örneğin, Şekil 2.6 aynı golf club-bir Taylormade Burner-Sürücü varlık aynı seller- "budgetgolfer" tarafından 09 satılan 31 listelerinin bazılarını göstermektedir. Ancak, bu listeleri biraz farklı özelliklere sahiptir. Diğer 20 farklı bitiş tarihleri ​​ile ihaleleri ise onlardan on, 124,99 $ bir sabit fiyat için sürücü sunuyoruz. Ayrıca, listeleri, farklı nakliye ücretleri ya $ 7,99 veya 9,99 $. "Budgetgolfer" araştırmacılar için deneyler çalışıyor sanki başka bir deyişle, öyle.

Taylormade Burner 09 Driver listeleri "budgetgolfer" tarafından satılan aynı madde aynı satıcı tarafından satılan ediliyor listeleri, eşleştirilmiş kümesi ama biraz farklı özelliklere sahip her zaman bir örnektir. eBay büyük günlükleri içinde listeleri milyonlarca içeren eşleştirilmiş setleri binlerce yüzlerce vardır. Böylece, daha doğrusu belli bir başlangıç ​​fiyatı içindeki tüm ihaleleri için nihai fiyat karşılaştırma daha einav ve arkadaşları eşleşen setleri içinde karşılaştırmalar yapmak. eşleşti setleri binlerce bu yüz içinde kıyaslamalar sonucunda elde birleştirmek için, einav ve arkadaşları her öğe (örneğin, ortalama satış fiyatı) referans değeri bakımından başlangıç ​​fiyatı ve nihai fiyat yeniden ifade eder. Taylormade Burner 09 Sürücü 100 $ referans değeri varsa, örneğin, (kendi satış dayalı), sonra 10 $ başlangıç ​​fiyatı 0.1 olarak ifade edilecek ve 120 $ nihai fiyat 1.2 olarak ifade edilecektir.

Şekil 2.6: eşleşen bir dizi örnek. Bu aynı kişi (budgetgolfer) tarafından satılan aynı golf kulübü (a Taylormade Burner 09 Sürücü), ancak bu satışların bazı farklı koşullar (örneğin, farklı başlangıç ​​fiyatı) yapıldı. Einav et al alınan Şekil. (2015).

Şekil 2.6: eşleşen bir dizi örnek. Bu aynı kişi ( "budgetgolfer") tarafından satılan aynı golf kulübü (a Taylormade Burner 09 Sürücü), ancak bu satışların bazı farklı koşullar (örneğin, farklı başlangıç ​​fiyatı) yapıldı. Alınan Şekil Einav et al. (2015) .

Einav ve arkadaşları ihale sonuçları üzerindeki başlangıç ​​fiyatının etkisi ile ilgilenen olduğunu hatırlayın. İlk olarak, lineer regresyon kullanılarak daha yüksek başlangıç ​​fiyatları satış olasılığını azalttığı ve daha yüksek başlangıç ​​fiyatları satış meydana şartına nihai satış fiyatı artırmak olduğunu tahmin etmiştir. Kendileri tarafından, bu tahminler-tüm ürünleri üzerinde ortalama ve olan başlangıç ​​fiyatı ve son arasında doğrusal bir ilişki varsayalım tüm bu ilginç değil sonuçlarla-vardır. Ama, einav ve arkadaşları da daha ince bulguların çeşitli tahmin etmek verilerinin büyük boyutu kullanın. Birincisi, einav ve arkadaşları ayrı ayrı farklı fiyatlar öğeler için ve lineer regresyon kullanmadan bu tahminleri yaptı. Bir satış başlangıç ​​fiyatı ve olasılık arasındaki ilişki doğrusal ise, başlangıç ​​fiyatı ile satış fiyatı arasındaki ilişki doğrusal olmayan (Şekil 2.7) açıkça ortaya koymuştur. Özellikle, 0.05 ve 0.85 arasında fiyat başlatmak için, başlangıç ​​fiyatı satış fiyatı, doğrusal bir ilişki kabul vardı analizde cevapsız tamamlanan bir bulguya çok az etkisi vardır.

2.7 Şekil: İlişki satış (sol panel) ve satış fiyatı (sağ panel) açık artırma başlangıç ​​fiyatı ve olasılık arasında. Başlangıç ​​fiyatı ve satış olasılığı arasında doğrusal bir ilişki kabaca vardır, ancak başlangıç ​​fiyatı ile satış fiyatı arasındaki doğrusal olmayan bir ilişki vardır; 0.05 ve 0.85 arasında fiyat başlatmak için, başlangıç ​​fiyatı satış fiyatı üzerinde çok az etkisi vardır. Her iki durumda da, ilişkiler et değeri temelde bağımsızdır. Bu grafikler, Şekil 4a ve 4b einav ark yeniden. (2015).

2.7 Şekil: İlişki satış (sol panel) ve satış fiyatı (sağ panel) açık artırma başlangıç ​​fiyatı ve olasılık arasında. Başlangıç ​​fiyatı ve satış olasılığı arasında doğrusal bir ilişki kabaca vardır, ancak başlangıç ​​fiyatı ile satış fiyatı arasındaki doğrusal olmayan bir ilişki vardır; 0.05 ve 0.85 arasında fiyat başlatmak için, başlangıç ​​fiyatı satış fiyatı üzerinde çok az etkisi vardır. Her iki durumda da, ilişkiler et değeri temelde bağımsızdır. Bu grafikler, Şekil 4A ve 4B, yeniden Einav et al. (2015) .

İkincisi, daha doğrusu tüm öğeleri üzerinden ortalama yerine, einav ve arkadaşları da (örneğin, evcil hayvan bakım ürünleri, elektronik, ve spor hatıra) öğeleri (Şekil 2.8) 23 farklı kategoride için başlangıç ​​fiyatı etkisini tahmin etmek için kendi veri büyük ölçekli kullanın. Bu tahminler daha belirgin öğelerin-gibi Hatıra başlangıç ​​fiyatı satış olasılık ve nihai satış fiyatı daha büyük bir etkisi daha küçük bir etkiye sahip olduğunu göstermektedir. Dahası, daha metalaştırılmış ürün-DVD ve video başlangıç ​​bedeli olarak nihai fiyat neredeyse hiçbir etkisi yoktur. Diğer bir deyişle, öğeler 23 farklı kategoride sonuçları birleştiren bir ortalama bu öğeler arasındaki farklar hakkında önemli bilgiler gizler.

2.8 Şekil: Sonuçlar her bir kategoriden tahminleri gösterdi; Tüm kategoriler için tahmin katı nokta Tablo 11 (einav ve ark., 2015, Tablo 11), bir araya toplanmış. Bu tahminler daha belirgin öğelerin-gibi Hatıra başlangıç ​​fiyatı satış (x-ekseni) ve nihai satış fiyatı (y-ekseni) daha büyük bir etkisi ihtimali üzerinde küçük bir etkiye sahip olduğunu göstermektedir.

2.8 Şekil: Sonuçlar her bir kategoriden tahminleri gösterdi; bir araya toplanmış tüm kategoriler için tahmin katı nokta (Einav et al. 2015, Table 11) . Bu tahminler daha belirgin öğelerin-gibi Hatıra başlangıç ​​fiyatı satış (x-ekseni) ve nihai satış fiyatı (y-ekseni) daha büyük bir etkisi ihtimali üzerinde küçük bir etkiye sahip olduğunu göstermektedir.

eBay ihaleleri özellikle ilgilenmiyor bile, Şekil 2.7 ve 2.8 teklif doğrusal ilişkileri varsayalım ve öğeleri birçok farklı kategoride birleştirmek Basit doğrusal regresyon tahminlerinin daha eBay daha zengin bir anlayış Şekil yolu hayran var. Bunlar daha ince tahminler büyük veri eşleşen gücünü göstermektedir; bu tahminler pahalıya olurdu tarla denemeleri muazzam bir sayıda olmadan imkansız olurdu.

Tabii ki, biz herhangi bir eşleştirme çalışmanın sonuçlarının daha az güven biz benzer bir deney sonuçlarında olduğundan daha olmalıdır. herhangi bir eşleme çalışmanın sonuçlarını değerlendirirken, iki önemli endişeler vardır. İlk olarak, biz sadece eşleşme için kullanılan şeylere adil karşılaştırmalar emin olabilirsiniz ki hatırlamak zorunda. Satıcı kimlik numarası, madde kategorisi, madde başlığı ve altyazı: ana sonuçlarda, einav ve arkadaşları tam dört özellikleri eşleşen etmedi. ürün haksız bir karşılaştırma oluşturabilir eşleşme için kullanılan değildi şekillerde farklı olsaydı. (Golf kulüpleri daha az popüler olduğu zaman) aslında bu mevsimsel bir dışlayıcı olacağını Örneğin, eğer "budgetgolfer" kışın Taylormade Burner 09 Sürücü için fiyat düşürdü, o zaman, düşük başlangıç ​​fiyatları son fiyatlarını düşürmek için yol görünür olabilir talep varyasyon. Genel olarak, bu sorunun en iyi yaklaşım eşleme birçok farklı çalışıyor gibi görünüyor. Örneğin, einav ve arkadaşları eşleşti setleri eş bir ay içinde bir yıl içinde satışa öğeleri, ve de onların analizlerini tekrarlayın. Zaman penceresi sıkı yapma uyumlu set sayısını azaltır, ancak mevsimsel değişim ile ilgili endişeleri azaltır. Neyse ki, onlar sonuçları eşleşen kriterler bu değişikliklerden değişmeden olduğunu bulmak. Eşleştirme Literatürde, kaygı bu tip genellikle gözlenebilirlerin ve gözlenemeyen etmenlerin açısından ifade, ama anahtar fikir araştırmacılar sadece eşleştirme kullanılan özelliklere adil karşılaştırmalar oluştururken gerçekten mesafesindedir.

eşleşen sonuçları yorumlama ikinci büyük endişe sadece eşleşen verilere uygulanır olmasıdır; Onlar uyumlu edilemeyen durumlar için geçerli değildir. Örneğin, einav ve arkadaşları, profesyonel ve yarı profesyonel satıcıları üzerinde duruluyor birden listeleri vardı öğeleri araştırmalarını sınırlayarak. Bu karşılaştırmalar yorumlanırken Böylece, sadece eBay bu alt için de geçerli olduğunu unutmamak gerekir.

Eşleştirme büyük veri kümelerinde adil karşılaştırmalar bulmak için güçlü bir stratejidir. pek çok sosyal bilimcinin, eşleştirme deneylere en iyi ikinci gibi hissediyor, ama bu biraz revize edilmesi gereken bir inançtır. etkileri 1) heterojenlik önemlidir ve 2) eşleştirme için iyi gözlenebilir vardır: zaman büyük verilerde Eşleştirme tarla denemeleri az sayıda daha iyi olabilir. Tablo 2.4 büyük veri kaynakları ile kullanılabilir eşleşen nasıl diğer bazı örnekler vermektedir.

Tablo 2.4: Dijital izleri içinde adil karşılaştırmalar bulmak için eşleştirme kullanmak çalışmaların örnekleri.
özlü odak Büyük veri kaynağı alıntı
Polis şiddet atışların Etkisi kayıtları-ve-frisk durdur Legewie (2016)
aileleri ve komşuları 11 Eylül 2001 etkisi oylama kayıtları ve bağış kayıtları Hersh (2013)
sosyal bulaşma İletişim ve ürün kabulü veri Aral, Muchnik, and Sundararajan (2009)

Sonuç olarak, deneysel olmayan verilerden nedensel etkileri tahmin naif yaklaşımlar tehlikelidir. Ancak, güçlü gelen zayıf bir süreklilik boyunca uzanan nedensel tahminler yapmak için stratejiler ve araştırmacılar olmayan deneysel verilere içinde adil karşılaştırmalar keşfedebilirsiniz. Doğal deneyler ve eşleşen: her zaman açık, büyük veri sistemlerinin büyümesi etkili iki varolan yöntemleri kullanmak yeteneğimizi arttırır.