Matching létre tisztességes összehasonlításokat metszés el esetek.
Fair összehasonlítások származhat akár a randomizált, kontrollált kísérletek vagy természetes kísérletek. De vannak olyan helyzetek, amikor nem tud futni az ideális kísérlet és a természet nem adta meg a természetes kísérlet. Ezekben a beállításokat, hogy a legjobb módja annak, hogy hozzon létre egy tisztességes összehasonlítás illő. Annak megfelelő, a kutató úgy néz ki, a nem-kísérleti adatok létrehozásához pár ember, hogy hasonló, kivéve, hogy az egyik megkapta a kezelést, és az egyik nem. A folyamat során a megfelelő, a kutatók valójában is metszés; azaz, elöntve az esetekben, ahol nincs nyilvánvaló összehasonlítást. Így ez a módszer lenne pontosabban az illesztés-and-metszés, de maradok a hagyományos kifejezés: megfelelő.
Egy gyönyörű példája a hatalom a megfelelő stratégiák masszív nem kísérleti adatforrások származnak kutatás a fogyasztói magatartást Liran Einav és munkatársai (2015) . Einav és munkatársai voltak érdekeltek aukciók zajlik az eBay-en, és leírja a munkájukat, fogok összpontosítani egy sajátos szempontból: a hatása árverési kikiáltási ár az aukciós eredmények, például az eladási ár, illetve a valószínűsége, hogy egy eladó.
A naiv módon, hogy válaszoljon a kérdésre a hatása a kiindulási ár eladási ár lenne egyszerűen kiszámítani a végleges ár aukciók különböző kiindulási áron. Ez a megközelítés jó lenne, ha egyszerűen csak szeretné megjósolni az eladási ár az adott elem, hogy már fel az eBay-en egy adott kiindulási árat. De, ha a kérdés az, hogy milyen hatással van a kikiáltási ár a piaci eredmények ez a megközelítés nem működik, mert ez nem a valós összehasonlítást; Az aukciókon alacsonyabb kiindulási ára is meglehetősen eltér aukciók magasabb induló árak (pl, lehet, hogy a különböző típusú áruk vagy különböző típusú olyan eladók).
Ha már aggasztja a méltányos összehasonlítást, akkor lehet, hagyja a naiv megközelítés és úgy fut a szántóföldi kísérletben, ahol Ön is eladni egy adott tárgy, mondjuk egy golfütő-egy fix sor aukció paraméterek mondjuk, a szállítás ingyenes, árverés nyitott két hétig, stb, de véletlenszerűen meghatározott induló árak. Ha összehasonlítjuk az eredő piaci eredmények ezen a területen kísérlet kínálna egy nagyon világos hatásának mérésére a kiindulási ár eladási ár. De ez a mérés csak akkor alkalmazható egy adott termék, és állítsa be az árverési paramétereket. Az eredmények eltérő lehet, például a különböző típusú termékek. Anélkül erős elmélet, nehéz extrapolálni ettől az egyetlen kísérlet az összes lehetséges kísérletek, hogy lehetett volna futtatni. Továbbá, szántóföldi kísérletek elég drága, hogy nem lenne megvalósíthatatlan futtatni elég őket, hogy fedezze a teljes paraméter térben termékek és aukciós típusok.
Ezzel szemben a naiv megközelítés és a kísérleti megközelítés, Einav és kollégái, hogy egy harmadik megközelítés: megfelelő. A fő trükk a stratégiájuk, hogy felfedezzék a dolgokat hasonló területen kísérletek történtek eddig az eBay-en. Például 2.6 ábra mutatja, néhány 31 listák pontosan ugyanazt a golf klub a Taylormade író 09 vezetőre által értékesített pontosan ugyanaz eladó-"budgetgolfer". Azonban ezek a listák némileg eltérő jellemzőkkel. Tizenegy közülük kínál a vezető számára a fix ára 124,99 $, míg a többi 20 aukciók különböző befejező időpontját. Továbbá, a listák különböző szállítási díjak, akár $ 7,99 vagy 9,99 $. Más szóval, ez olyan, mintha "budgetgolfer" fut kísérleteket a kutatók.
A listát a Taylormade Burner 09 illesztőprogram által értékesített "budgetgolfer" egyik példája egy kiegyenlített készlet listát, ahol pontosan ugyanazt a tétel által értékesített pontosan ugyanaz eladó, de minden egyes alkalommal kicsit eltérő jellemzőkkel. A masszív naplók eBay vannak több száz ezer kiegyenlített készlet járó több millió listáját. Így ahelyett, hogy összehasonlítva a végső árat az összes aukcióra egy adott kiindulási árat, Einav és kollégái, hogy összehasonlításokat belül kiegyenlített készletek. Annak érdekében, hogy összekapcsolják ered összehasonlítások ezen belül több százezer kiegyenlített készletek, Einav és kollégái újra kifejezni a kikiáltási ár és a végső ár szempontjából a referenciaérték az egyes elemek (pl átlagos értékesítési ár). Például, ha a Taylormade Burner 09 vezetőnek a referenciaérték $ 100 (alapuló értékesítés), akkor a kikiáltási ár 10 $ lenne kifejezve 0,1 és záró ára 120 $ lenne kifejezve 1,2.
Emlékezzünk vissza, hogy Einav és munkatársai voltak érdekeltek a hatását induló ár aukciós eredmények. Először is, a lineáris regresszió úgy becsülték, hogy a magasabb induló árak csökkentik a valószínűsége, hogy egy eladó, és hogy a magasabb induló árak növelése a végső eladási árat, feltétele a hirdetést bekövetkezését. Önmagukban ezek a becslések-, amelyeket átlagolva minden termék és lineáris összefüggés feltételezésével között induló ár és a végső eredmény-nem olyan érdekes. De Einav és kollégái is használhatják a hatalmas mérete adataikat megbecsülni a különböző finomabb megállapításokat. Először Einav és kollégáik ezeket a becsléseket külön tételek különböző árak és használata nélkül lineáris regresszió. Azt találták, hogy míg a viszony induló ár és a valószínűsége, hogy egy eladó lineáris, a kapcsolat a kikiáltási ár és eladási ár egyértelműen nem lineáris (2.7 ábra). Különösen induló árak 0,05 és 0,85, a kikiáltási ár nagyon kevés hatása eladási árat, annak megállapítása, hogy befejeződött hiányzott az elemzés, amely azt feltételezte, lineáris összefüggés.
Másodszor, nem pedig átlagosan több mint az összes elem, Einav és kollégái is használhatják a tömeges az adatok csak becsült hatása a kikiáltási ár 23 különböző kategóriájú elemek (pl kellékek, elektronikai és sport relikviákat) (2.8 ábra). Ezek a becslések azt mutatják, hogy több ruhadarabot-, mint relikviákat-induló ár kisebb hatása van a valószínűsége, hogy egy eladó és egy nagyobb hatással van a végső eladási ár. Továbbá több áruvá tételek-, mint a DVD és videó-megkezdése ár szinte nincs hatással a végső ár. Más szóval, az átlagos, amely egyesíti eredmények 23 különböző kategóriái tételek rejt fontos információt a különbség e tételeket.
Akkor is, ha nem érdekli különösebben aukciók az eBay-en, akkor van, hogy megcsodálják az is, hogy 2.7 ábra és 2.8 ábra ajánlat gazdagabb megértése eBay, mint az egyszerű lineáris regressziós becslések azt feltételezik, hogy a lineáris kapcsolatok és kombinálni különböző kategóriái elemeket. Ezek finomabb becsléseket bemutatják az erejét illő masszív adatok; Ezek a becslések lehetetlen lett volna anélkül, hogy rendkívül sok területen kísérletek, ami már megfizethetetlenül drága.
Persze, meg kell kevesebb bizalmat az eredmények adott megfelelő vizsgálat, mint azt az eredmények egy hasonló kísérletet. Az eredmények kiértékelése esetén bármilyen megfelelő tanulmány két fontos kérdéseket. Először is meg kell emlékezni, hogy csak akkor tudjuk, hogy tisztességes összehasonlítást a dolgokat, hogy használták az összehasonlításhoz. Az ő fő eredménye, Einav és kollégái azonban pontosan illő négy jellemzői: eladó azonosító száma, kívánt kategóriát, tétel címét, és a felirat. Ha a tételeket különböző módon, hogy nem használták megfelelő, hogy hozhat létre tisztességtelen összehasonlítást. Például, ha "budgetgolfer" alacsonyabb árakat Taylormade Burner 09 illesztőprogram télen (amikor golfütő kevésbé népszerű), akkor úgy tűnhet, hogy az alacsonyabb induló árak, mivel az alacsonyabb végső árak, holott ez lenne a tárgy a szezonális szükséglet változás. Általában a legjobb megoldás erre a problémára úgy tűnik, hogy megpróbálja sokféle megfelelő. Például Einav és kollégái megismétlik elemzésére, ahol kiegyenlített készlet tartalmaz, eladó egy éven belül egy hónapon belül, és egyidejűleg. Így az időablak szigorúbb csökkenti száma kiegyenlített készletek, de csökkenti aggodalmak szezonális változás. Szerencsére úgy találják, hogy az eredmények nem változtak ezek a változások a megfelelő feltételeket. A megfelelő szakirodalom az ilyen típusú aggodalom általában kifejezve észlelhetőség és unobservables, de a lényeg, tényleg, hogy a kutatókat csak létre valós összehasonlítási funkciók használt megfelelő.
A másik nagy gondja értelmezésekor találatot az, hogy csak azokra a párosított adatok; azok nem vonatkoznak azokra az esetekre, hogy nem sikerült megtalálni. Például úgy, hogy korlátozza a kutatás tételekhez már több listát Einav és kollégái összpontosítva profi és fél-profi eladók. Így értelmezésekor ezen összehasonlítások emlékeznünk kell arra, hogy csak erre a részhalmaza az eBay.
Matching egy erőteljes stratégia megtalálása tisztességes összehasonlítást nagy adatbázisok. Sok társadalomtudós, megfelelő olyan, mint a második legjobb kísérletek, de az a meggyőződés, hogy felül kell vizsgálni, egy kicsit. Matching masszív adatok lehet, hogy jobb, mint a kis számú szántóföldi kísérletek során: 1) heterogenitás hatása a fontos, és 2) vannak jó észlelhetőség az összehasonlításhoz. 2.4 táblázat ad néhány más példát arra, hogyan illő használható nagy adatforrás.
lényegi fókusz | Big adatforrás | Idézet |
---|---|---|
Hatása lövöldözés a rendőri erőszak | Stop-and-csóvál bejegyzések | Legewie (2016) |
Hatása szeptember 11-2001 család és a szomszédok | szavazási eredmények és adományozás rekordok | Hersh (2013) |
szociális fertőzés | Kommunikáció és termék elfogadása adatok | Aral, Muchnik, and Sundararajan (2009) |
Összefoglalva, naiv megközelítés becslésére okozati hatása nem kísérleti adatok veszélyesek. Azonban stratégiák készítésére okozati becslések mentén fekvő folytonosságot a legerősebb a leggyengébb, és a kutatók felfedezni tisztességes összehasonlítást a nem-kísérleti adatokkal. A növekedés az always-on, nagy adatrendszerek növeli a képességét, hogy hatékonyan használni a két meglévő módszerek: természetes kísérletek és megfelelő.