2.4.3.2 Matching

Bijpassende creëren eerlijke vergelijkingen door weg te snoeien gevallen.

Fair vergelijkingen kan afkomstig zijn van beide gerandomiseerde gecontroleerde experimenten of natuurlijke experimenten. Maar er zijn veel situaties waarin u de ideale experiment niet kan lopen en de natuur nog geen natuurlijk experiment. In deze instellingen, de beste manier om het creëren van een eerlijke vergelijking is matching. In matching de onderzoeker kijkt door niet-experimentele gegevens paren van mensen die op elkaar lijken, behalve dat men de behandeling ontvangen maken en één niet. In het proces van aanpassing, zijn de onderzoekers eigenlijk ook snoeien; dat wil zeggen, zich ontdoen van gevallen waarin er geen duidelijke vergelijking. Zo, deze methode zou worden nauwkeuriger genoemd matching-en-snoeien, maar ik zal vasthouden aan de traditionele aanduiding: matching.

Een mooi voorbeeld van de kracht van de aanpassing van strategieën met massieve niet-experimentele data bronnen komen uit het onderzoek naar consumentengedrag door Liran Einav en collega's (2015) . Einav en collega's geïnteresseerd waren in veilingen die plaatsvinden op eBay, en in het beschrijven van hun werk, zal ik me concentreren op één specifiek aspect: het effect van de veiling startprijs op de veiling resultaten, zoals de verkoop prijs of de kans op een verkoop.

De meest naïeve manier om de vraag over het effect van de startprijs op verkoopprijs antwoord zou zijn om gewoon te berekenen de uiteindelijke prijs voor veilingen met verschillende uitgangsposities prijzen. Deze aanpak zou goed zijn als je gewoon wilt de verkoopprijs van een bepaald item dat al op eBay had gezet met een bepaalde startprijs voorspellen. Maar als uw vraag is wat is het effect van het starten van prijs op marktuitkomsten deze aanpak zal niet werken, omdat het niet is gebaseerd op eerlijke vergelijking; de veilingen met lagere uitgangspunt prijzen kunnen heel verschillend van veilingen met hogere uitgangspunt prijzen (bijvoorbeeld, kunnen ze voor verschillende soorten goederen of onder verschillende soorten verkopers) zijn.

Als u al bezorgd over het maken van een eerlijke vergelijking, zou je de naïeve aanpak over te slaan en te overwegen het runnen van een veldexperiment waar u zou verkopen een specifiek item-zeggen, een golfclub-met een vaste set van de veiling parameters-zeggen, gratis verzending, veiling geopend voor twee weken, enz., maar met een willekeurig ingesteld beginnend prijzen. Door het vergelijken van de verkregen resultaten markt, zou dit veldexperiment een zeer duidelijke meting van het effect van het starten van prijs op de verkoop prijs aan te bieden. Maar, zou deze meting alleen van toepassing op een bepaald product en de set van de veiling parameters. De resultaten kunnen verschillen, bijvoorbeeld voor verschillende soorten producten. Zonder sterke theorie, is het moeilijk worden geëxtrapoleerd uit deze enkel experiment het volledige scala van mogelijke experimenten die kon worden uitgevoerd. Verder veldexperimenten voldoende duur dat zij onhaalbaar genoeg daarvan oplopen tot heel parameterruimte producten en modellen veiling kunnen dekken.

In tegenstelling tot de naïeve aanpak en de experimentele benadering, Einav en collega's nemen een derde benadering: matching. De belangrijkste truc van hun strategie is om dingen vergelijkbaar met veldexperimenten die al op eBay zijn gebeurd te ontdekken. Bijvoorbeeld, Figuur 2.6 toont enkele van de 31 lijsten voor exact dezelfde golf-club een TaylorMade Burner 09 Driver-verkocht door precies dezelfde seller- "budgetgolfer". Echter, deze lijsten hebben een iets andere eigenschappen. Elf van hen bieden de chauffeur voor een vaste prijs van $ 124,99, terwijl de overige 20 zijn veilingen met verschillende einddata. Ook de lijsten hebben verschillende verzendkosten, ofwel $ 7,99 of $ 9,99. Met andere woorden, het is alsof "budgetgolfer" loopt experimenten voor onderzoekers.

De lijsten van de TaylorMade Burner 09 Driver worden verkocht door "budgetgolfer" zijn een voorbeeld van een aangepaste reeks lijsten, waarbij de exacte hetzelfde item wordt verkocht door exact dezelfde verkoper maar elke keer met een iets andere eigenschappen. Binnen de massale logs van eBay zijn er letterlijk honderdduizenden geëvenaard sets met miljoenen lijsten. Dus, in plaats van het vergelijken van de uiteindelijke prijs voor alle veilingen binnen een bepaalde startprijs, Einav en collega's vergelijkingen maken binnen geëvenaard sets. Om de resultaten te combineren van de vergelijkingen binnen deze honderdduizenden geëvenaard sets, Einav en collega's opnieuw drukken de startprijs en de uiteindelijke prijs in termen van de referentiewaarde van elk item (bijv, de gemiddelde verkoopprijs). Bijvoorbeeld, als de Taylormade Burner 09 Driver een referentiewaarde van 100 $ (gebaseerd op de verkoop), vervolgens een vanaf prijs van $ 10 worden uitgedrukt als 0,1 en uiteindelijke prijs van $ 120 worden uitgedrukt als 1,2.

Figuur 2.6: Een voorbeeld van een aangepaste reeks. Dit is exact dezelfde golfclub (een TaylorMade Burner 09 Driver) worden verkocht door exact dezelfde persoon (budgetgolfer), maar sommige van deze verkopen werden uitgevoerd verschillende omstandigheden (bijvoorbeeld, verschillende startprijs). Figuur uit Einav et al. (2015).

Figuur 2.6: Een voorbeeld van een aangepaste reeks. Dit is exact dezelfde golfclub (een TaylorMade Burner 09 Driver) worden verkocht door exact dezelfde persoon ( "budgetgolfer"), maar sommige van deze verkopen werden uitgevoerd verschillende omstandigheden (bijvoorbeeld verschillende startprijs). Figuur uit Einav et al. (2015) .

Bedenk dat Einav en zijn collega's waren geïnteresseerd in het effect van start prijs op de veiling resultaten. Ten eerste, met behulp van lineaire regressie zij geschat dat hogere uitgangspunt prijzen te verlagen de kans op een verkoop, en dat hogere uitgangspunt prijzen te verhogen de uiteindelijke verkoopprijs, op voorwaarde dat een verkoop plaatsvindt. Door zelf, deze schattingen-die gemiddeld over alle producten en gaan uit van een lineair verband tussen de startprijs en de uiteindelijke uitkomsten-zijn niet zo interessant. Maar Einav en collega ook de enorme omvang van de gegevens te gebruiken om een ​​verscheidenheid van subtielere bevindingen schatten. Ten eerste, Einav en collega's maakten deze schattingen afzonderlijk voor artikelen van verschillende prijzen en zonder het gebruik van lineaire regressie. Zij vonden dat terwijl de relatie tussen de start prijs en de waarschijnlijkheid van een verkoop is lineair, de relatie tussen de startprijs en de verkoopprijs is duidelijk niet-lineair (Figuur 2.7). In het bijzonder, voor het starten van de prijzen tussen de 0,05 en 0,85, de startprijs heeft weinig invloed op de verkoopprijs, een bevinding die werd voltooid gemist in de analyse dat er een lineaire relatie had aangenomen.

Figuur 2.7: Relatie tussen veiling start prijs en de kans op een verkoop (linker paneel) en verkoopprijs (rechter paneel). Er is ongeveer een lineair verband tussen start prijs en de waarschijnlijkheid van de verkoop, maar er is een niet-lineair verband tussen start prijs en de verkoopprijs; voor het starten van de prijzen tussen de 0,05 en 0,85, de startprijs heeft zeer weinig invloed op de verkoopprijs. In beide gevallen gaat het er in principe onafhankelijk van de punt waarde. Deze grafieken reproduceren Figuur 4a en 4b Einav et al. (2015).

Figuur 2.7: Relatie tussen veiling start prijs en de kans op een verkoop (linker paneel) en verkoopprijs (rechter paneel). Er is ongeveer een lineair verband tussen start prijs en de waarschijnlijkheid van de verkoop, maar er is een niet-lineair verband tussen start prijs en de verkoopprijs; voor het starten van de prijzen tussen de 0,05 en 0,85, de startprijs heeft zeer weinig invloed op de verkoopprijs. In beide gevallen gaat het er in principe onafhankelijk van de punt waarde. Deze grafieken reproduceren Figuur 4a en 4b Einav et al. (2015) .

Ten tweede, in plaats van een gemiddelde over alle items, Einav en collega's ook gebruik maken van de enorme omvang van hun gegevens om de impact van de startprijs voor 23 verschillende categorieën van items (bijvoorbeeld, dierbenodigdheden, elektronica en sport memorabilia) (Figuur 2.8) te schatten. Deze schattingen laten zien dat voor meer onderscheidende items-zoals-memorabilia start prijs heeft een kleiner effect op de kans op een verkoop en een groter effect hebben op de uiteindelijke verkoopprijs. Verder, voor meer gecommodificeerde items-zoals dvd's en video-the start prijs heeft bijna geen invloed op de uiteindelijke prijs. Met andere woorden, een gemiddelde dat combineert resultaten van 23 verschillende categorieën die verbergt belangrijke informatie over de verschillen tussen deze punten.

Figuur 2.8: De resultaten toonden aan schattingen van elke categorie afzonderlijk; het vaste punt in de raming voor alle categorieën samengevoegd samen, tabel 11 (Einav et al. 2015, tabel 11). Deze schattingen laten zien dat voor meer onderscheidende items-zoals-memorabilia de start prijs heeft een kleiner effect op de kans op een verkoop (x-as) en een groter effect hebben op de uiteindelijke verkoopprijs (y-as).

Figuur 2.8: De resultaten toonden aan schattingen van elke categorie afzonderlijk; het vaste punt in de raming voor alle categorieën samengevoegd (Einav et al. 2015, Table 11) . Deze schattingen laten zien dat voor meer onderscheidende items-zoals-memorabilia de start prijs heeft een kleiner effect op de kans op een verkoop (x-as) en een groter effect hebben op de uiteindelijke verkoopprijs (y-as).

Zelfs als je niet bijzonder geïnteresseerd in veilingen op eBay, moet je de manier waarop Figuur 2.7 en Figuur 2.8 bieden een rijkere begrip van eBay dan eenvoudige lineaire regressie van schattingen die lineaire verbanden te nemen en te combineren veel verschillende soorten items te bewonderen. Deze subtieler schattingen illustreren de kracht van de aanpassing in massieve data; deze schattingen zou onmogelijk zijn geweest zonder een enorm aantal veldexperimenten, die onbetaalbaar zou zijn geweest.

Natuurlijk moeten we minder vertrouwen in de resultaten van een bepaalde matching studie dan we zouden in de resultaten van een vergelijkbaar experiment hebben. Bij de beoordeling van de resultaten van een vergelijkbare studie, zijn er twee belangrijke problemen. Ten eerste, we moeten niet vergeten dat we alleen kunnen zorgen voor eerlijke vergelijkingen op dingen die werden gebruikt voor de matching. In hun belangrijkste resultaten, leverde Einav en collega's exact overeenkomen met vier kenmerken: verkoper ID, artikelnummer categorie, post titel en ondertitel. Als de items waren anders op een manier die niet werden gebruikt voor matching, dat een oneerlijke vergelijking zou kunnen maken. Bijvoorbeeld, als "budgetgolfer" verlaagde prijzen voor Taylormade Burner 09 Driver in de winter (als golf clubs zijn minder populair), dan kan het voorkomen dat lagere uitgangspunt prijzen leiden tot de uiteindelijke prijzen te verlagen, terwijl het in feite zou dit een artefact van het seizoen zijn variatie in de vraag. In het algemeen lijkt de beste aanpak om dit probleem te proberen veel verschillende soorten matching. Bijvoorbeeld Einav en collega's te herhalen hun analyse, waar geëvenaard sets bevatten items op verkoop binnen één jaar, binnen een maand, en gelijktijdig. Waardoor het tijdvenster strakker vermindert het aantal passende sets, maar vermindert bezorgdheid over seizoenpatroon. Gelukkig vinden ze dat resultaten onveranderd door deze veranderingen in bijpassende criteria. In de bijbehorende literatuur wordt dit type van zorg meestal uitgedrukt in termen van de zichtbaarheid en unobservables, maar de belangrijkste idee is eigenlijk dat de onderzoekers alleen maar eerlijk vergelijkingen over de gebruikte passende functies creëren.

De tweede grote zorg bij het interpreteren van de aanpassing van de resultaten is dat ze alleen van toepassing zijn op elkaar afgestemd gegevens; zij zijn niet van toepassing op de gevallen die niet overeenstemden. Bijvoorbeeld door hun onderzoek te beperken tot zaken die meerdere aanbiedingen Einav en collega's zijn gericht op professionele en semi-professionele verkopers hadden. Dus, bij de interpretatie van deze vergelijkingen we moeten niet vergeten dat ze alleen van toepassing zijn op dit deel van eBay.

Matching is een krachtige strategie voor het vinden van een eerlijke vergelijkingen in grote datasets. Voor veel sociale wetenschappers, matching voelt als een na best om experimenten, maar dat is een geloof dat moet worden herzien, lichtjes. Matching in massieve data misschien beter dan een klein aantal veldexperimenten zijn wanneer: 1) heterogeniteit in effecten is belangrijk en 2) er zijn goede waarneembaarheid voor matching. Tabel 2.4 geeft een andere voorbeelden van aanpassing kan in combinatie met zware gegevensbronnen.

Tabel 2.4: Voorbeelden van studies die matching gebruiken om eerlijke vergelijkingen te vinden in digitale sporen.
inhoudelijke aandacht Big data source Citaat
Effect van schietpartijen op politiegeweld Stop-and-Frisk verslagen Legewie (2016)
Effect van 11 september 2001 op de gezinnen en buren stemverslagen en donatie verslagen Hersh (2013)
sociale besmetting Communicatie en product goedkeuring data Aral, Muchnik, and Sundararajan (2009)

Concluderend, naïef benaderingen schatten oorzakelijke effecten van niet-experimentele gegevens zijn gevaarlijk. Echter, strategieën voor het maken van causale schattingen liggen langs een continuüm van sterkste tot zwakste, en onderzoekers kunnen eerlijke vergelijkingen in niet-experimentele gegevens te ontdekken. De groei van always-on, big data systemen vergroot ons vermogen om effectief gebruik van twee bestaande methoden: natuurlijke experimenten en matching.