2.4.3.2 Matching

Matchende skape rettferdige sammenligninger ved beskjæring bort saker.

Fair sammenligninger kan komme fra enten randomiserte kontrollerte eksperimenter eller naturlige eksperimenter. Men, det er mange situasjoner der du ikke kan kjøre den ideelle eksperiment og naturen har ikke gitt et naturlig eksperiment. I disse innstillingene, den beste måten å skape en rettferdig sammenligning er samsvarende. I matching, ser forskeren gjennom ikke-eksperimentelle data til å lage par av folk som er like, bortsett fra at man har fått behandling, og man har ikke. I prosessen med matching, er forskerne faktisk også beskjæring; det vil si å forkaste tilfeller der det er ingen åpenbar sammenligning. Dermed denne metoden ville være mer presist å kalle matching-og-beskjæring, men jeg vil holde med den tradisjonelle betegnelsen: matching.

Et vakkert eksempel på kraften av matchende strategier med massive ikke-eksperimentelle datakilder kommer fra forskning på forbrukeratferd ved Liran Einav og kolleger (2015) . Einav og kolleger var interessert i auksjoner finner sted på eBay, og i å beskrive sitt arbeid, vil jeg fokusere på ett bestemt aspekt: ​​effekten av utropspris på auksjon utfall, for eksempel salgsprisen eller sannsynligheten for et salg.

Den mest naive måte å svare på spørsmålet om effekten av startpris på salg prisen ville være å bare beregne den endelige prisen for auksjoner med forskjellige startpriser. Denne tilnærmingen ville være fint hvis du bare ønsker å forutsi salgsprisen på et gitt element som hadde blitt satt på eBay med en gitt startpris. Men hvis spørsmålet er hva er effekten av startpris på markedet utfall denne tilnærmingen vil ikke fungere fordi det ikke er basert på sammenligninger; auksjoner med lavere startpriser kan være ganske forskjellig fra auksjoner med høyere startpriser (for eksempel, kan de være for ulike typer varer eller inkludere ulike typer selgere).

Hvis du allerede er opptatt av å gjøre sammenligninger, kan du hoppe over naiv tilnærming og vurdere å kjøre et felteksperiment der du ville selge et bestemt element-si, en golfkølle-med et fast sett med auksjon parametre-si, gratis frakt, auksjon åpne for to uker, osv-men med tilfeldig satt starter priser. Ved å sammenligne de resulterende markedet utfall, ville dette feltet eksperimentet tilbyr en svært tydelig mål på effekten av startpris på salgspris. Men, ville denne målingen gjelder bare for ett bestemt produkt og sett med auksjon parametere. Resultatet kan være forskjellig, for eksempel for forskjellige typer av produkter. Uten sterk teori, er det vanskelig å ekstrapolere fra denne ene forsøket hele spekteret av mulige eksperimenter som kunne ha blitt kjørt. Videre feltforsøk er tilstrekkelig dyrt at det ville være umulig å kjøre nok av dem opp for å dekke hele parameter plass av produkter og auksjon typer.

I motsetning til den naive tilnærming og den eksperimentelle metode, Einav og kolleger ta en tredje tilnærming: matching. Hoved lure av deres strategi er å oppdage ting som ligner på feltforsøk som allerede har skjedd på eBay. For eksempel, Figur 2.6 viser noen av de 31 oppføringer for akkurat det samme golf club-en Taylormade brenner 09 Driver-som selges av nøyaktig samme seller- "budgetgolfer". Men disse oppføringene har litt forskjellige egenskaper. Elleve av dem tilbyr sjåføren for en fast pris på $ 124,99, mens de øvrige 20 er auksjoner med forskjellige sluttdatoer. Også oppføringene har ulike porto, enten $ 7,99 eller $ 9,99. Med andre ord, er det som om "budgetgolfer" kjører eksperimenter for forskerne.

Oppføringene i Taylormade Burner 09 Driver som selges av "budgetgolfer" er et eksempel på et matchet sett med oppføringer, der nøyaktig samme varen blir solgt av nøyaktig samme selger, men hver gang med litt forskjellige egenskaper. Innenfor de massive logger av eBay det er bokstavelig talt hundrevis av tusenvis av tilpassede sett involverer millioner av oppføringer. Dermed snarere enn å sammenligne den endelige prisen for alle auksjoner innenfor en gitt startpris, Einav og kolleger foreta sammenligninger innenfor matchet sett. For å kombinere resultater fra sammenligninger innenfor disse hundretusener av tilpassede sett, Einav og kolleger re-uttrykke startpris og sluttprisen i forhold til referanseverdien for hvert element (for eksempel gjennomsnittlig salgspris). For eksempel, hvis Taylormade Burner 09 Driver har en referanseverdi på $ 100 (basert på salget), deretter en pris som starter på $ 10 ville bli uttrykt som 0,1 og endelig pris på $ 120 vil bli uttrykt som 1,2.

Figur 2.6: Et eksempel på et samsvarende sett. Dette er nøyaktig samme golfklubb (en Taylormade brenner 09 Driver) som selges av nøyaktig samme person (budgetgolfer), men noen av disse salgene ble utført ulike tilstander (f.eks forskjellig startpris). Figur tatt fra Einav et al. (2015).

Figur 2.6: Et eksempel på et samsvarende sett. Dette er nøyaktig samme golfklubb (en Taylormade brenner 09 Driver) som selges av nøyaktig samme person ( "budgetgolfer"), men noen av disse salgene ble utført ulike forhold (f.eks forskjellig startpris). Figur tatt fra Einav et al. (2015) .

Husker at Einav og kolleger var interessert i effekten av startprisen på auksjonen utfall. Først ved hjelp av lineær regresjon de anslått at høyere start prisene reduseres sannsynligheten for et salg, og at høyere starter prisene øke den endelige salgsprisen, betinget av et salg skjer. Av seg selv, disse estimatene-som er midlet over alle produkter og anta en lineær sammenheng mellom startpris og slutt utfall-er ikke alle som interessant. Men, Einav og kolleger også bruke den massive størrelsen på sine data for å estimere en rekke mer sparsomme funn. Først Einav og kolleger har gjort disse beregningene separat for elementer av forskjellige priser og uten bruk av lineær regresjon. De fant at mens forholdet mellom start pris og sannsynligheten for et salg er lineær, forholdet mellom start pris og salgsprisen er tydelig ikke-lineær (figur 2.7). Spesielt for å starte priser mellom 0,05 og 0,85, har start pris svært liten innvirkning på salgsprisen, et funn som ble gjennomført savnet i analysen som hadde antatt en lineær sammenheng.

Figur 2.7: Forholdet mellom Utropspris og sannsynligheten for et salg (venstre panel) og salgsprisen (høyre panel). Det er omtrent en lineær sammenheng mellom start pris og sannsynligheten for salg, men det er en ikke-lineær sammenheng mellom start pris og salgspris; for å starte priser mellom 0,05 og 0,85, har start pris svært liten innvirkning på salgsprisen. I begge tilfeller er forholdet er i utgangspunktet er uavhengig av innstillingsverdi. Disse grafene reprodusere Fig 4a og 4b Einav et al. (2015).

Figur 2.7: Forholdet mellom Utropspris og sannsynligheten for et salg (venstre panel) og salgsprisen (høyre panel). Det er omtrent en lineær sammenheng mellom start pris og sannsynligheten for salg, men det er en ikke-lineær sammenheng mellom start pris og salgspris; for å starte priser mellom 0,05 og 0,85, har start pris svært liten innvirkning på salgsprisen. I begge tilfeller er forholdet er i utgangspunktet er uavhengig av innstillingsverdi. Disse grafene reprodusere Fig 4a og 4b Einav et al. (2015) .

For det andre, i stedet for gjennomsnitt over alle elementer, Einav og kolleger også bruke massive omfanget av sine data for å anslå effekten av startpris for 23 ulike kategorier av elementer (for eksempel kjæledyr forsyninger, elektronikk og idrett memorabilia) (figur 2.8). Disse anslagene viser at for mer karakteristiske elementer, for eksempel memorabilia-start pris har en mindre effekt på sannsynligheten for et salg og en større effekt på den endelige salgsprisen. Videre, for mer commodified elementer, for eksempel DVD-er og video-startprisen har nesten ingen innvirkning på den endelige prisen. Med andre ord, et gjennomsnitt som kombinerer resultater fra 23 ulike kategorier av elementer skjuler viktig informasjon om forskjellene mellom disse elementene.

Figur 2.8: Resultatene viste beregninger fra hver kategori individuelt; solid prikk i anslaget for alle kategorier slått sammen, tabell 11 (Einav et al. 2015, tabell 11). Disse anslagene viser at for mer karakteristiske elementer-som minner-startprisen har en mindre effekt på sannsynligheten for et salg (x-aksen) og en større effekt på den endelige salgsprisen (y-aksen).

Figur 2.8: Resultatene viste beregninger fra hver kategori individuelt; solid prikk i anslaget for alle kategorier sammenslåtte sammen (Einav et al. 2015, Table 11) . Disse anslagene viser at for mer karakteristiske elementer-som minner-startprisen har en mindre effekt på sannsynligheten for et salg (x-aksen) og en større effekt på den endelige salgsprisen (y-aksen).

Selv om du ikke er spesielt interessert i auksjoner på eBay, må du beundre måten Figur 2.7 og Figur 2.8 tilbyr en rikere forståelse av eBay enn enkle lineære regresjon estimater som antar lineære sammenhenger og kombinerer mange ulike kategorier av elementer. Disse mer subtile estimater illustrere makt matchende i massive data; disse estimatene ville ha vært umulig uten et enormt antall feltforsøk, noe som ville vært uoverkommelig dyrt.

Selvfølgelig bør vi ha mindre tillit til resultatene av en bestemt samsvarende studie enn vi ville gjort i resultatene av en tilsvarende eksperiment. Ved vurdering av resultatene fra noen matchende studien, er det to viktige bekymringer. Først må vi huske at vi bare kan sikre rettferdige sammenligninger på ting som ble brukt for matching. I sine viktigste resultatene, gjorde Einav og kolleger eksakt matching på fire kjennetegn: selger ID-nummer, produktkategori, element tittel og undertittel. Hvis elementene var annerledes på måter som ikke ble brukt for matching, som kan skape en urettferdig sammenligning. For eksempel, hvis "budgetgolfer" senket prisene for Taylormade Burner 09 Driver om vinteren (når golfklubber er mindre populære), så det kan se ut til at lavere startpriser fører til lavere sluttprisen, når det faktisk dette ville være en gjenstand for sesong variasjoner i etterspørselen. Generelt, den beste tilnærmingen til dette problemet synes å være å prøve mange forskjellige typer matching. For eksempel, Einav og kolleger gjenta sin analyse hvor matchet sett inkluderer elementer på salg innen ett år, innen en måned, og møtereferat. Å gjøre det tidsvinduet strammere reduserer antall matchet sett, men reduserer bekymringer om sesongvariasjon. Heldigvis finner de at resultatene er uforandret av disse endringene i matchende kriterier. I den tilhørende litteraturen, er denne type bekymring vanligvis uttrykt i form av målbare og unobservables, men nøkkelen ideen er egentlig at forskere er bare å skape rettferdige sammenligninger på de funksjonene som brukes i matching.

Den andre store bekymringen når man tolker samsvarende resultater er at de kun gjelder matchet data; de ikke gjelder for saker som ikke kan matches. For eksempel ved å begrense sin forskning til elementer som har hatt flere oppføringer Einav og kollegaer fokuserer på profesjonelle og semi-profesjonelle selgere. Dermed når man tolker disse sammenligningene vi må huske på at de kun gjelder denne undergruppe av eBay.

Matching er en kraftig strategi for å finne rettferdige sammenligninger i store datasett. For mange samfunnsvitere, føles matching som nest beste til eksperimenter, men det er en tro som bør revideres, litt. Matching i massive data kan være bedre enn et lite antall feltforsøk når: 1) heterogenitet i effekter er viktig, og 2) det er gode målbare parametere for matching. Tabell 2.4 gir noen eksempler på hvordan samsvarende kan anvendes med store datakilder.

Tabell 2.4: Eksempler på studier som bruker matching for å finne rettferdige sammenligninger innenfor digitale spor.
Saklig fokus Big datakilde Sitering
Effekt av skytingen på politivold Stopp-og-Frisk poster Legewie (2016)
Effekt 11. september 2001 om familier og naboer stemmegivning poster og donasjon poster Hersh (2013)
sosial smitte Kommunikasjon og produkt adopsjon data Aral, Muchnik, and Sundararajan (2009)

I konklusjonen, naiv tilnærming til å estimere kausale effekter fra ikke-eksperimentelle data er farlig. Imidlertid kan strategier for å gjøre årsaks estimatene som ligger langs et kontinuum fra sterkest til svakest, og forskere oppdage rettferdige sammenligninger innenfor ikke-eksperimentelle data. Veksten av alltid-på, store datasystemer øker vår evne til effektivt å bruke to eksisterende metoder: naturlige eksperimenter og matching.