2.4.3.2 Matching

Matchende skabe retfærdige sammenligninger ved beskæring væk sager.

Fair sammenligninger kan komme fra enten randomiserede kontrollerede forsøg eller naturlige eksperimenter. Men der er mange situationer, hvor du ikke kan køre den ideelle eksperiment og naturen har endnu ikke lavet en naturlig eksperiment. I disse indstillinger, at den bedste måde at skabe en rimelig sammenligning matcher. I matching, ser forskeren gennem ikke-eksperimentelle data til at skabe par af mennesker, der ligner, bortset fra at man har modtaget behandling, og man har ikke. I processen med matching, er forskerne faktisk også beskæring; det er, kassere de tilfælde, hvor der er ingen indlysende sammenligning. Således er denne metode ville være mere præcist kaldet matching-og-beskæring, men jeg vil holde fast i den traditionelle benævnelse: matching.

Et smukt eksempel på styrken i matchende strategier med massive ikke-eksperimentelle datakilder kommer fra forskning i forbrugeradfærd ved Liran Einav og kolleger (2015) . Einav og kolleger var interesseret i auktioner, der finder sted på eBay, og beskriver deres arbejde, vil jeg fokusere på et særligt aspekt: ​​effekten af ​​auktionen Startprisen på auktion resultater, såsom salgsprisen eller sandsynligheden for et salg.

Den mest naive måde at besvare spørgsmålet om effekten af ​​startpris på salgsprisen ville være simpelthen at beregne den endelige pris for auktioner med forskellige udgangspunkter priser. Denne fremgangsmåde ville være fint, hvis du blot ønsker at forudsige salgsprisen for en given vare, der var blevet sat på eBay med en given startpris. Men hvis dit spørgsmål er, hvad er effekten af start pris på markedsvilkår udfald denne fremgangsmåde vil ikke arbejde, fordi den ikke er baseret på rimelige sammenligninger; auktionerne med lavere start priser kan være helt forskellig fra auktioner med højere start priser (f.eks de kunne være for forskellige typer af varer eller inkludere forskellige typer af sælgere).

Hvis du allerede er bekymret for at gøre retfærdige sammenligninger, kan du springe den naive tilgang og overveje at køre et felt eksperiment, hvor du ville sælge en bestemt vare-sige, en golfkølle-med et fast sæt af auktion parametre-sige, gratis forsendelse, auktion åben i to uger, osv-men med sat tilfældigt startende priser. Ved at sammenligne de resulterende markedsresultater, vil dette felt eksperiment tilbyder en meget klar måling af effekten af ​​start pris på salgsprisen. Men, ville denne måling kun gælde for én bestemt produkt og sæt auktion parametre. Resultaterne kan være anderledes, for eksempel til forskellige typer af produkter. Uden stærk teori, er det vanskeligt at ekstrapolere fra denne enkelt eksperiment hele spektret af mulige eksperimenter, som kunne have været kørt. Endvidere markforsøg er tilstrækkeligt dyre, at det ville være umuligt at køre nok af dem op for at dække hele parameter rummet af produkter og auktion typer.

I modsætning til den naive tilgang og den eksperimenterende tilgang, Einav og kolleger tager en tredje tilgang: matching. Det vigtigste trick i deres strategi er at opdage ting ligner markforsøg, der allerede sket på eBay. For eksempel, figur 2.6 viser nogle af de 31 programoversigter for nøjagtig den samme golfklub-en TaylorMade Burner 09 driveren-sælges af nøjagtig samme seller- "budgetgolfer". Men disse lister har lidt forskellige egenskaber. Elleve af dem tilbyde driveren til en fast pris på $ 124,99, mens de øvrige 20 er auktioner med forskellige slutdatoer. Også lister har forskellige shipping gebyrer, enten $ 7,99 eller $ 9,99. Med andre ord, er det som om "budgetgolfer" kører forsøg til forskerne.

De lister ved TaylorMade Burner 09 driveren sælges ved "budgetgolfer" er et eksempel på et matchede sæt lister, hvor nøjagtig samme emne bliver solgt af nøjagtig samme sælger, men hver gang med lidt forskellige egenskaber. Inden for de massive logs af eBay er der bogstaveligt talt hundredvis af tusindvis af matchede sæt involverer millioner af lister. Således, i stedet at sammenligne den endelige pris for alle auktioner i en given startpris, Einav og kolleger foretage sammenligninger inden matchede sæt. For at kombinere resultater fra sammenligninger inden disse hundredtusinder af matchede sæt, Einav og kolleger igen udtrykke startpris og sidste pris i form af referenceværdien for hvert punkt (f.eks dens gennemsnitlige salgspris). For eksempel, hvis TaylorMade Burner 09 driveren har en referenceværdi på $ 100 (baseret på salget), derefter en start pris på $ 10 blive udtrykt som 0,1 og endelige pris på $ 120 blive udtrykt som 1.2.

Figur 2.6: Et eksempel på et matchet sæt. Dette er nøjagtig den samme golfklub (en TaylorMade Burner 09 driveren) sælges af nøjagtig samme person (budgetgolfer), men nogle af disse salg blev udført forskellige betingelser (fx anderledes start pris). Figur taget fra Einav et al. (2015).

Figur 2.6: Et eksempel på et matchet sæt. Dette er nøjagtig den samme golfklub (en TaylorMade Burner 09 driveren) sælges af nøjagtig samme person ( "budgetgolfer"), men nogle af disse salg blev udført forskellige forhold (f.eks anderledes start pris). Figur taget fra Einav et al. (2015) .

Husk på, at Einav og kolleger var interesseret i effekten af ​​startpris på auktion resultater. Først ved hjælp af lineær regression, de skønnede, at højere start priser mindske sandsynligheden for et salg, og at højere start priser øge den endelige salgspris, betinget af et salg forekommende. Ved selv, disse estimater-som gennemsnit over alle produkter og påtage sig en lineær sammenhæng mellem startpris og endelige resultater-er ikke så interessant. Men Einav og kolleger bruger også den massive størrelse af deres data til at estimere en række mere subtile resultater. Først Einav og kolleger gjorde disse skøn separat for elementer af forskellige priser og uden brug af lineær regression. De fandt, at mens forholdet mellem start pris og sandsynligheden for et salg er lineær, forholdet mellem startpris og salgsprisen er tydeligvis ikke-lineær (Figur 2.7). Især for at starte priserne mellem 0,05 og 0,85, startprisen har meget ringe indflydelse på salgsprisen, en konstatering, der blev afsluttet savnet i analysen, som havde antaget en lineær sammenhæng.

Figur 2.7: Forholdet mellem auktion startpris og sandsynligheden for et salg (venstre panel) og salgspris (højre panel). Der er omtrent en lineær sammenhæng mellem start pris og sandsynligheden for salg, men der er en ikke-lineær sammenhæng mellem start pris og salgspris; til start priserne mellem 0,05 og 0,85, startprisen har meget ringe indflydelse på salgsprisen. I begge tilfælde forholdet er dybest set uafhængige af elementet værdi. Disse grafer reproducere Fig 4a og 4b Einav et al. (2015).

Figur 2.7: Forholdet mellem auktion startpris og sandsynligheden for et salg (venstre panel) og salgspris (højre panel). Der er omtrent en lineær sammenhæng mellem start pris og sandsynligheden for salg, men der er en ikke-lineær sammenhæng mellem start pris og salgspris; til start priserne mellem 0,05 og 0,85, startprisen har meget ringe indflydelse på salgsprisen. I begge tilfælde forholdet er dybest set uafhængige af elementet værdi. Disse grafer reproducere Fig 4a og 4b Einav et al. (2015) .

For det andet, i stedet for gennemsnittet over alle elementer, Einav og kolleger bruger også den massive omfang deres data til at vurdere effekten af ​​start pris for 23 forskellige kategorier af genstande (f.eks PET forsyninger, elektronik og sport memorabilia) (Figur 2.8). Disse skøn viser, at mere markante elementer-såsom memorabilia-start prisen har en mindre effekt på sandsynligheden for et salg og en større effekt på den endelige salgspris. Endvidere for mere kommercialiseres poster-såsom DVD'er og video-start prisen har næsten ingen indflydelse på den endelige pris. Med andre ord, et gennemsnit, der kombinerer resultater fra 23 forskellige kategorier af poster skjuler vigtige oplysninger om forskellene mellem disse elementer.

Figur 2.8: Resultaterne viste estimater fra hver kategori individuelt; den faste prik i estimatet for alle kategorier samlet sammen, Tabel 11 (Einav et al. 2015, tabel 11). Disse skøn viser, at mere markante elementer-såsom memorabilia-start prisen har en mindre effekt på sandsynligheden for et salg (x-aksen) og en større effekt på den endelige salgspris (y-aksen).

Figur 2.8: Resultaterne viste estimater fra hver kategori individuelt; den faste prik i estimatet for alle kategorier poolede sammen (Einav et al. 2015, Table 11) . Disse skøn viser, at mere markante elementer-såsom memorabilia-start prisen har en mindre effekt på sandsynligheden for et salg (x-aksen) og en større effekt på den endelige salgspris (y-aksen).

Selv hvis du ikke er særligt interesseret i auktioner på eBay, du nødt til at beundre den måde, Figur 2.7 og Figur 2.8 tilbud en rigere forståelse af eBay end simple lineære regression skøn, som antager lineære relationer og kombinere mange forskellige kategorier af poster. Disse mere subtile skøn illustrere magt matcher i massiv data; disse skøn ville have været umuligt uden et enormt antal af markforsøg, hvilket ville have været uoverkommeligt dyre.

Selvfølgelig skal vi have mindre tillid til resultaterne af en bestemt matching undersøgelse, end vi ville i resultaterne af en tilsvarende eksperiment. Ved vurdering af resultaterne fra enhver matching studie, er der to vigtige bekymringer. Først, vi skal huske, at vi kun kan sikre rimelige sammenligninger om ting, der blev brugt til matchning. I deres vigtigste resultater, gjorde Einav og kolleger præcis matcher på fire karakteristika: sælger ID-nummer, produktkategori, punkt titel, og undertekster. Hvis elementerne var forskellige på måder, som ikke blev brugt til matchning, der kunne skabe en urimelig sammenligning. For eksempel, hvis "budgetgolfer" sænket priserne for TaylorMade Burner 09 driveren om vinteren (når golfklubber er mindre populære), så kunne det forekomme, at lavere start priser føre til lavere endelige priser, når de i virkeligheden ville det være en artefakt af sæsonbetinget variation i efterspørgslen. Generelt er den bedste tilgang til dette problem synes at være at forsøge mange forskellige slags matching. For eksempel Einav og kolleger gentage deres analyse, hvor matchede sæt omfatter punkter på salg inden for et år, inden for en måned, og samtidigt. Gøre tidsvindue strammere reducerer antallet af matchede sæt, men reducerer bekymringer om sæsonvariation. Heldigvis de finder, at resultaterne er uændret ved disse ændringer i matchende kriterier. I den matchende litteratur, er denne form for bekymring normalt udtrykkes i observable og unobservables, men den centrale idé er virkelig, at forskerne kun skabe fair sammenligninger på de funktioner, der anvendes i matchning.

Den anden store bekymring ved fortolkningen matchende resultater er, at de kun finder anvendelse på matchede data; de gælder ikke for de sager, der ikke kunne matches. For eksempel ved at begrænse deres forskning til elementer, der havde flere fortegnelser Einav og kolleger med fokus på professionelle og semi-professionelle sælgere. Således, når de fortolker disse sammenligninger, vi skal huske, at de kun gælder for denne delmængde af eBay.

Matching er en kraftfuld strategi for at finde retfærdige sammenligninger i store datasæt. For mange samfundsforskere, matching føles næstbedste eksperimenter, men det er en tro, der bør revideres, en smule. Matching i massive data kan være bedre end et lille antal markforsøg, når: 1) heterogenitet i effekter er vigtig, og 2) der er gode observable til matchning. Tabel 2.4 giver nogle andre eksempler på, hvordan matching kan bruges med store datakilder.

Tabel 2.4: Eksempler på undersøgelser, der bruger matching for at finde retfærdige sammenligninger inden digitale spor.
Materiel fokus Big datakilde Citation
Effekt af skyderier på politivold Stop-and-Frisk records Legewie (2016)
Effekt 11. september 2001 om familier og naboer afstemningsresultaterne og donation optegnelser Hersh (2013)
Social afsmitning Kommunikation og produkt vedtagelse data Aral, Muchnik, and Sundararajan (2009)

Afslutningsvis naive tilgange til estimering kausale effekter fra ikke-eksperimentelle data er farlige. strategier for at gøre kausale skøn ligger langs et kontinuum fra stærkeste til svageste, og forskere, kan dog finde retfærdige sammenligninger inden ikke-eksperimentelle data. Væksten af ​​altid-on, store datasystemer øger vores evne til effektivt at bruge to eksisterende metoder: naturlige eksperimenter og matchning.