2.4.3.2 Vastaavat

Vastaavat luoda oikeudenmukainen vertailuja karsimalla pois tapauksissa.

Fair vertailuja voi tulla joko satunnaistettu kontrolloitu kokeissa tai luonnollinen kokeiluja. Mutta on olemassa monia tilanteita, joissa ei voida ajaa ihanteellinen kokeilu ja luonto ei ole antanut luonnollinen kokeilu. Näissä asetuksia, paras tapa luoda oikeudenmukainen vertailu matching. Vuonna matching, tutkija näyttää läpi kuin kokeelliset tiedot luoda paria ihmisiä, jotka ovat samanlaisia, paitsi että yksi on saanut hoitoa ja yksi on ei. Tässä prosessissa matching tutkijat todella myös karsintaa; se on, hylätään silloin, kun ei ole olemassa selvää vertailua. Siten tämä menetelmä olisi oikeampi matching-ja-karsintaa, mutta minä kiinni perinteistä merkintää: matching.

Kaunis esimerkki voimasta vastaavia strategioita massiivinen kuin koetarkoituksessa tietolähteiden peräisin tutkimusta kuluttajakäyttäytymisen Liran Einav ja työtovereiden (2015) . Einav ja kollegat olivat kiinnostuneita huutokaupat tapahtuu eBay, ja kuvatessaan työtään, minä keskittyä erityisestä näkökulmasta: vaikutus huutokaupan lähtöhinnan huutokauppasivustoilla lopputuloksista, kuten myyntihinta tai todennäköisyys myyntiin.

Kaikkein naiivi tapa vastata kysymykseen vaikutuksesta lähtöhinnan myyntiin hinta olisi yksinkertaisesti laskea lopullista hintaa huutokaupan erilaiset lähtökohdat hintoihin. Tämä lähestymistapa olisi hienoa, jos haluat vain ennustaa myyntihinta tietyn kohteen, joka oli saatettu eBay tietyn lähtöhinnan. Mutta, jos kysymys on, mikä on vaikutus alkaa hinta markkinatuloksiin tämä lähestymistapa ei toimi, koska se ei perustu oikeudenmukainen vertailuja; huutokaupat alhaisemmat alkaa hinnat saattavat olla aivan erilainen kuin huutokaupan korkeampia alkaa hintoihin (esim, ne saattavat olla erilaisia ​​tavaroita tai sisältävät erityyppisiä myyjät).

Jos olet jo huolissasi tehdä oikeudenmukainen vertailuja, voit ohittaa naiivi lähestymistapa ja harkitse kenttäkokeessa, jossa voit myydä tietyn kohteen-sanovat, golfklubin-kiinteällä joukon huutokaupan parametrien-sanovat, vapaa merenkulku, huutokauppa avoinna kaksi viikkoa, jne-mutta satunnaisesti aloitussyvyys hintoihin. Vertaamalla saatua markkinat tuloksia, tämä kenttäkoe tarjoaisi erittäin selkeä mittaus vaikutus alkaa hinta myyntihinta. Mutta tämä mittaus koskisi ainoastaan ​​yhden tietyn tuote ja muita huutokauppa parametreja. Tulokset voivat olla erilaisia, esimerkiksi erityyppisiä tuotteita. Ilman vahvaa teoria, on vaikea tehdä päätelmiä tämän yhden kokeen kaikkia mahdollisia kokeita, jotka olisi voitu käyttää. Lisäksi kenttäkokeet ovat riittävän kalliita, että se olisi käytännössä mahdotonta ajaa tarpeeksi niitä jopa kattaa koko parametriavaruus tuotteiden ja huutokauppa tyyppejä.

Toisin kuin naiivi lähestymistapa ja kokeellisen lähestymistavan, Einav ja työtovereiden ottaa kolmas lähestymistapa: matching. Tärkein temppu niiden strategia on löytää asioita samanlainen kenttäkokeet, jotka ovat jo tapahtunut eBayssa. Esimerkiksi Kuva 2.6 näkyy joitakin 31 listat täsmälleen samasta golfklubin-a TaylorMade Burner 09 Kuljettajan myy täsmälleen sama seller- "budgetgolfer". Nämä listat ovat hieman erilaisia ​​ominaisuuksia. Yksitoista niistä tarjoavat kuljettajalle kiinteään hintaan $ 124.99, kun taas muut 20 ovat huutokaupan eri päättymispäivät. Myös listat ovat eri postikulut, joko $ 7.99 tai $ 9.99. Toisin sanoen, se on ikään kuin "budgetgolfer" on käynnissä kokeita tutkijat.

Listat on TaylorMade Burner 09 Kuljettajan myy "budgetgolfer" ovat yksi esimerkki sovitetun joukon listausten, jossa täsmälleen sama tuote on myy täsmälleen sama myyjä, mutta joka kerta hieman eri ominaisuuksia. Sisällä Höylähirsi eBay on kirjaimellisesti satoja tuhansia Hyväksytty sarjaa, joissa miljoonat listat. Niinpä sen sijaan, että vertaamalla lopullista hintaa kaikissa huutokaupoissa tietyn lähtöhinnan, Einav ja työtovereiden tehdä vertailuja sovitettu sarjoiksi. Jotta yhdistää tulokset vertailujen tekoa näiden satojatuhansia Hyväksytty sarjaa, Einav ja työtovereiden uudelleen ilmaista lähtöhinnan ja lopullinen hinta mitattuna viitearvon kunkin kohteen (esim sen keskimääräinen myyntihinta). Esimerkiksi jos TaylorMade Burner 09 Kuljettaja on viitearvon $ 100 (perustuu sen myynnistä), sitten alkaen hinta on $ 10 ilmaistaisiin 0,1 ja lopullinen hinta 120 $ ilmaistaisiin 1.2.

Kuva 2.6: Esimerkki sovitetun joukon. Tämä on täsmälleen sama golfklubin (a TaylorMade Burner 09 Driver) myy täsmälleen sama henkilö (budgetgolfer), mutta jotkut näistä myynti suoritettiin eri olosuhteissa (esim erilaiset lähtöhinnaksi). Kuva on otettu Einav et al. (2015).

Kuva 2.6: Esimerkki sovitetun joukon. Tämä on täsmälleen sama golfklubin (a TaylorMade Burner 09 Driver) myy täsmälleen sama henkilö ( "budgetgolfer"), mutta jotkut näistä myynti suoritettiin eri olosuhteissa (esim erilaiset lähtöhinnaksi). Kuva on otettu Einav et al. (2015) .

Muista, että Einav ja kollegat olivat kiinnostuneita vaikutus lähtöhinta huutokauppasivustoilla tuloksiin. Ensiksi, lineaarisen regressioanalyysin avulla he arvioitu, että korkeammat lähtö- hinnat laskevat todennäköisyyttä myyntiin, ja että korkeammat käynnistys hinta parantaa lopullinen myyntihinta, ehtona on myynnissä tapahtuu. Sellaisenaan, nämä arviot-joista määritetään keskiarvo kaikista tuotteista ja olettaa lineaarinen suhde lähtöhinnan ja lopulliset tulokset-eivät ole kovin kiinnostava. Mutta, Einav ja työtovereiden myös käyttää massiivisen koon tietonsa arvioida erilaisia ​​hienovaraisempaa havainnoista. Ensinnäkin Einav ja työtovereiden tehnyt nämä arviot erikseen eriä eri hintoja ja käyttämättä lineaarista regressiota. He havaitsivat, että vaikka suhde lähtöhinta ja todennäköisyys myynti on lineaarinen suhde lähtöhinnan ja myyntihinta on selvästi epälineaarinen (Kuva 2.7). Erityisesti, aloitusaika hinnat 0,05 0,85, lähtöhinnaksi on hyvin vähän vaikutusta myyntihintaan, päätelmä valmistui jäi analyysissa, joka oli oletettu lineaarinen suhde.

Kuva 2.7: väliset huutokaupan lähtöhinta ja todennäköisyys myynnin (vasen paneeli) ja myyntihinnan (oikea paneeli). On suunnilleen lineaarinen suhde lähtöhinta ja todennäköisyys myynnin, mutta on epälineaarinen suhde lähtöhinta ja myyntihinta; aloittamiselle hintojen välillä 0,05 ja 0,85, lähtöhinnaksi on hyvin vähän vaikutusta myyntihintaan. Molemmissa tapauksissa suhteet ovat periaatteessa riippumattomia kohteen arvoa. Nämä kaaviot jäljentää kuvion 4a ja 4b Einav et al. (2015).

Kuva 2.7: väliset huutokaupan lähtöhinta ja todennäköisyys myynnin (vasen paneeli) ja myyntihinnan (oikea paneeli). On suunnilleen lineaarinen suhde lähtöhinta ja todennäköisyys myynnin, mutta on epälineaarinen suhde lähtöhinta ja myyntihinta; aloittamiselle hintojen välillä 0,05 ja 0,85, lähtöhinnaksi on hyvin vähän vaikutusta myyntihintaan. Molemmissa tapauksissa suhteet ovat periaatteessa riippumattomia kohteen arvoa. Nämä kaaviot jäljentää kuvion 4a ja 4b Einav et al. (2015) .

Toiseksi, sen sijaan keskimäärin yli kaikki kohteet, Einav ja työtovereiden myös käyttää laajamittaisesti tietonsa arvioida vaikutusta lähtöhinta 23 eri kohteita (esim lemmikkieläinten tarvikkeita, elektroniikka-, ja urheilu muistoesineiden) (Kuva 2.8). Nämä arviot osoittavat, että enemmän erottuva kohteita-kuten muistoesineitä-lähtöhinta on pienempi vaikutus todennäköisyys myynnin ja suuremman vaikutuksen lopullinen myyntihinta. Edelleen enemmän tuotteistunut kohteita-, kuten DVD- ja video-alusta hinta on lähes ole vaikutusta lopulliseen hintaan. Toisin sanoen, keskimäärin joka yhdistää tulokset 23 eri kohteita kätkee tärkeää tietoa eroista nämä kohteet.

Kuva 2.8: Tulokset osoittivat arvioiden kussakin luokassa erikseen; kiinteä piste arvion kaikkien luokkien yhdistettiin, taulukossa 11 (Einav et al. 2015, taulukko 11). Nämä arviot osoittavat, että enemmän erottuva kohteita-kuten muistoesineitä-alusta hinta on pienempi vaikutus todennäköisyys myynti (x-akseli) ja suurempi vaikutus lopullisen myyntihinnan (y-akseli).

Kuva 2.8: Tulokset osoittivat arvioiden kussakin luokassa erikseen; kiinteä piste arvion kaikkien luokkien yhdistettiin (Einav et al. 2015, Table 11) . Nämä arviot osoittavat, että enemmän erottuva kohteita-kuten muistoesineitä-alusta hinta on pienempi vaikutus todennäköisyys myynti (x-akseli) ja suurempi vaikutus lopullisen myyntihinnan (y-akseli).

Vaikka et ole erityisen kiinnostuneita huutokaupat eBayssa, sinun täytyy ihailla tapaa, jolla Kuva 2.7 ja Kuva 2.8 tarjoavat rikkaampi käsitys eBay kuin yksinkertainen lineaarinen regressio arvioidaan, että oletetaan lineaarinen suhteita ja yhdistää monia eri kohteita. Nämä hienovaraisempaa arvioita havainnollistavat voiman täsmäytymisen suuren määrän tietoa; Näiden arvioiden olisi ollut mahdotonta ilman valtava määrä kenttäkokeissa, joka olisi ollut liian kallis.

Tietenkin meidän pitäisi olla vähemmän luottamusta tuloksiin mitään erityistä matching tutkimuksessa kuin olisimme tulokset vertailukelpoisia kokeilu. Tuloksia arvioitaessa miltään matching tutkimuksessa on kaksi tärkeää huolenaiheita. Ensinnäkin on muistettava, että voimme vain varmistaa oikeudenmukainen vertailu asioita, joita käytettiin vastaavia. Heidän keskeiset tulokset, Einav ja työtovereiden ei tarkka Matching neljä ominaisuudet: myyjä henkilötunnus, tuoteryhmästä, kohde otsikko ja alaotsikko. Jos erät olivat eri tavoilla, joita ei ole käytetty vastaavia, jotka voivat luoda epäoikeudenmukaista vertailun. Jos esimerkiksi "budgetgolfer" alensi hintoja TaylorMade Burner 09 Kuljettajan talvella (kun mailat ovat vähemmän suosittuja), niin se voisi vaikuttaa siltä, ​​että pienemmät sakon hinnat johtavat alentaa lopullisia hintoja, kun tosiasiassa tämä olisi artefakti kausiluonteinen kysynnän vaihtelu. Yleensä paras lähestymistapa tähän ongelmaan näyttää olevan yrittää monenlaisia ​​vastaavia. Esimerkiksi Einav ja työtovereiden toistamiseen mittaamiseen, kun Hyväksytty sarjaa kuuluvat Myymälän vuoden kuluessa kuukauden kuluessa, ja samanaikaisesti. Making aikaikkuna tiukempi vähentää määrä Hyväksytty sarjaa, mutta vähentää huoli kausivaihtelua. Onneksi he havaitsevat, että tulokset eivät muutu nämä muutokset vastaavat kriteerit. Vastaavanvärisiin kirjallisuudessa, tällainen huoli on yleensä ilmaistaan ​​havaittavuutta ja unobservables, mutta keskeinen ajatus on todella, että tutkijat ainoastaan ​​luoda oikeudenmukainen vertailuja ominaisuuksia käytetään matching.

Toinen suuri huolenaihe tulkittaessa vastaavia tuloksia on, että ne koskevat vain sovitetun datan; ne eivät koske tapauksia, joita ei voida Hyväksytty. Esimerkiksi rajoittamalla niiden tutkimus kohteita, jotka oli useita listauksia Einav ja kollegat keskittyvät ammatti- ja semi-myyjiä. Siten tulkittaessa nämä vertailut on muistettava, että niitä sovelletaan vain tähän osajoukkoon eBay.

Matching on tehokas strategia löytää oikeudenmukainen vertailut suuria aineistoja. Sosiaalitieteilijöille, sovitus tuntuu toiseksi paras kokeisiin, mutta se on uskomus, että olisi tarkistettava, hieman. Sovitus massiivinen tietojen ehkä parempi pieni määrä kenttäkokeissa kun: 1) heterogeenisyys vaikutuksia on tärkeä ja 2) on hyvät havaittavuutta hakupalvelusta. Taulukossa 2.4 esitetään joitakin muita esimerkkejä siitä, miten vastaavat voidaan käyttää suuria tietolähteitä.

Taulukko 2.4: Esimerkkejä tutkimuksista, jotka käyttävät vastaavia löytää oikeudenmukainen vertailuja digitaalinen jälkiä.
Sisältöä tarkennus Big tietolähteen lainaus
Vaikutus ampumista poliisi- väkivaltaa Stop and frisk kirjaa Legewie (2016)
Vaikutus 11. syyskuuta 2001 perheiden ja naapurit äänestysrekistereistä ja lahjoitustilastoja Hersh (2013)
sosiaalinen contagion Viestintä ja tuotteen hyväksymistä tiedot Aral, Muchnik, and Sundararajan (2009)

Lopuksi naiivi lähestymistapoja arvioida syy vaikutuksia kuin kokeelliset tiedot ovat vaarallisia. Kuitenkin strategioita tehdä syy arvioiden sijaitseviin jatkumona vahvin heikoimpaan, ja tutkijat voivat löytää oikeudenmukainen vertailuja ei-kokeelliset tiedot. Kasvu aina päällä, iso tietojärjestelmiin lisää kykymme tehokkaasti käyttää kahta nykyiset menetelmät: luonnollinen kokeiluja ja vastaavia.