2.4.3.2 Matching

Cocog nggawe bandingaken padha dening pruning adoh kasus.

bandingaken padha bisa teka saka salah siji randomized kontrol nyobi utawa nyobi alam. Nanging, ana akeh kahanan sampeyan ora bisa mbukak eksperimen becik lan alam wis ora kasedhiya eksprimen alam. Ing setelan iki, cara sing paling apik kanggo nggawe comparison padha wis cocog. Ing cocog, peneliti katon liwat data non-eksperimen kanggo nggawe pasangan wong sing padha, kajaba mung siji sing wis ditampa perawatan lan siji wis ora. Ing proses cocog, paneliti bener uga pruning; sing, discarding kasus kono ora comparison ketok. Mangkono, cara iki bakal luwih kanthi aran cocog-lan-pruning, nanging aku bakal kelet karo istilah tradisional: cocog.

Conto ayu saka daya sing cocog karo Sastranegara karo sumber data non-eksperimen massive teka saka riset ing prilaku konsumen dening Liran Einav lan kolega (2015) . Einav lan kolega padha kasengsem ing Lelang njupuk Panggonan ing eBay, lan ing njlentrehke karya, aku bakal fokus ing siji aspek tartamtu: efek saka lelangan miwiti rega ing kasil lelangan, kayata rega sale utawa kemungkinan sale a.

Cara sing paling naif kanggo njawab pitakonan bab efek saka rega miwiti ing rega sale bakal mung ngetung rega final Lelang karo prices miwiti beda. pendekatan iki bakal nggoleki yen sampeyan mung arep kanggo mrédhiksi rega sale saka item diwenehi sing wis sijine eBay karo rega miwiti diwenehi. Nanging, yen pitakonan iku apa efek saka miwiti rega ing kasil pasar pendekatan ora bisa amarga ora adhedhasar bandingaken padha; ing Lelang karo prices miwiti ngisor bisa cukup beda saka Lelang karo prices miwiti luwih (eg, padha uga kanggo macem-macem barang utawa kalebu macem-macem jinis ebay).

Yen sampeyan wis babagan nggawe bandingaken padha, sampeyan bisa nglumpati pendekatan naif lan nimbang mlaku eksprimen lapangan ngendi sampeyan bakal ngedol tartamtu item-ngomong, klub-karo golf tetep lelangan paramèter-ngomong, free shipping, lelangan mbukak kanggo rong minggu, lan sapiturute, nanging karo acak nyetel prices miwiti. Miturut mbandingaken kasil pasar asil, jajalan lapangan iki bakal kurban ukuran cetha banget saka efek saka miwiti rega ing rega sale. Nanging, ukuran iki mung bakal aplikasi kanggo salah siji produk tartamtu lan nyetel paramèter lelangan. Asil uga beda, contone, kanggo macem-macem produk. Tanpa teori kuwat, iku angel extrapolate saka eksprimen siji iki sawetara sing kebak bisa nyobi sing bisa wis mbukak. Luwih, nyobi lapangan sing cekap larang iku bakal infeasible kanggo mbukak cukup saka wong-wong mau nganti nutupi papan parameter kabèh produk lan jinis lelangan.

Ing kontras kanggo pendekatan naif lan pendekatan eksperimen, Einav lan kolega njupuk pendekatan katelu: cocog. Carane utama strategi sing kanggo nemokake iku padha nyobi lapangan sing wis kedaden ing eBay. Contone, Figure 2.6 nuduhake sawetara saka 31 listings for persis golf club-a padha Taylormade Burner 09 Driver-kang didol dening persis seller- "budgetgolfer" padha. Nanging, listings iki duwe ciri rada beda. Eleven wong kurban driver kanggo rega tetep $ 124,99, nalika liyane 20 sing Lelang karo tanggal mburi beda. Uga, kiriman duwe Fees kapal beda, salah siji $ 7.99 utawa $ 9.99. Ing tembung liyane, iku kaya "budgetgolfer" mlaku nyobi kanggo peneliti.

Kiriman saka Taylormade Burner 09 Driver kang didol dening "budgetgolfer" iku siji conto saka pesawat dicocogaké kiriman, endi item pas padha lagi didol dening bakul pas padha nanging saben wektu kanthi ciri rada beda. Ing log massive saka eBay ana secara harfiah atusan ewu set dicocogaké nglibatno yuta listings. Mangkono, tinimbang mbandingaken rega Final kanggo kabeh Lelang ing rega miwiti diwenehi, Einav lan kolega nggawe bandingaken ing set dicocogaké. Supaya kanggo gabungke asil saka bandingaken ing atusan iki ewu mranata cocok, Einav lan kolega re-nyebut rega miwiti lan rega final ing syarat-syarat Nilai referensi saben item (eg, rega sale saben sawijining). Contone, yen Taylormade Burner 09 Driver nduwèni aji referensi $ 100 (adhedhasar sawijining dodolan), banjur rega miwiti saka $ 10 bakal ditulis minangka 0,1 lan rega Final saka $ 120 bakal ditulis minangka 1.2.

Figure 2.6: Tuladha pesawat dicocogaké. Iki pas klub golf padha (Taylormade Burner 09 Driver) kang didol dening wong pas padha (budgetgolfer), nanging sawetara saka dodolan padha dileksanakake kahanan beda (contone, rega miwiti beda). Figure dijupuk saka Einav et al. (2015).

Figure 2.6: Tuladha pesawat dicocogaké. Iki pas klub golf padha (Taylormade Burner 09 Driver) kang didol dening wong pas padha ( "budgetgolfer"), nanging sawetara saka dodolan padha dileksanakake kahanan beda (eg, rega miwiti beda). Figure dijupuk saka Einav et al. (2015) .

Kelingan sing Einav lan kolega padha kasengsem ing efek saka rega wiwitan ing kasil lelangan. First, nggunakake kemunduran linear padha kira-kira sing prices miwiti luwih ngurangi kemungkinan sale, lan sing prices miwiti luwih nambah rega sale final, saratipun ing Advertisement kedadean. Miturut piyambak, prakiraan-kang iki sing averaged liwat kabeh produk lan nganggep hubungan linier antarane rega miwiti lan final kasil-ora kabeh sing menarik. Nanging, Einav lan kolega uga nggunakake ukuran massive saka data sing kanggo ngira macem-macem temonan liyane subtle. First, Einav lan kolega digawe prakiraan dhewe kanggo item saka prices beda lan tanpa nggunakake kemunduran linear. Padha ketemu sing nalika hubungan antarane rega wiwitan lan kemungkinan sale iku linear, hubungan antarane rega miwiti lan rega sale cetha non-linear (Figure 2.7). Ing tartamtu, kanggo miwiti prices antarane 0,05 lan 0,85, rega wiwitan wis banget sethitik impact ing rega sale, finding sing rampung ora kejawab ing analisis sing wis wiwit hubungan linier.

Tokoh 2.7: Relationship antarane rega wiwitan lelangan lan kemungkinan sale (panel kiwa) lan rega sale (panel tengen). Ana kira-kira hubungan linier antarane rega wiwitan lan kemungkinan sale, nanging ana hubungan non-linear antarane rega wiwitan lan rega sale; kanggo miwiti prices antarane 0,05 lan 0,85, rega wiwitan wis banget sethitik impact ing rega sale. Ing kasus loro, ing sesambetan Sejatine sawijining regane item. gambar iki ngasilaken Fig 4a lan 4 b Einav et al. (2015).

Tokoh 2.7: Relationship antarane rega wiwitan lelangan lan kemungkinan sale (panel kiwa) lan rega sale (panel tengen). Ana kira-kira hubungan linier antarane rega wiwitan lan kemungkinan sale, nanging ana hubungan non-linear antarane rega wiwitan lan rega sale; kanggo miwiti prices antarane 0,05 lan 0,85, rega wiwitan wis banget sethitik impact ing rega sale. Ing kasus loro, ing sesambetan Sejatine sawijining regane item. Gambar iki ngasilaken Fig 4a lan 4 b Einav et al. (2015) .

Kapindho, tinimbang roto liwat kabeh item, Einav lan kolega uga nggunakake ukuran massive saka data sing kanggo ngira impact saka rega miwiti kanggo 23 macem-macem kategori item (eg, Penyetor pet, electronics, lan Kenangan olahraga) (Figure 2.8). prakiraan Iku nuduhake sing luwih khusu item kayata rega Kenangan-wiwitan nduwe pengaruh cilik ing kemungkinan sale lan efek luwih gedhe ing rega sale final. Luwih, luwih commodified item kayata DVDs lan video-rega wiwitan wis meh ora impact ing rega final. Ing tembung liyane, lan rata-rata sing nggabungke asil saka 23 macem-macem kategori item kurang informasi penting bab beda antarane item iki.

Tokoh 2.8: Results nuduhake prakiraan saka saben kategori individu; dot ngalangi ing ngira kanggo kabeh kategori nglumpukake bebarengan, Tabel 11 (Einav et al. 2015, Tabel 11). prakiraan Iku nuduhake sing luwih khusu item kayata Kenangan-rega wiwitan nduwe pengaruh cilik ing kemungkinan sale (x-sumbu) lan efek luwih gedhe ing rega sale final (y-sumbu).

Tokoh 2.8: Results nuduhake prakiraan saka saben kategori individu; dot ngalangi ing ngira kanggo kabeh kategori nglumpukake bebarengan (Einav et al. 2015, Table 11) . prakiraan Iku nuduhake sing luwih khusu item kayata Kenangan-rega wiwitan nduwe pengaruh cilik ing kemungkinan sale (x-sumbu) lan efek luwih gedhe ing rega sale final (y-sumbu).

Malah yen sampeyan ora utamané interested in Lelang ing eBay, sampeyan kudu ngujo cara sing Tokoh 2.7 lan Tokoh 2.8 kurban pangerten sugih saka eBay saka prakiraan kemunduran linear prasaja sing nganggep sesambetan linear lan gabungke akeh macem-macem kategori item. Iki prakiraan liyane subtle ilustrasi daya sing cocog ing data massive; iki prakiraan wis mokal tanpa nomer gedhe tenan saka nyobi lapangan, kang mesthi wis prohibitively larang.

Mesti wae, kita kudu kurang kapercayan ing asil sembarang sinau cocog tartamtu saka kita ngatur ing asil saka eksprimen iso dibandhingke. Nalika pambiji asil saka sinau cocog, ana loro uneg-uneg penting. First, kita kudu elinga kita mung bisa mesthekake bandingaken padha ing bab-bab sing padha digunakake kanggo cocog. Ing asil utama sing, Einav lan kolega durung pas cocog ing ciri papat: bakul ID nomer, kategori item, judhul item, lan subtitle. Yen item padha beda-beda ing cara sing padha ora digunakake kanggo cocog, sing bisa nggawe comparison adil. Contone, yen "budgetgolfer" sudo prices kanggo Taylormade Burner 09 Driver ing mangsa (nalika klub golf sing kurang populer), banjur bisa katon sing prices miwiti ngisor mimpin kanggo murah prices final, nalika ing kasunyatan iki bakal artefak saka mangsan jenis ing dikarepake. Umumé, ing pendekatan paling apik kanggo masalah iki misale jek bakal nyoba akeh macem-macem jinis cocog. Contone, Einav lan kolega mbaleni analisis ngendi set dicocogaké kalebu item ing sale ing setahun, ing siji sasi, lan contemporaneously. Nggawe jendhela wektu kenceng sudo nomer mranata cocok, nanging nyuda uneg-uneg babagan jenis mangsan. Begjanipun, padha golek sing asil panggah dening owah-owahan ing kritéria cocog. Ing sastra cocog, iki jinis badhan biasane ditulis ing syarat-syarat observables lan unobservables, nanging idea tombol punika saestu sing paneliti mung nggawe bandingaken padha ing fitur digunakake ing cocog.

Ing badhan utama nalika panjurubasan kasil sing cocog karo iku padha mung aplikasi kanggo data dicocogaké; padha ora aplikasi kanggo kasus sing ora bisa bakal dicocogaké. Contone, dening matesi riset sing kanggo item sing wis kaping listings Einav lan kolega sing ngarahke ing ebay profesional lan semi-profesional. Wau, nalika panjurubasan bandingaken kita kudu elinga yen padha mung aplikasi kanggo himpunan iki eBay.

Cocog iku strategi kuat kanggo nemokake bandingaken padha ing sekumpulan data gedhe. Kanggo akeh ilmuwan sosial, cocog ngrasa kaya liya-paling kanggo èkspèrimèn, nanging sing yakin sing kudu diubah, rada. Cocog ing data massive bisa luwih apik saka nomer cilik nyobi lapangan nalika: 1) beda-beda ing efek penting lan 2) ana observables apik kanggo cocog. Tabel 2.4 menehi sawetara conto liyane saka carane cocog bisa digunakake karo sumber data amba.

Tabel 2.4: Conto pasinaon sing nggunakake cocog kanggo golek perbandingan sing padha ing ngambah digital.
fokus intine sumber data Big citation
Efek saka bombing ing panganiaya polisi Stop-lan-Frisk cathetan Legewie (2016)
Efek saka September 11, 2001 ing kulawargané lan tanggi cathetan pilihan lan cathetan sumbangan Hersh (2013)
contagion Social Komunikasi lan Adoption produk data Aral, Muchnik, and Sundararajan (2009)

Wusananipun, cedhak naif kanggo ngitung efek nyebabake saka data non-eksperimen sing mbebayani. Nanging, Sastranegara kanggo nggawe prakiraan nyebabake lying sadawane terus saka kuat kanggo weakest, lan peneliti bisa nemokake bandingaken padha ing data non-eksperimen. Ing perkembangane saka tansah ing, sistem data amba mundhak kemampuan kita kanggo èfèktif nggunakake rong cara sing wis ana: nyobi alam lan cocog.