Matching krijuar krahasime të ndershme nga tëharrje larg raste.
Krahasimet e drejtë mund të vijnë nga të dyja randomized kontrolluar eksperimentet apo eksperimente natyrore. Por, ka shumë situata ku ju nuk mund të kandidojë eksperimentin ideal dhe natyra nuk ka dhënë një eksperiment natyror. Në këto mjedise, mënyra më e mirë për të krijuar një krahasim e drejtë përputhen. Në përputhen, studiuesi duket me të dhëna jo-eksperimentale për të krijuar palë e njerëzve që janë të ngjashme, përveç se ai ka marrë trajtim dhe nuk ka. Në procesin e përputhjes, studiuesit janë në fakt edhe krasitjes; që është, hidhni rastet ku ka asnjë krahasim të dukshme. Kështu, kjo metodë do të thirret më saktë përputhen-dhe-tëharrje, por unë do të rrinë me afat tradicionale: përputhen.
Një shembull i bukur i fuqisë së krahasimit të strategjive me burimet masive të të dhënave jo-eksperimentale vijnë nga hulumtimi në sjelljen e konsumatorit nga Liran Einav dhe kolegët (2015) . Einav dhe kolegët ishin të interesuar në ankandet që zhvillohen në eBay, dhe në përshkrimin e punës së tyre, unë do të përqëndrohet në një aspekt të veçantë: efektin e ankandit çmim fillestar për rezultatet e ankandit, të tilla si të çmimit të shitjes ose probabilitetin e një shitje.
Mënyra më naive për t'iu përgjigjur pyetjes në lidhje me efektin e çmimit fillestar të çmimit të shitjes do të ishte thjesht të llogaritur çmimin përfundimtar për ankandet me çmime të ndryshme duke filluar. Kjo qasje do të jetë mirë në qoftë se ju doni thjesht të parashikojnë çmimin e shitjes së një artikull të caktuar që ishte vënë në eBay me një çmim të caktuar duke filluar. Por, në qoftë se pyetja juaj është se çfarë është efekti i fillimit të çmimit në rezultatet e tregut të këtë qasje nuk do të funksionojë për shkak se ajo nuk është e bazuar në krahasime të ndershme; ankande me çmime më të ulëta fillestare mund të jenë krejt të ndryshme nga ankandet me çmimet më të larta fillestare (p.sh., ata mund të jenë të llojeve të ndryshme të mallrave ose të përfshijnë lloje të ndryshme të shitësit).
Nëse ju jeni tashmë të shqetësuar për të bërë krahasime të ndershme, ju mund të kaloni qasje naive dhe e konsiderojnë drejtimin e një eksperiment në terren, ku ju do të shesë një të veçantë zë-thonë, një klub-me golfit një grup të caktuar të ankandit parametrave-thonë, të anijeve të lirë, ankand e hapur për dy javë, etj, por me të vendosur rastësisht çmimet duke filluar. Duke krahasuar rezultatet që rezultojnë të tregut, ky eksperiment fushë do të ofrojë një matje shumë të qartë për efektin e fillimit të çmimit të çmimit të shitjes. Por, kjo matje do të zbatohen vetëm për një produkt të veçantë dhe të vendosur e parametrave ankand. Rezultatet mund të jenë të ndryshme, për shembull, për lloje të ndryshme të produkteve. Pa teori të fortë, është e vështirë të nxjerrim nga ky eksperiment i vetëm gamën e plotë të eksperimenteve të mundshme që mund të ketë qenë drejtuar. Më tej, eksperimentet në terren janë mjaft të shtrenjta se do të jetë e parealizueshme për të drejtuar mjaft prej tyre deri për të mbuluar tërë hapësirën parametër të produkteve dhe llojet e ankandit.
Në kontrast me qasjen naiv dhe qasje eksperimentale, Einav dhe kolegët të marrë një qasje të tretë: përputhen. Qëllimi kryesor i strategjisë së tyre është për të zbuluar gjëra të ngjashme me eksperimentet në terren që kanë ndodhur tashmë në eBay. Për shembull, Figura 2.6 tregon disa nga 31 Listimet për pikërisht në të njëjtën klub-a e golfit Taylormade Burner 09 Shofer-duke u shitur nga pikërisht në të njëjtën seller- "budgetgolfer" e. Megjithatë, këto Listimet kanë karakteristika pak më të ndryshme. Njëmbëdhjetë prej tyre ofrojnë shofer për një çmim fiks prej $ 124,99, ndërsa 20 të tjera janë ankand me data të ndryshme në fund. Gjithashtu, Listimet kanë tarifa të ndryshme të anijeve, ose $ 7.99 ose $ 9,99 $. Me fjalë të tjera, është sikur "budgetgolfer" është duke eksperimente për studiuesit.
Listimet e 09 Shofer Taylormade Burner duke u shitur nga "budgetgolfer" janë një shembull i një sërë përputhet e listings, ku i njëjti artikull saktë është duke u shitur nga shitësi njëjtë e saktë, por çdo herë me karakteristika pak më të ndryshme. Brenda shkrimet masive të eBay ka fjalë për fjalë qindra e mijëra grupe të krahasohen përfshijnë miliona listings. Kështu, në vend se duke krahasuar çmimin përfundimtar për të gjitha ankandet brenda një çmim të caktuar fillestar, Einav dhe kolegët e bëjnë krahasime brenda grupe krahasohen. Në mënyrë për të kombinuar rezultatet nga krahasimet brenda këtyre qindra e mijëra grupe të krahasohen, Einav dhe kolegët e ri-shprehur çmim fillestar dhe çmimin përfundimtar për sa i përket vlerës së referencës të çdo send (p.sh., çmimi mesatar i saj shitjes). Për shembull, në qoftë se 09 Shofer Taylormade Burner ka një vlerë të referencës prej 100 $ (bazuar në shitjet e saj), atëherë një çmim fillestar prej $ 10 do të shprehet si 0.1 dhe çmimin final prej $ 120 do të shprehet si 1.2.
Kujtojnë se Einav dhe kolegët ishin të interesuar në efektin e çmimit të fillimit mbi rezultatet e ankandit. Së pari, duke përdorur regresionin linear ata vlerësuar se çmimet e larta duke filluar uljen probabilitetin e një shitje, dhe se çmimet e larta duke filluar rritjen e çmimit përfundimtar të shitjes, të kushtëzuar nga një shitje ndodhin. Vetë, këto vlerësime-të cilat janë si mesatare e të gjitha produktet dhe të marrë një marrëdhënie lineare në mes të çmimit fillestar dhe përfundimtar nuk rezultateve, janë të gjitha që interesante. Por, Einav dhe kolegët të përdorin madhësinë masiv të të dhënave të tyre për të vlerësuar një shumëllojshmëri të gjetjeve më delikate. Së pari, Einav dhe kolegët e bërë këto vlerësime veçmas për sendet e çmime të ndryshme dhe pa përdorur regresionin linear. Ata gjetën se ndërsa marrëdhëniet në mes të çmimit të fillimit dhe probabilitetin e një shitje është linear, marrëdhënia midis çmim fillestar dhe çmimin e shitjes është qartësisht jo-lineare (Figura 2.7). Në mënyrë të veçantë, për fillimin e çmimeve në mes të 0.05 dhe 0.85, çmimi fillestar ka shumë pak ndikim në çmimin e shitjes, një gjetje që u përfundua humbur në analizën që kishte marrë një marrëdhënie lineare.
Së dyti, në vend se mesatarisht mbi të gjitha sendet, Einav dhe kolegët të përdorë gjithashtu edhe shkallën masiv të dhënat e tyre për të vlerësuar ndikimin e çmim fillestar për 23 kategori të ndryshme të artikujve (p.sh., furnizimet manar, elektronikë, dhe sportive relikeve) (Figura 2.8). Këto vlerësime tregojnë se për më shumë të dallueshme artikuj, të tilla si çmimi i relikeve-start ka një efekt më të vogël në probabilitetin e një shitje dhe një efekt të madh në çmimin përfundimtar të shitjes. Më tej, për artikuj-të tilla më commodified si DVD dhe video-çmimin e fillimit ka pothuajse asnjë ndikim në çmimin përfundimtar. Me fjalë të tjera, një mesatare që kombinon rezultatet nga 23 kategorive të ndryshme të artikujve fsheh informacion të rëndësishëm në lidhje me dallimet në mes të këtyre artikujve.
Edhe nëse ju nuk janë të interesuar veçanërisht në ankand në eBay, ju duhet të admirojnë mënyrën se Ilustrimi 2.7 dhe Figura 2.8 ofrojë një kuptim më të pasur i eBay se vlerësimet e thjeshtë të regresionit linear që supozojnë marrëdhënie lineare dhe të kombinojnë shumë kategori të ndryshme të artikujve. Këto vlerësime më delikate të ilustruar fuqinë e përputhen në të dhënat masive; këto vlerësime do të kishte qenë i pamundur pa një numër të madh të eksperimenteve në terren, i cili do të kishte qenë të shtrenjta.
Natyrisht, ne duhet të kemi më pak besim në rezultatet e ndonjë studim të veçantë përputhjes se ne do të në rezultatet e një eksperimenti të krahasueshme. Kur vlerësimin e rezultateve nga çdo studim përputhen, janë dy shqetësime të rëndësishme. Së pari, ne duhet të kujtojmë se ne mund të sigurojnë vetëm krahasime të drejta për gjërat që janë përdorur për të përputhen. Në rezultatet e tyre kryesore, Einav dhe kolegët e saktë përputhen me katër karakteristika: shitësi numrin ID, kategori pika, titullin pika, dhe subtitle. Në qoftë se sendet janë të ndryshme në mënyra të cilat nuk janë përdorur për të përputhen, që mund të krijojnë një krahasim të padrejtë. Për shembull, në qoftë se "budgetgolfer" ulur çmimet për Taylormade Burner 09 Shofer në dimër (kur klubet e golfit janë më pak të njohura), atëherë ajo mund të duket se çmimet e ulëta fillestare të çojë në çmime më të ulëta finale, kur në fakt kjo do të jetë një Objekti i sezonale ndryshim në kërkesë. Në përgjithësi, mënyra më e mirë për këtë problem duket të jetë duke u përpjekur për lloje të ndryshme të përputhen. Për shembull, Einav dhe kolegët e përsëritur analizën e tyre, ku grupe të krahasohen përfshijnë artikuj në shitje brenda një viti, brenda një muaji, dhe njëkohësisht. Marrja dritarja koha forta zvogëlon numrin e përcakton përputhet, por zvogëlon shqetësime lidhur me variacion sezonal. Për fat të mirë, ata të gjeni se rezultatet janë të pandryshuara nga këto ndryshime në kritere përputhen. Në literaturën përputhen, ky lloj i shqetësimit zakonisht shprehet në termat e vëzhgimeve dhe unobservables, por ideja kryesore është me të vërtetë që studiuesit janë vetëm duke krijuar krahasime të ndershme në tiparet e përdorura në përputhen.
Shqetësimi i dytë i madh gjatë interpretimit përputhen rezultatet është se ato zbatohen vetëm për të dhëna krahasohen; ato nuk zbatohen për rastet që nuk mund të krahasohen. Për shembull, duke kufizuar hulumtimet e tyre për sendet që kishin prona të shumta Einav dhe kolegët janë duke u përqëndruar në shitësit profesionale dhe gjysmë-profesional. Kështu, gjatë interpretimit këto krahasime ne duhet të kujtojmë se ato zbatohen vetëm për këtë mesin e eBay.
Matching është një strategji e fuqishme për gjetjen e krahasime të ndershme në datasets të mëdha. Për shumë shkencëtarë socialë, të ngjashëm ndjehet si dytë më e mirë për eksperimente, por kjo është një besim që duhet të rishikohet, pak. Matching në të dhënat masive mund të jetë më mirë se një numër i vogël i eksperimenteve fushore kur: 1) heterogjeniteti në efektet e rëndësishme dhe 2) ka vëzhgimeve të mira për përputhen. Tabela 2.4 jep disa shembuj të tjerë se si përputhen mund të përdoret me burime të mëdha të të dhënave.
fokusi substanciale | burim i madh dhënave | Citim |
---|---|---|
Efekti i të shtënave mbi dhunën policore | Stop-and-Frisk të dhënat | Legewie (2016) |
Efekti i 11 shtatorit 2001 në familjet dhe fqinjët | të dhënat e votimit dhe të dhënat donacion | Hersh (2013) |
sëmundje ngjitëse social | Komunikimi dhe miratimin e produktit të dhënave | Aral, Muchnik, and Sundararajan (2009) |
Në përfundim, qasje naive ndaj vlerësuar efekti shkakor nga të dhënat jo-eksperimentale janë të rrezikshme. Megjithatë, strategjitë për të bërë vlerësime shkakësore shtrirë përgjatë një vazhdimësi nga më të fortë deri dobët, dhe studiuesit mund të zbuloni krahasime të ndershme brenda të dhënave jo-eksperimentale. Rritja e gjithmonë-në sistemet, të të dhënave të mëdha rrit aftësinë tonë për të përdorur efektivisht dy metoda ekzistuese: eksperimente natyrore dhe përputhen.