2.4.3.2 મેચિંગ

દૂર કિસ્સાઓમાં કાપણી દ્વારા વાજબી તુલના બનાવવા મેળ ખાય છે.

ફેર તુલના ક્યાં નિદર્શિત અંકુશિત પ્રયોગો અથવા કુદરતી પ્રયોગો થઇ શકે છે. પરંતુ, ત્યાં ઘણી પરિસ્થિતિઓમાં જ્યાં તમે આદર્શ પ્રયોગ ચલાવી શકો નહિં અને પ્રકૃતિ કુદરતી પ્રયોગ દ્વારા આપવામાં આવી નથી છે. આ સેટિંગ્સ, શ્રેષ્ઠ માર્ગ વાજબી સરખામણી બંધબેસતા બનાવવા માટે. બંધબેસતા, સંશોધક લોકો સમાન છે, સિવાય કે એક સારવાર પ્રાપ્ત થઈ છે જોડીઓ બનાવવા માટે બિન-પ્રાયોગિક માહિતી મારફતે જુએ છે અને એક નથી. મેચિંગ પ્રક્રિયા માં, સંશોધકોએ ખરેખર પણ કાપણી કરવામાં આવે છે; કે કિસ્સાઓ છે કે જ્યાં કોઈ સ્પષ્ટ સરખામણી છે કાઢી છે. આમ, આ પદ્ધતિ વધુ ચોક્કસ બંધબેસતી અને કાપણી કહેવામાં આવશે, પરંતુ હું પરંપરાગત શબ્દ સાથે વળગી પડશે: મેચિંગ.

મોટા બિન-પ્રાયોગિક માહિતી સ્રોતો સાથે વ્યૂહરચના બંધબેસતા શક્તિ એક સુંદર ઉદાહરણ Liran Einav અને સાથીઓ દ્વારા ગ્રાહક વર્તન પર સંશોધન આવે (2015) . Einav અને સહકર્મીઓ ઇબે પર થતી હરાજીમાં રસ ધરાવતા હતા અને તેમના કામ વર્ણન, હું એક ખાસ પાસા પર ધ્યાન કેન્દ્રિત પડશે: જેમ કે વેચાણ કિંમત અથવા વેચાણ સંભાવના તરીકે હરાજી પરિણામો પર હરાજી શરૂ ભાવ અસર.

વેચાણ ભાવ પર શરૂ ભાવ અસર વિશે પ્રશ્નનો જવાબ આપવા માટે સૌથી સરળ માર્ગ એ છે અલગ શરૂ ભાવ સાથે હરાજી માટે અંતિમ ભાવ ગણતરી હશે. આ અભિગમ દંડ હોઈ શકે જો તમને ફક્ત આપેલ વસ્તુ છે કે જે આપેલ શરૂ ભાવ સાથે ઇબે પર મૂકવામાં આવ્યું હતું વેચાણ કિંમત આગાહી કરવા માંગો છો કરશે. પરંતુ, જો તમારા પ્રશ્ન છે કારણ કે તે વાજબી સરખામણી પર આધારિત છે કામ કરશે નહિં આ અભિગમ બજાર પરિણામો પર ભાવ શરૂ અસર શું છે; નીચલા શરૂ ભાવ સાથે હરાજી ઊંચા શરૂ ભાવ (દા.ત., તેઓ માલ વિવિધ પ્રકારો માટે હોઈ શકે છે અથવા વેચનાર વિવિધ પ્રકારના સમાવેશ થઈ શકે છે) સાથે હરાજી તદ્દન અલગ હોઈ શકે છે.

-કહેવું પરિમાણો જો તમે પહેલાથી જ ફેર તુલના કરવા અંગે ચિંતા હોય તો, તમે નિષ્કપટ અભિગમ અવગણો અને એક ક્ષેત્ર પ્રયોગ જ્યાં તમે એક વિશિષ્ટ આઇટમ-કહેવું વેચાણ કરશે, એક ગોલ્ફ ક્લબ સાથે હરાજી એક નિશ્ચિત સમૂહ ચાલી વિચારણા કરી શકે છે, મુક્ત શીપીંગ, હરાજી બે અઠવાડિયા, માટે ખુલ્લા વગેરે પણ સાથે રેન્ડમ શરૂ ભાવ સુયોજિત કરો. પરિણામે બજાર પરિણામો સરખામણી કરીને, તો આ ક્ષેત્ર પ્રયોગ વેચાણ કિંમત પર ભાવ શરૂ અસર ખૂબ જ સ્પષ્ટ માપ આપે છે કરશે. પરંતુ, આ માપ માત્ર એક ચોક્કસ ઉત્પાદન માટે લાગુ પડે છે અને હરાજી પરિમાણો સુયોજિત કરશે. પરિણામો અલગ હોઈ શકે છે, ઉદાહરણ તરીકે, ઉત્પાદનો વિવિધ પ્રકારો માટે. મજબૂત સિદ્ધાંત વિના, તે આ એક પ્રયોગ શક્ય પ્રયોગો સંપૂર્ણ શ્રેણી કે શકે છે ચલાવવા કરવામાં આવી છે કરાય મુશ્કેલ છે. વધુમાં, ક્ષેત્ર પ્રયોગો પૂરતી ખર્ચાળ છે કે તે ઉત્પાદનો અને હરાજી પ્રકારો સમગ્ર પરિમાણ જગ્યા આવરી તેમને પૂરતી ચલાવવા માટે અશક્ય હશે.

નિષ્કપટ અભિગમ અને પ્રાયોગિક અભિગમ વિપરીત, Einav અને સહકર્મીઓ ત્રીજા અભિગમ લે છે: મેચિંગ. તેમની વ્યૂહરચના મુખ્ય યુક્તિ ક્ષેત્ર પ્રયોગો કે જે પહેલાથી જ ઇબે પર થયું હોવાનું સમાન વસ્તુઓ શોધવા માટે છે. ઉદાહરણ તરીકે, આકૃતિ 2.6 બરાબર એ જ ગોલ્ફ ક્લબ એક ટેલરમેડ બર્નર 09 ડ્રાઈવર-રહી બરાબર એ જ seller- "budgetgolfer" દ્વારા વેચવામાં 31 સૂચિઓ કેટલાક બતાવે છે. જો કે, આ સૂચિઓ સહેજ અલગ લાક્ષણિકતાઓ ધરાવે છે. તેમને અગિયાર $ 124.99 એક નિયત કિંમત માટે ડ્રાઈવર તક આપે છે, જ્યારે અન્ય 20 વિવિધ અંત તારીખો સાથે હરાજી છે. પણ, સૂચિઓ, અલગ શીપીંગ ફી હોય છે ક્યાં $ 7.99 અથવા 9.99 $. અન્ય શબ્દોમાં, તે છે, કારણ કે જો "budgetgolfer" સંશોધકો માટે પ્રયોગો ચાલી રહી છે.

ટેલરમેડ બર્નર 09 ડ્રાઈવર સૂચિઓ "budgetgolfer" દ્વારા વેચવામાં આવી સૂચિઓ, જ્યાં ચોક્કસ જ વસ્તુ ચોક્કસ જ વિક્રેતા દ્વારા વેચવામાં આવી રહી છે એક મેળ ખાતી સેટ પરંતુ સહેજ દરેક અલગ લક્ષણો સાથે સમય એક ઉદાહરણ છે. ઇબે મોટા લોગ અંદર ત્યાં શાબ્દિક સૂચિઓ લાખો સંડોવતા મેળ ખાતી સેટ હજારો છે. આમ, તેના બદલે આપેલ શરૂ ભાવ અંદર બધા હરાજી માટે અંતિમ ભાવ સરખામણી કરતાં, Einav અને સહકર્મીઓ સાથે મેળ ખાતી સેટ અંદર સરખામણીઓ બનાવવા. ક્રમમાં મેળ ખાતી સેટ હજારો આ સેંકડો અંદર તુલના પરિણામો ભેગા કરવા માટે, Einav અને સહકર્મીઓ શરૂ ભાવ અને દરેક વસ્તુ (દા.ત., તેની સરેરાશ વેચાણ ભાવ) ના સંદર્ભ કિંમત દ્રષ્ટિએ અંતિમ ભાવ ફરીથી વ્યક્ત. ઉદાહરણ તરીકે, જો ટેલરમેડ બર્નર 09 ડ્રાઈવર $ 100 એક સંદર્ભ કિંમત છે (તેના વેચાણ પર આધારિત), પછી $ 10 એક શરૂ ભાવ 0.1 તરીકે વ્યક્ત કરવામાં આવશે અને $ 120 અંતિમ ભાવ 1.2 તરીકે વ્યક્ત કરવામાં આવે છે.

આકૃતિ 2.6: એક મેળ ખાતી સમૂહ એક ઉદાહરણ છે. આ ચોક્કસ જ ગોલ્ફ ક્લબ (એક ટેલરમેડ બર્નર 09 ડ્રાઇવર) ચોક્કસ જ વ્યક્તિ (budgetgolfer) દ્વારા વેચવામાં આવી રહી છે, પરંતુ આ વેચાણ કેટલાક વિવિધ શરતો (દા.ત., અલગ શરૂ ભાવ) કરવામાં આવી હતી. Einav એટ અલ માંથી લેવામાં આકૃતિ. (2015).

આકૃતિ 2.6: એક મેળ ખાતી સમૂહ એક ઉદાહરણ છે. આ ચોક્કસ જ ગોલ્ફ ક્લબ (એક ટેલરમેડ બર્નર 09 ડ્રાઇવર) ચોક્કસ જ વ્યક્તિ ( "budgetgolfer") દ્વારા વેચવામાં આવી રહી છે, પરંતુ આ વેચાણ કેટલાક વિવિધ શરતો (દા.ત., અલગ શરૂ ભાવ) કરવામાં આવી હતી. માંથી લેવામાં આકૃતિ Einav et al. (2015) .

જણાવ્યું હતું કે Einav અને સહકર્મીઓ હરાજી પરિણામો પર પ્રારંભ ભાવ અસર રસ હતા. પ્રથમ, રેખીય રીગ્રેસન સુધારાયું મદદથી તેઓ અંદાજ છે કે ઊંચા શરૂ ભાવમાં વેચાણ સંભાવના ઘટાડો, અને ઊંચા શરૂ ભાવ અંતિમ વેચાણ કિંમત, વેચાણ બનતું પર શરતી વધારો છે. પોતાને દ્વારા, આ અંદાજો જે બધા ઉત્પાદનો પર સરેરાશ છે અને શરૂ ભાવ અને અંતિમ વચ્ચે રેખીય સંબંધ ધારે છે કે જે બધી રસપ્રદ નથી પરિણામો થાય છે. પરંતુ, Einav અને સહકર્મીઓ પણ તેમની માહિતી મોટા કદ ઉપયોગ વધુ ગૂઢ તારણો વિવિધ અંદાજ. પ્રથમ, Einav અને સહકર્મીઓ અલગ અલગ ભાવ આઇટમ્સ માટે અને રેખીય રીગ્રેસન સુધારાયું ઉપયોગ કર્યા વગર આ અંદાજ કરી હતી. તેઓ જાણવા મળ્યું છે કે પ્રારંભ ભાવ અને વેચાણ સંભાવના વચ્ચે સંબંધ રેખીય છે, શરૂ ભાવ અને વેચાણ કિંમત વચ્ચે સંબંધ, સ્પષ્ટપણે બિન-રેખીય છે (આકૃતિ 2.7) છે. ખાસ કરીને, 0.05 અને 0.85 વચ્ચે ભાવો શરૂ કરવા માટે, શરૂ ભાવ વેચાણ ભાવ, તારણો વિશ્લેષણ કે રેખીય સંબંધ ધારણ કર્યું હતું ચૂકી પૂર્ણ કરવામાં આવી હતી પર ખૂબ જ ઓછી અસર હોય છે.

હરાજી શરૂ ભાવ અને વેચાણ (ડાબી પેનલ) અને વેચાણ ભાવ (જમણી પેનલ) સંભાવના વચ્ચે સંબંધ: આકૃતિ 2.7. ત્યાં આશરે પ્રારંભ ભાવ અને વેચાણ સંભાવના વચ્ચે રેખીય સંબંધ છે, પરંતુ ત્યાં શરૂ ભાવ અને વેચાણ કિંમત વચ્ચે બિન-રેખીય સંબંધ છે; 0.05 અને 0.85 વચ્ચે ભાવો શરૂ કરવા માટે, શરૂ ભાવ વેચાણ ભાવ પર ખૂબ જ ઓછી અસર હોય છે. બંને કિસ્સાઓમાં, સંબંધો વસ્તુ કિંમત મૂળભૂત સ્વતંત્ર છે. આ આલેખ ફિગ 4A અને 4 બી Einav એટ અલ પ્રજનન. (2015).

હરાજી શરૂ ભાવ અને વેચાણ (ડાબી પેનલ) અને વેચાણ ભાવ (જમણી પેનલ) સંભાવના વચ્ચે સંબંધ: આકૃતિ 2.7. ત્યાં આશરે પ્રારંભ ભાવ અને વેચાણ સંભાવના વચ્ચે રેખીય સંબંધ છે, પરંતુ ત્યાં શરૂ ભાવ અને વેચાણ કિંમત વચ્ચે બિન-રેખીય સંબંધ છે; 0.05 અને 0.85 વચ્ચે ભાવો શરૂ કરવા માટે, શરૂ ભાવ વેચાણ ભાવ પર ખૂબ જ ઓછી અસર હોય છે. બંને કિસ્સાઓમાં, સંબંધો વસ્તુ કિંમત મૂળભૂત સ્વતંત્ર છે. આ આલેખ ફિગ 4A અને 4 બી ફરી સંભળાવવું Einav et al. (2015) .

બીજું, તેના બદલે તમામ વસ્તુઓ પર સરેરાશ કરતાં, Einav અને સહકર્મીઓ પણ તેમની માહિતી મોટા પાયે વસ્તુઓ (દા.ત., પેટ પુરવઠા, ઇલેક્ટ્રોનિક્સ, અને રમતો સંસ્મરણીય) (આકૃતિ 2.8) 23 વિવિધ વર્ગો માટે શરૂ કિંમત અસર અંદાજ ઉપયોગ કરે છે. આ અંદાજો વધુ વિશિષ્ટ માટે વસ્તુઓ જેમ કે તરીકે સંસ્મરણીય શરૂઆત ભાવ વેચાણ સંભાવના અને અંતિમ વેચાણ કિંમત પર એક મોટા અસર પર એક નાની અસર છે કે જે દર્શાવે છે. વધુમાં, માટે વધુ commodified વસ્તુઓ-ડીવીડી અને વિડિઓ પ્રારંભ ભાવ અંતિમ કિંમત પર લગભગ કોઈ અસર ધરાવે છે. અન્ય શબ્દોમાં, સરેરાશ વસ્તુઓ 23 વિવિધ વર્ગો માંથી પરિણામો સાથે જોડાયેલું છે આ વસ્તુઓ વચ્ચે તફાવત વિશે મહત્વની જાણકારી છુપાવી દે.

આકૃતિ 2.8: પરિણામો વ્યક્તિગત રીતે દરેક શ્રેણી અંદાજ દર્શાવે છે; બધા વર્ગો માટે અંદાજ ઘન ડોટ મળીને pooled, ટેબલ 11 (Einav એટ અલ. 2015, કોષ્ટક 11). આ અંદાજો વધુ વિશિષ્ટ માટે વસ્તુઓ જેમ કે તરીકે સંસ્મરણીય શરૂઆત ભાવ વેચાણ (એક્સ-ધરી) અને અંતિમ વેચાણ કિંમત (વાય-અક્ષ) પર મોટા અસર સંભાવના પર એક નાની અસર છે કે જે દર્શાવે છે.

આકૃતિ 2.8: પરિણામો વ્યક્તિગત રીતે દરેક શ્રેણી અંદાજ દર્શાવે છે; સાથે pooled બધા વર્ગો માટે અંદાજ ઘન ડોટ (Einav et al. 2015, Table 11) . આ અંદાજો વધુ વિશિષ્ટ માટે વસ્તુઓ જેમ કે તરીકે સંસ્મરણીય શરૂઆત ભાવ વેચાણ (એક્સ-ધરી) અને અંતિમ વેચાણ કિંમત (વાય-અક્ષ) પર મોટા અસર સંભાવના પર એક નાની અસર છે કે જે દર્શાવે છે.

જો તમે ખાસ કરીને ઇબે પર હરાજી રસ ન હોય તો, તમે કે જે રીતે 2.7 આકૃતિ અને 2.8 ઓફર સરળ રેખીય રીગ્રેસન સુધારાયું અંદાજ છે કે રેખીય સંબંધો ધારણ કરે છે અને વસ્તુઓ ઘણી વિવિધ વર્ગો ભેગા કરતાં ઇબે એક સમૃદ્ધ સમજ આકૃતિ પ્રશંસક છે. આ વધુ ગૂઢ અંદાજ વિશાળ માહિતી બંધબેસતા શક્તિ સમજાવે; આ અંદાજ ક્ષેત્ર પ્રયોગો એક પ્રચંડ નંબર છે, કે જે લેતી ખર્ચાળ બની હોત વગર અશક્ય બની હોત.

અલબત્ત, અમે એક તુલનાત્મક પ્રયોગ પરિણામો કરતાં કોઇ ખાસ મેચિંગ અભ્યાસના પરિણામો ઓછી વિશ્વાસ હોવો જોઈએ. જ્યારે કોઇ મેળ અભ્યાસ પરિણામો આકારણી, ત્યાં બે મહત્વપૂર્ણ ચિંતા છે. પ્રથમ, અમે યાદ રાખો કે અમે ફક્ત વસ્તુઓ છે કે જે મેચિંગ માટે ઉપયોગ કરવામાં આવ્યો હતો પર ફેર તુલના ખાતરી કરી શકો છો છે. વિક્રેતા ID નંબર, વસ્તુ શ્રેણી, આઇટમ શીર્ષક, અને Subtitle: તેમના મુખ્ય પરિણામો, Einav અને સહકર્મીઓ ચોક્કસ ચાર લાક્ષણિકતાઓ પર બંધબેસતા હતી. જો વસ્તુઓ છે કે જે રીતે મેચિંગ માટે ઉપયોગ ન હતી, કે અયોગ્ય સરખામણી બનાવવા શકે છે અલગ અલગ હતા. ઉદાહરણ તરીકે, જો "budgetgolfer" ટેલરમેડ બર્નર 09 ડ્રાઈવર માટે ભાવમાં શિયાળામાં ઘટાડો (જ્યારે ગોલ્ફ ક્લબ ઓછા લોકપ્રિય છે), પછી તે દેખાય શકે છે કે જે નીચા શરૂ ભાવ અંતિમ નીચા ભાવ તરફ દોરી જ્યારે હકીકતમાં આ મોસમી એક આર્ટિફેક્ટ હશે માંગ વિવિધતા. સામાન્ય રીતે, આ સમસ્યા માટે શ્રેષ્ઠ અભિગમ બંધબેસતી ઘણાં વિવિધ પ્રકારના પ્રયાસ કરી રહ્યું છે. ઉદાહરણ તરીકે, Einav અને સહકર્મીઓ તેમના વિશ્લેષણમાં જ્યાં સરખાવવા સેટ્સ એક વર્ષની અંદર વેચાણ પર વસ્તુઓ, એક મહિનાની અંદર, અને સમકાલીનતાથી સમાવેશ થાય છે પુનરાવર્તન કરો. સમય વિન્ડો સજ્જડ બનાવી સરખાવવા સેટ્સ સંખ્યા ઘટે છે, પણ મોસમી વિવિધતા વિશે ચિંતા ઘટાડે છે. સદનસીબે, તેઓ શોધવા કે પરિણામો બંધબેસતા માપદંડ આ ફેરફારો દ્વારા યથાવત છે. બંધબેસતી સાહિત્યમાં, ચિંતા આ પ્રકારની સામાન્ય રીતે observables અને unobservables દ્રષ્ટિએ વ્યક્ત કરવામાં આવે છે, પરંતુ કી વિચાર ખરેખર છે કે સંશોધકો માત્ર બંધબેસતી ઉપયોગમાં લક્ષણો પર ફેર તુલના બનાવી રહ્યા છે.

બીજા મુખ્ય ચિંતા છે જ્યારે બંધબેસતા પરિણામો ઈન્ટરપ્રીટ છે કે તેઓ માત્ર મેળ ખાતી માહિતી માટે અરજી છે; તેઓ કિસ્સાઓમાં કે સરખાવવા કરી શકે લાગુ પડતી નથી. ઉદાહરણ માટે, વસ્તુઓ છે કે જે ઘણી સૂચિઓ Einav અને સહકર્મીઓ વ્યાવસાયિક અને અર્ધ વ્યાવસાયિક વેચનાર પર ધ્યાન કેન્દ્રિત કરવામાં આવે હતી તેમના સંશોધન મર્યાદિત દ્વારા. આમ, જ્યારે આ સરખામણીઓ ઈન્ટરપ્રીટ અમે યાદ જ જોઈએ કે તેઓ માત્ર ઇબે આ ઉપગણ માટે લાગુ પડે છે.

મેચિંગ મોટા ડેટાસેટ્સ માં ફેર તુલના શોધવા માટે એક શક્તિશાળી વ્યૂહરચના છે. ઘણાં સામાજિક વિજ્ઞાનીઓ માટે, બંધબેસતા પ્રયોગો માટે બીજા ક્રમના શ્રેષ્ઠ જેવી લાગે છે, પરંતુ તે એક એવી માન્યતા છે કે સુધારેલા જોઈએ, સહેજ છે. મોટા ડેટા માં બંધબેસતા ક્ષેત્ર પ્રયોગો એક નાની સંખ્યા કરતાં વધુ સારી હોઇ શકે છે જ્યારે: 1) અસરો વૈવિધ્યનો મહત્વનું છે અને 2) મેચિંગ માટે સારી observables છે. કોષ્ટક 2.4 કેવી રીતે બંધબેસતા મોટા માહિતી સ્ત્રોત સાથે વાપરી શકાય છે કેટલાક અન્ય ઉદાહરણો પૂરી પાડે છે.

કોષ્ટક 2.4: અભ્યાસ કે ડિજિટલ નિશાનો અંદર ફેર તુલના શોધવા માટે બંધબેસતા ઉપયોગ ઉદાહરણો.
મૂળ ધ્યાન મોટા ડેટા સ્રોત સાઇટેશન
પોલીસ હિંસા પર ગોળીબાર અસર સ્ટોપ અને નાચવું રેકોર્ડ Legewie (2016)
પરિવારો અને પાડોશીઓ પર 11 સપ્ટેમ્બર, 2001 ના અસર મતદાન રેકોર્ડ અને દાન રેકોર્ડ Hersh (2013)
સામાજિક સંસર્ગ કોમ્યુનિકેશન અને ઉત્પાદન દત્તક માહિતી Aral, Muchnik, and Sundararajan (2009)

અંતમા, બિન-પ્રાયોગિક માહિતી સાધક અસરો અંદાજ નિષ્કપટ અભિગમ ખતરનાક છે. જો કે, મજબૂત થી કમજોર કરવા માટે એક અખંડ સાથે બોલતી સાધક અંદાજો માટે વ્યૂહરચના, અને સંશોધકો બિન-પ્રાયોગિક માહિતી અંદર ફેર તુલના શોધી શકો છો. કુદરતી પ્રયોગો અને મેચિંગ: હંમેશા પર, મોટા માહિતી સિસ્ટમો વિકાસ અસરકારક બે હાલના પદ્ધતિઓનો ઉપયોગ કરવા માટે અમારી ક્ષમતા વધારે છે.