દૂર કિસ્સાઓમાં કાપણી દ્વારા વાજબી તુલના બનાવવા મેળ ખાય છે.
ફેર તુલના ક્યાં નિદર્શિત અંકુશિત પ્રયોગો અથવા કુદરતી પ્રયોગો થઇ શકે છે. પરંતુ, ત્યાં ઘણી પરિસ્થિતિઓમાં જ્યાં તમે આદર્શ પ્રયોગ ચલાવી શકો નહિં અને પ્રકૃતિ કુદરતી પ્રયોગ દ્વારા આપવામાં આવી નથી છે. આ સેટિંગ્સ, શ્રેષ્ઠ માર્ગ વાજબી સરખામણી બંધબેસતા બનાવવા માટે. બંધબેસતા, સંશોધક લોકો સમાન છે, સિવાય કે એક સારવાર પ્રાપ્ત થઈ છે જોડીઓ બનાવવા માટે બિન-પ્રાયોગિક માહિતી મારફતે જુએ છે અને એક નથી. મેચિંગ પ્રક્રિયા માં, સંશોધકોએ ખરેખર પણ કાપણી કરવામાં આવે છે; કે કિસ્સાઓ છે કે જ્યાં કોઈ સ્પષ્ટ સરખામણી છે કાઢી છે. આમ, આ પદ્ધતિ વધુ ચોક્કસ બંધબેસતી અને કાપણી કહેવામાં આવશે, પરંતુ હું પરંપરાગત શબ્દ સાથે વળગી પડશે: મેચિંગ.
મોટા બિન-પ્રાયોગિક માહિતી સ્રોતો સાથે વ્યૂહરચના બંધબેસતા શક્તિ એક સુંદર ઉદાહરણ Liran Einav અને સાથીઓ દ્વારા ગ્રાહક વર્તન પર સંશોધન આવે (2015) . Einav અને સહકર્મીઓ ઇબે પર થતી હરાજીમાં રસ ધરાવતા હતા અને તેમના કામ વર્ણન, હું એક ખાસ પાસા પર ધ્યાન કેન્દ્રિત પડશે: જેમ કે વેચાણ કિંમત અથવા વેચાણ સંભાવના તરીકે હરાજી પરિણામો પર હરાજી શરૂ ભાવ અસર.
વેચાણ ભાવ પર શરૂ ભાવ અસર વિશે પ્રશ્નનો જવાબ આપવા માટે સૌથી સરળ માર્ગ એ છે અલગ શરૂ ભાવ સાથે હરાજી માટે અંતિમ ભાવ ગણતરી હશે. આ અભિગમ દંડ હોઈ શકે જો તમને ફક્ત આપેલ વસ્તુ છે કે જે આપેલ શરૂ ભાવ સાથે ઇબે પર મૂકવામાં આવ્યું હતું વેચાણ કિંમત આગાહી કરવા માંગો છો કરશે. પરંતુ, જો તમારા પ્રશ્ન છે કારણ કે તે વાજબી સરખામણી પર આધારિત છે કામ કરશે નહિં આ અભિગમ બજાર પરિણામો પર ભાવ શરૂ અસર શું છે; નીચલા શરૂ ભાવ સાથે હરાજી ઊંચા શરૂ ભાવ (દા.ત., તેઓ માલ વિવિધ પ્રકારો માટે હોઈ શકે છે અથવા વેચનાર વિવિધ પ્રકારના સમાવેશ થઈ શકે છે) સાથે હરાજી તદ્દન અલગ હોઈ શકે છે.
-કહેવું પરિમાણો જો તમે પહેલાથી જ ફેર તુલના કરવા અંગે ચિંતા હોય તો, તમે નિષ્કપટ અભિગમ અવગણો અને એક ક્ષેત્ર પ્રયોગ જ્યાં તમે એક વિશિષ્ટ આઇટમ-કહેવું વેચાણ કરશે, એક ગોલ્ફ ક્લબ સાથે હરાજી એક નિશ્ચિત સમૂહ ચાલી વિચારણા કરી શકે છે, મુક્ત શીપીંગ, હરાજી બે અઠવાડિયા, માટે ખુલ્લા વગેરે પણ સાથે રેન્ડમ શરૂ ભાવ સુયોજિત કરો. પરિણામે બજાર પરિણામો સરખામણી કરીને, તો આ ક્ષેત્ર પ્રયોગ વેચાણ કિંમત પર ભાવ શરૂ અસર ખૂબ જ સ્પષ્ટ માપ આપે છે કરશે. પરંતુ, આ માપ માત્ર એક ચોક્કસ ઉત્પાદન માટે લાગુ પડે છે અને હરાજી પરિમાણો સુયોજિત કરશે. પરિણામો અલગ હોઈ શકે છે, ઉદાહરણ તરીકે, ઉત્પાદનો વિવિધ પ્રકારો માટે. મજબૂત સિદ્ધાંત વિના, તે આ એક પ્રયોગ શક્ય પ્રયોગો સંપૂર્ણ શ્રેણી કે શકે છે ચલાવવા કરવામાં આવી છે કરાય મુશ્કેલ છે. વધુમાં, ક્ષેત્ર પ્રયોગો પૂરતી ખર્ચાળ છે કે તે ઉત્પાદનો અને હરાજી પ્રકારો સમગ્ર પરિમાણ જગ્યા આવરી તેમને પૂરતી ચલાવવા માટે અશક્ય હશે.
નિષ્કપટ અભિગમ અને પ્રાયોગિક અભિગમ વિપરીત, Einav અને સહકર્મીઓ ત્રીજા અભિગમ લે છે: મેચિંગ. તેમની વ્યૂહરચના મુખ્ય યુક્તિ ક્ષેત્ર પ્રયોગો કે જે પહેલાથી જ ઇબે પર થયું હોવાનું સમાન વસ્તુઓ શોધવા માટે છે. ઉદાહરણ તરીકે, આકૃતિ 2.6 બરાબર એ જ ગોલ્ફ ક્લબ એક ટેલરમેડ બર્નર 09 ડ્રાઈવર-રહી બરાબર એ જ seller- "budgetgolfer" દ્વારા વેચવામાં 31 સૂચિઓ કેટલાક બતાવે છે. જો કે, આ સૂચિઓ સહેજ અલગ લાક્ષણિકતાઓ ધરાવે છે. તેમને અગિયાર $ 124.99 એક નિયત કિંમત માટે ડ્રાઈવર તક આપે છે, જ્યારે અન્ય 20 વિવિધ અંત તારીખો સાથે હરાજી છે. પણ, સૂચિઓ, અલગ શીપીંગ ફી હોય છે ક્યાં $ 7.99 અથવા 9.99 $. અન્ય શબ્દોમાં, તે છે, કારણ કે જો "budgetgolfer" સંશોધકો માટે પ્રયોગો ચાલી રહી છે.
ટેલરમેડ બર્નર 09 ડ્રાઈવર સૂચિઓ "budgetgolfer" દ્વારા વેચવામાં આવી સૂચિઓ, જ્યાં ચોક્કસ જ વસ્તુ ચોક્કસ જ વિક્રેતા દ્વારા વેચવામાં આવી રહી છે એક મેળ ખાતી સેટ પરંતુ સહેજ દરેક અલગ લક્ષણો સાથે સમય એક ઉદાહરણ છે. ઇબે મોટા લોગ અંદર ત્યાં શાબ્દિક સૂચિઓ લાખો સંડોવતા મેળ ખાતી સેટ હજારો છે. આમ, તેના બદલે આપેલ શરૂ ભાવ અંદર બધા હરાજી માટે અંતિમ ભાવ સરખામણી કરતાં, Einav અને સહકર્મીઓ સાથે મેળ ખાતી સેટ અંદર સરખામણીઓ બનાવવા. ક્રમમાં મેળ ખાતી સેટ હજારો આ સેંકડો અંદર તુલના પરિણામો ભેગા કરવા માટે, Einav અને સહકર્મીઓ શરૂ ભાવ અને દરેક વસ્તુ (દા.ત., તેની સરેરાશ વેચાણ ભાવ) ના સંદર્ભ કિંમત દ્રષ્ટિએ અંતિમ ભાવ ફરીથી વ્યક્ત. ઉદાહરણ તરીકે, જો ટેલરમેડ બર્નર 09 ડ્રાઈવર $ 100 એક સંદર્ભ કિંમત છે (તેના વેચાણ પર આધારિત), પછી $ 10 એક શરૂ ભાવ 0.1 તરીકે વ્યક્ત કરવામાં આવશે અને $ 120 અંતિમ ભાવ 1.2 તરીકે વ્યક્ત કરવામાં આવે છે.
જણાવ્યું હતું કે Einav અને સહકર્મીઓ હરાજી પરિણામો પર પ્રારંભ ભાવ અસર રસ હતા. પ્રથમ, રેખીય રીગ્રેસન સુધારાયું મદદથી તેઓ અંદાજ છે કે ઊંચા શરૂ ભાવમાં વેચાણ સંભાવના ઘટાડો, અને ઊંચા શરૂ ભાવ અંતિમ વેચાણ કિંમત, વેચાણ બનતું પર શરતી વધારો છે. પોતાને દ્વારા, આ અંદાજો જે બધા ઉત્પાદનો પર સરેરાશ છે અને શરૂ ભાવ અને અંતિમ વચ્ચે રેખીય સંબંધ ધારે છે કે જે બધી રસપ્રદ નથી પરિણામો થાય છે. પરંતુ, Einav અને સહકર્મીઓ પણ તેમની માહિતી મોટા કદ ઉપયોગ વધુ ગૂઢ તારણો વિવિધ અંદાજ. પ્રથમ, Einav અને સહકર્મીઓ અલગ અલગ ભાવ આઇટમ્સ માટે અને રેખીય રીગ્રેસન સુધારાયું ઉપયોગ કર્યા વગર આ અંદાજ કરી હતી. તેઓ જાણવા મળ્યું છે કે પ્રારંભ ભાવ અને વેચાણ સંભાવના વચ્ચે સંબંધ રેખીય છે, શરૂ ભાવ અને વેચાણ કિંમત વચ્ચે સંબંધ, સ્પષ્ટપણે બિન-રેખીય છે (આકૃતિ 2.7) છે. ખાસ કરીને, 0.05 અને 0.85 વચ્ચે ભાવો શરૂ કરવા માટે, શરૂ ભાવ વેચાણ ભાવ, તારણો વિશ્લેષણ કે રેખીય સંબંધ ધારણ કર્યું હતું ચૂકી પૂર્ણ કરવામાં આવી હતી પર ખૂબ જ ઓછી અસર હોય છે.
બીજું, તેના બદલે તમામ વસ્તુઓ પર સરેરાશ કરતાં, Einav અને સહકર્મીઓ પણ તેમની માહિતી મોટા પાયે વસ્તુઓ (દા.ત., પેટ પુરવઠા, ઇલેક્ટ્રોનિક્સ, અને રમતો સંસ્મરણીય) (આકૃતિ 2.8) 23 વિવિધ વર્ગો માટે શરૂ કિંમત અસર અંદાજ ઉપયોગ કરે છે. આ અંદાજો વધુ વિશિષ્ટ માટે વસ્તુઓ જેમ કે તરીકે સંસ્મરણીય શરૂઆત ભાવ વેચાણ સંભાવના અને અંતિમ વેચાણ કિંમત પર એક મોટા અસર પર એક નાની અસર છે કે જે દર્શાવે છે. વધુમાં, માટે વધુ commodified વસ્તુઓ-ડીવીડી અને વિડિઓ પ્રારંભ ભાવ અંતિમ કિંમત પર લગભગ કોઈ અસર ધરાવે છે. અન્ય શબ્દોમાં, સરેરાશ વસ્તુઓ 23 વિવિધ વર્ગો માંથી પરિણામો સાથે જોડાયેલું છે આ વસ્તુઓ વચ્ચે તફાવત વિશે મહત્વની જાણકારી છુપાવી દે.
જો તમે ખાસ કરીને ઇબે પર હરાજી રસ ન હોય તો, તમે કે જે રીતે 2.7 આકૃતિ અને 2.8 ઓફર સરળ રેખીય રીગ્રેસન સુધારાયું અંદાજ છે કે રેખીય સંબંધો ધારણ કરે છે અને વસ્તુઓ ઘણી વિવિધ વર્ગો ભેગા કરતાં ઇબે એક સમૃદ્ધ સમજ આકૃતિ પ્રશંસક છે. આ વધુ ગૂઢ અંદાજ વિશાળ માહિતી બંધબેસતા શક્તિ સમજાવે; આ અંદાજ ક્ષેત્ર પ્રયોગો એક પ્રચંડ નંબર છે, કે જે લેતી ખર્ચાળ બની હોત વગર અશક્ય બની હોત.
અલબત્ત, અમે એક તુલનાત્મક પ્રયોગ પરિણામો કરતાં કોઇ ખાસ મેચિંગ અભ્યાસના પરિણામો ઓછી વિશ્વાસ હોવો જોઈએ. જ્યારે કોઇ મેળ અભ્યાસ પરિણામો આકારણી, ત્યાં બે મહત્વપૂર્ણ ચિંતા છે. પ્રથમ, અમે યાદ રાખો કે અમે ફક્ત વસ્તુઓ છે કે જે મેચિંગ માટે ઉપયોગ કરવામાં આવ્યો હતો પર ફેર તુલના ખાતરી કરી શકો છો છે. વિક્રેતા ID નંબર, વસ્તુ શ્રેણી, આઇટમ શીર્ષક, અને Subtitle: તેમના મુખ્ય પરિણામો, Einav અને સહકર્મીઓ ચોક્કસ ચાર લાક્ષણિકતાઓ પર બંધબેસતા હતી. જો વસ્તુઓ છે કે જે રીતે મેચિંગ માટે ઉપયોગ ન હતી, કે અયોગ્ય સરખામણી બનાવવા શકે છે અલગ અલગ હતા. ઉદાહરણ તરીકે, જો "budgetgolfer" ટેલરમેડ બર્નર 09 ડ્રાઈવર માટે ભાવમાં શિયાળામાં ઘટાડો (જ્યારે ગોલ્ફ ક્લબ ઓછા લોકપ્રિય છે), પછી તે દેખાય શકે છે કે જે નીચા શરૂ ભાવ અંતિમ નીચા ભાવ તરફ દોરી જ્યારે હકીકતમાં આ મોસમી એક આર્ટિફેક્ટ હશે માંગ વિવિધતા. સામાન્ય રીતે, આ સમસ્યા માટે શ્રેષ્ઠ અભિગમ બંધબેસતી ઘણાં વિવિધ પ્રકારના પ્રયાસ કરી રહ્યું છે. ઉદાહરણ તરીકે, Einav અને સહકર્મીઓ તેમના વિશ્લેષણમાં જ્યાં સરખાવવા સેટ્સ એક વર્ષની અંદર વેચાણ પર વસ્તુઓ, એક મહિનાની અંદર, અને સમકાલીનતાથી સમાવેશ થાય છે પુનરાવર્તન કરો. સમય વિન્ડો સજ્જડ બનાવી સરખાવવા સેટ્સ સંખ્યા ઘટે છે, પણ મોસમી વિવિધતા વિશે ચિંતા ઘટાડે છે. સદનસીબે, તેઓ શોધવા કે પરિણામો બંધબેસતા માપદંડ આ ફેરફારો દ્વારા યથાવત છે. બંધબેસતી સાહિત્યમાં, ચિંતા આ પ્રકારની સામાન્ય રીતે observables અને unobservables દ્રષ્ટિએ વ્યક્ત કરવામાં આવે છે, પરંતુ કી વિચાર ખરેખર છે કે સંશોધકો માત્ર બંધબેસતી ઉપયોગમાં લક્ષણો પર ફેર તુલના બનાવી રહ્યા છે.
બીજા મુખ્ય ચિંતા છે જ્યારે બંધબેસતા પરિણામો ઈન્ટરપ્રીટ છે કે તેઓ માત્ર મેળ ખાતી માહિતી માટે અરજી છે; તેઓ કિસ્સાઓમાં કે સરખાવવા કરી શકે લાગુ પડતી નથી. ઉદાહરણ માટે, વસ્તુઓ છે કે જે ઘણી સૂચિઓ Einav અને સહકર્મીઓ વ્યાવસાયિક અને અર્ધ વ્યાવસાયિક વેચનાર પર ધ્યાન કેન્દ્રિત કરવામાં આવે હતી તેમના સંશોધન મર્યાદિત દ્વારા. આમ, જ્યારે આ સરખામણીઓ ઈન્ટરપ્રીટ અમે યાદ જ જોઈએ કે તેઓ માત્ર ઇબે આ ઉપગણ માટે લાગુ પડે છે.
મેચિંગ મોટા ડેટાસેટ્સ માં ફેર તુલના શોધવા માટે એક શક્તિશાળી વ્યૂહરચના છે. ઘણાં સામાજિક વિજ્ઞાનીઓ માટે, બંધબેસતા પ્રયોગો માટે બીજા ક્રમના શ્રેષ્ઠ જેવી લાગે છે, પરંતુ તે એક એવી માન્યતા છે કે સુધારેલા જોઈએ, સહેજ છે. મોટા ડેટા માં બંધબેસતા ક્ષેત્ર પ્રયોગો એક નાની સંખ્યા કરતાં વધુ સારી હોઇ શકે છે જ્યારે: 1) અસરો વૈવિધ્યનો મહત્વનું છે અને 2) મેચિંગ માટે સારી observables છે. કોષ્ટક 2.4 કેવી રીતે બંધબેસતા મોટા માહિતી સ્ત્રોત સાથે વાપરી શકાય છે કેટલાક અન્ય ઉદાહરણો પૂરી પાડે છે.
મૂળ ધ્યાન | મોટા ડેટા સ્રોત | સાઇટેશન |
---|---|---|
પોલીસ હિંસા પર ગોળીબાર અસર | સ્ટોપ અને નાચવું રેકોર્ડ | Legewie (2016) |
પરિવારો અને પાડોશીઓ પર 11 સપ્ટેમ્બર, 2001 ના અસર | મતદાન રેકોર્ડ અને દાન રેકોર્ડ | Hersh (2013) |
સામાજિક સંસર્ગ | કોમ્યુનિકેશન અને ઉત્પાદન દત્તક માહિતી | Aral, Muchnik, and Sundararajan (2009) |
અંતમા, બિન-પ્રાયોગિક માહિતી સાધક અસરો અંદાજ નિષ્કપટ અભિગમ ખતરનાક છે. જો કે, મજબૂત થી કમજોર કરવા માટે એક અખંડ સાથે બોલતી સાધક અંદાજો માટે વ્યૂહરચના, અને સંશોધકો બિન-પ્રાયોગિક માહિતી અંદર ફેર તુલના શોધી શકો છો. કુદરતી પ્રયોગો અને મેચિંગ: હંમેશા પર, મોટા માહિતી સિસ્ટમો વિકાસ અસરકારક બે હાલના પદ્ધતિઓનો ઉપયોગ કરવા માટે અમારી ક્ષમતા વધારે છે.