مطابقة خلق مقارنات عادلة من قبل التقليم بعيدا الحالات.
مقارنات عادلة يمكن أن تأتي من أي تجارب عشوائية محكومة أو التجارب الطبيعية. ولكن، هناك العديد من الحالات حيث لا يمكنك تشغيل تجربة مثالية، والطبيعة لا تقدم تجربة طبيعية. في هذه الإعدادات، فإن أفضل طريقة لخلق مقارنة عادلة مطابقة. في مطابقة، ويبدو للباحث من خلال البيانات غير التجريبية لإنشاء أزواج من الناس التي تشبه إلا أن واحدا تلقت العلاج واحد لم يفعل ذلك. في عملية المطابقة والباحثين هي في الواقع تشذيب أيضا. وهذا هو، ونبذ الحالات حيث لا توجد مقارنة واضحة. وهكذا، وهذه الطريقة سوف أكثر تسمى بدقة المطابقة والتقليم، ولكنني سوف العصا مع المدى التقليدي: مطابقة.
وهناك مثال جميل من قوة مطابقة الاستراتيجيات مع مصادر البيانات غير تجريبية ضخمة تأتي من البحوث حول سلوك المستهلك من خلال يران إيناف وزملاؤه (2015) . كانت إيناف والزملاء المهتمين في المزادات التي تجري على موقع ئي باي، واصفا عملهم، وسوف تركز على جانب معين واحد: تأثير مزاد بسعر يبدأ على نتائج المزاد، مثل بيع السعر أو احتمال بيع.
إن الطريقة الأكثر الساذجة للرد على سؤال حول تأثير بسعر يبدأ في بيع الثمن قد يكون ببساطة حساب السعر النهائي للمزادات بأسعار تبدأ مختلفة. ومن شأن هذا النهج سيكون على ما يرام إذا كنت تريد ببساطة لتوقع سعر بيع بند معين الذي كانت قد فرضته على موقع ئي باي مع بسعر يبدأ معين. ولكن، إذا كان سؤالك ما هو تأثير تبدأ الأسعار على نتائج السوق هذا النهج لن ينجح لأنه لا يقوم على المقارنة العادلة. المزادات مع انخفاض أسعار البداية قد تكون مختلفة تماما عن المزاد مع ارتفاع أسعار البداية (على سبيل المثال، لأنها قد تكون لأنواع مختلفة من السلع أو تشمل أنواعا مختلفة من البائعين).
إذا كنت تشعر بالقلق بالفعل عن إجراء مقارنات عادلة، قد تخطي نهج ساذج والنظر في تشغيل تجربة ميدانية حيث كنت ستبيع تحديدا البند، يقول، نادي الغولف مع مجموعة ثابتة من المزاد معلمات القول، مزاد حرية الملاحة، مفتوحة لمدة أسبوعين، وما إلى ذلك، ولكن مع وضع عشوائيا بأسعار تبدأ. من خلال مقارنة نتائج السوق الناتجة عن ذلك، وهذا من شأنه تجربة ميدانية تقدم مقياسا واضحا جدا من تأثير بدءا الأسعار على سعر البيع. ولكن، أن هذا القياس ينطبق فقط على منتج واحد معين ومجموعة من المعلمات المزاد. قد تكون النتائج مختلفة، على سبيل المثال، لأنواع مختلفة من المنتجات. دون نظرية قوية، فإنه من الصعب استقراء من هذه التجربة واحدة من مجموعة كاملة من التجارب الممكنة التي يمكن أن يتم تشغيل. وعلاوة على ذلك، التجارب الميدانية غالية بما فيه الكفاية أنه سيكون حكم المستحيل لتشغيل ما يكفي منها حتى تغطي مساحة المعلمة كاملة من المنتجات وأنواع المزاد.
وعلى النقيض من نهج ساذج والمنهج التجريبي، إيناف وزملاؤه أن تتخذ نهجا الثالث: مطابقة. الخدعة الرئيسية لاستراتيجيتهم هو اكتشاف أشياء مماثلة إلى التجارب الميدانية التي وقعت بالفعل على موقع ئي باي. على سبيل المثال، ويبين الشكل 2.6 بعض 31 قوائم للبالضبط نفس نادي الغولف واحد تايلور الشعلة 09 سائق ذو وتباع من قبل بالضبط البائع- نفسه "budgetgolfer". ومع ذلك، هذه القوائم لها خصائص مختلفة قليلا. أحد عشر منهم تقديم السائق بسعر ثابت من 124.99 $، في حين أن 20 آخرين هم المزاد مع تواريخ انتهاء مختلفة. أيضا، القوائم لديها رسوم الشحن مختلفة، إما 7.99 $ أو 9،99 $. وبعبارة أخرى، فإنه كما لو كانت "budgetgolfer" يعمل التجارب للباحثين.
القوائم من 09 سائق تايلور الشعلة التي تباع من قبل "budgetgolfer" هي مثال واحد من مجموعة مطابقة من القوائم، حيث يتم بيع البند نفسه بالضبط من نفس البائع بالضبط ولكن في كل مرة مع خصائص مختلفة قليلا. ضمن سجلات ضخمة من موقع ئي باي هناك مئات الآلاف من مجموعات المتطابقة تشمل الملايين من القوائم. وهكذا، بدلا من مقارنة السعر النهائي لجميع المزادات داخل بسعر يبدأ معين، إيناف وزملاؤه إجراء مقارنات ضمن مجموعات مطابقة. من أجل الجمع بين نتائج المقارنات بين هذه المئات من الآلاف من مجموعات المتطابقة، إيناف وزملاؤه إعادة التعبير عن سعر البداية والسعر النهائي من حيث القيمة المرجعية لكل بند (على سبيل المثال، في متوسط سعر البيع). على سبيل المثال، إذا كان تايلور الشعلة 09 سائق لديه القيمة المرجعية من 100 $ (على أساس مبيعاتها)، ثم بسعر يبدأ من 10 $ سوف كنسبة 0.1 وسيتم أعرب السعر النهائي 120 $ 1.2.
يذكر أن إيناف وزملاؤه كانوا مهتمين تأثير سعر بدء المزاد على النتائج. لأول مرة، وذلك باستخدام الانحدار الخطي أنها تشير التقديرات إلى أن ارتفاع أسعار انطلاق تقلل من احتمال بيع، وأن ارتفاع أسعار انطلاق تزيد من سعر البيع النهائي، مشروطا بيع يحدث. في حد ذاتها، هذه التقديرات والتي بلغ متوسط على كل المنتجات وتفترض وجود علاقة خطية بين سعر البداية والنهائية النتائج ليسوا كل ذلك مثيرة للاهتمام. ولكن، إيناف وزملاؤه أيضا استخدام حجم هائل من البيانات لتقدير مجموعة متنوعة من النتائج أكثر دقة. أولا، أدلى إيناف وزملاؤه هذه التقديرات بشكل منفصل عن البنود أسعار مختلفة، ودون استخدام الانحدار الخطي. ووجد الباحثون أنه في حين أن العلاقة بين سعر بدء واحتمال بيع خطية، والعلاقة بين سعر البداية وسعر البيع هو واضح غير الخطية (الشكل 2.7). على وجه الخصوص، لبدء الأسعار بين 0.05 و 0.85، ويبدأ سعر له تأثير ضئيل جدا على سعر البيع، وهو الاكتشاف الذي تم الانتهاء غاب في التحليل الذي يفترض وجود علاقة خطية.
ثانيا، بدلا من المتوسط على جميع البنود، إيناف وزملاؤه أيضا استخدام نطاق واسع من البيانات لتقدير تأثير السعر ابتداء من 23 فئات مختلفة من العناصر (على سبيل المثال، مستلزمات الحيوانات الأليفة، والالكترونيات، والتذكارات الرياضية) (الشكل 2.8). وتشير هذه التقديرات إلى أن أكثر المميزة العناصر مثل سعر تذكارات بداية له تأثير أقل على احتمال بيع وتأثير أكبر على سعر البيع النهائي. وعلاوة على ذلك، للسلع مثل أكثر السلعية عن أقراص فيديو رقمية وفيديو وسعر بدء يكاد لا يملك أي تأثير على السعر النهائي. وبعبارة أخرى، في المتوسط الذي يجمع بين النتائج من 23 فئة مختلفة من العناصر يخفي معلومات مهمة حول الاختلافات بين هذه العناصر.
حتى إذا لم تكن مهتمة بصفة خاصة في مزادات على موقع ئي باي، يجب عليك أن تعجب الطريقة التي الشكل 2.7 والشكل 2.8 عرض على فهم أكثر ثراء من موقع ئي باي من التقديرات الانحدار الخطي البسيط أن نفترض العلاقات الخطية والجمع بين العديد من فئات مختلفة من العناصر. وتوضح هذه التقديرات أكثر دقة وقوة مطابقة في البيانات الضخمة. كان يمكن أن يكون هذه التقديرات المستحيل دون وجود عدد هائل من التجارب الميدانية، التي كانت باهظة التكاليف.
بالطبع، يجب أن يكون أقل ثقة في نتائج أي دراسة مطابقة معينة من كنا في نتائج تجربة مماثلة. عند تقييم نتائج أي دراسة مطابقة، وهناك نوعان من الشواغل الهامة. أولا، علينا أن نتذكر أننا يمكن أن تضمن مقارنات عادلة على الأشياء التي كانت تستخدم لمطابقة فقط. في نتائجها الرئيسية، إيناف وزملاؤه لم المطابقة التامة على أربع خصائص: عدد البائع الهوية، وفئة البند، عنوان البند، والعنوان الفرعي. إذا كانت عناصر مختلفة في الطرق التي لم تستخدم للمطابقة، التي يمكن أن تخلق هذه مقارنة ظالمة. على سبيل المثال، إذا "budgetgolfer" خفضت أسعار تايلور الشعلة 09 سائق في فصل الشتاء (عندما نوادي الجولف هي أقل شعبية)، فلا يمكن أن تظهر أن انخفاض أسعار انطلاق تؤدي إلى خفض الأسعار النهائية، في حين أن هذا من شأنه أن يكون قطعة أثرية الموسمية التباين في الطلب. بشكل عام، فإن أفضل نهج لهذه المشكلة ويبدو أن تجربة العديد من أنواع مختلفة من مطابقة. على سبيل المثال، إيناف وزملاؤه يكرر تحليلهم حيث تشمل مجموعات مطابقة البنود على بيع خلال سنة واحدة، في غضون شهر واحد، وبالتزامن. مما يجعل من نافذة الوقت تشديد يقلل من عدد من مجموعات المتطابقة، ولكن يقلل من المخاوف بشأن التغيرات الموسمية. لحسن الحظ، وجدوا أن النتائج لم تتغير هذه التغييرات في معايير مطابقة. في الأدب المطابقة، ويتم التعبير عن هذا النوع من القلق عادة من حيث المتغيرات الظاهرة وunobservables، ولكن الفكرة الأساسية هي حقا أن الباحثين تخلق فقط مقارنات عادلة على الميزات المستخدمة في مطابقة.
القلق الرئيسي الثاني عند تفسير النتائج مطابقة هو أنها لا تنطبق إلا على بيانات مطابقة. أنها لا تنطبق على الحالات التي لا يمكن أن تكون مطابقة. على سبيل المثال، عن طريق الحد من أبحاثهم إلى العناصر التي كانت قوائم متعددة تركز إيناف وزملاؤه على البائعين المهنية وشبه المهنية. وهكذا، عند تفسير هذه المقارنات يجب علينا أن نتذكر أنها لا تنطبق إلا على هذه المجموعة الفرعية من موقع ئي باي.
مطابقة هي استراتيجية قوية لإيجاد مقارنات عادلة في مجموعات البيانات الكبيرة. لكثير من علماء الاجتماع، ومطابقة وكأنه ثاني أفضل لتجارب، ولكن هذا هو الاعتقاد بأن ينبغي تنقيح، قليلا. مطابقة بيانات ضخمة قد يكون أفضل من عدد قليل من التجارب الميدانية في الحالات التالية: 1) عدم التجانس في الآثار مهم و2) هناك المدروسة جيدة للمطابقة. ويقدم الجدول 2.4 بعض أمثلة أخرى لكيفية مطابقة يمكن استخدامها مع مصادر البيانات الكبيرة.
التركيز الموضوعي | مصدر البيانات الكبيرة | تنويه |
---|---|---|
أثر إطلاق النار على عنف الشرطة | التوقف وتفتيشها السجلات | Legewie (2016) |
تأثير 11 سبتمبر 2001 على الأسر والجيران | سجلات التصويت وسجلات التبرع | Hersh (2013) |
عدوى الاجتماعي | بيانات الاتصال واعتماد المنتج | Aral, Muchnik, and Sundararajan (2009) |
في الختام، النهج ساذجة لتقدير الآثار السببية من البيانات غير التجريبية خطيرة. ومع ذلك، يمكن للاستراتيجيات من أجل جعل تقديرات السببية الكذب على طول سلسلة متصلة من الأقوى إلى الأضعف، والباحثين اكتشاف مقارنات عادلة ضمن البيانات غير التجريبية. نمو نظم البيانات دائما على، كبيرة يزيد من قدرتنا على الاستخدام الفعال لاثنين من الأساليب القائمة: التجارب الطبيعية ومطابقة.