ہم تقریبا ایسے تجربات کر سکتے ہیں جو ہمارے پاس نہیں ہیں یا نہیں کر سکتے ہیں. بڑے پیمانے پر بڑے اعداد و شمار سے فائدہ اٹھانے والے دو نقطہ نظر قدرتی تجربات اور مماثلت ہیں.
کچھ اہم سائنسی اور پالیسی کے سوالات کی وجہ سے ہے. مثال کے طور پر، اجرت پر روزگار کے تربیتی پروگرام کا اثر کیا ہے؟ اس سوال کا جواب دینے والے ایک محقق شاید ان لوگوں کی آمدنی کا موازنہ کرسکیں جو ان لوگوں کو تربیت دینے کے لئے سائن اپ کرتے ہیں جو نہیں. لیکن ان گروپوں کے درمیان اجرت میں کوئی فرق کتنا ہی ہے اور لوگوں کے درمیان اس کے درمیان اختلافات کی وجہ سے تربیت اور اس کی وجہ کتنا ہے. یہ ایک مشکل سوال ہے، اور یہ وہی ہے جو خود کار طریقے سے زیادہ ڈیٹا سے دور نہیں ہوتا. دوسرے الفاظ میں، ممکنہ ممنوعہ اختلافات کے بارے میں تشویش یہ ہے کہ آپ کے اعداد و شمار میں کتنے کارکنان ہیں.
بہت سے حالات میں، کچھ علاج کے اثرات کا اندازہ کرنے کا سب سے بڑا طریقہ، جیسا کہ ملازمت کی تربیت، بے ترتیب کنٹرول تجربہ چلانا ہے جہاں ایک محقق بے ترتیب طور پر کچھ لوگوں کو علاج فراہم کرتا ہے اور دوسروں کو نہیں. میں تجربات کے سبھی باب 4 کو وقف کروں گا، لہذا میں دو حکمت عملی پر توجہ مرکوز کروں گا جو غیر تجرباتی اعداد و شمار کے ساتھ استعمال کیا جاسکتا ہے. پہلی حکمت عملی دنیا میں ہونے والی چیزوں کی تلاش پر منحصر ہے جس میں بے ترتیب طور پر (یا تقریبا بے ترتیب طور پر) بعض لوگوں کو علاج فراہم کرتا ہے اور نہ دوسروں کو. دوسرا حکمت عملی غیر فعال تجربہ کار اعداد و شمار پر منحصر ہے ان لوگوں کے درمیان preexisting اختلافات کے لئے اکاؤنٹ کرنے کی کوشش میں جنہوں نے علاج کیا نہیں کیا ہے.
ایک شکایات کا دعوی ممکن ہو سکتا ہے کہ ان دونوں کی حکمت عملی سے بچنا چاہئے کیونکہ وہ مضبوط عقائد کی ضرورت ہوتی ہے، فرضات جو اندازہ لگانا مشکل ہے اور اس میں، عملی طور پر، اکثر خلاف ورزی کی جاتی ہیں. جب میں اس دعوی کے لئے ہمدردی ہوں تو، مجھے لگتا ہے کہ یہ بہت دور ہے. یہ یقینی طور پر سچ ہے کہ ناقابل یقین حد تک غیر متوقع اعداد و شمار سے متعلق تخمینوں کو بنانے کے لئے مشکل ہے، لیکن مجھے نہیں لگتا کہ اس کا مطلب یہ ہے کہ ہمیں کبھی بھی کوشش نہیں کرنا چاہئے. خاص طور پر، غیر تجرباتی نقطہ نظر مددگار ثابت ہوسکتے ہیں اگر آپ کو ایک استعمال کے لۓ لوکیجی رکاوٹ کو روکنے سے روکنے یا اخلاقی رکاوٹوں کا مطلب یہ ہے کہ آپ ایک تجربے کو چلانا نہیں چاہتے ہیں. اس کے علاوہ، غیر تجرباتی نقطہ نظر مددگار ثابت ہوسکتے ہیں اگر آپ اعداد و شمار کا فائدہ اٹھانا چاہتے ہیں جو پہلے سے ہی بے ترتیب کنٹرول تجربہ ڈیزائن کرنے کے لئے موجود ہے.
آگے بڑھنے سے پہلے، یہ بھی قابل ذکر ہے کہ causal تخمینے میں سماجی تحقیق میں سب سے زیادہ پیچیدہ موضوعات میں سے ایک ہے، اور وہ جو شدید اور جذباتی بحث کا باعث بن سکتا ہے. اس کے بعد میں، میں اس کے بارے میں انترجھاوٹ بنانے کے لئے ہر نقطہ نظر کی ایک امید مند تشریح پیش کروں گا، پھر میں اس نقطہ نظر کا استعمال کرتے ہوئے کچھ چیلنجوں کا بیان کروں گا. ہر باب کے بارے میں مزید تفصیلات اس باب کے آخر میں مواد میں دستیاب ہیں. اگر آپ اپنے کسی تحقیق میں کسی بھی نقطہ نظر کا استعمال کرنے کی منصوبہ بندی کرتے ہیں تو، میں نے بہت سے عمدہ کتابوں میں سے کسی ایک کی وجہ سے علت کی بنیاد پر (Imbens and Rubin 2015; Pearl 2009; Morgan and Winship 2014) .
غیر تجرباتی اعداد و شمار سے متعلق تخمینوں کا تخمینہ بنانے کے لئے ایک نقطہ نظر اس واقعہ کو دیکھنے کے لئے ہے جس نے کچھ لوگوں کے ساتھ بے ترتیب طور پر علاج کیا ہے اور دوسروں کو نہیں. ان حالات کو قدرتی تجربات کہتے ہیں. قدرتی تجربے کے واضح ترین مثال میں سے ایک جوشوا انگسٹ (1990) کی آمدنی پر فوجی خدمات کے اثر کا اندازہ لگاتا ہے. ويتنام میں جنگ کے دوران، ریاستہائے متحدہ نے اپنی مسلح افواج کا سائز ایک مسودہ کے ذریعے بڑھایا. فیصلہ کرنے کے لۓ کونسا شہریوں کو سروس میں بلایا جائے گا، امریکی حکومت نے لاٹری رکھی ہے. ہر پیدائش کی تاریخ کاغذ کے ٹکڑے پر لکھا گیا تھا، اور جیسا کہ اعداد و شمار 2.7 میں دکھایا گیا تھا، کاغذ کے ان ٹکڑے ٹکڑے ایک وقت میں منتخب ہوئے تھے تاکہ حکم کا تعین کرنے کے لۓ نوجوانوں کو خدمت کرنے کے لئے کہا جائے گا. مسودہ میں). نتائج کے مطابق، 14 ستمبر کو پیدا ہونے والے مردوں کو سب سے پہلے بلایا گیا تھا، 24 اپریل کو پیدا ہونے والے مردوں کو دوسرا اور اسی طرح کہا جاتا تھا. بالآخر، اس لاٹری میں، 195 مختلف دنوں میں پیدا ہونے والے مردوں کو مسودہ کیا گیا تھا، جبکہ 171 دنوں پر پیدا ہونے والے مرد نہیں تھے.
اگرچہ یہ فوری طور پر ظاہر نہیں ہوسکتا ہے، اگرچہ ایک مسودہ لاٹری کو بے ترتیب کن کنٹرول کے لئے ایک اہم مماثلت ہے: دونوں صورتوں میں، شرکاء کو بے ترتیب طور پر علاج حاصل کرنے کے لئے تفویض کیا جاتا ہے. اس بے ترتیب علاج کے اثرات کا مطالعہ کرنے کے لئے، انگرسٹس نے ہمیشہ بڑے ڈیٹا سسٹم کا فائدہ اٹھایا: امریکی سماجی سیکیورٹی ایڈمنسٹریشن، جو تقریبا ہر امریکی کی آمدنی سے متعلق آمدنی پر معلومات جمع کرتی ہے. اس بارے میں معلومات کو اکٹھا کرنے کے بارے میں جو غیر سرکاری طور پر حکومتی انتظامی ریکارڈ میں جمع کردہ لاٹری ڈیٹا کے ساتھ مسودہ لاٹری میں منتخب کیا گیا تھا، انگرسٹ نے نتیجہ اخذ کیا کہ سابق فوجیوں کی آمدنی نسبتا غیر تجربہ کاروں کے مقابلے میں تقریبا 15 فیصد کم تھی.
اس مثال کے طور پر ظاہر ہوتا ہے کہ بعض اوقات سماجی، سیاسی، یا قدرتی افواج اس طرح کے علاج کو تفویض کرتی ہیں جو محققین کی طرف سے لیورجڈڈ ہوسکتے ہیں، اور بعض اوقات ان کے علاج کے اثرات کو ہمیشہ بڑے اعداد و شمار کے ذرائع میں گرفتار کیا جاتا ہے. اس ریسرچ کی حکمت عملی کو مندرجہ بالا خلاصہ کیا جاسکتا ہے: \[\text{random (or as if random) variation} + \text{always-on data} = \text{natural experiment}\]
ڈیجیٹل عمر میں اس حکمت عملی کی وضاحت کرنے کے لئے، ہمیں ایک الیکشن پر غور کریں کہ الیگزینڈر ماس اور اینریکو موریٹی (2009) نے محنت کار ساتھیوں کے ساتھ ملازمین کی پیداوری پر کام کرنے کا اندازہ لگایا. نتائج کو دیکھنے سے پہلے، اس بات کی نشاندہی کی جا رہی ہے کہ آپ کی ہوسکتی ہے کہ متضاد امیدیں موجود ہیں. ایک طرف، آپ یہ توقع کر سکتے ہیں کہ پیداواری ساتھیوں کے ساتھ کام کرنے والے ہمسایہ دباؤ کی وجہ سے اس کی پیداوار میں اضافہ کرنے کے لئے مزدور کی قیادت کریں گے. یا، دوسری طرف، آپ یہ توقع کر سکتے ہیں کہ مشکل کام کرنے والے ساتھیوں کو کسی مزدور کو سست کرنے کی راہنمائی کی جا سکتی ہے کیونکہ اس کا کام اس کے ساتھیوں کی طرف سے کیا جائے گا. پیداوری پر ہم مرتبہ اثرات کا مطالعہ کرنے کا واضح طریقہ ایک بے ترتیب کنٹرول تجربہ ہوگا جہاں کارکنوں کو مختلف پیداوری سطحوں کے کارکنوں کے ساتھ شفایابی سے تفویض کیا جاتا ہے اور پھر نتیجے میں پیداوری ہر کسی کے لئے ماپا ہے. تاہم، محققین، کسی بھی حقیقی کاروبار میں کارکنوں کے شیڈول کو کنٹرول نہیں کرتے ہیں، اور اس وجہ سے ماس اور موریٹی نے ایک سپر مارکیٹ میں کیشوں سے متعلق قدرتی تجربے پر انحصار کرنا پڑا تھا.
اس مخصوص سپر مارکیٹ میں، شیڈولنگ کے طریقہ کار کی وجہ سے اور جس طرح کی تبدیلیوں کی تجاوز کی جاتی ہے، ہر کیشئر کے مختلف کارکنوں کو دن کے مختلف اوقات میں تھا. اس کے علاوہ، خاص طور پر سپر مارکیٹ میں، کیشئرز کا انعقاد ان کے ساتھیوں کی پیداوری سے متعلق تھا یا اسٹور پر کتنا مصروف تھا. دوسرے الفاظ میں، اگرچہ کیش کا شیڈولنگ لاٹری کی طرف سے طے نہیں کیا گیا تھا، ایسا ہی تھا جیسے کارکنوں نے کبھی کبھی بے ترتیب طور پر اعلی (یا کم) پیداوریوں کے ساتھیوں کے ساتھ کام کرنے کا عزم کیا تھا. خوش قسمتی سے، یہ سپر مارکیٹ بھی ایک ڈیجیٹل عمر چیک آؤٹ سسٹم تھا جس نے ہر چیز کو ہر وقت کیشئر سکیننگ کی اشیاء کو سراہا. اس چیک آؤٹ لاگ ڈیٹا سے، مس اور موریٹی نے پیدا کرنے کے قابل، انفرادی، اور ہمیشہ کی پیداوار کی پیمائش کرنے میں کامیاب تھے: فی سیکنڈ سکینر اشیاء. ان دو چیزوں کو یکجا کرنا- ہمسایہ پیداوری میں قدرتی طور پر واقع ہونے والی تبدیلی اور ہمیشہ کی پیداوار کی پیداوار - ماس اور مورٹی نے اندازہ کیا ہے کہ اگر ایک کیشئر کو شریک کارکنوں کو مقرر کیا گیا ہے، جو 10 فی صد زیادہ اوسط سے زیادہ پیداوار ہو تو اس کی پیداوار میں 1.5٪ . اس کے علاوہ، انہوں نے دو اہم مسائل دریافت کرنے کے سائز اور ان کے ڈیٹا کی سمردد استعمال کیا ہے: اس اثر کی heterogeneity (جس کے لئے کارکنوں کی قسم اثر بڑا ہے؟) اور اثر کے پیچھے میکانزم (کیوں اعلی پیداوری ساتھیوں کی قیادت کریں اندوز کرتا اعلی پیداوری؟). ہم ان دو اہم مسائل پر واپس جائیں گے- علاج کے اثرات اور میکانیزم کے تجاوز - باب 4 میں جب ہم مزید تفصیل میں تجربات پر بحث کرتے ہیں.
ان دو مطالعات سے نمٹنے کے لئے، جدول 2.3 دیگر مطالعات کو خلاصہ کرتا ہے جو اسی طرح کی ساخت میں ہے: کسی بھی بے ترتیب اعداد و شمار کے اثر کو اندازہ کرنے کے لئے ہمیشہ ڈیٹا بیس کا استعمال کرتے ہوئے. عملی طور پر، محققین قدرتی تجربات تلاش کرنے کے لئے دو مختلف حکمت عملی کا استعمال کرتے ہیں، دونوں جو پھل مند ہوسکتے ہیں. کچھ محققین ہمیشہ ہمیشہ کے اعداد و شمار کے ذریعہ شروع کرتے ہیں اور دنیا میں بے ترتیب واقعات کو تلاش کرتے ہیں؛ دوسروں کو دنیا میں بے ترتیب واقعہ شروع کرنا اور ڈیٹا کے ذرائع کو تلاش کرنا ہے جو اس کے اثر پر قبضہ کرتے ہیں.
مضحکہ خیز توجہ | قدرتی تجربہ کا ذریعہ | ہمیشہ ڈیٹا کا ذریعہ | حوالہ |
---|---|---|---|
پیداوار پر اثرات | شیڈولنگ کے عمل | چیک آؤٹ ڈیٹا | Mas and Moretti (2009) |
دوستی کی تشکیل | طوفان | فیس بک | Phan and Airoldi (2015) |
جذبات کا پھیلانا | بارش | فیس بک | Lorenzo Coviello et al. (2014) |
ہم سے مل کر اقتصادی ٹرانسفر | زلزلہ | موبائل پیسہ ڈیٹا | Blumenstock, Fafchamps, and Eagle (2011) |
ذاتی کھپت کا رویہ | 2013 امریکی حکومت بند | ذاتی فنانس ڈیٹا | Baker and Yannelis (2015) |
تجدید نظام کے اقتصادی اثرات | مختلف | ایمیزون پر براؤزنگ کا ڈیٹا | Sharma, Hofman, and Watts (2015) |
زوجہ بچوں پر دباؤ کا اثر | 2006 اسرائیل - حزب اللہ جنگ | پیدائشی ریکارڈ | Torche and Shwed (2015) |
وکیپیڈیا پر پڑھنے کا رویہ | سنوڈن کی آراء | وکیپیڈیا لاگ ان | Penney (2016) |
ورزش پر پیر اثرات | موسم | صحت ٹریکرز | Aral and Nicolaides (2017) |
اس بحث میں ابھی تک قدرتی تجربات کے بارے میں، میں نے ایک اہم نقطہ نظر چھوڑ دیا ہے: اس قدر سے جا رہے ہیں کہ آپ نے کبھی کبھار بہت مشکل ہوسکتے ہیں. چلو ویت نام کے مسودہ کی نمائش میں آتے ہیں. اس صورت میں، انگرسٹس آمدنی پر فوجی خدمات کے اثر کا اندازہ کرنے میں دلچسپی رکھتے تھے. بدقسمتی سے، فوجی سروس بے ترتیب طور پر مقرر نہیں کیا گیا تھا؛ بلکہ یہ مسودہ کیا جا رہا تھا کہ بے ترتیب طور پر تفویض کیا گیا تھا. تاہم، ہر کسی کو جو مسودہ کیا گیا تھا وہ (وہاں بہت سی چھوٹیاں تھیں)، اور ان سب لوگوں کو جو مسودہ کیا گیا تھا (لوگوں کو خدمت کرنے کے رضاکارانہ طور پر). مسودے کی بناء پر تصادفی طور پر تفویض کیا گیا تھا، ایک محقق مسودہ میں تمام مردوں کے لئے مسودہ کا اثر انداز کر سکتا ہے. لیکن انگرسٹس نے مسودہ ہونے کا اثر نہیں جاننا چاہا؛ وہ فوج میں خدمت کرنے کا اثر جاننا چاہتا تھا. اس تخمینہ کو بنانے کے لئے، اضافی مفکوم اور پیچیدگیوں کی ضرورت ہوتی ہے. سب سے پہلے، محققین کو یہ فرض کرنے کی ضرورت ہے کہ اثر انداز ہونے والے آمدنی کا مسودہ تیار کرنے کا واحد طریقہ فوج کی خدمت کے ذریعہ ہے . اگر یہ ایرر برقرار رہے تو ہمارے ہیلپ ڈیسک سے رابطہ کریں. غلط استعمال کی اطلاع دیتے ہوئے ایرر آ گیا ہے. براہ مہربانی دوبارہ کوشش کریں. اگر یہ ایرر برقرار رہے تو ہمارے ہیلپ ڈیسک سے رابطہ کریں. غلط استعمال کی اطلاع دیتے ہوئے ایرر آ گیا ہے. براہ مہربانی دوبارہ کوشش کریں. اگر یہ ایرر برقرار رہے تو ہمارے ہیلپ ڈیسک سے رابطہ کریں. عام طور پر، خارج ہونے والی پابندی ایک اہم فرض ہے، اور عام طور پر اس کی تصدیق کرنا مشکل ہے. یہاں تک کہ اگر خارج ہونے والی پابندی درست ہے تو، تمام مردوں پر سروس کے اثر کا اندازہ لگانا ناممکن ہے. اس کے بجائے، یہ پتہ چلتا ہے کہ محققین مردوں کے مخصوص ذیلی نصف پر اثر انداز کر سکتے ہیں جنہیں نامزد کیا جاتا ہے (مرد جو مسودہ کرتے وقت خدمت کریں گے، لیکن اس کی (Angrist, Imbens, and Rubin 1996) نہیں کرتے جب کام نہیں کریں گے) (Angrist, Imbens, and Rubin 1996) . شکایات، تاہم، دلچسپی کی اصل آبادی نہیں تھی. یاد رکھیں کہ یہ مسائل لاٹری مسودہ کے نسبتا صاف کیس میں بھی پیدا ہوتے ہیں. جب ایک جسمانی لاٹری کی طرف سے علاج نہیں کیا جاسکتا ہے تو پیچیدگی کا مزید سیٹ بنتا ہے. مثال کے طور پر، مسس اور موریٹی میں کیشئرز کا مطالعہ، اضافی سوالات اس مفہوم کے بارے میں پیدا ہوتے ہیں کہ ساتھیوں کا کام لازمی طور پر بے ترتیب ہے. اگر یہ عقیدت مضبوطی سے سرشار ہو گئی ہے، تو یہ ان کے اندازے پر عمل کرسکتا ہے. نتیجے میں، قدرتی تجربات غیر تجرباتی اعداد و شمار سے متعلق تخمینوں کا تخمینہ کرنے کے لئے طاقتور حکمت عملی ہوسکتی ہے، اور بڑے اعداد و شمار کے ذریعہ قدرتی تجربات پر سرمایہ کاری کرنے کی صلاحیت میں اضافہ ہوتا ہے. تاہم، شاید یہ بہت اچھا خیال اور کبھی کبھی مضبوط خیالات کی ضرورت ہو گی- جس قدر آپ کو یہ اندازہ لگایا جاسکتا ہے کہ فطرت کیا ہے.
دوسری تجربہ کار میں آپ کو غیر تجرباتی اعداد و شمار سے متعلق تخمینوں کا تخمینہ بنانے کے بارے میں بتانا چاہتا ہوں کہ ان کے درمیان preexisting اختلافات کے اکاؤنٹ میں کرنے کے لۓ غیر تجرباتی اعداد و شمار کے اعداد و شمار کے اعداد و شمار پر منحصر ہے. بہت سارے ایسے ایڈجسٹمنٹ کے نقطہ نظر ہیں، لیکن میں ان پر توجہ مرکوز کرتا ہوں جو ایک نامزد نامہ ملا ہے . مماثلت میں، محققین غیر تجرباتی اعداد و شمار کے ذریعے نظر آتے ہیں جو لوگوں کے جوڑوں کو پیدا کرنے کے لئے تیار ہوتے ہیں مگر اس کے علاوہ کسی نے اس کو علاج حاصل کیا ہے اور نہیں ہے. ملاپ کے عمل میں، محققین اصل میں بھی pruning ہیں ؛ یہ ہے، ایسے معاملات کو مسترد کرنی چاہئے جہاں کوئی واضح میچ نہیں ہے. اس طرح، یہ طریقہ زیادہ درست طریقے سے مماثلت اور پیرامیشن کہا جائے گا، لیکن میں روایتی اصطلاح کے مطابق رہوں گا: ملاپ.
بڑے پیمانے پر غیر تجرباتی اعداد و شمار کے ذرائع کے ساتھ مماثلت کی حکمت عملی کی ایک مثال مثال کے طور پر صارفین کے رویے پر لرنر ایونا اور ساتھیوں (2015) تحقیقات سے آتی ہے. وہ ای بے پر نیلامی حاصل کرنے میں دلچسپی رکھتی تھیں، اور ان کے کام کی وضاحت کرتے ہوئے، میں نیلامی کے نتائج پر نیلامی شروع ہونے والی قیمت، جیسے بیچ کی قیمت یا فروخت کی امکانات پر توجہ مرکوز کروں گا.
فروخت کی قیمت پر شروع ہونے والی قیمت کے اثر کا اندازہ کرنے کا سب سے بڑا طریقہ یہ ہے کہ صرف مختلف ابتدائی قیمتوں کے ساتھ نیلامیوں کے لئے حتمی قیمت کا حساب ہوگا. اگر یہ ایرر برقرار رہے تو ہمارے ہیلپ ڈیسک سے رابطہ کریں. اس ویڈیو پر غلط استعمال کی اطلاع دیتے ہوئے ایرر آ گیا ہے. لیکن اگر آپ کا سوال ابتدائی قیمت کے اثرات کا خدشہ ہے، تو یہ نقطہ نظر کام نہیں کرے گا کیونکہ یہ مناسب موازنہ پر مبنی نہیں ہے؛ کم شروع ہونے والی قیمتوں کے ساتھ نیلامیوں کو اعلی قیمتوں سے زیادہ قیمتوں کے ساتھ بہت مختلف ہو سکتا ہے (مثال کے طور پر، وہ مختلف قسم کے سامان کے لئے ہو سکتے ہیں یا مختلف اقسام کے بیچنے والے شامل ہیں).
اگر آپ غیر تجرباتی اعداد و شمار سے متعلق تخمینوں کا تخمینہ کرتے وقت مسائل پیدا کرنے سے واقف ہیں تو، آپ نوو نقطہ نظر کو چھوڑ سکتے ہیں اور فیلڈ تجربے کو چلانے پر غور کریں گے جہاں آپ ایک مخصوص شے کو فروخت کریں گے، ایک گولف کلب نیلامی کے پیرامیٹرز کا سیٹ - کہتے ہیں کہ، مفت شپنگ اور نیلامی دو ہفتوں تک کھلی ہیں لیکن ابتدائی قیمتوں کو بے ترتیب طور پر مقرر کیا جاتا ہے. نتیجے میں مارکیٹ کے نتائج کا موازنہ کرتے ہوئے، اس فیلڈ تجربے کو فروخت کی قیمت پر شروع ہونے والی قیمت کے اثر کا ایک واضح پیمائش پیش کرے گا. لیکن یہ پیمائش صرف ایک مخصوص مصنوعات پر لاگو ہوگی اور نیلامی پیرامیٹرز کا تعین کرے گا. نتائج مختلف ہوسکتے ہیں، مثال کے طور پر، مختلف قسم کے مصنوعات کے لئے. مضبوط نظریہ کے بغیر، اس واحد تجربے سے ممکنہ تجربات کی مکمل رینج کو ختم کرنا مشکل ہے جو چل سکتا ہے. اس کے علاوہ، فیلڈ کے تجربات کافی مہنگا ہیں کہ ہر متغیر کو چلانے کے لئے یہ ممکن نہیں ہوگا کہ آپ کوشش کرنا چاہتے ہیں.
جناب اور تجرباتی نقطہ نظروں کے برعکس، ایینوف اور ساتھیوں نے تیسرے نقطہ نظر کو حاصل کیا: مماثلت. ان کی حکمت عملی میں اہم چیلنج یہ ہے کہ ایسی چیزیں دریافت کریں جو فیلڈ تجربات سے متعلق ہیں جو ای بے پر پہلے ہی ہوا ہے. مثال کے طور پر، اعداد و شمار 2.8 بالکل ایک ہی گالف کلب کے لئے 31 لسٹنگ میں سے کچھ ظاہر کرتا ہے- ٹیلومورڈڈ برنر 09 ڈرائیور کی فروخت "بجٹ گالففر." کی طرف سے فروخت کیا جا رہا ہے. تاہم، یہ 31 لسٹنگ تھوڑی مختلف خصوصیات ہیں، جیسے مختلف شروع قیمت، اختتام کی تاریخ، اور شپنگ فیس. دوسرے الفاظ میں، جیسے کہ "بجٹ گالفر" محققین کے تجربات چل رہا ہے.
Taylormade برنر 09 ڈرائیور کی یہ لسٹنگ "بجٹ گولفر" کی طرف سے فروخت کی جا رہی ہے، اس فہرست کے ملحق سیٹ کی ایک مثال ہے، جہاں بالکل اسی چیز کو بالکل اسی بیچنے والے کی طرف سے فروخت کیا جا رہا ہے، لیکن ہر وقت تھوڑا مختلف خصوصیات کے ساتھ. ای بے کی بڑے پیمانے پر لاگ ان کے اندر اندر لاکھوں ملحقہ سیٹوں میں لاکھوں لسٹنگ شامل ہیں. لہذا، دیئے گئے شروع ہونے والے قیمت کے ساتھ تمام نیلامیوں کے لئے حتمی قیمت کا موازنہ کرنے کے بجائے، انو اور ساتھیوں نے ملحق سیٹ کے مقابلے میں مقابلے میں. ان سینکڑوں ہزار ملحق سیٹوں کے اندر اندر موازنہ کے نتائج کو یکجا کرنے کے لئے، ایینوف اور ساتھیوں نے ہر چیز کے حوالہ کی قیمت کے لحاظ سے ابتدائی قیمت اور حتمی قیمت (مثال کے طور پر، اس کی اوسط فروخت کی قیمت) کا دوبارہ اظہار کیا. مثال کے طور پر، اگر Taylormade برنر 09 ڈرائیور نے $ 100 (اس کی فروخت پر مبنی) کی ایک حوالہ قیمت تھی، تو $ 10 کی ایک ابتدائی قیمت 0.1 اور 1.2 کے طور پر 120 ڈالر کی حتمی قیمت کا اظہار کیا جائے گا.
یاد رکھیں کہ انو اور ساتھیوں نے نیلامی نتائج پر شروع کی قیمت کے اثر میں دلچسپی لائی ہے. سب سے پہلے، انہوں نے لکیری رجعت کا اندازہ کیا کہ اس کی قیمتوں میں زیادہ قیمتوں میں فروخت کی امکانات کم ہو جاتی ہے، اور اس کی قیمتوں میں زیادہ قیمتوں میں حتمی فروخت کی قیمت میں اضافی اضافہ ہوتا ہے. خود کی طرف سے، یہ تخمینہ - جو لکیری رشتہ کی وضاحت کرتے ہیں اور تمام مصنوعات پر معمولی ہیں- وہ سب دلچسپ نہیں ہیں. اس کے بعد، Einav اور ساتھیوں نے ان کے اعداد و شمار کے بڑے پیمانے پر سائز کا استعمال کرتے ہوئے مختلف قسم کے زیادہ ٹھیک ٹھیک تخمینوں کو پیدا کرنے کے لئے استعمال کیا. مثال کے طور پر، مختلف ابتدائی قیمتوں کے لئے علیحدہ علیحدہ اثر کا اندازہ لگاتے ہوئے، انہوں نے محسوس کیا کہ قیمت اور فروخت کی قیمت کے درمیان تعلقات غیر لائنر ہے (اعداد و شمار 2.9). خاص طور پر، 0.05 اور 0.85 کے درمیان قیمتوں کا آغاز کرنے کے لئے، قیمتوں پر فروخت کی قیمت پر بہت کم اثر پڑتا ہے، جو ان کی پہلی تجزیہ کی وجہ سے مکمل طور پر چھوٹا ہوا تھا. اس کے علاوہ، تمام اشیاء پر نظر انداز کرنے کے بجائے ایینوف اور ساتھیوں نے اشیاء کی 23 مختلف اقسام (مثال کے طور پر، پالتو جانوروں کی فراہمی، الیکٹرانکس، اور کھیل حفظان صحت) (قیمت 2.10) کے لئے شروع ہونے والی قیمت کے اثرات کا اندازہ کیا. ان تخمینوں سے پتہ چلتا ہے کہ زیادہ مخصوص اشیاء کے لئے - جیسے یادگار سے شروع ہونے والا قیمت فروخت کی امکانات اور حتمی فروخت کی قیمت پر بڑا اثر پر اثر انداز ہوتا ہے. اس کے علاوہ، مزید اشیاء کے لئے جیسے ڈی وی ڈی - شروع ہونے والی قیمت حتمی قیمت پر تقریبا کوئی اثر نہیں ہے. دوسرے الفاظ میں، اوسط جو اشیاء کی 23 مختلف قسموں کے نتائج کو یکجا کرتا ہے ان اشیاء کے درمیان اہم اختلافات کو چھپاتا ہے.
یہاں تک کہ اگر آپ ای بے پر نیلامیوں میں خاص طور پر دلچسپی نہیں رکھتے ہیں، تو آپ کو اندازہ لگانا ہوگا کہ 2.9 اور اعداد و شمار 2.10 کے مطابق سادہ تخمینوں سے ای بے کی امیر سمجھنے کی پیشکش کی جاتی ہے جو ایک لکیری رشتہ کا بیان کرتے ہیں اور اشیاء کے بہت سے مختلف اقسام کو یکجا کرتے ہیں. اس کے علاوہ، اگرچہ فیلڈ تجربات کے ساتھ یہ زیادہ ٹھیک ٹھیک تخمینوں کو پیدا کرنے کے لئے سائنسی لحاظ سے ممکن ہو گا، لاگت اس طرح کے تجربات لازمی طور پر ناممکن بنا دے گی.
قدرتی تجربات کے طور پر، ایسے طریقوں میں موجود ہیں جو مماثلت خراب تخمینوں کی قیادت کرسکتے ہیں. مجھے لگتا ہے کہ موازنہ تخمینوں کے ساتھ سب سے بڑی تشویش یہ ہے کہ وہ اس چیزوں کے مطابق باہمی ہوسکتے ہیں جو ملازمت میں استعمال نہیں ہوئے تھے. مثال کے طور پر، ان کے اہم نتائج میں، انو اور اس کے ساتھی نے چار خصوصیات پر عین مطابق مماثلت کیا: بیچنے والے کی شناختی نمبر، شے زمرہ، شے کا عنوان، اور ذیلی عنوان. اگر اشیاء مختلف طریقوں سے مختلف تھے جو ملازمت کے لئے استعمال نہیں کیے گئے تھے، تو یہ غیر منصفانہ موازنہ پیدا کرسکتا ہے. مثال کے طور پر، اگر "بجٹ گالفر" نے موسم سرما میں Taylormade برنر 09 ڈرائیور کے لئے قیمتوں کو کم کیا (جب گالف کلب کم مقبول ہیں)، تو یہ ظاہر ہوتا ہے کہ کم قیمتوں میں کم قیمتیں حتمی حتمی قیمتوں کا باعث بنتی ہیں، جب اصل میں یہ ایک نمائش ہے مطالبہ میں موسمی تبدیلی اس تشویش کو حل کرنے کے لئے ایک نقطہ نظر بہت مختلف قسم کے ملاپ کی کوشش کر رہا ہے. مثال کے طور پر، ایونیو اور ساتھیوں نے اپنے تجزیے کو بار بار کیا جبکہ ملٹی کے لئے استعمال شدہ وقت کی ونڈو مختلف ہوتی ہے (ملائی ہوئی سیٹ میں ایک سال کے اندر، ایک ماہ کے اندر اندر اشیاء، اور ہمسایہ طور پر) شامل تھے. خوش قسمتی سے، انہوں نے ہر وقت کھڑکیوں کے لئے اسی نتائج پایا. ایک تشویش کے ساتھ ایک تشویش تشریح سے پیدا ہوتا ہے. مماثلت سے ملنے والی اعداد و شمار صرف مماثل ڈیٹا پر لاگو ہوتے ہیں؛ وہ ایسے معاملات پر لاگو نہیں کرتے جو مل کر نہیں مل سکے. مثال کے طور پر، ان اشیاء میں ان کی تحقیق کو محدود کرکے، جس میں کئی لسٹنگ موجود تھیں، ایینوف اور ساتھی پیشہ ورانہ اور نیم پیشہ ورانہ بیچنے والے پر توجہ مرکوز کرتے ہیں. اس طرح، جب ان موازنہ کی تشریح کرتے ہیں ہمیں یاد رکھنا ضروری ہے کہ وہ صرف ای بے کے اس ذیلی سیٹ پر لاگو ہوتے ہیں.
غیر تجرباتی اعداد و شمار میں منصفانہ موازنہ تلاش کرنے کے لئے ملاپ ایک طاقتور حکمت عملی ہے. بہت سے سماجی سائنسدانوں کے لئے، مماثل دوسرے تجربوں کے تجربات پر محسوس کرتا ہے، لیکن یہ یقین ہے کہ نظر ثانی کی جا سکتی ہے. جب بڑے پیمانے پر اعداد و شمار میں مل کر ایک چھوٹی سی فیلڈ تجربات کے مقابلے میں بہتر ہوسکتا ہے تو (1) اثرات میں حرجات اہم ہے اور (2) مماثلت مماثلت کے لئے ضروری متغیر متغیر ہوتے ہیں. ٹیبل 2.4 کچھ اور دیگر اعداد و شمار فراہم کرتا ہے کہ بڑے اعداد و شمار کے ذریعہ ملازمت کیسے استعمال کیا جاسکتا ہے.
مضحکہ خیز توجہ | بگ ڈیٹا کا ذریعہ | حوالہ |
---|---|---|
پولیس تشدد پر فائرنگ کا اثر | سٹاپ اور فاسک ریکارڈ | Legewie (2016) |
11 ستمبر، 2001 کے خاندانوں اور پڑوسیوں پر اثر | ووٹ ریکارڈ اور عطیہ ریکارڈ | Hersh (2013) |
سماجی تنازعات | مواصلات اور مصنوعات کو اپنانے کے اعداد و شمار | Aral, Muchnik, and Sundararajan (2009) |
آخر میں، غیر تجرباتی اعداد و شمار سے متعلق اثرات کے اثرات کا اندازہ مشکل ہے، لیکن قدرتی تجربات اور اعدادوشمار ایڈجسٹمنٹ (مثال کے طور پر، مماثلت) جیسے طریقوں کا استعمال کیا جا سکتا ہے. کچھ حالات میں، یہ نقطہ نظر غلط طور پر غلط ہوسکتے ہیں، لیکن جب احتیاط سے تعینات کیا جاتا ہے تو، یہ نقطہ نظر تجرباتی نقطہ نظر میں مفید تکمیل ہوسکتی ہیں جو میں باب 4 میں بیان کرتا ہوں. اس کے علاوہ، یہ دو نقطہ نظر خاص طور پر ہمیشہ کی ترقی سے فائدہ اٹھانے کا امکان لگتے ہیں. بڑے اعداد و شمار کے نظام پر.