مجھے لگتا ہے کہ تجربات کو سمجھنے کا بہترین طریقہ ممکنہ نتائج کا فریم ورک ہے (جس میں میں نے باب 2 میں ریاضیاتی نوٹوں پر بحث کی ہے). ممکنہ نتائج کے فریم ورک میں ڈیزائن پر مبنی نمونے سے متعلق خیالات کے قریبی تعلقات ہیں جو میں نے باب 3 میں بیان کیا ہے (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) . یہ ضمنی اس طرح سے لکھا گیا ہے کہ کنکشن پر زور دیا جائے. یہ زور تھوڑا غیر روایتی ہے، لیکن مجھے لگتا ہے کہ نمونے اور تجربات کے درمیان کنکشن مددگار ہے: اس کا مطلب یہ ہے کہ آپ نمونے کے بارے میں کچھ جانتے ہیں تو آپ تجربات کے بارے میں کچھ جانتے ہیں اور اس کے برعکس. جیسا کہ میں ان نوٹوں میں دکھائے گا، ممکنہ نتائج کے فریم ورک سبب اثرات کے اثرات کا تخمینہ کرنے کے لئے بے ترتیب شدہ کنٹرول تجربات کی طاقت سے ظاہر ہوتا ہے، اور اس سے مکمل طور پر اعدام کردہ تجربات کے ساتھ کیا کیا جا سکتا ہے کی حدود کو بھی ظاہر کرتا ہے.
اس اپ ڈیٹ میں، میں ممکنہ نتائج کے فریم ورک کی وضاحت کرتا ہوں، باب 2 میں ریاضیاتی نوٹوں سے کچھ مواد کو ڈپلیکیٹ کرنے کے لۓ ان نوٹسوں کو زیادہ خود مختص کرنے کے لۓ. پھر میں اوسط علاج کے اثرات کے اندازے کے بارے میں کچھ مفید نتائج بیان کروں گا، بشمول زیادہ سے زیادہ مختص اور متنوع اختلافات کے تخمینوں کے بارے میں بحث بھی شامل ہے. یہ اپرید Gerber and Green (2012) پر بھاری تعداد میں پھیلتا ہے.
ممکنہ نتائج فریم ورک
ممکنہ نتائج کے فریم ورک کی وضاحت کرنے کے لئے، ویکیپیڈیا میں مستقبل کی شراکت پر ایک barnstar حاصل کرنے کے اثر کا اندازہ کرنے کے لئے، Restivo اور وین ڈی Rijt کے تجربے میں واپس آتے ہیں. ممکنہ نتائج کے فریم ورک میں تین اہم عناصر ہیں: یونٹس ، علاج ، اور ممکنہ نتائج . Restivo اور وین ڈی Rijt کے معاملے میں، یونٹس ایڈیٹرز مستحق تھے - وہ سب سے اوپر 1٪ شراکت داروں میں - جو ابھی تک ایک barnstar نہیں تھا. ہم ان ایڈیٹرز کو \(i = 1 \ldots N\) طرف سے انڈیکس کرسکتے ہیں. ان کے تجربے کے علاج میں " \(W_i = 1\) " یا "کوئی \(W_i = 1\) " تھا، اور میں \(W_i = 1\) لکھتا ہوں اگر شخص \(i\) علاج حالت میں ہے اور \(W_i = 0\) دوسری صورت میں. ممکنہ نتائج کے تیسرے عنصر کو سب سے اہم ہے: ممکنہ نتائج . یہ تھوڑا سا تصوراتی اور زیادہ مشکل ہے کیونکہ وہ "ممکنہ" نتائج میں شامل ہوسکتے ہیں. ہر وکیپیڈیا کے ایڈیٹر کے لئے، ایک ترمیم کی تعداد کو تصور کر سکتا ہے کہ وہ علاج کی حالت میں بناؤ گی ( \(Y_i(1)\) ) اور وہ تعداد جو کنٹرول حالت میں کرے گی ( \(Y_i(0)\) ).
نوٹ کریں کہ یونٹس، علاج، اور نتائج کے اس انتخاب کو اس تجربے سے کیا سیکھا جا سکتا ہے. مثال کے طور پر، کسی اضافی مفہوم کے بغیر، رائیویو اور وین ڈیجٹ تمام وکیپیڈیا ایڈیٹرز پر بارارسٹر کے اثرات کے بارے میں کچھ نہیں کہہ سکتے ہیں یا اس طرح کے ترمیم کے معیار کے نتائج کے بارے میں کچھ نہیں کہہ سکتے ہیں. عام طور پر، یونٹس، علاج، اور نتائج کا انتخاب مطالعہ کے اہداف پر مبنی ہونا چاہئے.
ان ممکنہ نتائج کو دیکھتے ہوئے - جس میں جدول 4.5 میں بیان کیا جاتا ہے وہ شخص کے لئے علاج کا سبب بن سکتا ہے \(i\)
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]
میرے لئے، یہ مساوات ایک causal اثر کی وضاحت کرنے کے لئے واضح طریقہ ہے، اور، اگرچہ انتہائی آسان ہے، یہ فریم ورک بہت سے اہم اور دلچسپ طریقوں (Imbens and Rubin 2015) میں عام طور پر تبدیل کر دیتا ہے.
شخص | علاج کی حالت میں ترمیم | کنٹرول حالت میں ترمیم کرتا ہے | علاج کا اثر |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
ن | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
مطلب | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
اگر ہم اس راستے کی بنیاد پر وضاحت کرتے ہیں، تاہم، ہم ایک مسئلہ میں چلتے ہیں. تقریبا تمام معاملات میں، ہم دونوں ممکنہ نتائج کا مشاہدہ نہیں کرتے. یہی وجہ ہے، ایک ویکیپیڈیا کے مخصوص ایڈیٹر کو بھی ایک برار اسٹار موصول ہوئی ہے یا نہیں. لہذا، ہم ممکنہ نتائج میں سے ایک کا مشاہدہ کریں \(Y_i(1)\) یا \(Y_i(0)\) - لیکن دونوں نہیں. دونوں ممکنہ نتائج کا مشاہدہ کرنے میں ناکامی اس طرح کی ایک بڑی دشواری ہے کہ Holland (1986) نے اسے بنیادی وجوہات کی بنیادی مسئلہ قرار دیا .
خوش قسمتی سے، جب ہم تحقیق کررہے ہیں، ہم صرف ایک شخص نہیں رکھتے ہیں، ہمارے پاس بہت سے لوگ ہیں، اور اس وجہ سے بنیادی وابستہ کی بنیادی مسئلہ کے ارد گرد ایک راستہ پیش کرتا ہے. انفرادی سطح کے علاج کے اثر کا اندازہ کرنے کی کوشش کرنے کے بجائے، ہم اوسط علاج کے اثر کا اندازہ لگا سکتے ہیں:
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]
یہ اب بھی \(\tau_i\) شرائط میں ظاہر ہوا ہے جو غیر \(\tau_i\) ہیں، لیکن کچھ الجبرا کے ساتھ ( Gerber and Green (2012) Eq 2.8 کے ساتھ ہم حاصل
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]
مساوات 4.3 سے پتہ چلتا ہے کہ اگر ہم آبادی کے مطابق اوسط نتائج کا علاج کر سکتے ہیں ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) اور آبادی کے اوسط نتائج کا کنٹرول ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) )، پھر ہم کسی خاص شخص کے علاج کے اثر انداز کے بغیر، اوسط علاج کا اثر انداز کر سکتے ہیں.
اب میں نے اپنے تخمینہ کا اندازہ کیا ہے - جس چیز کا ہم تخمینہ کرنے کی کوشش کر رہے ہیں- میں یہ بتاتا ہوں کہ ہم کس طرح اعداد و شمار کے ساتھ اصل میں اندازہ کر سکتے ہیں. مجھے اس نمائش کے چیلنج کے بارے میں سوچنا ہے کہ ایک نمونے کی نمائش کے طور پر (باب 3 میں ریاضیاتی نوٹوں پر واپس سوچیں). تصور کریں کہ ہم تصادفی طور پر کچھ لوگوں کو علاج کی حالت میں دیکھتے ہیں چنانچہ ہم بعض لوگوں کو کنٹرول حالت میں نظر انداز کرتے ہیں، پھر ہم ہر حالت میں اوسط نتائج کا اندازہ کر سکتے ہیں:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]
کہاں \(N_t\) اور \(N_c\) علاج اور کنٹرول کے حالات میں لوگوں کی تعداد ہیں. مساوات 4.4 فرق کی معتبر تخمینہ ہے. نمونے کے ڈیزائن کی وجہ سے، ہم جانتے ہیں کہ پہلی مدت علاج کے تحت اوسط نتائج کے لئے ایک غیر جانبدار تخمینہ والا ہے اور دوسرا اصطلاح کنٹرول کے تحت ایک غیر جانبدار تخمینہ والا ہے.
اس بات کا اندازہ کرنے کا ایک اور طریقہ ہے کہ تصادفی کو کس طرح قابل بناتا ہے کہ یہ یقینی بناتا ہے کہ علاج اور کنٹرول گروپوں کے درمیان مقابلے منصفانہ ہے کیونکہ بے ترتیب کو یقینی بناتا ہے کہ دو گروہوں کو ایک دوسرے کی طرح مل جائے گا. اس کی مثالی چیزیں جو ہم نے ماپا ہیں (استعمال سے پہلے 30 دنوں میں ترمیم کی تعداد) اور جو چیزیں ہم نے ماپا نہیں ہیں (جنہیں صنف کہتے ہیں) کہتے ہیں. مشاہدہ اور غیر محفوظ عوامل دونوں پر توازن کو یقینی بنانے کی صلاحیت بہت اہم ہے. غیر فعال عوامل پر خود کار طریقے سے توازن کی طاقت کو دیکھنے کے لئے، چلو تصور کریں کہ مستقبل کی تحقیق سے پتہ چلتا ہے کہ مرد عورتوں کے مقابلے میں زیادہ تر ذمہ دار ہیں. کیا Restivo اور وین ڈی Rijt کے تجربے کے نتائج کو باطل کرے گا؟ نہیں. بے ترتیب کی طرف سے، انہوں نے اس بات کا یقین کیا کہ تمام غیر منقطع متوقع ہو، توقع میں. نامعلوم کے خلاف یہ تحفظ انتہائی طاقتور ہے، اور یہ ایک اہم طریقہ ہے کہ باب 2 میں بیان کردہ غیر تجرباتی تکنیک سے تجربات مختلف ہیں.
پوری آبادی کے لئے علاج کے اثر کی وضاحت کرنے کے علاوہ، لوگوں کے ذیلی سیٹ کے لئے علاج کے اثر کی وضاحت کرنا ممکن ہے. یہ عام طور پر ایک مشروط اوسط علاج کے اثر (CATE) کہا جاتا ہے. مثال کے طور پر، رائیوو اور وین ڈی ریجٹ کے مطالعہ میں، چلو تصور کرتے ہیں کہ \(X_i\) یہ ہے کہ آیا ایڈیٹر 90 دن کے دوران ترمیم کے میڈین نمبر سے اوپر یا نیچے تھا. ایک ان روشنی اور بھاری ایڈیٹرز کے لئے علیحدہ علیحدہ علاج کے اثر کا حساب کر سکتا ہے.
ممکنہ نتائج کا فریم ورک causal مداخلت اور تجربات کے بارے میں سوچنے کے لئے ایک طاقتور طریقہ ہے. تاہم، وہاں دو اضافی پیچیدگیوں ہیں جو آپ کو ذہن میں رکھنا چاہئے. یہ دو پیچیدگیوں کو اکثر اسٹبل یونٹ کے علاج کے معاوضہ (SUTVA) کے اصطلاح کے تحت مل کر پھنسایا جاتا ہے. SUTVA کا پہلا حصہ یہ ہے کہ شخص \(i\) کا نتیجہ صرف ایک چیز ہے جس کا نتیجہ یہ ہے کہ وہ شخص علاج یا کنٹرول کرنے میں تھا. دوسرے الفاظ میں، یہ فرض کیا جاتا ہے کہ \(i\) دوسرے لوگوں کو دیئے گئے علاج سے متاثر نہیں ہوتا یہ کبھی کبھی "مداخلت" یا "کوئی spillovers" کہا جاتا ہے، اور اس کے طور پر لکھا جا سکتا ہے:
\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]
کہاں \(\mathbf{W_{-i}}\) شخص کے علاوہ ہر شخص کے لئے علاج کی حیثیت کا ایک ویکٹر ہے \(i\) . ایک طریقہ یہ ہے کہ اس کی خلاف ورزی کی جاسکتی ہے، اگر ایک شخص سے علاج کسی اور شخص پر ہوتا ہے تو، مثبت یا منفی طور پر. Restivo اور وین ڈی Rijt کے تجربے کے لئے واپس لوٹنے، دو دوستوں کی تصور \(i\) اور \(j\) اور اس شخص \(i\) ایک barnstar اور \(j\) نہیں کرتا ہے. اگر \(i\) ستارہ وصول سبب بنتا \(j\) زیادہ ترمیم کرنے کے لئے (مقابلے کے احساس سے باہر) یا (مایوسی کا احساس سے باہر) سے کم میں ترمیم کریں، پھر SUTVA خلاف ورزی کی گئی ہے. اس کا بھی خلاف ورزی کی جا سکتی ہے اگر علاج کا اثر دوسرے افراد کو علاج حاصل کرنے کی کل تعداد پر منحصر ہے. مثال کے طور پر، اگر Restivo اور وین ڈی ریج 100 کے بجائے 1000 یا 10،000 برنسٹرز کو دے چکے تھے، تو اس کے نتیجے میں اس نے برنسٹر حاصل کرنے کے اثر پر اثر انداز کیا.
دوسرا مسئلہ SUTVA میں گراؤنڈ ہے یہ فرض ہے کہ صرف ایک ہی متعلقہ علاج یہ ہے جو محققین کو بچاتا ہے. اس مفہوم کو کبھی کبھی پوشیدہ علاج یا عدم اطمینان نہیں کہا جاتا ہے. مثال کے طور پر، ریویوو اور وین ڈی رجٹ میں، یہ ایک ایسا کیس ہوسکتا ہے جو بارنسٹر دینے سے محققین نے مقبول ایڈیٹرز کے صفحے پر ایڈیٹرز کو نمایاں کیا ہے اور یہ مقبول ایڈیٹرز کے صفحے پر کیا جا رہا ہے، اس میں ترمیم کے رویے میں تبدیلی کی وجہ سے. اگر یہ سچ ہے تو، بارنسٹر کا اثر مقبول ایڈیٹرز کے صفحے پر ہونے کے اثر سے متضاد نہیں ہے. ظاہر ہے، یہ واضح نہیں ہے کہ، سائنسی نقطہ نظر سے، یہ کشش یا غیر جانبدار تصور کیا جانا چاہئے. یہی ہے کہ، آپ ایک محقق کا تصور کر سکتے ہیں کہ ایک برنسٹر حاصل کرنے کا اثر تمام بعد میں علاج میں شامل ہوتا ہے جس میں Barnstar چلتا ہے. یا آپ اس صورت حال کا تصور کر سکتے ہیں جہاں تحقیقات ان تمام چیزوں سے بارارسٹرز کے اثر کو الگ کرنا چاہتے ہیں. اس کے بارے میں سوچنے کا ایک طریقہ یہ پوچھنا ہے کہ اگر کچھ بھی نہیں ہے تو Gerber and Green (2012) (پی ایچ 41) جو "سمیٹری میں ٹوٹ ڈال" کہتے ہیں تو کیا ہوتا ہے؟ دوسرے الفاظ میں، کیا علاج کے علاوہ کوئی اور چیز موجود ہے جس میں لوگوں کو علاج کے لۓ اور کنٹرول کے حالات مختلف طریقے سے علاج کیا جاتا ہے؟ سمیٹری توڑنے کے بارے میں خدشہ یہ ہے کہ میڈیکل ٹرائلوں میں کنٹرول گروپ میں لیڈ مریضوں کو ایک جگہبو کی گولی لگانے کے لئے کیا مریض ہیں. اس طرح، محققین اس بات کا یقین کر سکتے ہیں کہ دو شرائط کے درمیان صرف فرق اصل دوا ہے اور اس کو گولی لینے کا تجربہ نہیں ہے.
سوٹوا کے بارے میں مزید کے لئے، گوربر Gerber and Green (2012) سیکشن 2.7، Morgan and Winship (2014) سیکشن 2.5 Morgan and Winship (2014) ، اور سیکشن 1.6 Imbens and Rubin (2015) .
صحت سے متعلق
پچھلے سیکشن میں، نے بیان کیا ہے کہ اوسط علاج کے اثر کا اندازہ کیسے لگایا جائے. اس سیکشن میں، میں ان اندازوں کی متغیریت کے بارے میں کچھ خیالات پیش کروں گا.
اگر آپ کو دو نمونہ وسائل کے درمیان فرق کا اندازہ لگانے کے طور پر اوسط علاج کے اثر کا اندازہ لگانے کے بارے میں سوچتے ہیں، تو یہ ظاہر کرنا ممکن ہے کہ اوسط علاج کے اثرات کی معیاری غلطی یہ ہے:
\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]
جہاں \(m\) لوگوں کو علاج اور \(Nm\) کو کنٹرول کرنے کے لئے تفویض کیا گیا ہے ( Gerber and Green (2012) ، ایق 3.4 دیکھیں). اس طرح، جب کتنے لوگ علاج کرنے کے لئے تفویض کرنے اور کتنا زیادہ تفویض کرنے کے لئے تفویض کرنے کے بارے میں سوچتے ہیں تو، آپ دیکھ سکتے ہیں کہ \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) ، پھر آپ چاہتے ہیں \(m \approx N / 2\) ، جب تک کہ علاج اور کنٹرول کی قیمت اسی طرح کی ہے. مساوات 4.6 واضح کرتی ہے کہ کیوں ووڈ پر سماجی معلومات کے اثرات کے بارے میں بانڈ اور ساتھیوں کے (2012) تجربے کا ڈیزائن (اعداد و شمار 4.18) غیر معقول اعداد وشمار تھا. یاد رکھیں کہ اس کے علاج میں شرائط میں 98 فیصد حصہ موجود تھے. اس کا مطلب یہ ہے کہ کنٹرول کی حالت میں اس کا مطلب یہ ہے کہ یہ درست طریقے سے درست نہیں تھا کیونکہ اس کا مطلب یہ ہے کہ علاج اور کنٹرول کی حالت کے درمیان اندازہ لگایا گیا ہے کہ یہ درست نہیں ہے جیسا کہ یہ ہو سکتا ہے. شراکت داروں کے زیادہ سے زیادہ اختصاص پر مزید کے List, Sadoff, and Wagner (2011) حالات کے درمیان فرق ہونے پر، بشمول List, Sadoff, and Wagner (2011) .
آخر میں، بنیادی متن میں، میں نے وضاحت کیا کہ فرق میں فرق کے لحاظ سے فرقے والے تخمینہ، جو عام طور پر ایک مخلوط ڈیزائن میں استعمال کیا جاتا ہے، فرق کے وسائل کے تخمینہ کے مقابلے میں چھوٹے متغیر کا باعث بن سکتا ہے، جو عام طور پر ایک مضامین کے درمیان استعمال ہوتا ہے. ڈیزائن. اگر \(X_i\) علاج سے پہلے کے نتائج کی قیمت ہے، تو مقدار جس میں ہم فرق میں اختلاف اختلاف کے نقطہ نظر کے ساتھ تخمینہ کرنے کی کوشش کر رہے ہیں:
\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]
اس مقدار کی معیاری غلطی یہ ہے کہ ( Gerber and Green (2012) ، ای 4.4 4.4 دیکھیں)
\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]
نقطہ نظر. 4.6 اور ایق. 4.8 سے پتہ چلتا ہے کہ Gerber and Green (2012) ، اقبال 4.6 ملاحظہ کریں جب فرق میں اختلافات کا نقطہ نظر ایک چھوٹی معیاری غلطی ہوگی.
\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]
بالکل، جب \(X_i\) \(Y_i(1)\) اور \(Y_i(0)\) بہت پیشن گوئی ہے، تو آپ فرق سے مختلف \(Y_i(0)\) فرق کے نقطۂ نظر سے زیادہ درست تخمینہ حاصل کرسکتے ہیں- ایک کا مطلب ریویو اور وین ڈی ریج کے تجربے کے حوالے سے اس کے بارے میں سوچنے کا ایک طریقہ یہ ہے کہ لوگوں میں ترمیم کی مقدار میں بہت زیادہ قدرتی تبدیلی موجود ہے، لہذا یہ علاج اور حالات کو بہتر بنانے کے مقابلے میں مشکل ہے: یہ ایک رشتہ دار کا پتہ لگانا مشکل ہے. شور نتائج کے اعداد و شمار میں چھوٹے اثر. لیکن اگر آپ اس قدرتی طور پر واقع ہونے والی متغیر میں فرق کرتے ہیں، تو اس میں بہت کم متغیر ہوتی ہے، اور یہ ایک چھوٹے سے اثر کا پتہ لگانا آسان بناتا ہے.
Frison and Pocock (1992) کو مختلف معائنہ میں فرق کے ذرائع، فرق سے اختلافات، اور ANCOVA کی بنیاد پر نقطہ نظر کے عین مطابق مقابلے کے لئے ملاحظہ کریں جہاں ایک سے زیادہ پیمائش پہلے سے علاج اور بعد از علاج ہیں. خاص طور پر، وہ ANCOVA کی سفارش کرتے ہیں، جس میں میں نے یہاں احاطہ نہیں کیا ہے. اس کے علاوہ، McKenzie (2012) دیکھیں کہ کئی مراحل سے متعلق نتائج کے اقدامات کی اہمیت کی بحث کے لئے.