ریاضياتي یادښتونه

زما په اند د تجربو د پوهیدو غوره لاره د احتمالي پایلو چوکاټ دی (کوم چې ما په دویم فصل کې د ریاضيیکي یادښتونو په اړه خبرې وکړې). د بالقوه پایلو چوکاټ د ډیزاین پر بنسټ نمونې څخه نظریاتو سره نږدې اړیکې لري چې ما په دریم فصل کې بیان کړې (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) . دا ضمیمه په داسې ډول لیکل شوي چې د دې اړیکې ټینګار کوي. دا ټینګار یو څه غیر رواج دی، مګر زما په اند د نمونې او تجربو تر مینځ اړیکې ګټورې دي: دا پدې مانا ده چې که تاسو د نمونې په اړه څه شی پوهیږئ بیا تاسو د تجربو په اړه پوهه یا بلکه پوهیږئ. لکه څنګه چې زه پدې یادونو کې ښودل شم، د بالقوه پایلو چوکاټ د ناڅاپي کنټرول تجربو پیاوړتیا څرګندوي چې د تاثیر اغیزو اټکل وکړي، او دا د حتی اعدام شوو تجربو سره څه شي ترسره کیدی شي محدوديتونه ښیي.

په دې ضمیمه کې، زه به د احتمالي پایلو کاري چوکاټ تشریح کړم، د 2 نوټونو کې د ریاضياتي نوټونو څخه ځینې مواد مباحث کول ترڅو دا یادښتونه په ځان کې شامل شي. بیا زه به د منځنۍ درملنې اغیزو اټکلونو په اړه ځینې ګټورې پایلې تشریح کړم، په ګډون د مطلوب تخصیص او د توپیرونو توپیر کونکي اټکل کونکي شامل دي. دا ضمیمه په Gerber and Green (2012) ډیره لوړه شوې ده.

احتمالي پايلې چوکاټ

د احتمالي پایلو کاري چوکاټ روښانه کولو لپاره، راځئ چې د ويکيپېډيا ته د راتلونکو مرستو په اړه د Barnstar د ترلاسه کولو اغيز اټکل لپاره د ريويو او وين ډي ريج تجربه ته راشي. د احتمالي پايلو چوکاټ درې اساسي عناصر لري: واحدونه ، درملنه ، او احتمالي پايلې . د ریویو او وین دي راټ په حالت کې، واحدونه د ادعاوو مستحق دي - هغه څوک چې د برخې اخیستونکو په سر کې 1٪ برخه لري - کوم چې ال تر اوسه د بارنسټ سترګې نلري. موږ کولای شو دا ادرس د \(i = 1 \ldots N\) لخوا لینک کړئ. په خپلو تجربه د علاج "barnstar" یا وو "نه barnstar،" او زه به وليکي \(W_i = 1\) که کس \(i\) کې د درملنې په حالت کې دی او د \(W_i = 0\) بل ډول. د احتمالي پایلو چوکاټ دریم عنصر خورا مهم دی: احتمالي پایلې . دا یو څه نور خورا مفهوم ستونزمن دي ځکه چې دوی د "احتمالي" پایلې - هغه شیان شامل دي چې کیدلی شي. د هر ويکيپېډيا د اديب لپاره، يو څوک کولی شي د درملنې حالت کې د هغه سمون تصور وکړي ( \(Y_i(1)\) ) او هغه شمېره چې هغه د کنترول حالت کې کوي ( \(Y_i(0)\) ).

په ياد ولرئ چې د واحدونو، درملنې او پايلو انتخاب دا ټاکي چې د دې تجربې څخه څه شي زده کولى شي. د بیلګې په توګه، پرته له کوم اضافي انګیرنې، ریویووا او وین دي رټټ په وکیپیډیا ایډز ایډرونو کې د باروارډ اغیزې او یا د سمون کیفیت په پایلو باندې هیڅ څه نه شي کولی. په عموم کې، د واحدونو، درملونو او پایلو غوره کول باید د مطالعې موخو پر بنسټ وي.

د دې احتمالي پایلو ته په پام سره - کوم چې په جدول کې 4.5 کې لنډیز شوي دي - یو څوک کولی شي د انسان لپاره د درملنې انتان اغیزه تعریف کړي \(i\)

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]

زما لپاره، دا مساوي د معتبره اغیز تعریفولو لپاره واضح لاره ده، او که څه هم ډیر ساده دی، دا چوکاټ ډیری مهمې او په زړه پورې لارو چارو کې د عمومي کولو وړ دی (Imbens and Rubin 2015) .

جدول 4.5: د احتمالي پایلو جدول
شخص د درملنې حالت کې واقع شوی د کنترول حالت کې سمون د درملنې اغیز
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
ن \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
مطلب \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

که موږ په دې لاره کې موجوديت تعریف کړو، سره له دې، موږ د یوې ستونزې په لور روان یو. په نږدې ټولو قضیو کې، موږ د دواړو احتمالي پایلو څارنه نه کوو. دا د ويکيپېډيا ځانګړي ځانګړونکي دي يا هم د بارنارټ ترلاسه کول دي يا نه. له همدې امله، موږ د احتمالي پایلو څخه یو یو وګورئ - \(Y_i(1)\) یا \(Y_i(0)\) - مګر دواړه دواړه. د دواړو احتمالي پایلو د لیدلو وړتیا یوه لویه ستونزه ده چې Holland (1986) یې د علت د توقیف بنسټیزې ستونزې ګڼي .

په خوشبختۍ سره، کله چې موږ څېړنه کوو، موږ یوازې یو تن نلرو، موږ ډیر خلک لرو، او دا د علت د لاسوهنې بنسټیزې ستونزې شاوخوا وړاندې کوي. د انفرادی سطحې درملنې اغیز اټکل کولو په پرتله، موږ کولی شو د اوسط درملنې اغیز اټکل وکړو:

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]

دا لا تراوسه د \(\tau_i\) په اړه څرګند شوي کوم چې غیر منفي دي، مګر د ځینې الجزیرې سره (د Gerber and Green (2012) ایق 2.8 Gerber and Green (2012) ) سره موږ ترلاسه کوو

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]

مساوي 4.3 ښیي چې که موږ د درملنې لاندې د خلکو منځنۍ پایلې ترلاسه کړو ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) او د نفوس منځنۍ پایلې د کنترول لاندې ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) )، نو موږ کولی شو د منځنۍ درملنې اغیز اټکل وکړو حتی که څه هم د کوم ځانګړي کس لپاره د درملنې اغیز اټکل پرته پرته.

اوس چې ما خپل اټکل تعریف کړ - هغه څه چې موږ یې اټکل کوو هڅه کوو - موږ به په حقیقت کې موږ د معلوماتو سره څنګه څنګه کولی شو اټکل وکړو. زه غواړم د دې اټکل کولو ننګونې د نمونې اخیستنې ستونزه په توګه وټاکم) په دریم فصل کې د ریاضياتي نوټونو ته فکر وکړئ (. تصور وکړئ چې موږ په ناڅاپه توګه ځینې خلک غوره کوو چې د درملنې حالت کې وګوري او موږ په ناڅاپي توګه ځینې خلک وټاکو چې د کنترول حالت کې وګوري، نو بیا موږ په هر حالت کې د اوسط پایلې اټکل کولی شئ:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]

چیرې چې \(N_t\) او \(N_c\) د درملنې او کنترول شرایطو کې د خلکو شمیر دی. مساوات 4.4 د توپیر د اټکل اټکل دی. د نمونې اخیستنې ډیزاین له امله، موږ پوهیږو چې لومړی دور د درملنې لاندې د منځنۍ پایلو لپاره یو غیر اټکل اټمیمونکی دی او دویم اصطالح یو کنټرول اټمیممینټر کنترول دی.

د کومې اندازې په اړه فکر کولو لپاره د فکر کولو لپاره بله بله لاره دا ده چې دا ډاډ ترلاسه کوي چې د درملنې او کنټرول ډلو ترمنځ پرتله کول منصفانه دي ځکه چې تصمیم نیولو ډاډ ورکوي چې دواړه ډلې به یو بل سره ورته وي. دا ورته والی د هغه شیانو لپاره دی چې موږ یې اندازه کړی (د تجربې دمخه 30 ورځو کې د سمونونو شمیره واچوئ) او هغه شیان چې موږ یې اندازه نده کړې (جنسیت ته ووایاست). د دې لیدل شوي تضمین کولو توان دا دی چې دواړه لیدل شوي او غیر منفي فکتورونو کې توازن مهم دی. د غیرقانوني فکټورونو په اړه د اتوماتیک توازن ځواک لیدلو لپاره، اجازه راکړئ چې راتلونکې څیړنې ومومي چې نارینه د ښځو په پرتله د انعامونو مسولیت لري. ایا دا د ریویو او وین ډیج تجربه پایلې باطلوي؟ نه د تصفیه کولو له الرې، دوی ډاډ ورکړ چې ټول غیر فعاله به د توقع په صورت کې متوازن وي. د نامعلومو په وړاندې دا تحفظ خورا پیاوړی دی، او دا یو مهم لار ده چې تجربې د دویم فصل کې تشریح شوي غیر تجربه شوي تخنیکونو څخه توپیر لري.

د ټول نفوس لپاره د درملنې د اغېزو تعریف کولو سربیره، دا ممکن د خلکو د سب سایټ لپاره د درملنې اغیز تعریف کړي. دا په عموما د شرایطو منځنۍ درملنې اغیزې (CATE) په نامه یادېږي. د بیلګې په توګه، د ریویو او وین دي رټټ لخوا په مطالعه کې، اجازه راکړئ چې \(X_i\) دا وي چې ایا ایډيټر د تجربې دمخه د 90 ورځو په ترڅ کې د ترمیم منځګړیتوب شمیره پورته یا ښکته وه. یو کولی شي د دې رڼا او ډیرو ایډیورز لپاره د درملنې اغیز په جلا توګه محاسبه کړي.

د بالقوه پایلو چوکاټ د تلفاتو پیژندل او تجربو په اړه فکر کولو یوه پیاوړی لاره ده. په هرصورت، دوه اضافي پیچليتیاوې شتون لري چې تاسو باید په پام کې ونیسئ. دا دوه پیچلتیاوې د Stable Unit Treatment Value Assumption (SUTVA) اصطالح الندې وختونو سره یوځاى کیږي. د SUTVA لومړۍ برخه دا انګیرنه ده چې یوازې د شخص \(i\) نتیجه ده چې آیا دا شخص د درملنې یا کنترول حالت کې وي که نه. په بل عبارت، دا فرض کیږي چې دا شخص \(i\) د نورو خلکو لخوا د درملنې لخوا اغیز نه کیږي. دا ځینې وختونه "نه مداخله" یا "هیڅ سپیلر" نه بلل کیږي، او دا لیکل کیدای شي لکه:

\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]

چیرې چې \(\mathbf{W_{-i}}\) د هر چا لپاره د درملنې دریځونه د شخص پرته پرته وي \(i\) . یوه لاره چې دا یې سرغړونه کیدی شي دا ده چې که د یو کس درملنه بل کس ته وغواړي، په مثبته یا منفي توګه. د ریویوو او وین ديجټټ تجربه ته بیرته راستوندل، دوه ملګري \(i\) او \(j\) او هغه شخص تصور کوي چې \(i\) یو باینارټ او \(j\) نه لري. که چېرې \(i\) د Barnstar سبب شي \(j\) د ډیرو برخو (د سيالۍ احساس) څخه کم کړي یا لږ (د ناامني احساس څخه بهر) بدل کړي، بیا وروسته SUTVA سرغړونه شوې. دا کیدای شي د سرغړونې څخه سرغړونه وشي که د درملنې اغېزه د درملنې ترالسه کولو ټولو هغو کسانو پورې تړاو ولري چې درملنه ترالسه کوي. د بیلګې په توګه، که رائیویو او وین دي رټټ د 100 پهځای 1000 یا 10000 بارنټران ورکړي، نو دا به د باینتینټل د ترالسه کولو په اغیز اغیزه ولري.

دویمه مسله چې په SUTVA کې ځای پر ځای شوې ده داسې انګیرل کیږي چې یوازې ورته اړونده درمل هغه یو دی چې څیړونکی یې ورکوي؛ دا انګیرنه کله ناکله پټ شوي درمل یا غیر معلولیت ویل کیږي . د بیلګې په توګه، په ریویو او وین دي رټټ کې، ښايي دا وي چې د بارنټارټ په واسطه څیړونکو د دې المل شو چې ایډیورز د مشهور ایډیورز پاڼې پاڼې کې راښکاره شي او دا د بارنټارډ ترلاسه کولو پرځای دا د مشهور ایڈیٹرز پاڼې کې وي. د دې لامل شو چې د سمون په چلند کې بدلون. که دا سمه وي، نو د بارنارسټ اغیزه د مشهور ایډیورز پاڼې په اړه د توپیر وړ نه ده. البته، دا روښانه نده چې، د یوې ساینسي نظریې څخه، دا باید زړه نازک یا ناپاک وي. دا، تاسو کولی شئ د څیړونکي فکر وکړئ چې د باینټینټل د ترلاسه کولو اغیز ټولې ټولې درملنې کې شامل دي چې د بارنسټ ستریدونکي. یا تاسو داسې وضعیت تصور کولی شئ چیرته چې څیړنه غواړئ د دې ټولو شیانو څخه د باروارډز اغیز تاثیر کړي. د دې په اړه فکر کولو لپاره یوه لاره دا ده چې آیا د کوم څه شتون شتون لري چې Gerber and Green (2012) (41) د "سمه توګه مینځ ته راځي" ته لیږل کیږي؟ په بل عبارت، آیا د درملنې پرته بل څه شی دی چې د درملنې په حالت کې خلک او کنټرول یې په بل ډول توپیر کوي؟ د تغیراتو ماتولو په اړه اندیښنې دا دي چې د درملنې ډلې کې د ناروغانو مشرتابه په طبي محاکمو کې د ځایبو ګولۍ اخیستلو لپاره الرښوونه کوي. په دې ډول، څیړونکي کوالی شي ډاډ ترلاسه کړي چې د دوو شرایطو ترمنځ یواځې توپیر حقیقي درمل دي او د ګولۍ اخیستلو تجربه نه ده.

د SUTVA په اړه د نورو لپاره، برخه 2.7 د Gerber and Green (2012) برخه وګورئ، برخه 2.5 د Morgan and Winship (2014) ، او برخه 1.6 د Imbens and Rubin (2015) .

دقیقیت

په تیره برخه کې، ما په ډاګه کړی چې د اوسط درملنې اغیز څنګه اټکل کوي. پدې برخه کې، زه به د دغو اټکلونو بدلونونو په اړه ځینې نظرونه چمتو کړم.

که تاسو فکر کوئ چې د نمونې درملنې اغیزې اټکل وکړئ لکه څنګه چې د دوو نمونې وسیلو ترمنځ توپیر اټکل کړئ، نو دا ممکنه ده چې وښیي چې د اوسط درملنې اغیز معیاري غلطی دی:

\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]

چیرته چې \(m\) خلک د درملنې لپاره ګمارل شوي او \(Nm\) کنترولیږي ( Gerber and Green (2012) ، EQ 3.4 وګورئ). په دې توګه، کله چې فکر وکړئ چې څومره خلک درملنې ته ګمارل کیږي او څومره څومره کنټرول کنټرولوي، تاسو ګورئ چې که د \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) ، نو تاسو غواړئ چې \(m \approx N / 2\) ، څومره چې د درملنې لګښت او کنترول ورته وي. مساوات 4.6 روښانه کوي چې ولې د رایې ورکولو په اړه د ټولنیزو معلوماتو اغیزې په اړه د بانډ او همکارانو (2012) تجربه ډیزاین ډیزاین (2012) 4.18 شمیره (د احصایې له پلوه ناکافي وه. یادونه وکړه چې د دې درملنې په شرایطو کې یې٪ 98 برخه اخیستونکي درلودل. دا پدې مانا چې د کنترول حالت کې د معنی تعامل د سمې کچې په توګه اټکل شوی نه و، ځکه چې په پایله کې د درملنې او کنټرول حالت ترمنځ اټکل شوی توپیر سم دقیق په توګه اټکل شوی نه و. د شرایطو لپاره د ګډون کوونکو لپاره د غوره تخصیص په اړه، د هغه شرایطو په شمول چې د شرایطو ترمینځ توپیر لري، List, Sadoff, and Wagner (2011) وګورئ List, Sadoff, and Wagner (2011) .

په پای کې، په اصلي متن کې، ما تشریح کړه چې څنګه د توپیرونو توپیر اټکل کوونکی، کوم چې په عموما په مخلوط ډیزاین کې کارول کیږي، کیدای شي د توپیر په وسیله اټمینټر څخه لږ توپیر را منځ ته کړي، کوم چې په عام ډول د منځنیو موضوعاتو کې کارول کیږي ډیزاین. که \(X_i\) د درملنې دمخه د پایلو ارزښت وي، نو هغه مقدار چې موږ یې هڅه کوو د توپیرونو په توپیر سره د اټکل کولو هڅه وکړو:

\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]

د دې مقدار معیاري غلطی دی) Gerber and Green (2012) ، ایق 4.4 وګورئ (

\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]

دقیقا پرتله کول. 4.6 او EQ. 4.8 څرګندوي چې د توپیرونو توپیرونه به یو کوچني معیشت خراب شي کله چې) Gerber and Green (2012) ، EQ 4.6 وګورئ)

\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]

که څه هم \(X_i\) د \(Y_i(1)\) \(Y_i(0)\) خورا ډیر اټکل کیږي، نو تاسو کولی شئ دقیق توپیرونه د توپیرونو توپیر له توپیر څخه توپیر ترلاسه کړئ - د معنی یو د ریویو او وین ديجټټ تجربه کې د دې په اړه فکر کولو یوه لاره دا ده چې د پیسو په شمیر کې ډیر طبیعي بدلون شتون لري، نو دا د درملنې او کنترول شرایطو سره پرتله کول ستونزمن کوي: دا ستونزمن کار دی چې یو خپلوان کشف کړي د شور د شور پایلو په ډاټا کې لږ اغیزه. مګر که تاسو د طبيعي پیښور بدلونونو سره توپیر وکړئ، نو دلته خورا لږ بدلون شتون لري، او دا د کوچني تاثیر موندلو اسانه اسانه کوي.

د مختلفو توپیرونو د توپیر پرتله کولو لپاره، Frison and Pocock (1992) وګورئ، د توپیرونو توپیرونه، او په ANOVVA-based-based عمومي ترتیباتو کې چېرته چې مخکې له مخکې د درملنې مخکې درملنه او درملنه کیږي. په ځانګړې توګه، دوی په انډول سره ANCOVA سپارښتنه کوي، کوم چې ما دلته پوښلي نه دي. برسېره پر دې، د McKenzie (2012) وګورئ څو د درملنې وروسته د پایلو د اقداماتو د اهمیت په اړه بحث وکړي.