আমি মনে করি পরীক্ষাগুলি বোঝার সর্বোত্তম উপায় হল সম্ভাব্য ফলাফল কাঠামো (যা আমি অধ্যায় ২-এর গাণিতিক নোটগুলিতে আলোচনা করেছি)। সম্ভাব্য ফলাফল কাঠামো ডিজাইন-ভিত্তিক স্যাম্পলিং থেকে ধারণাগুলির সাথে ঘনিষ্ঠ সম্পর্ক রয়েছে যা আমি তৃতীয় অধ্যায়ে বর্ণনা করেছি (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) । এই পরিশিষ্টটি এমনভাবে লেখা হয়েছে যে এই সংযোগটি জোর দেওয়া হয়েছে। এই জোর দেওয়া একটি বিট অ প্রথাগত, কিন্তু আমি মনে করি যে নমুনা এবং পরীক্ষার মধ্যে সংযোগ সহায়ক। এর মানে হল যে যদি আপনি স্যাম্পলিং সম্পর্কে কিছু জানেন তবে আপনি পরীক্ষাগুলি সম্পর্কে কিছু জানেন এবং তদ্বিপরীত। যেহেতু আমি এই নোটগুলিতে দেখবো, সম্ভাব্য ফলাফল কাঠামো কার্যকরী প্রভাবগুলির অনুমান করার জন্য র্যান্ডমাইজড নিয়ন্ত্রিত পরীক্ষাগুলির শক্তি প্রকাশ করে এবং এটি এমনকি পুরোপুরি সঞ্চালিত পরীক্ষায়ও কি করা যেতে পারে তা সীমাবদ্ধতা দেখায়।
এই পরিশিষ্টে, আমি সম্ভাব্য ফলাফল কাঠামোটি বর্ণনা করব, এই নোটগুলিকে আরো স্বতন্ত্রভাবে তৈরি করার জন্য অধ্যায়ের ২ টি গাণিতিক নোটগুলির কিছু উপাদানকে প্রতিলিপি করব। তারপর আমি অনুকূল বরাদ্দকরণ এবং পার্থক্য মধ্যে-পার্থক্য estimators একটি আলোচনা সহ গড় চিকিত্সা প্রভাবের আনুমানিক নির্ভুলতা সম্পর্কে কিছু সহায়ক ফলাফল বর্ণনা করব। এই পরিশিষ্ট Gerber and Green (2012) উপর ব্যাপকভাবে আঁকা।
সম্ভাব্য ফলাফল কাঠামো
সম্ভাব্য ফলাফল কাঠামোকে ব্যাখ্যা করার জন্য, উইকিপিডিয়ায় ভবিষ্যতের অবদানসমূহে একটি বার্নস্টার প্রাপ্তির প্রভাব সম্পর্কে পূর্বাভাস দেওয়ার জন্য আমরা Restivo এবং van de Rijt এর পরীক্ষায় ফিরে আসি। সম্ভাব্য ফলাফল কাঠামো তিনটি প্রধান উপাদান: ইউনিট , চিকিত্সা , এবং সম্ভাব্য ফলাফল । Restivo এবং ভ্যান দে Rijt ক্ষেত্রে, ইউনিট সম্পাদক যোগ্য ছিল - যারা শীর্ষ 1% অংশগ্রহণকারীদের মধ্যে- যারা একটি barnstar এখনো প্রাপ্ত করেনি আমরা এই সম্পাদককে \(i = 1 \ldots N\) । তাদের গবেষণায় চিকিত্সাগুলি ছিল "বার্নস্টার" বা "কোন বার্নস্টার," এবং আমি \(W_i = 1\) যদি ব্যক্তিটি \(i\) \(W_i = 0\) অবস্থায় থাকে এবং \(W_i = 0\) অন্যথায়। সম্ভাব্য ফলাফল কাঠামো তৃতীয় উপাদান সবচেয়ে গুরুত্বপূর্ণ: সম্ভাব্য ফলাফল এইগুলি আরও বেশি ধারণামূলক কঠিন কারণ তারা "সম্ভাব্য" ফলাফলগুলি-যা ঘটতে পারে - তা অন্তর্ভুক্ত করে। প্রতিটি উইকিপিডিয়া সম্পাদকের জন্য, তিনি যে কোনও ক্ষেত্রে \(Y_i(1)\) চিকিৎসার ক্ষেত্রে ( \(Y_i(1)\) তৈরি করতে পারবেন এবং তার সংখ্যার কন্ট্রোল অবস্থায় ( \(Y_i(0)\) )।
লক্ষ্য করুন যে ইউনিট, চিকিত্সা এবং ফলাফলগুলির এই পছন্দটি এই পরীক্ষা থেকে কী শিখতে পারে তা নির্ধারণ করে। উদাহরণস্বরূপ, কোন অতিরিক্ত ধারণা ছাড়াই, Restivo এবং van de Rijt সব উইকিপিডিয়া সম্পাদকদের বা বার্ষিক সম্পাদনা মানের মত ফলাফলগুলিতে বর্ষসনার প্রভাব সম্পর্কে কিছুই বলতে পারে না। সাধারণভাবে, ইউনিট, চিকিত্সা এবং ফলাফলগুলির পছন্দ অধ্যয়নের লক্ষ্যগুলির উপর ভিত্তি করে হওয়া উচিত।
এই সম্ভাব্য ফলাফল দেওয়া - যা টেবিলের 4.5-তে সংক্ষেপিত হয় - ব্যক্তির জন্য চিকিত্সার কার্যকারিতার প্রভাব সংজ্ঞায়িত করতে পারে \(i\) হিসাবে
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]
আমার কাছে, এই সমীকরণ একটি কার্যকারিতার প্রভাব সংজ্ঞায়িত করার নিখুঁত উপায়, এবং, যদিও অত্যন্ত সহজ, এই কাঠামোটি অনেক গুরুত্বপূর্ণ এবং আকর্ষণীয় উপায়ে (Imbens and Rubin 2015) ।
ব্যক্তি | চিকিত্সা অবস্থায় সম্পাদনা | নিয়ন্ত্রণ অবস্থায় সম্পাদনা | চিকিত্সা প্রভাব |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
এন | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
গড় | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
আমরা এই ভাবে কার্যকারিতা নির্ধারণ করি, তবে, আমরা একটি সমস্যা মধ্যে চালানো। প্রায় সব ক্ষেত্রে, আমরা উভয় সম্ভাব্য ফলাফল পালন করতে না। যে, একটি নির্দিষ্ট উইকিপিডিয়া সম্পাদক একটি বার্নস্টোন প্রাপ্ত বা না। অতএব, আমরা সম্ভাব্য ফলাফলগুলির একটি পালন \(Y_i(1)\) বা \(Y_i(0)\) না উভয়। উভয় সম্ভাব্য ফলাফল পালন করতে অসমর্থতা যেমন একটি বড় সমস্যা Holland (1986) এটি প্রচলিত কারণ মৌলিক সমস্যা বলা
সৌভাগ্যবশত, আমরা যখন গবেষণা করছি, তখন আমরা কেবলমাত্র এক ব্যক্তি নই, আমাদের অনেক লোক আছে, এবং এই কারণগত সমস্যাের মৌলিক সমস্যা সম্পর্কে একটি উপায় প্রস্তাব করে। পৃথক স্তরের চিকিত্সা প্রভাব অনুমান করার চেষ্টা করার চেয়ে, আমরা গড় চিকিত্সা প্রভাব অনুমান করতে পারেন:
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]
এটি এখনও \(\tau_i\) যা \(\tau_i\) নয়, কিন্তু কিছু বীজগণিত (ইক 2.8 Gerber and Green (2012) ) অনুসারে প্রকাশ করা হয়।
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]
সমীকরণ 4.3 দেখায় যে, যদি আমরা জনসংখ্যার গড় পরিচর্যা চিকিত্সার অধীনে অনুমান করতে পারি ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) এবং জনসংখ্যার গড় ফলাফল নিয়ন্ত্রণের ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), তাহলে আমরা কোনও নির্দিষ্ট ব্যক্তির জন্য চিকিত্সা প্রভাব অনুমান ছাড়াও, গড় চিকিত্সা প্রভাব অনুমান করতে পারি।
এখন যে আমরা আমাদের অনুমিত সংজ্ঞায়িত করেছি - আমরা যে জিনিসটি অনুমান করার চেষ্টা করছি তা-ই করবো কিভাবে আমরা আসলে এটি ডেটা দিয়ে অনুমান করতে পারি। আমি একটি নমুনা সমস্যা (অনুচ্ছেদ 3 মধ্যে গাণিতিক নোট ফিরে) হিসাবে এই অনুমান চ্যালেঞ্জ সম্পর্কে মনে করতে চান। কল্পনা করুন যে, আমরা অনিয়মিতভাবে কিছু লোককে চিকিৎসার অবস্থার নিরীক্ষণ করার জন্য বেছে নিয়েছি এবং আমরা অনিয়মিতভাবে নিয়ন্ত্রণ অবস্থানে নিরীক্ষণ করার জন্য কিছু লোককে বেছে নেব, তারপর আমরা প্রতিটি অবস্থায় গড় ফলাফল অনুমান করতে পারি:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]
যেখানে \(N_t\) এবং \(N_c\) হয় চিকিত্সা এবং নিয়ন্ত্রণ অবস্থানে মানুষের সংখ্যা। সমীকরণ 4.4 একটি পার্থক্য-এর অর্থ অনুমানকারী। স্যাম্পলিং ডিজাইনের কারণে, আমরা জানি যে প্রথমবারের মতো চিকিত্সা অধীনে গড় ফলাফলের জন্য একটি নিরপেক্ষ আধিকারিক এবং দ্বিতীয় মেয়াদ নিয়ন্ত্রণের অধীন একটি নিরপেক্ষ আধিকারিক।
র্যান্ডমাইজেশনটি কীভাবে সক্ষম হবে সে সম্পর্কে আরেকটি উপায় হল এটি নিশ্চিত করে যে, চিকিত্সা এবং নিয়ন্ত্রণ গ্রুপগুলির মধ্যে তুলনাটি ন্যায্য কারণ র্যান্ডমাইজেশন নিশ্চিত করে যে দুটি গ্রুপ একে অপরের অনুরূপ হবে। এই সামঞ্জস্য আমরা পরিমাপ করা হয়েছে জন্য বস্তু (আমাদের গবেষণাগার 30 দিন আগে সংখ্যার সংখ্যার বলে) এবং আমরা মাপা না জিনিস (বল লিঙ্গ) বলে মনে হয়। উভয় পরিদর্শন এবং অবাঞ্ছিত কারণের উপর ভারসাম্য নিশ্চিত করার এই ক্ষমতাটি অত্যন্ত গুরুত্বপূর্ণ। অবাঞ্ছিত কার্যাবলীগুলিতে স্বয়ংক্রিয় সামঞ্জস্যের ক্ষমতা দেখতে, আসুন আমরা কল্পনা করি যে ভবিষ্যতের গবেষণায় দেখা যায় যে পুরুষদের তুলনায় পুরুষেরা পুরোপুরি প্রতিভার প্রতি সংবেদনশীল রিস্টিভো এবং ভ্যান ডি রিজটের পরীক্ষার ফলাফল অকার্যকর হবে কি? না। র্যান্ডমিং দ্বারা, তারা নিশ্চিত যে সমস্ত অলঙ্ঘনীয় ভারসাম্য হবে, প্রত্যাশা মধ্যে। অজানা বিরুদ্ধে এই সুরক্ষা খুব শক্তিশালী, এবং এটি অধ্যায়ের 2 বর্ণিত অ পরীক্ষামূলক পরীক্ষামূলক কৌশল থেকে ভিন্ন একটি গুরুত্বপূর্ণ উপায়।
একটি সমগ্র জনসংখ্যার জন্য চিকিত্সা প্রভাব সংজ্ঞা ছাড়াও, এটি একটি উপসেট মানুষের জন্য একটি চিকিত্সা প্রভাব সংজ্ঞায়িত করা সম্ভব। এটি সাধারণত একটি শর্তাধীন গড় চিকিত্সা প্রভাব (CATE) বলা হয়। উদাহরণস্বরূপ, রেস্টিভো এবং ভ্যান ডি রিজটের গবেষণায়, আসুন আমরা কল্পনা করি যে এই গবেষণায় পরীক্ষার 90 দিনের আগে সম্পাদক মধ্যস্থ সংখ্যার উপরে বা নীচে কিনা \(X_i\) এই আলো এবং ভারী সম্পাদকদের জন্য পৃথকভাবে চিকিত্সা প্রভাব গণনা করতে পারে।
সম্ভাব্য ফলাফল কাঠামো কার্যকারিতার পরিপ্রেক্ষিতে এবং পরীক্ষাগুলি সম্পর্কে চিন্তা করার একটি শক্তিশালী উপায়। যাইহোক, দুটি অতিরিক্ত জটিলতা আছে যে আপনি মনে রাখা উচিত। এই দুটি জটিলতা প্রায়ই স্টলেবল ইউনিট ট্রিটমেন্ট ভ্যালু অ্যাস্পপশন (SUTVA) শব্দটির অধীনে একত্রিত হয়। SUTVA এর প্রথম অংশটি এই ধারণাকে ধারণ করে যে ব্যক্তির জন্য যে বিষয় একমাত্র বিষয় \(i\) এর পরিণতি হল যে ব্যক্তিটি চিকিত্সার বা নিয়ন্ত্রণ অবস্থানে ছিল কিনা। অন্য কথায়, এটি অনুমান করা হয় যে ব্যক্তি \(i\) অন্য মানুষের দেওয়া চিকিত্সা দ্বারা প্রভাবিত হয় না। এটি কখনও কখনও "কোন হস্তক্ষেপ" বা "কোন spillovers" বলা হয়, এবং হিসাবে লেখা হতে পারে:
\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]
যেখানে \(\mathbf{W_{-i}}\) ব্যক্তি ছাড়া সকলের জন্য চিকিত্সা স্থিতিগুলির একটি ভেক্টর \(i\) এটি লঙ্ঘিত হতে পারে এমন এক উপায় হল যদি এক ব্যক্তি অন্য ব্যক্তির উপর চলাচল করে, তবে ইতিবাচক বা নেতিবাচকভাবে Restivo এবং ভ্যান ডি Rijt এর পরীক্ষা ফিরে আসছে, দুই বন্ধু \(i\) এবং \(j\) কল্পনা করুন এবং সেই ব্যক্তিটি \(i\) একটি বালাস্টর পায় এবং \(j\) না। তাহলে \(i\) barnstar গ্রহণ ঘটায় \(j\) (প্রতিযোগীতা একটা ধারনা মধ্যে) আরো সম্পাদনা করার অথবা (হতাশা একটা ধারনা থেকে বের) কম সম্পাদনা করুন, তারপর SUTVA লঙ্ঘন করা হয়েছে। চিকিত্সার প্রভাব চিকিত্সা গ্রহণ অন্যান্য ব্যক্তিদের মোট সংখ্যা উপর নির্ভর করে এটি লঙ্ঘন করা যেতে পারে। উদাহরণস্বরূপ, যদি Restivo এবং van de Rijt 100 এর পরিবর্তে 1000 বা 10,000 বালাস্টর দিয়েছিলেন তবে এটি বার্নস্টার পাওয়ার প্রভাবকে প্রভাবিত করেছিল।
SUTVA মধ্যে lumped দ্বিতীয় ইস্যু শুধুমাত্র প্রাসঙ্গিক চিকিত্সা গবেষক বিতরণ করে যে এক যে ধারণা হয়; এই অনুমান কখনও কখনও কোন গোপন চিকিত্সা বা অপব্যবহার বলা হয় । উদাহরণস্বরূপ, রেস্টিভো এবং ভ্যান ডি রিজটের ক্ষেত্রে, এটি হতে পারে যে একটি বর্ষপঞ্জি প্রদান করে গবেষকরা একটি জনপ্রিয় সম্পাদক পৃষ্ঠায় সম্পাদককে তুলে ধরার জন্য এবং এটি জনপ্রিয় সম্পাদকগণের পৃষ্ঠপোষকতার পরিবর্তে একটি বার্নস্টার প্রাপ্তির পরিবর্তে- যে সম্পাদন আচরণ পরিবর্তন ঘটেছিল। যদি এই সত্য হয়, তাহলে বর্ষার প্রভাবটি জনপ্রিয় সম্পাদকদের পৃষ্ঠায় থাকার প্রভাব থেকে আলাদা নয়। অবশ্যই, এটি স্পষ্ট নয়, যদি একটি বৈজ্ঞানিক দৃষ্টিকোণ থেকে, এটি আকর্ষণীয় বা অযৌক্তিক বলে মনে করা উচিত। যে, আপনি একজন গবেষক কল্পনা করতে পারেন যে একটি বার্নস্টা গ্রহণের প্রভাব বার্নস্টার ট্রিগার যে পরবর্তী পরবর্তী চিকিত্সা অন্তর্ভুক্ত। অথবা আপনি এমন একটি পরিস্থিতির কথা ভাবতে পারেন যেখানে একটি গবেষণায় এই সমস্ত অন্যান্য জিনিস থেকে বর্ষার প্রভাবকে বিচ্ছিন্ন করতে চায়। এটি সম্পর্কে চিন্তা করার এক উপায় হল কি জিজ্ঞাসা করা হয় যে Gerber and Green (2012) (পি 41) কি একটি সমতুল্য বিভাজক বলে মনে করে? অন্য কথায়, কি চিকিত্সার চেয়ে অন্য কিছু আছে যা রোগীকে চিকিৎসার এবং নিয়ন্ত্রণের ক্ষেত্রে ভিন্নভাবে আচরণ করতে পারে? সিমম্যাট্রি ভাঙার বিষয়ে উদ্বেগগুলি হল মেডিক্যাল ট্রায়ালের নিয়ন্ত্রণ গ্রুপের নেতৃস্থানীয় রোগীদের একটি প্লেসো পিল লাগানোর জন্য। এই ভাবে, গবেষকরা নিশ্চয়ই নিশ্চিত হতে পারে যে দুটি শর্তের মধ্যে পার্থক্যটি প্রকৃত ওষুধ এবং সেটি গ্রহণের অভিজ্ঞতা নয়।
SUTVA- এর উপর আরো জানার জন্য, Gerber and Green (2012) এর অধ্যায় 2.7, Morgan and Winship (2014) বিভাগের Morgan and Winship (2014) অধ্যায় Imbens and Rubin (2015) অনুচ্ছেদ 1.6 Imbens and Rubin (2015) ।
স্পষ্টতা
আগের বিভাগে, আমি বর্ণনা করেছি কিভাবে গড় চিকিত্সা প্রভাব অনুমান করা। এই বিভাগে, আমি তাদের অনুমানের পরিবর্তনশীলতা সম্পর্কে কিছু ধারণা প্রদান করব।
দুটি নমুনার মধ্যে পার্থক্য অনুমান হিসাবে আপনি গড় চিকিত্সা প্রভাব অনুমান করার কথা ভাবছেন, তাহলে এটি দেখাতে পারে যে গড় চিকিত্সা প্রভাব মান ত্রুটি হয়:
\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]
যেখানে \(m\) মানুষকে চিকিত্সা এবং \(Nm\) নিয়ন্ত্রণ করার জন্য নিযুক্ত করা হয়েছে ( Gerber and Green (2012) , eq। 3.4)। এইভাবে, কতজনকে চিকিত্সা দেওয়ার জন্য এবং কতজনকে নিয়ন্ত্রন করতে হবে তা নিয়ে চিন্তা করার সময়, আপনি দেখতে পারেন যে যদি \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , তারপর আপনি চান \(m \approx N / 2\) , যতক্ষণ চিকিত্সা এবং নিয়ন্ত্রণ খরচ একই। সমীকরণ 4.6 ব্যাখ্যা করে যে কেন বন্ড ও সহকর্মীদের নকশা (2012) ভোটের উপর সোশ্যাল মিডিয়ার প্রভাব সম্পর্কে গবেষণা (চিত্র 4.18) অকার্যকর পরিসংখ্যানগতভাবে। মনে রাখবেন যে এটির 98% অংশগ্রহণকারীর অবস্থার মধ্যে। এর অর্থ এই যে, নিয়ন্ত্রণ শর্তের গড় আচরণ সঠিকভাবে অনুমান করা যায় না যে এটি হতে পারে, যার ফলে এর অর্থ দাঁড়ায় যে চিকিত্সার এবং নিয়ন্ত্রণের অবস্থার মধ্যে আনুমানিক পার্থক্য যথোপযুক্তভাবে অনুমান করা যায় না। অংশগ্রহণকারীর অনুকূল বরাদ্দকরণের শর্তগুলিতে আরও শর্তের জন্য, যখন খরচগুলি শর্তগুলির মধ্যে পার্থক্য করে, তখন List, Sadoff, and Wagner (2011) ।
অবশেষে, প্রধান পাঠ্যাংশে, আমি বর্ণনা করেছিলাম কিভাবে একটি পার্থক্য-পার্থক্য অনুমানকারী, যা সাধারণত একটি মিশ্র নকশা ব্যবহার করা হয়, একটি পার্থক্য-ইন-অর্থ প্রাক্তন অভিযানের তুলনায় ছোট বিন্দুতে পরিণত হতে পারে, যা সাধারণত-উভয় বিষয়গুলির মধ্যে ব্যবহৃত হয় নকশা। যদি \(X_i\) চিকিত্সার আগে ফলাফলের মূল্য হয়, তাহলে আমরা পার্থক্য-পার্থক্য পদ্ধতির সঙ্গে অনুমান করার চেষ্টা করছি যে পরিমাণ হল:
\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]
যে পরিমাণের মান ত্রুটি ( Gerber and Green (2012) , eq। 4.4)
\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]
Eq এর তুলনা 4.6 এবং eq 4.8 প্রকাশ করে যে পার্থক্য-পার্থক্য পদ্ধতিতে একটি ছোট মান ত্রুটি থাকবে ( Gerber and Green (2012) , eq। 4.6 দেখুন)
\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]
মোটামুটিভাবে, যখন \(X_i\) \(Y_i(1)\) এবং \(Y_i(0)\) খুব পূর্বাভাস দেওয়া হয়, তখন আপনি পার্থক্য থেকে পার্থক্য-পার্থক্য পদ্ধতির তুলনায় আরো সুনির্দিষ্ট \(Y_i(0)\) এর মানে হল এক Restivo এবং ভ্যান ডি Rijt এর গবেষণায় প্রেক্ষাপটে এই বিষয়ে একটি উপায় হল যে ব্যক্তিরা যে পরিমাণে সম্পাদনা করে তার মধ্যে প্রাকৃতিক প্রকারের অনেক পরিবর্তন রয়েছে, তাই এটি চিকিত্সা ও নিয়ন্ত্রণের অবস্থার তুলনা করা কঠিন করে তোলে: এটি একটি আত্মীয়কে সনাক্ত করা কঠিন শব্দ ফলাফল ছোট ছোট প্রভাব। কিন্তু যদি আপনি এই স্বাভাবিকভাবেই ক্রমবর্ধমান বৈচিত্র্যের মধ্যে পার্থক্য-আউট করেন, তবে খুব কম পরিবর্তনশীলতা রয়েছে এবং এটি একটি ছোট্ট প্রভাবকে সনাক্ত করা সহজ করে তোলে।
একাধিক পরিমাপ প্রাক চিকিত্সার এবং পোস্ট চিকিত্সা আছে যেখানে আরো সাধারণ সেটিংস মধ্যে পার্থক্য-এর-গড়, পার্থক্য-পার্থক্য, এবং ANCOVA ভিত্তিক পদ্ধতির একটি সুনির্দিষ্ট তুলনা জন্য Frison and Pocock (1992) দেখুন। বিশেষ করে, তারা দৃঢ়ভাবে ANCOVA, যা আমি এখানে ঢেকে নেই সুপারিশ। উপরন্তু, একাধিক পোস্ট চিকিত্সার ফলাফল ব্যবস্থা গুরুত্বের একটি আলোচনা জন্য McKenzie (2012) দেখুন।