ওজন বিকৃতি ইচ্ছাকৃতভাবে স্যাম্পলিং প্রক্রিয়া দ্বারা সৃষ্ট পূর্বাবস্থা করতে পারেন.
সম্ভাব্যতা নমুনা ঐ যেখানে সব মানুষ একটি পরিচিত, নন-জিরো অন্তর্ভুক্তি সম্ভাবনা আছে, এবং সহজ সম্ভাব্যতা স্যাম্পলিং নকশা র্যান্ডম স্যাম্পলিং যেখানে প্রতিটি ব্যক্তি অন্তর্ভুক্তি সমান সম্ভাবনা রয়েছে সহজ. উত্তরদাতাদের নিখুঁত মৃত্যুদন্ড (যেমন, কোন কভারেজ ত্রুটি এবং কোন অ প্রতিক্রিয়া) সঙ্গে সহজ র্যান্ডম স্যাম্পলিং মাধ্যমে নির্বাচন করা হয়, তখন প্রাক্কলন কারণ নমুনা হবে অন জনসংখ্যার একটি ক্ষুদ্র সংস্করণ গড় হতে সহজবোধ্য.
সহজ র্যান্ডম স্যাম্পলিং কদাচিৎ অনুশীলন ব্যবহার করা হয়, যদিও. বরং, গবেষকরা ইচ্ছাকৃতভাবে খরচ কমানো এবং সঠিকতা বৃদ্ধি অন্তর্ভুক্তির অসম সম্ভাব্যতা ব্যক্তিদের নির্বাচন. গবেষকরা ইচ্ছাকৃতভাবে অন্তর্ভুক্তি বিভিন্ন সম্ভাব্যতা ব্যক্তিদের নির্বাচন করলে সমন্বয় স্যাম্পলিং প্রক্রিয়া দ্বারা সৃষ্ট বিকৃতি থেকে ফিরিয়ে আনার প্রয়োজন হয়. অন্য কথায়, আমরা কিভাবে একটি নমুনা থেকে সাধারণের বোধগম্য কিভাবে নমুনা নির্বাচন করা হয়েছিল তার উপর নির্ভর করে.
উদাহরণস্বরূপ, বর্তমান জনসংখ্যা সার্ভে (সিপিএস) বেকারত্বের হার অনুমান করার জন্য মার্কিন সরকার দ্বারা ব্যবহার করা হয়. প্রতি মাসে প্রায় 100,000 মানুষ সাক্ষাত্কার হয়, হয় সামনা-সামনি বা টেলিফোনে, এবং ফলাফল আনুমানিক বেকারত্বের হার উত্পাদন ব্যবহার করা হয়. কারণ সরকার প্রতিটি রাজ্যে বেকারত্বের হার অনুমান করার জন্য শুভেচ্ছা, কারণ এটি যে ছোট জনগোষ্ঠী (যেমন, রোড আইল্যান্ড) এবং বিশাল জনসংখ্যার রাজ্য থেকে অনেক সঙ্গে রাজ্যে খুব অল্প উত্তরদাতা উত্পাদ হবে প্রাপ্তবয়স্কদের একটি সহজ র্যান্ডম নমুনা ব্যবহার করতে পারবেন না (যেমন , ক্যালিফোর্নিয়া). পরিবর্তে, বিভিন্ন হারে বিভিন্ন রাজ্যে সিপিএস নমুনা মানুষ, একটি প্রক্রিয়া নির্বাচন অসম সম্ভাব্যতা সঙ্গে স্তরীভূত স্যাম্পলিং নামক. উদাহরণস্বরূপ, যদি সিপিএস 2,000 উত্তরদাতা চেয়েছিলেন রাষ্ট্র প্রতি, তারপর রোড আইল্যান্ড প্রাপ্তবয়স্কদের ক্যালিফোর্নিয়ার প্রাপ্তবয়স্কদের চেয়ে অন্তর্ভুক্তি প্রায় 30 গুণ বেশী সম্ভাবনা থাকবে (রোড আইল্যান্ড: 800,000 প্রাপ্তবয়স্কদের প্রতি 2,000 উত্তরদাতা বনাম ক্যালিফোর্নিয়া: 30.000.000 প্রাপ্তবয়স্কদের প্রতি 2,000 উত্তরদাতা). আমরা পরে দেখতে হবে, অসম সম্ভাব্যতা সঙ্গে স্যাম্পলিং এই ধরনের খুব, তথ্য অনলাইন উত্স সঙ্গে ঘটে, কিন্তু সিপিএস অসদৃশ, স্যাম্পলিং প্রক্রিয়া সাধারণত পরিচিত বা গবেষক দ্বারা নিয়ন্ত্রিত হয় না.
তার স্যাম্পলিং নকশা দেওয়া, সিপিএস সরাসরি মার্কিন প্রতিনিধি নয়; এটা রোড আইল্যান্ড থেকে অনেক মানুষ এবং ক্যালিফোর্নিয়া থেকে খুব অল্প অন্তর্ভুক্ত. অতএব, এটা নমুনা বেকারত্বের হার দিয়ে দেশে বেকারত্বের হার অনুমান করার অপরিণামদর্শী হবে. পরিবর্তে নমুনা গড়ের, এটা একটি ভরযুক্ত গড়, যেখানে ওজন আসলে হিসাব যে রোড আইল্যান্ড থেকে মানুষ আরো কালিফোর্নিয়ার মানুষের চেয়ে অন্তর্ভুক্ত হওয়ার সম্ভাবনা ছিলো নেওয়া উত্তম. উদাহরণস্বরূপ, ক্যালিফোর্নিয়া থেকে প্রতিটি ব্যক্তি হবে upweighted- তারা রোড আইল্যান্ড থেকে অনুমান এবং প্রতিটি ব্যক্তির হবে আরও গোণে downweighted-তারা অনুমান কম গোণে. প্রকৃতরূপে, আপনি মানুষ যে আপনি কম বিষয়ে জানার জন্য সম্ভবত হয় ভয়েস দেওয়া হয়.
এই খেলনা উদাহরণস্বরূপ একটি গুরুত্বপূর্ণ কিন্তু সাধারণভাবে অনেকেই ভুল বুঝে ভাবেন বিন্দু illustrates: একটি নমুনা ভাল অনুমান উত্পাদন জনসংখ্যার একটি ক্ষুদ্র সংস্করণ হতে পারে না. যথেষ্ট কিভাবে তথ্য সংগ্রহ করা হয় সম্পর্কে জানা থাকে, তাহলে সেই তথ্য যখন নমুনা থেকে অনুমান উপার্জন ব্যবহার করা যেতে পারে. পদ্ধতির আমি শুধু বর্ণনা এবং করেছি যে আমি প্রযুক্তিগত মধ্যে গাণিতিকভাবে বর্ণনা শাস্ত্রীয় সম্ভাব্যতা স্যাম্পলিং কাঠামোর মধ্যে squarely পরিশিষ্টের মধ্যে-বৃক্ষের পতন হয়. এখন, আমি কিভাবে যে একই ধারণা অ সম্ভাব্যতা নমুনা প্রয়োগ করা যেতে পারে দেখাব.