উপস্থাপনা আপনার লক্ষ্য জনসংখ্যা আপনার উত্তরদাতা থেকে সারবস্তু তৈরীর সম্পর্কে.
বৃহত্তর জনসংখ্যার উত্তরদাতাদের কাছ থেকে তথ্য সংগ্রহের সময় যে ধরনের ত্রুটিগুলি ঘটতে পারে তা বুঝতে হলে 1963 সালের মার্কিন রাষ্ট্রপতি নির্বাচনের ফলাফলের ভবিষ্যদ্বাণী করার চেষ্টা করে যে সাহিত্য ডাইজেস্ট স্ট্রো পোলটি বিবেচনা করা যাক। যদিও এটি 75 বছর আগে ঘটেছে, আজকের এই দুর্বলতাটি এখনও গবেষকদের শেখানোর জন্য একটি গুরুত্বপূর্ণ পাঠ আছে।
সাহিত্য ডাইজেস্ট জনপ্রিয় সাধারণ আগ্রহের ম্যাগাজিন ছিল, এবং 1 9 ২0 সালে শুরু হওয়ার পর থেকেই তিনি প্রেসিডেন্ট নির্বাচনের ফলাফলের পূর্বাভাসের জন্য স্ট্রব পোলিং চালাচ্ছিলেন। এই ভবিষ্যদ্বাণীগুলি তৈরি করতে, তারা অনেক লোককে ব্যালট পাঠাবে এবং তারপর ফিরে আসা ভোটগুলির সাথে মিলিয়ে তুলবে; লিটারারি ডাইজেস্ট গর্বের সাথে রিপোর্ট করেছিল যে তারা যে বেলোটগুলি পেয়েছিল তা "ওজন, সমন্বয় বা ব্যাখ্যাও করা হয়নি।" এই পদ্ধতিটি সঠিকভাবে 19২0-19২4, 1 9২8 ও 1 9 ২3 সালের নির্বাচনের বিজয়ীদের পূর্বাভাস দেয়। 1936 সালে, গ্রেট ডিপ্রেশন, সাহিত্য ডাইজেস্ট 10 মিলিয়ন লোককে ভোট দিচ্ছে, যার নাম মূলত টেলিফোনের ডিরেক্টরি এবং অটোমোবাইল নিবন্ধন রেকর্ড থেকে এসেছে। এখানে তারা তাদের পদ্ধতি বর্ণনা কিভাবে:
"ডাইগস্টের মসৃণ চলমান যন্ত্রটি ত্রিশ বছরের অভিজ্ঞতার দ্রুতগতির স্পেসিফিকেশন নিয়ে আসে যাতে হার্ড তথ্য অনুমান কম হয় ... এই সপ্তাহে 500 কলম এক মিলিয়নেরও বেশি একের বেশি ঠিকানা প্রকাশ করে। প্রতিদিন, নিউইয়র্কে মোটর-চুনযুক্ত চতুর্থ অ্যাভিনিউয়ের উপরে একটি বড় রুমের মধ্যে, 400 জন কর্মীরা চকচকে এক মিলিয়ন টুকরো মুদ্রিত বস্তুর সরে যায়- যথেষ্ট চরিত্রের শহর ব্লককে প্রশস্ত করতে - এপোডেড খামে [এসআইসি]। প্রতি ঘন্টায়, ডাইগস্টের নিজস্ব পোস্ট অফিসের উপসাগরে, তিনটি অস্পষ্ট ডাকটেশনের মিক্সিং মেশিনগুলি সীলমোহরযুক্ত এবং সাদা অঙ্গপ্রত্যঙ্গগুলি মুদ্রাঙ্কিত; দক্ষ ডাকের কর্মচারীরা তাদের মেইলসেক গুলো ছুঁড়ে ফেলেছিল; জাহাজের ডিইজিস্ট ট্রাকগুলি তাদের মেইল ট্রেন প্রকাশের জন্য দৌঁড়াচ্ছে। । । পরের সপ্তাহে, এই দশ মিলিয়ন থেকে প্রথম উত্তরগুলি চিহ্নিত বদ্বীপের ইনকামিং জোয়ার শুরু করবে, ট্রিপল-চেক করা, যাচাই করা, পাঁচ-বার ক্রস ক্লাসিফাইড এবং মোট সংখ্যা। গত আসরের টোটেজ এবং চেক করা হয়েছে, অতীত অভিজ্ঞতা একটি মানদণ্ড হলে, দেশটি এক শতাংশের মধ্যে চিলির 40 [ভোটারদের] প্রকৃত জনপ্রিয় ভোট জানাবে। "(২২ আগস্ট, 1936)
সাহিত্যের ডাইজেস্টের আকারের আদান-প্রদান আজকে কোন "বড় তথ্য" গবেষককে অবিলম্বে স্বীকৃত। 10 মিলিয়ন ব্যালট বিতরণ, একটি আশ্চর্যজনক 2.4 মিলিয়ন ফেরৎ - যে আধুনিক রাজনৈতিক নির্বাচনের তুলনায় প্রায় 1,000 গুণ বড়। এই 2.4 মিলিয়ন উত্তরদাতাদের থেকে, রায় স্পষ্ট ছিল: অ্যালফ লন্ডন আসন্ন ফ্র্যাংকলিন রুজভেল্টকে পরাজিত করতে যাচ্ছে। কিন্তু, আসলে, রুজভেল্ট একটি ভূমিধসে ল্যান্ডনকে পরাজিত করে। সাহিত্য ডাইজেস্ট এত তথ্য দিয়ে ভুল কিভাবে পারে? স্যাম্পলিং আমাদের আধুনিক বোঝা সাহিত্য ডাইজেস্ট এর ভুল পরিষ্কার করে তোলে এবং ভবিষ্যতে অনুরূপ ভুলগুলি করা এড়ানোর জন্য আমাদের সাহায্য করে।
নমুনা সম্পর্কে পরিষ্কারভাবে চিন্তা করার জন্য আমাদের চারটি ভিন্ন ভিন্ন দল (চিত্র 3.2) বিবেচনা করা দরকার। প্রথম গ্রুপ লক্ষ্য জনসংখ্যা ; এই গ্রুপটি যে গবেষক আগ্রহের জনসংখ্যা হিসাবে সংজ্ঞায়িত করে। সাহিত্য ডাইজেস্টের ক্ষেত্রে, লক্ষ্যমাত্রা জনসংখ্যা ছিল 1936 সালের রাষ্ট্রপতি নির্বাচনে ভোটার।
টার্গেট জনসংখ্যা নির্ধারণের পর, একজন গবেষককে এমন একটি তালিকা তৈরি করতে হবে যা স্যাম্পলিংয়ের জন্য ব্যবহার করা যেতে পারে। এই তালিকাটিকে একটি স্যাম্পলিং ফ্রেম বলা হয় এবং এটিতে মানুষকে বলা হয় ফ্রেম জনসংখ্যা । মূলত, টার্গেট জনসংখ্যা এবং ফ্রেম জনসংখ্যা ঠিক একই হবে, কিন্তু অভ্যাস এই ক্ষেত্রে হয় না। উদাহরণস্বরূপ, সাহিত্য ডাইজেস্টের ক্ষেত্রে, ফ্রেম জনসংখ্যা ছিল 10 মিলিয়ন মানুষ, যাদের নাম টেলিফোন ডিরেক্টরি এবং অটোমোবাইল রেজিস্ট্রেশন রেকর্ডগুলি থেকে মূলত এসেছিল। লক্ষ্য জনসংখ্যার এবং ফ্রেম জনসংখ্যার মধ্যে পার্থক্য কভারেজ ত্রুটি বলা হয় কভারেজ ত্রুটি, নিজেই না, গ্যারান্টি সমস্যা যাইহোক, এটি কাভারেজ পক্ষপাত হতে পারে যদি ফ্রেম জনসংখ্যার মানুষ নির্ধারিত জনসংখ্যার মানুষ থেকে আলাদা আলাদা আলাদা আলাদা লোক থাকে যারা ফ্রেম জনসংখ্যার মধ্যে নেই। এই, আসলে, লিটারেরি ডাইজেস্ট পোলের ঠিক কি ঘটেছে। তাদের ফ্রেমের জনসাধারণের লোকেরা অ্যালফ ল্যাননকে সমর্থন করার সম্ভাবনা দেখিয়েছিল, কারণ তারা ধনী ছিল (স্মরণ কর যে, টেলিফোন এবং অটোমোবাইল উভয়ই 1936 সালে তুলনামূলকভাবে নতুন এবং ব্যয়বহুল ছিল)। সুতরাং, সাহিত্য ডায়াজেস্ট পোলে, কভারেজ ত্রুটি কভারেজ পক্ষপাতের নেতৃত্বে।
ফ্রেম জনসংখ্যা নির্ধারণের পর, পরবর্তী ধাপটি নমুনা জনসংখ্যার নির্বাচন করার জন্য একজন গবেষক; এই মানুষ যারা গবেষক সাক্ষাত্কারের চেষ্টা করবে। যদি নমুনা ফ্রেমের জনসংখ্যার তুলনায় ভিন্ন বৈশিষ্ট্য থাকে, তবে স্যাম্পলিং নমুনা ত্রুটি সনাক্ত করতে পারে। সাহিত্য ডাইজেস্ট ফ্যাসজ্যাকের ক্ষেত্রে, আসলে সেখানে কোনও স্যাম্পলিং ছিল না- ফ্রেম জনসংখ্যার মধ্যে প্রত্যেকের সাথে যোগাযোগ করার জন্য ম্যাগাজিন-এবং তাই কোনও নমুনা ত্রুটি ছিল না। অনেক গবেষক নমুনা ত্রুটি-ফোকাসের উপর মনোযোগ কেন্দ্রীভূত করে- এটি সাধারণত একমাত্র ধরনের ত্রুটি যা সার্ভেগুলিতে ত্রুটিযুক্ত মার্জিনের দ্বারা ধরা যায়- কিন্তু সাহিত্য ডাইজেস্ট ফ্যাসজ্যাক আমাদেরকে মনে করিয়ে দেয় যে আমাদের সকল ত্রুটিগুলির উত্স বিবেচনা করতে হবে, র্যান্ডম এবং নিয়মানুসারী উভয়ই।
অবশেষে, একটি নমুনা জনসংখ্যার নির্বাচন করার পরে, একটি গবেষক তার সমস্ত সদস্যদের সাক্ষাত করার চেষ্টা করে। যারা সফলভাবে সাক্ষাত্কার হয় তারা উত্তরদাতারা বলে । আদর্শভাবে, নমুনা জনসংখ্যা এবং উত্তরদাতারা ঠিক একই হবে, কিন্তু অভ্যাস আছে nonresponse। যে, যারা নমুনা নির্বাচিত হয় কখনও কখনও অংশগ্রহণ করবেন না। যদি সাড়া দেয় এমন ব্যক্তিদের থেকে ভিন্ন সাড়া দেওয়া হয়, তাহলে অ-প্রতিক্রিয়া পক্ষপাতিত্ব থাকতে পারে। সাহিত্য ডাইজেস্ট পোলের সাথে দ্বিতীয় প্রধান সমস্যা ছিল অ-প্রতিক্রিয়ার পক্ষপাত। একটি ব্যালট প্রাপ্ত যারা শুধুমাত্র 24%, প্রতিক্রিয়া, এবং এটি ল্যাণ্ডন সমর্থিত যারা বেশী প্রতিক্রিয়া সম্ভবত ছিল।
প্রতিনিধিত্বের ধারণাগুলি প্রবর্তনের একটি উদাহরণ হচ্ছে, সাহিত্যের ডাইজেস্ট পোলটি একটি বারবার দৃষ্টান্তমূলক বর্ণনা, অজ্ঞাতসঙ্কুল স্যাম্পলিংয়ের বিপদ সম্পর্কে সতর্ককারীরা সতর্ক। দুর্ভাগ্যবশত, আমি মনে করি যে অনেক লোক এই গল্প থেকে আঁকা যে পাঠ একটি ভুল এক। গল্পের সবচেয়ে সাধারণ নৈতিকতা হচ্ছে গবেষকরা অ-সম্ভাব্যতা নমুনা থেকে কিছু শিখতে পারেন না (অর্থাত, অংশগ্রহণকারীদের নির্বাচন করার জন্য কঠোর সম্ভাবনা ছাড়া-ভিত্তিক নিয়ম ছাড়া নমুনা)। কিন্তু, আমি এই অধ্যায়ে পরে দেখবো হিসাবে, যে বেশ সঠিক নয়। পরিবর্তে, আমি এই গল্প সত্যিই দুটি নৈতিকতা আছে মনে; নৈতিকতা যেগুলি সত্য আজও সেগুলি 1 936 সালে ছিল। প্রথমত, বিপুল সংখ্যক অজ্ঞাতসারে সংগৃহীত তথ্য একটি ভাল অনুমানের নিশ্চয়তা দেবে না। সাধারণভাবে, বেশিরভাগ উত্তরদাতারা অনুমানের বৈচিত্রকে হ্রাস করে, কিন্তু এটি পক্ষপাতিত্বকে হ্রাস করে না। অনেক তথ্য দিয়ে, গবেষকরা কখনও কখনও ভুল জিনিস একটি সুনির্দিষ্ট অনুমান পেতে পারেন; তারা সঠিকভাবে ভুল হতে পারে (McFarland and McFarland 2015) । সাহিত্য ডাইজেস্ট ফ্যাসাক্সের দ্বিতীয় প্রধান পাঠ্য হলো, গবেষণার জন্য হিসাব করা প্রয়োজন যে কিভাবে তাদের নমুনা সংগৃহীত হয় যখন আনুমানিক হিসাব করা হয়। অন্য কথায়, যেহেতু সাহিত্য ডাইজেস্ট পোলের নমুনা প্রক্রিয়া নিয়মিতভাবে কিছু উত্তরদাতাদের দিকে ঝুঁকেছে, গবেষকরা আরও জটিল মূল্যায়ন প্রক্রিয়ার ব্যবহার করতে চেয়েছিলেন যা কিছু উত্তরদাতাকে অন্যদের চেয়ে বেশি গুরুত্ব দেয়। পরে এই অধ্যায়ে, আমি আপনাকে এমন একটি ভদ্র পদ্ধতিতে পোস্ট-স্ট্র্যাটিফিকেশন দেখাব - যা আপনাকে অজ্ঞান নমুনার থেকে ভাল অনুমান করতে সক্ষম করে।