نمائندگی آپ کے ہدف آبادی کے لئے اپنے مدعا سے استنباط کرنے کے بارے میں ہے.
بڑی آبادی کے لیے مدعا سے اخذ کرتے وقت ہو سکتا ہے کہ غلطیوں کی قسم کو سمجھنے کے لئے، کے ادبی ڈائجسٹ تنکے کی سروے 1936 امریکی صدارتی انتخابات کے نتائج کی پیشن گوئی کرنے کی کوشش کی ہے کہ غور کریں. یہ 75 سے زیادہ سال پہلے تھا اگرچہ، اس شکست آج بھی محققین کو سکھانے کے لئے ایک اہم سبق ہے.
ادبی ڈائجسٹ ایک مقبول عام مفاد میگزین تھا، اور 1920 میں شروع ہونے والے وہ صدارتی انتخابات کے نتائج کی پیشن گوئی کرنے تنکے انتخابات چلانے شروع کر دیا. ادبی ڈائجسٹ فخر کے ساتھ وہ موصول ووٹ کیے گئے اور نہ ہی ".، بارت ایڈجسٹ، اور نہ ہی تشریح" یہ عمل صحیح فاتح نے پیش گوئی کی کہ کیا؛ یہ پیشن گوئی کرنے کے انہوں نے اس وقت لوگوں کے بہت سے پر بیلٹ بھیجنے، اور صرف ووٹ واپس آ گیا ہے کہ اپ کی گنتی کرے گا 1920، 1924، 1928 اور 1932. 1936 میں میں انتخابات کے، عظیم کساد بازاری کے درمیان میں، ادبی ڈائجسٹ باہر ووٹ 10 ملین افراد، جن کے نام غالب طور پر ٹیلی فون ڈائریکٹری اور آٹوموبائل رجسٹریشن کے ریکارڈ سے آیا کے لئے بھیجا. یہاں وہ کس طرح ان کے طریقہ کار بیان کیا ہے:
"تیس سال کا تجربہ کی فوری صحت سے متعلق کے ساتھ ڈائجسٹ کے ہموار چلانے کی مشین چالوں مشکل حقائق سے تخمینی کام کو کم کرنے کے. . . .اس ہفتے 500 قلم میں مزید ایک دن میں ایک لاکھ پتوں کی ایک چوتھائی سے باہر نوچا. ہر روز، نیویارک میں موٹر ribboned چوتھا ایونیو اعلی اوپر ایک عظیم کمرے، میں، 400 کے کارکنوں نے بڑی تدبیر معاملہ کافی طباعت چالیس سٹی بلاک میں خطاب سمیٹ لیتی [SIC] ہموار کرنے کی ایک ملین ٹکڑے ٹکڑے سلائڈ. ہر گھنٹہ، ہضم کی اپنی پوسٹ آفس سٹیشن میں، تین بکبک ڈاک کی لمبائی ماپنے مشینوں کو سیل کر دیا اور سفید oblongs مہر؛ ہنر مند پوسٹل ملازمین mailsacks ابڑا میں ان کو بس الٹ؛ بیڑے ہضم ٹرکس ان میل ٹرینوں کا اظہار کرنے کے گزر. . . اگلے ہفتے، ان دس لاکھ سے سب سے پہلے جواب، ذکر ووٹ کی آنے والی لہر شروع ٹرپل جانچ پڑتال کی تصدیق، پانچ مرتبہ کراس خفیہ اور کل ہونے کے لئے کرے گا. گزشتہ اعداد و شمار totted اور جانچ پڑتال کی گئی ہے جب، ماضی کے تجربات کو ایک کسوٹی ہے تو ملک میں 1 فیصد چالیس ملین ووٹروں] کی اصل مقبول ووٹ کا ایک حصہ کے اندر اندر پتہ چل جائے گا. "(22 اگست، 1936)
سائز کے ڈائجسٹ کی fetishization آج کسی "بڑی ڈیٹا" محقق کو فوری طور پر پہچانا ہے. 10 ملین ووٹ تقسیم، ایک حیرت انگیز 2.4 ملین ووٹ واپس آئے کہ رہے تھے تقریبا جدید سیاسی انتخابات سے 1،000 گنا بڑا ہے. ان 2.4 ملین مدعا سے فیصلے واضح تھا: ادبی ڈائجسٹ پیش گوئی کی ہے کہ چیلنجر مطلقا لندن لازم فرینکلن روزویلٹ کو شکست دینے کے لئے جا رہا تھا. لیکن، حقیقت میں، عین برعکس ہوا. روزویلٹ بھاری اکثریت میں لندن سے ہرایا. کس طرح ادبی ڈائجسٹ اتنی زیادہ ڈیٹا کے ساتھ غلط جا سکتے ہیں؟ سیمپلنگ کی ہماری جدید سمجھ ادبی ڈائجسٹ کی غلطیاں واضح کرتا ہے اور ہمیں مستقبل میں اسی طرح کی غلطیوں سے بچنے میں مدد ملتی ہے.
نمونے لینے کے بارے میں واضح طور پر سوچ لوگوں کے چار مختلف گروپوں (پیکر 3.1) پر غور کرنے کی ضرورت ہے ہمیں. لوگوں کے پہلے گروپ ہدف آبادی ہے؛ اس گروپ ریسرچ دلچسپی کی آبادی کے طور پر وضاحت کرتا ہے ہے. ادبی ڈائجسٹ کی صورت میں ہدف آبادی 1936 کے صدارتی انتخابات میں ووٹروں تھا. ایک ہدف آبادی پر فیصلہ کرنے کے بعد، ایک محقق اگلے نمونے لینے کے لئے استعمال کیا جا سکتا ہے کہ لوگوں کی ایک فہرست تیار کرنے کے لئے کی ضرورت ہے. یہ فہرست ایک نمونے لینے کے فریم کہا جاتا ہے اور نمونے لینے کے فریم پر آبادی فریم آبادی کو کہا جاتا ہے. ادبی ڈائجسٹ کی صورت میں فریم آبادی جن کے نام ٹیلی فون ڈائریکٹری اور آٹوموبائل رجسٹریشن کے ریکارڈ سے غالب طور پر آئے 10 ملین افراد تھی. مثالی طور پر ہدف آبادی اور فریم آبادی بالکل ایک ہی ہو جائے گا، لیکن عملی طور پر یہ اکثر ایسا نہیں ہے. ہدف آبادی اور فریم آبادی کے درمیان اختلافات کی کوریج کی خرابی کو کہا جاتا ہے. کوریج کی خرابی، خود کی طرف سے مسائل کی ضمانت نہیں ہے. لیکن، فریم آبادی میں لوگوں لوگوں سے منظم طریقے سے مختلف ہیں، اگر نہیں فریم آبادی میں وہاں کی کوریج تعصب ہو گا. کوریج کی خرابی ادبی ڈائجسٹ سروے کے ساتھ بڑی خامیوں کے پہلے تھا. وہ ووٹروں کو کہ رہا تھا کے بارے میں جاننے کے لئے چاہتا تھا ان کا ہدف آبادی کی لیکن امیر زیادہ نمائندگی ہے کہ وہ ٹیلی فون ڈائریکٹری اور آٹوموبائل رجسٹریز، ذرائع سے غالب طور پر ایک نمونے لینے کے فریم تعمیر شدہ امریکیوں ان ٹیکنالوجیز کے دونوں کہ مطلقا لندن (یادآوری کی حمایت کرنے کے امکانات زیادہ تھے جو، جس میں عام ہیں. آج، وقت اور امریکہ عظیم کساد بازاری کے درمیان میں تھا کہ) نسبتا نئے تھے.
فریم آبادی کی وضاحت کرنے کے بعد، اگلے قدم نمونہ آبادی منتخب کرنے کے لئے ایک محقق کے لئے ہے؛ ان لوگوں محقق انٹرویو کرنے کی کوشش کریں گے کہ ہیں. نمونہ فریم آبادی سے مختلف خصوصیات ہیں، تو ہم نمونے لینے کی خرابی کو متعارف کرانے کر سکتے ہیں. یہ عام طور پر اندازوں کے ساتھ کہ غلطی کی گنجائش میں مقدار کی خرابی کی طرح ہے. ادبی ڈائجسٹ کی ناکامی کی صورت میں، وہاں اصل میں کوئی نمونہ تھا؛ وہ فریم آبادی میں ہر کسی سے رابطہ کرنے کی کوشش کی. کوئی سیمپلنگ خرابی تھی اگرچہ، غلطی کو اب بھی واضح طور پر نہیں تھا. یہ عام طور پر سروے سے اندازوں سے خبر شائع کی جاتی ہے کہ غلطیوں کے مارجن کو عام طور پر misleadingly چھوٹے ہیں کہ واضح؛ اگر گمراہی کے تمام ذرائع کو شامل نہیں کرتے.
آخر میں، ایک محقق نمونہ آبادی میں ہر کسی کا انٹرویو کرنے کی کوشش ہے. ان لوگوں کو کامیابی کا انٹرویو کر رہے ہیں کہ جواب دہندگان کو کہا جاتا ہے. مثالی طور پر، نمونہ آبادی اور مدعا بالکل ایک ہی ہو جائے گا، لیکن عملی طور پر کوئی جواب نہیں ہے. کہ نمونے میں منتخب کر رہے ہیں ان لوگوں کو شرکت کرنے سے انکار، ہے. لوگوں کو جواب جو جواب نہیں دیتے جو ان لوگوں سے مختلف ہیں، تو پھر غیر ردعمل کا تعصب نہیں ہو سکتا. غیر کے جواب تعصب ادبی ڈائجسٹ سروے کے ساتھ دوسرے اہم مسئلہ تھا. ایک بیلٹ حاصل کرنے والے لوگوں میں سے صرف 24 فیصد جواب میں، اور یہ باہر کر دیا لندن کی حمایت کی جو لوگ جواب دینے کے امکانات زیادہ تھے کہ.
صرف نمائندگی کے خیالات کو متعارف کرانے کے لئے ایک مثال ہونے کے پرے، ادبی ڈائجسٹ سروے اویوستیت نمونے لینے کے خطرات کے بارے محققین خبردار، ایک اکثر دہرایا تمثیل ہے. بدقسمتی سے، میں سوچتا ہوں سبق ہے کہ بہت سے لوگوں کو اس کہانی سے اپنی طرف متوجہ کیا غلط ایک ہے. کہانی کا سب سے عام اخلاقی محققین (شرکاء کے انتخاب کے لئے سخت احتمال پر مبنی قوانین کے بغیر یعنی، نمونے) غیر احتمال نمونوں سے کچھ نہیں سیکھ سکتا ہے ہے. لیکن، کے طور پر میں بعد میں اس باب میں دکھاتا ہوں، کہ نہیں بالکل درست ہے. اس کے بجائے، مجھے لگتا ہے کہ اس کہانی کے لئے دو اخلاقیات واقعی موجود ہیں؛ وہ 1936. پہلی میں تھے جتنے سچے آج ہیں کہ اخلاق، گروہ اتفاقیہ جمع اعداد و شمار کی ایک بڑی رقم ایک اچھا تخمینہ ضمانت نہیں دے گا. دوئم، محققین وہ اس سے اندازوں کر رہے ہیں جب ان کے ڈیٹا جمع کیا گیا تھا کہ کس طرح کے لئے اکاؤنٹ کرنے کی ضرورت ہے. دوسرے الفاظ میں، ادبی ڈائجسٹ سروے میں اعداد و شمار جمع کرنے کے عمل کو منظم طریقے سے کچھ مدعا کی طرف سے skewed گیا تھا کیونکہ، محققین دوسروں سے کہ وزن کچھ مدعا زیادہ ایک سے زیادہ پیچیدہ تخمینہ کے عمل کو استعمال کرنے کی ضرورت ہے. بعد میں اس باب میں، میں تم سے ایک ایسی weighting کے طریقہ کار پوسٹ ستریکرن-غیر احتمال نمونوں کے ساتھ بہتر اندازوں بنانے کے لئے آپ کو چالو کر سکتے دکھاتا ہوں.