التمثيل هو حول جعل الاستدلالات من المشاركين لسكان تستهدفها.
من أجل فهم هذا النوع من الأخطاء التي يمكن أن يحدث عندما استنتاج من المستطلعين إلى عدد أكبر من السكان، دعونا النظر في استطلاع القش الأدبية دايجست التي حاولت التنبؤ بنتيجة الانتخابات الرئاسية الأمريكية 1936. على الرغم من أنه كان قبل أكثر من 75 عاما، هذه الهزيمة لا يزال لديه درسا مهما لتعليم الباحثين اليوم.
كان الأدبية دايجست مجلة المصلحة العامة الشعبية، وابتداء من عام 1920 أنها بدأت تشغيل استطلاعات القش للتنبؤ بنتائج الانتخابات الرئاسية. لجعل هذه التنبؤات أنهم سيرسلون أوراق الاقتراع إلى الكثير من الناس، ثم ببساطة نستعرض ما الاقتراع التي أعيدت؛ وأبلغ الأدبية دايجست بفخر أن بطاقات الاقتراع التي تلقوها كانت لا "مرجح، تعديل، ولا تفسير." هذا الإجراء توقع الفائز بشكل صحيح الانتخابات في عام 1920، 1924، 1928 و 1932. في عام 1936، في خضم فترة الكساد الكبير، أرسلت الأدبية دايجست من بطاقات الاقتراع إلى 10 مليون شخص، الذين جاء معظمهم من دليل الهاتف وسجلات تسجيل السيارات الأسماء. وهنا كيف وصفوه منهجيتها:
"التحركات الجهاز تشغيل سلس الموجز مع الدقة سريعة من تجربة ثلاثين عاما" للحد من التخمين إلى الحقائق الثابتة. . . .هذا الأسبوع 500 الأقلام خدش اكثر من ربع مليون عنوان في اليوم. كل يوم، في غرفة كبيرة عالية فوق شارع الرابع ذا الشريط السيارات، في نيويورك، 400 عامل تنزلق بشكل حاذق مليون قطعة من المطبوعات بما فيه الكفاية لتمهيد أربعين مدينة كتل في مغلفات تناول [كذا]. كل ساعة، في هضم نفسه مكتب بريد المحطات الفرعية، ثلاثة الأحاديث آلات القياس البريد مختومة وختمها مستطيلات بيضاء. موظفو البريد المهرة انقلبت بهم إلى انتفاخ mailsacks. انطلقت الشاحنات أسطول هضم لهم التعبير الإلكتروني القطارات. . . الأسبوع المقبل، فإن الإجابات الأولى من هذه عشرة ملايين يبدأ المد واردة من الاصوات ملحوظة، لتكون ثلاثية فحصها، والتحقق منها، وخمس مرات عبر تصنيفها وبلغ. عندما تم totted الرقم الأخير وفحصها، وإذا كانت تجربة الماضية هي المعيار، فإن البلاد يعرف إلى داخل جزء من 1 في المئة من أصوات الناخبين الفعلي من أربعين مليون [الناخبين]. "(22 أغسطس 1936)
fetishization دايجست من حجم يمكن التعرف على الفور على أي باحث "البيانات الكبيرة" اليوم. من 10 مليون ورقة اقتراع وزعت، أعيد التي مذهلة 2.4 مليون بأصواتهم لحوالي 1000 مرات أكبر من استطلاعات الرأي السياسية الحديثة. من هذه العينة 2.4 مليون كان الحكم واضحا: الأدبية دايجست توقع أن المنافس آلف لاندون كان على وشك هزيمة الحالية فرانكلين روزفلت. ولكن، في الواقع، حدث العكس تماما. هزم روزفلت لاندون في انهيار أرضي. كيف يمكن الأدبية دايجست الذهاب الخطأ مع الكثير من البيانات؟ فهمنا الحديث لأخذ العينات يجعل أخطاء الأدبية دايجست واضحة ويساعدنا على تجنب الوقوع في أخطاء مماثلة في المستقبل.
التفكير بوضوح حول أخذ العينات يتطلب منا النظر في أربع مجموعات مختلفة من الناس (الشكل 3.1). أول مجموعة من الناس هي الفئة المستهدفة. هذه هي المجموعة التي تحدد البحثية والسكان من الاهتمام. في حالة الأدبية دايجست كان السكان المستهدفين الناخبين في الانتخابات الرئاسية 1936. بعد اتخاذ قرار بشأن السكان المستهدفين، الباحث يحتاج بجانب وضع قائمة من الناس التي يمكن استخدامها لأخذ العينات. وهذا ما يسمى قائمة إطار أخذ العينات ويسمى السكان في إطار المعاينة السكان الإطار. في حالة الأدبية دايجست كان عدد السكان إطار ال 10 مليون شخص الذين جاء معظمهم من دليل الهاتف وسجلات تسجيل السيارات الأسماء. من الناحية المثالية السكان المستهدفين والسكان إطار سيكون بالضبط نفس الشيء، ولكن في الواقع هذا ليس هو الحال في كثير من الأحيان. ويطلق على الخلافات بين السكان المستهدفين والسكان إطار الخطأ التغطية. خطأ تغطية لا، في حد ذاته يضمن المشاكل. ولكن، إذا كان الناس في عدد السكان إطار مختلفة بشكل منهجي من الناس لا في السكان إطار ستكون هناك تغطية التحيز. كان الخطأ تغطية أول من العيوب الرئيسية مع استطلاع الأدبية دايجست. انهم يريدون معرفة الناخبين التي كان لها هدف السكان لكنها شيدت إطار أخذ العينات في الغالب من دليل الهاتف والسجلات السيارات، مصادر أن الإفراط في تمثيل ثراء الأمريكيين الذين كانوا أكثر ميلا إلى دعم آلف لاندون (أذكر أن كلا من هذه التقنيات، وهو أمر شائع اليوم، كانت جديدة نسبيا في ذلك الوقت والتي كانت الولايات المتحدة في خضم الكساد العظيم).
بعد تحديد السكان الإطار، فإن الخطوة التالية هي لباحث لتحديد عينة السكان. هؤلاء هم الناس أن الباحث محاولتهم مقابلة. إذا كانت العينة لها خصائص مختلفة من السكان الإطار، فإننا يمكن أن يعرض خطأ المعاينة. هذا هو نوع من الخطأ كميا في هامش الخطأ التي عادة ما ترافق التقديرات. في حالة الفشل الذريع الأدبية دايجست، كان هناك في الواقع أي عينة. حاولوا الاتصال الجميع في السكان الإطار. حتى ولو كان هناك أي خطأ أخذ العينات، وكان من الواضح أن هناك لا يزال خطأ. هذا يوضح أن هامش الأخطاء التي عادة ما ذكرت تقديرات من مسوحات وعادة ما تكون صغيرة مضلل. أنها لا تشمل جميع مصادر الخطأ.
وأخيرا، يحاول الباحث لمقابلة الجميع في عينة السكان. ويطلق على هؤلاء الناس أن تجري مقابلات مع بنجاح المشاركين. من الناحية المثالية، فإن سكان العينة والعينة يكون بالضبط نفس الشيء، ولكن في الواقع هناك عدم الاستجابة. وهذا هو، الناس الذين يتم اختيارهم في العينة ترفض المشاركة. إذا كان الناس الذين يستجيبون تختلف عن أولئك الذين لا تستجيب، ثم يمكن أن يكون هناك عدم الاستجابة التحيز. كان عدم الاستجابة التحيز المشكلة الرئيسية الثانية مع استطلاع الأدبية دايجست. 24٪ فقط من الناس الذين حصلوا على الاقتراع وردت، واتضح أن الناس الذين دعموا اندون كانوا أكثر عرضة للرد.
بغض النظر عن كونه مجرد مثال لإدخال أفكار التمثيل، واستطلاع الأدبية دايجست هو المثل المتكررة، حذر الباحثون من مخاطر أخذ العينات العشوائية. للأسف، وأعتقد أن الدرس الذي رسم الكثير من الناس من هذه القصة هو خطأ واحد. إن المغزى الأكثر شيوعا من القصة هو أن الباحثين لا يمكن أن تتعلم أي شيء من العينات غير الاحتمالية (أي عينات من دون قواعد صارمة على أساس احتمال اختيار المشاركين). ولكن، كما سوف تظهر لاحقا في هذا الفصل، وهذا ليس صحيحا تماما. بدلا من ذلك، وأعتقد أن هناك حقا اثنين من الأخلاق لهذه القصة. الأخلاق التي تحققت اليوم كما كانت عليه في عام 1936. أولا، كمية كبيرة من البيانات التي تم جمعها عشوائيا لا يضمن على تقدير جيد. ثانيا، يحتاج الباحثون لتفسير كيفية جمع بياناتهم عندما نحرز تقديرات منه. وبعبارة أخرى، لأن عملية جمع البيانات في الاستطلاع الأدبية دايجست وقد مال منهجي تجاه بعض المشاركين، يحتاج الباحثون إلى استخدام عملية تقدير أكثر تعقيدا أن أوزان بعض المشاركين أكثر من غيرها. في وقت لاحق في هذا الفصل، وأنا سوف تظهر لك واحدة من هذه الترجيح إجراءات ما بعد التقسيم الطبقي التي يمكن أن تتيح لك إجراء تقديرات أفضل مع العينات غير الاحتمالية.