التمثيل هو حول جعل الاستدلالات من المشاركين لسكان تستهدفها.
من أجل فهم نوع الأخطاء التي يمكن أن تحدث عند الاستدلال من المجيبين على العدد الأكبر من السكان ، دعنا نفكر في استطلاع الرأي القاسي الأدبي الذي حاول التنبؤ بنتائج الانتخابات الرئاسية الأمريكية عام 1936. على الرغم من أنه حدث منذ أكثر من 75 عامًا ، إلا أن هذه الأزمة ما زالت تحتوي على درس مهم لتعليم الباحثين اليوم.
كانت مجلة Literary Digest مجلة شعبية عامة ، وبدأت في عام 1920 في إجراء استطلاعات الرأي للتنبؤ بنتائج الانتخابات الرئاسية. ولإجراء هذه التنبؤات ، فإنهم سيرسلون بطاقات الاقتراع إلى الكثير من الناس ثم يقومون ببساطة بجمع أوراق الاقتراع التي تم إرجاعها ؛ ذكرت الأدبية دايجست بفخر أن بطاقات الاقتراع التي تلقوها كانت لا "مرجح، تعديل، ولا تفسير." هذا الإجراء توقع بشكل صحيح عن أسماء الفائزين في انتخابات عام 1920، 1924، 1928 و 1932. في عام 1936، في خضم فترة الكساد الكبير، الأدبية أرسلت دايجست صناديق الاقتراع إلى 10 ملايين شخص ، وجاءت أسماؤهم في الغالب من أدلة الهاتف وسجل تسجيل السيارات. إليكم كيف وصفوا منهجيتهم:
"تتحرك آلة التشغيل السلس في DIGEST بدقة متناهية تبلغ 30 عامًا من الخبرة للحد من التخمين للحقائق الصعبة ... هذا الأسبوع خمسمائة أقلام خدش أكثر من ربع مليون عنوان يوميًا. في كل يوم ، في غرفة كبيرة تقع فوق الطريق الرابع من السيارات ، في نيويورك ، قام 400 عامل بتحريك مليون قطعة من المواد المطبوعة - بما يكفي لتمهيد أربعين مدينة - إلى المغلفات التي تمت معالجتها [كذا]. في كل ساعة ، في محطة مكتب البريد التابعة لشركة DIGEST ، ثلاث آلات قياس بريدية ثرثرة مختومة ومختومة بواجهة بيضاء. الموظفين المهرة البريدية انقلبت لهم في انتفاخ mailsacks. أسطول شاحنات DIGEST عجلها للتعبير عن القطارات البريدية. . . في الأسبوع المقبل ، ستبدأ الإجابات الأولى من هؤلاء العشرة ملايين الموجة القادمة من صناديق الاقتراع المعلمة ، بحيث يتم فحصها ثلاث مرات والتحقق منها وخمس مرات وتصنيفها. عندما يتم تحديد الرقم الأخير وفحصه ، إذا كانت التجربة السابقة هي المعيار ، فإن الدولة ستعرف في حدود نسبة 1٪ من الأصوات الشعبية الفعلية لأربعين مليون ناخب. (22 أغسطس 1936)
يمكن التعرف على حجم الحسبة الأدبية من الحجم على الفور لأي باحث "بيانات كبيرة" اليوم. من بين 10 ملايين بطاقة اقتراع تم توزيعها ، تم إرجاع 2.4 مليون مدهش - وهذا أكبر بنحو 1000 مرة من استطلاعات الرأي السياسية الحديثة. ومن بين هؤلاء المستجيبين البالغ عددهم 2.4 مليون ، كان الحكم واضحًا: كان ألف لاندون يهزم الرئيس الحالي فرانكلين روزفلت. لكن ، في الواقع ، هزم روزفلت لاندون في انهيار أرضي. كيف يمكن أن نخطأ في الأدبية مع الكثير من البيانات؟ إن فهمنا الحديث لأخذ العينات يجعل أخطاء Literary Digest واضحة وتساعدنا على تجنب ارتكاب أخطاء مماثلة في المستقبل.
يتطلب التفكير بوضوح في أخذ العينات أن نفكر في أربع مجموعات مختلفة من الأشخاص (الشكل 3.2). المجموعة الأولى هي المجموعة المستهدفة ؛ هذه هي المجموعة التي يعرّفها الباحثون على أنهم السكان المعنيون. في حالة الندوة الأدبية ، كان السكان المستهدفين ناخبين في الانتخابات الرئاسية لعام 1936.
بعد اتخاذ قرار بشأن مجموعة مستهدفة ، يحتاج الباحث إلى وضع قائمة بالأشخاص الذين يمكن استخدامهم لأخذ العينات. تسمى هذه القائمة بإطار أخذ العينات ويطلق على الأشخاص الموجودون عليها اسم مجموعة الأطر . من الناحية المثالية ، فإن السكان المستهدفين وسكان الإطار سيكونون متماثلين تمامًا ، ولكن في الممارسة العملية لا يكون هذا هو الحال في كثير من الأحيان. على سبيل المثال ، في حالة Literary Digest ، كان عدد السكان 10 مليون شخص ، وجاءت أسماؤهم في الغالب من أدلة الهاتف وسجلات تسجيل السيارات. ويطلق على الاختلافات بين السكان المستهدفين وتعداد الأرتال خطأ التغطية . خطأ التغطية لا يضمن بحد ذاته للمشاكل. ومع ذلك ، يمكن أن يؤدي ذلك إلى تحيز التغطية إذا كان الأشخاص في مجموعة الأطر يختلفون بشكل منهجي عن الأشخاص في المجموعة المستهدفة الذين ليسوا في مجموعة الأطر. هذا هو ، في الواقع ، ما حدث بالضبط في استطلاع الرأي الأدبي . يميل الناس في إطارهم إلى الأرجح إلى دعم ألف ألف لاندون ، ويرجع ذلك جزئيا إلى كونهم أكثر ثراء (تذكر أن كل من الهواتف والسيارات كانت جديدة ومكلفة نسبيا في عام 1936). لذلك ، في استطلاع الرأي الأدبي ، أدى خطأ في التغطية إلى تحيز التغطية.
بعد تحديد مجموعة الأطر ، تكون الخطوة التالية هي قيام الباحث باختيار عينة من السكان ؛ هؤلاء هم الأشخاص الذين سيحاولون الباحث إجراء مقابلة معهم. إذا آﺎﻧﺖ اﻟﻌﻴﻨﺔ ﻟﻬﺎ ﺧﺼﺎﺋﺺ ﻣﺨﺘﻠﻔﺔ ﻋﻦ ﺳﺮﻋﺔ اﻹﻃﺎرات ، ﻓﻴﻤﻜﻦ ﻋﻨﺪﺋﺬ أﺧﺬ ﻋﻴﻨﺔ أﺧﺬ اﻟﻌﻴﻨﺔ . ومع ذلك ، في حالة الفشل الأدبي لموجز البيانات ، لم يكن هناك في الواقع أي أخذ عينات - المجلة للاتصال بجميع الأشخاص في إطار المجموعة - وبالتالي لم يكن هناك خطأ في أخذ العينات. يميل العديد من الباحثين إلى التركيز على خطأ أخذ العينات - وهذا هو عادة النوع الوحيد من الأخطاء الذي تم التقاطه بهامش الخطأ الذي تم الإبلاغ عنه في الاستطلاعات - لكن إخفاق المنصة الأدبية يذكرنا بأننا نحتاج إلى النظر في جميع مصادر الخطأ ، بشكل عشوائي ومنهجي.
وأخيرا ، بعد اختيار عينة من السكان ، يحاول الباحث إجراء مقابلة مع جميع أعضائه. هؤلاء الأشخاص الذين تمت مقابلتهم بنجاح يطلق عليهم اسم المستجيبين . من الناحية المثالية ، فإن عينة السكان والمستجيبين سيكونون متطابقين تمامًا ، ولكن في الممارسة العملية لا يوجد رد. أي أن الأشخاص الذين يتم اختيارهم في العينة في بعض الأحيان لا يشاركون. إذا كان الأشخاص الذين يستجيبون مختلفين عن أولئك الذين لا يستجيبون ، فقد يكون هناك تحيز غير مستجيب . كان التحيز بعدم الاستجابة هو المشكلة الرئيسية الثانية في استطلاع الرأي الأدبي . أجاب 24٪ فقط من الأشخاص الذين حصلوا على بطاقة الاقتراع ، وتبين أن الأشخاص الذين دعموا لاندون كانوا أكثر عرضة للرد.
بالإضافة إلى كونه مجرد مثال لتقديم أفكار التمثيل ، فإن استطلاع الرأي الأدبي هو مثال مشابه ، يحذر الباحثين من مخاطر أخذ العينات العشوائية. لسوء الحظ ، أعتقد أن الدرس الذي استخلصه العديد من الناس من هذه القصة هو الدرس الخطأ. أكثر الأخلاقيات شيوعًا في القصة هو أن الباحثين لا يستطيعون تعلم أي شيء من العينات غير الاحتمالية (أي عينات بدون قواعد صارمة قائمة على الاحتمالية لاختيار المشاركين). ولكن ، كما سأوضح لاحقًا في هذا الفصل ، هذا ليس صحيحًا تمامًا. بدلا من ذلك ، أعتقد أن هناك حقا أخلاقين لهذه القصة. الأخلاق التي هي صحيحة اليوم كما كانت في عام 1936. أولا ، كمية كبيرة من البيانات التي تم جمعها بشكل عشوائي لن يضمن تقدير جيد. بشكل عام ، فإن وجود عدد كبير من المستجيبين يقلل من تباين التقديرات ، ولكنه لا يقلل بالضرورة من التحيز. مع الكثير من البيانات ، يمكن للباحثين في بعض الأحيان الحصول على تقدير دقيق للشيء الخطأ. يمكن أن تكون غير دقيقة على وجه التحديد (McFarland and McFarland 2015) . الدرس الرئيسي الثاني من الفشل الأدبي الموجز هو أن الباحثين يحتاجون إلى حساب كيفية جمع العينة عند وضع التقديرات. وبعبارة أخرى ، لأن عملية أخذ العينات في الاستطلاع الأدبي دايجست كانت تميل بشكل منهجي نحو بعض المجيبين ، كان على الباحثين استخدام عملية تقدير أكثر تعقيدًا ترجح بعض المجيبين أكثر من غيرهم. في وقت لاحق من هذا الفصل ، سوف أعرض عليك إجراءًا واحدًا للتوزين - ما بعد التقسيم الطبقي - يمكن أن يساعدك على تقديم تقديرات أفضل من العينات العشوائية.