ليس كل العينات غير الاحتمالية هي نفسها. ويمكننا أن نضيف المزيد من السيطرة على الواجهة الأمامية.
وانغ نهج وزملاؤه المستخدمة في تقدير نتائج الانتخابات الرئاسية الأمريكية 2012 يعتمد كليا على إدخال تحسينات في مجال تحليل البيانات. وهذا يعني أنها جمعت الكثير من الردود ما يمكن ثم حاول إعادة وزن لهم. استراتيجية متكاملة للعمل مع أخذ العينات غير الاحتمالية هي الحصول على مزيد من السيطرة على عملية جمع البيانات.
أبسط مثال على عملية أخذ العينات غير الاحتمالية التي تسيطر عليها جزئيا هو أخذ العينات الحصص، وهي تقنية يعود إلى الأيام الأولى من الدراسات المسحية. في أخذ العينات الحصص والباحثين تقسيم السكان إلى مجموعات مختلفة (على سبيل المثال، الشبان، والشابات، الخ) والحصص ثم تعيين لعدد من الناس التي سيتم اختيارها في كل مجموعة. ويتم اختيار المشاركين بطريقة عشوائية حتى التقى الباحث حصتها في كل مجموعة. بسبب الحصص، تبدو العينة الناتجة أشبه السكان المستهدفين من شأنه أن يكون صحيحا غير ذلك، ولكن لأن احتمالات إدراج غير معروفة كثير من الباحثين يشككون في أخذ العينات الحصص. في الواقع، كانت العينات الحصص سببا لل"ديوي الهزائم ترومان" خطأ في عام 1948 الانتخابات الرئاسية الأمريكية. لأنه يوفر بعض السيطرة على عملية أخذ العينات، ومع ذلك، يمكن للمرء أن يرى كيف أخذ العينات الحصص قد يكون لها بعض المزايا على جمع البيانات غير المنضبط تماما.
تجاوز أخذ العينات الحصص، نهج أكثر حداثة في السيطرة على عملية أخذ العينات غير الاحتمالية هي ممكنة الآن. واحد يسمى هذا النهج عينة مطابقة، ويتم استخدامه من قبل بعض مقدمي وحة على الانترنت التجارية. في أبسط أشكالها، عينة مطابقة يتطلب اثنين من مصادر البيانات: 1) سجل كاملة من السكان و 2) لوحة كبيرة من المتطوعين. من المهم أن المتطوعين لا تحتاج إلى أن تكون عينة احتمالية من أية مجموعة من السكان. التأكيد على أنه لا توجد شروط لاختيار في لوحة، وأنا أسميها لوحة القذرة. أيضا، يجب أن تتضمن كل من السجل السكاني ولوحة القذرة بعض المعلومات الإضافية عن كل شخص، في هذا المثال، سوف تنظر العمر والجنس، ولكن في حالات واقعية يمكن أن تكون هذه المعلومات الإضافية أكثر تفصيلا. خدعة من مطابقة العينة لتحديد عينات من لوحة القذرة في الطريقة التي تنتج العينات التي تبدو وكأنها العينات الاحتمالية.
يبدأ مطابقة العينة عندما يتم أخذ عينة احتمالية محاكاة من السجل السكاني. تصبح هذه العينة محاكاة عينة المستهدفة. ثم، استنادا إلى المعلومات الإضافية، تتم مطابقة الحالات في العينة المستهدفة للناس في لوحة القذرة لتشكيل عينة مطابقة. على سبيل المثال، إذا كان هناك امرأة عمرها 25 عاما في العينة المستهدفة، ثم يجد الباحث الأنثى 25 عاما من لوحة قذرة لتكون في عينة مطابقة. وأخيرا، وتجرى مقابلات مع أفراد العينة مطابقة لإنتاج مجموعة نهائية من المستطلعين.
على الرغم من أن عينة مطابقة يشبه العينة المستهدفة، من المهم أن نتذكر أن العينة مطابقة ليست عينة احتمالية. يمكن أن عينات مطابقة تطابق سوى عينة الهدف على معلومات مساعدة معروفة (مثل العمر والجنس)، ولكن ليس على خصائص بعيدة عن التروي. على سبيل المثال، إذا يميل الناس على لوحة القذرة لتكون أكثر فقرا بعد كل شيء، سبب واحد للانضمام إلى فريق المسح هي لكسب المال، ثم حتى لو تبدو العينة مطابقة مثل العينة المستهدفة من حيث العمر والجنس فإنه لا يزال لديها انحياز الفقراء. سحر أخذ العينات احتمال الحقيقية هو استبعاد وجود مشاكل على كل خصائص قياس وبعيدة عن التروي (نقطة التي تنسجم مع مناقشتنا للمطابقة للالاستدلال السببي من الدراسات الرصدية في الفصل 2).
في الممارسة العملية، عينة مطابقة يعتمد على وجود لوحة كبيرة ومتنوعة حريصة على استكمال الدراسات الاستقصائية، وبالتالي يتم بشكل رئيسي من قبل الشركات التي يمكن أن تحمل لتطوير والحفاظ على هذا الفريق. أيضا، من الناحية العملية، يمكن أن يكون هناك مشاكل مع مطابقة (أحيانا مباراة جيدة لشخص في العينة المستهدفة غير موجود على لوحة) وعدم الاستجابة (الناس في بعض الأحيان في العينة مطابقة رفض المشاركة في الاستطلاع). لذلك، من الناحية العملية، والباحثين القيام عينة مطابقة أيضا تنفيذ نوع من التكيف في مرحلة ما بعد التقسيم الطبقي لجعل التقديرات.
ومن الصعب تقديم ضمانات النظرية مفيدة حول مطابقة عينة، ولكن في الممارسة العملية يمكن أن تؤدي بشكل جيد. على سبيل المثال، ستيفن Ansolabehere وبريان شافنير (2014) مقارنة ثلاث دراسات موازية لحوالي 1،000 شخص وأجري في عام 2010 باستخدام ثلاث عينات مختلفة وإجراء مقابلات مع وسائل: البريد والهاتف، وهيئة الإنترنت باستخدام عينة مطابقة والتكيف في مرحلة ما بعد التقسيم الطبقي. وكانت التقديرات من ثلاث مقاربات مماثلة تماما لتقديرات معايير عالية الجودة مثل المسح التيار السكان (CPS) والمساحة المقابلة الصحية الوطنية (NHIS). وبشكل أكثر تحديدا، كانت كل استطلاعات الرأي الإنترنت والبريد الإلكتروني قبالة بمعدل 3 نقطة مئوية وكان مسح الهاتف من قبل 4 نقاط مئوية. أخطاء كبيرة هذا ما يقرب من ما هو متوقع من عينات من حوالي 1000 شخص. على الرغم من أن أيا من هذه الأوضاع تنتج بيانات أفضل بكثير، على حد سواء المسح الإنترنت والهاتف (والذي تولى أيام أو أسابيع) هي إلى حد أسرع إلى حقل من المسح الإلكتروني (الذي استغرق ثمانية أشهر)، والمسح الإنترنت، والتي تستخدم عينة مطابقة، كان أرخص من اثنين من وسائط أخرى.
في الختام، العلماء والإحصاء الاجتماعي يشككون بشكل لا يصدق من الاستنتاجات من هذه العينات غير الاحتمالية، في جزء لأنها ترتبط مع بعض الإخفاقات محرجة من الدراسات المسحية مثل الاستطلاع الأدبية دايجست. في جزء منه، وأنا أتفق مع هذا الشك: من المرجح أن تنتج تقديرات سيئة العينات غير الاحتمالية غير المعدلة. ومع ذلك، إذا يمكن للباحثين ضبط لالتحيز في عملية أخذ العينات (على سبيل المثال، في مرحلة ما بعد التقسيم الطبقي) أو التحكم في عملية أخذ العينات إلى حد ما (على سبيل المثال، عينة مطابقة)، فإنها يمكن أن تنتج أفضل التقديرات، وحتى تقديرات نوعية كافية لمعظم الأغراض. بالطبع، سيكون من الأفضل أن تفعل أخذ العينات احتمال تنفيذها تماما، ولكن هذا لم يعد يبدو أن هناك خيارا واقعيا.
العينتين غير الاحتمالية والعينات الاحتمالية تختلف في نوعيتها، وحاليا هو الحال أن معظم التقديرات من العينات الاحتمالية هي أكثر جديرة بالثقة من تقديرات العينات غير الاحتمالية احتمالا. ولكن، حتى الآن، تقديرات من العينات غير الاحتمالية التي أجريت جيدا هي على الأرجح أفضل من تقديرات العينات الاحتمالية التي أجريت على نحو رديء. وعلاوة على ذلك، والعينات غير الاحتمالية هي أرخص إلى حد كبير. وهكذا، يبدو أن احتمال مقابل أخذ العينات غير الاحتمالية يقدم ذات جودة تكلفة مفاضلة (الشكل 3.6). نتطلع إلى الأمام، وأتوقع أن التقديرات من عينات غير الاحتمالية الحسن سوف تصبح أرخص وأفضل. وعلاوة على ذلك، بسبب انهيار في الدراسات الاستقصائية الهاتف الثابت وتزايد معدلات عدم الاستجابة، وأتوقع أن العينات الاحتمالية سوف تصبح أكثر تكلفة وأقل جودة. وبسبب هذه الاتجاهات الطويلة الأجل، وأعتقد أنه أخذ العينات غير الاحتمالية سوف تصبح ذات أهمية متزايدة في الحقبة الثالثة من الدراسات المسحية.