كما تم تكرار العديد من الموضوعات في هذا الفصل في العناوين الرئاسية الأخيرة في الرابطة الأمريكية لأبحاث الرأي العام (AAPOR) ، مثل تلك التي كتبها Dillman (2002) Newport (2011) Santos (2014) Link (2015) .
لمزيد من المعلومات حول الاختلافات بين الأبحاث الاستقصائية والمقابلات المتعمقة ، انظر Small (2009) . ذات الصلة بالمقابلات المتعمقة هي مجموعة من المقاربات تُسمى الإثنوغرافيا. في البحوث الإثنوغرافية ، يقضي الباحثون عمومًا وقتًا أطول بكثير مع المشاركين في بيئتهم الطبيعية. لمعرفة المزيد عن الاختلافات بين الاثنوغرافيا والمقابلات المتعمقة ، انظر Jerolmack and Khan (2014) . لمعرفة المزيد عن الإثنوغرافيا الرقمية ، راجع Pink et al. (2015) .
وصفي لتاريخ أبحاث المسح قصير للغاية بحيث يشمل العديد من التطورات المثيرة التي حدثت. لمزيد من المعلومات التاريخية ، انظر Smith (1976) و Converse (1987) و Igo (2008) . لمزيد من المعلومات حول فكرة ثلاثة عهود من الأبحاث المسحية ، انظر Groves (2011) و Dillman, Smyth, and Christian (2008) (التي تفصل بين الثلاث عصور بشكل مختلف قليلاً).
Groves and Kahn (1979) نظرة خاطفة داخل الانتقال من المرحلة الأولى إلى الفترة الثانية في بحث المسح عن طريق إجراء مقارنة مفصلة مفصلة بين الاستبيان المباشر والهاتفي. ( ??? ) ننظر إلى الوراء في التطور التاريخي لطرق أخذ العينات العشوائي.
لمزيد من المعلومات حول كيف تغيرت الأبحاث المسحية في الماضي استجابة للتغيرات في المجتمع ، انظر Tourangeau (2004) و ( ??? ) و Couper (2011) .
وقد نوقش نقاط القوة والضعف في الطلب والملاحظة من قبل علماء النفس (على سبيل المثال ، Baumeister, Vohs, and Funder (2007) ) وعلماء الاجتماع (على سبيل المثال ، Jerolmack and Khan (2014) ؛ Maynard (2014) ؛ Cerulo (2014) ؛ Vaisey (2014) ؛ Jerolmack and Khan (2014) ] Jerolmack and Khan (2014) الفرق بين الطلب Jerolmack and Khan (2014) أيضًا في الاقتصاد ، حيث يتحدث الباحثون عن التفضيلات المعلنة Jerolmack and Khan (2014) عنها ، فعلى سبيل المثال ، يمكن للباحث أن يسأل المستجيبين عما إذا كانوا يفضلون تناول الآيس كريم أو الذهاب إلى صالة الألعاب الرياضية (أذكر التفضيلات) ، أو لاحظ عدد المرات التي يتناول فيها الناس الآيس كريم والذهاب إلى صالة الألعاب الرياضية (تفضيلات الكشف) ، وهناك شكوك عميقة حول أنواع معينة من بيانات التفضيلات المعلنة في الاقتصاد كما هو موضح في Hausman (2012) .
الموضوع الرئيسي من هذه المناقشات هو أن السلوك المبلغ عنه ليس دائمًا دقيقًا. ولكن ، كما هو موضح في الفصل 2 ، قد لا تكون مصادر البيانات الضخمة دقيقة ، وقد لا يتم جمعها على عينة من الاهتمام ، وقد لا تكون متاحة للباحثين. وبالتالي ، أعتقد أنه في بعض الحالات ، يمكن أن يكون السلوك المبلغ عنه مفيدًا. علاوة على ذلك ، فإن الموضوع الرئيسي الثاني من هذه المناقشات هو أن التقارير حول العواطف والمعرفة والتوقعات والآراء ليست دقيقة دائمًا. ولكن إذا كان الباحثون في حاجة إلى معلومات حول هذه الحالات الداخلية - إما للمساعدة في شرح بعض السلوك أو على أنه الشيء المراد تفسيره - فقد يكون السؤال مناسبًا. وبالطبع ، يمكن أن يكون التعلُّم حول الدول الداخلية بطرح أسئلة أمراً صعباً لأن المستجيبين أنفسهم أحياناً لا يدركون حالتهم الداخلية (Nisbett and Wilson 1977) .
يقوم الفصل الأول من Groves (2004) بعمل ممتاز للتوفيق بين المصطلحات غير المتسقة أحيانًا التي يستخدمها الباحثون في المسح لوصف إطار الخطأ الإجمالي للمسح. للحصول على معالجة طول الكتاب لإطار الخطأ الإجمالي للمسح ، راجع Groves et al. (2009) ، Groves and Lyberg (2010) لمحة تاريخية ، انظر Groves and Lyberg (2010) .
كما تظهر فكرة تحلل الأخطاء إلى التحيز والتباين في التعلم الآلي ؛ انظر ، على سبيل المثال ، القسم 7.3 من Hastie, Tibshirani, and Friedman (2009) . وهذا غالباً ما يقود الباحثين إلى الحديث عن مقايضة "التباين المتحيز".
من حيث التمثيل ، هناك مقدمة رائعة لقضايا عدم الاستجابة وعدم الانحياز هو تقرير المجلس القومي للبحوث Nonresponse في استطلاعات العلوم الاجتماعية: A Research Agenda (2013) . نظرة عامة أخرى مفيدة مقدمة من Groves (2006) . كذلك ، تم إصدار عدد خاص من مجلة الإحصاءات الرسمية ، ورأي العام الفصلي ، وسجلات الأكاديمية الأمريكية للعلوم السياسية والاجتماعية حول موضوع عدم الاستجابة. وأخيرا ، هناك في الواقع العديد من الطرق المختلفة لحساب معدل الاستجابة ؛ يتم وصف هذه الأساليب بالتفصيل في تقرير صادر عن الجمعية الأمريكية لباحثي الرأي العام (AAPOR) ( ??? ) .
لمعرفة المزيد عن استطلاع 1936 الأدبي الموجز ، انظر Bryson (1976) ، Squire (1988) ، Cahalan (1989) ، و Lusinchi (2012) . لمناقشة أخرى لهذا الاستطلاع كتحذير Gayo-Avello (2011) ضد جمع البيانات العشوائية ، انظر Gayo-Avello (2011) . في عام 1936 ، استخدم جورج جالوب شكلاً أكثر تطوراً من أخذ العينات وكان قادراً على إنتاج تقديرات أكثر دقة مع عينة أصغر بكثير. كان نجاح غالوب على " النشرة الأدبية " علامة بارزة في تطوير أبحاث المسح كما هو موصوف في الفصل 3 من @ converse_survey_1987؛ الفصل 4 من Ohmer (2006) ؛ والفصل 3 من @ igo_averaged_2008.
من حيث القياس ، فإن أول مورد كبير لتصميم الاستبيانات هو Bradburn, Sudman, and Wansink (2004) . لمزيد من العلاجات المتقدمة ، انظر Schuman and Presser (1996) ، والتي تركز بشكل خاص على أسئلة Saris and Gallhofer (2014) ، و Saris and Gallhofer (2014) ، وهو أكثر عمومية. يتم أخذ نهج مختلف قليلا في القياس في القياس النفسي ، كما هو موضح في ( ??? ) . المزيد عن الاختبار التمهيدي متاح في Presser and Blair (1994) ، Presser et al. (2004) ، والفصل 8 من Groves et al. (2009) . لمعرفة المزيد عن تجارب الاستطلاع ، انظر Mutz (2011) .
من حيث التكلفة ، فإن المعالجة الكلاسيكية ، طول الكتاب للمفاضلة بين تكاليف المسح وأخطاء المسح هي Groves (2004) .
هناك Särndal, Swensson, and Wretman (2003) لأخذ العينات Särndal, Swensson, and Wretman (2003) هما Lohr (2009) (أكثر تمهيدية) و Särndal, Swensson, and Wretman (2003) (أكثر تقدماً). وهناك علاج كلاسيكي بطول الكتب Särndal and Lundström (2005) والطرق ذات الصلة هو Särndal and Lundström (2005) . في بعض ظروف العصر الرقمي ، يعرف الباحثون قليلاً عن غير المراسلين ، وهو أمر لم يكن صحيحاً في الماضي. توجد أشكال مختلفة من تعديل عدم الإجابة عندما يكون لدى الباحثين معلومات حول غير مراسلين ، كما هو موضح من قبل Kalton and Flores-Cervantes (2003) و Smith (2011) .
دراسة Xbox بواسطة W. Wang et al. (2015) يستخدم تقنية تسمى الانحدار متعدد المستويات وما بعد الطبقية ("السيد P.") التي تسمح للباحثين بتقدير وسائل المجموعة حتى عندما يكون هناك العديد من المجموعات. على الرغم من وجود بعض الجدل حول جودة التقديرات من هذه التقنية ، فإنها تبدو كمنطقة واعدة للاستكشاف. تم استخدام هذه التقنية لأول مرة في Park, Gelman, and Bafumi (2004) ، وكان هناك استخدام ومناقشة لاحقة (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . لمعرفة المزيد عن العلاقة بين الأوزان الفردية وأوزان المجموعة ، انظر Gelman (2007) .
للنُهُج الأخرى Schonlau et al. (2009) استبيانات الويب ، انظر Schonlau et al. (2009) ، Bethlehem (2010) ، Valliant and Dever (2011) . يمكن استخدام اللوحات عبر الإنترنت إما لأخذ العينات المحتملة أو لأخذ العينات غير الاحتمالية. لمعرفة المزيد عن لوحات الإنترنت ، انظر Callegaro et al. (2014) .
في بعض الأحيان ، وجد الباحثون أن عينات الاحتمال والعينات غير الاحتمالية تعطي تقديرات للجودة المماثلة (Ansolabehere and Schaffner 2014) ، ولكن المقارنات الأخرى وجدت أن العينات غير الاحتمالية أسوأ (Malhotra and Krosnick 2007; Yeager et al. 2011) . أحد الأسباب المحتملة لهذه الاختلافات هو أن العينات غير الاحتمالية قد تحسنت مع مرور الوقت. للحصول على رؤية أكثر تشاؤما لطرق أخذ العينات غير الاحتمالية ، راجع فريق عمل AAPOR بشأن أخذ العينات غير الاحتمالية (Baker et al. 2013) ، وأوصي أيضًا بقراءة التعليق الذي يتبع التقرير الموجز.
Conrad and Schober (2008) هو مجلد محرر بعنوان " تصور مقابلة المسح في المستقبل" ، وهو يقدم مجموعة متنوعة من وجهات النظر حول مستقبل طرح الأسئلة. يتناول Couper (2011) مواضيع مشابهة ، و Schober et al. (2015) مثالاً لطيفًا لكيفية أن تؤدي أساليب جمع البيانات التي تم تصميمها وفقًا لإعدادات جديدة إلى الحصول على بيانات ذات جودة أعلى. Schober and Conrad (2015) حجة أكثر عمومية حول الاستمرار في تعديل عملية أبحاث المسح لمطابقة التغييرات في المجتمع.
Tourangeau and Yan (2007) قضايا التحيز الاجتماعي المرغوب في الأسئلة الحساسة ، و Lind et al. (2013) بعض الأسباب المحتملة التي تجعل الناس يكشفون عن معلومات أكثر حساسية في مقابلة تدار بواسطة الكمبيوتر. لمزيد من المعلومات حول دور الأشخاص الذين يجرون المقابلات في زيادة معدلات المشاركة في الدراسات الاستقصائية ، انظر Maynard and Schaeffer (1997) ، Maynard, Freese, and Schaeffer (2010) ، Conrad et al. (2013) و Schaeffer et al. (2013) . لمعرفة المزيد عن الاستطلاعات المختلطة ، انظر Dillman, Smyth, and Christian (2014) .
Stone et al. (2007) يقدم معالجة طول الكتاب للتقييم اللحظي البيئي والطرق ذات الصلة.
لمزيد من النصائح حول جعل الاستطلاعات تجربة ممتعة وقيمة للمشاركين ، راجع العمل على أسلوب التصميم (Dillman, Smyth, and Christian 2014) . للحصول على مثال آخر مثير للاهتمام لاستخدام تطبيقات Facebook لاستقصاءات العلوم الاجتماعية ، راجع Bail (2015) .
يصف Judson (2007) عملية الجمع بين الدراسات الاستقصائية والبيانات الإدارية بأنها "تكامل المعلومات" ويناقش بعض مزايا هذا النهج ، فضلاً عن تقديم بعض الأمثلة.
فيما يتعلق بسؤال المخصب ، كانت هناك العديد من المحاولات السابقة للتصديق على التصويت. للحصول على نظرة عامة على تلك الأدبيات ، انظر Belli et al. (1999) ، Ansolabehere and Hersh (2012) ، Hanmer, Banks, and White (2014) ، Berent, Krosnick, and Lupia (2016) . انظر Berent, Krosnick, and Lupia (2016) للحصول على رؤية أكثر تشككًا في النتائج المقدمة في Ansolabehere and Hersh (2012) .
من المهم ملاحظة أنه على الرغم من أن Ansolabehere و Hersh قد شجعتهما جودة البيانات من Catalist ، إلا أن التقييمات الأخرى للبائعين التجاريين كانت أقل حماسة. Pasek et al. (2014) وجدت نوعية رديئة عندما تمت مقارنة البيانات من المسح مع ملف المستهلك من مجموعة أنظمة التسويق (التي دمجت في حد ذاتها بيانات من ثلاثة مزودين: أكسيوم ، اكسيريان ، و InfoUSA). أي أن ملف البيانات لم يتطابق مع استجابات الاستطلاع التي توقع الباحثون أنها صحيحة ، وكان ملف المستهلك يحتوي على بيانات مفقودة لعدد كبير من الأسئلة ، وكان نمط البيانات المفقود مرتبطًا بقيمة الاستبيان المبلغ عنها (وبعبارة أخرى ، كانت البيانات منهجية ، ليست عشوائية).
لمعرفة المزيد عن الربط القياسي بين الاستطلاعات والبيانات الإدارية ، انظر Sakshaug and Kreuter (2012) and Schnell (2013) . لمعرفة المزيد عن الربط القياسي بشكل عام ، انظر Dunn (1946) و Fellegi and Sunter (1969) (تاريخي) و Larsen and Winkler (2014) (حديث). كما تم تطوير أساليب مماثلة في علوم الكمبيوتر تحت أسماء مثل إزالة البيانات المكررة ، تحديد الحالة ، مطابقة الأسماء ، كشف مكرر ، وكشف السجلات المكررة (Elmagarmid, Ipeirotis, and Verykios 2007) . هناك أيضًا نُهُج للحفاظ على الخصوصية لتسجيل الروابط التي لا تتطلب نقل معلومات التعريف الشخصية (Schnell 2013) . طور الباحثون في Facebook إجراءً لربط سجلاتهم بطريقة احتمالية لسلوك التصويت (Jones et al. 2013) ؛ تم إجراء هذا الربط لتقييم تجربة سأخبرك عنها في الفصل 4 (Bond et al. 2012) . لمعرفة المزيد عن الحصول على موافقة بشأن الربط القياسي ، انظر Sakshaug et al. (2012) .
مثال آخر لربط المسح الاجتماعي على نطاق واسع بالسجلات الإدارية الحكومية يأتي من مسح الصحة والتقاعد وإدارة الضمان الاجتماعي. لمزيد من المعلومات حول هذه الدراسة ، بما في ذلك معلومات حول إجراء الموافقة ، راجع أولسون (1996, 1999) .
إن عملية دمج العديد من مصادر السجلات الإدارية في ملف بيانات رئيسي - وهي العملية التي يعمل بها Catalist - هي عملية شائعة في المكاتب الإحصائية لبعض الحكومات الوطنية. قام اثنان من الباحثين من إحصاءات السويد بكتابة كتاب مفصل حول هذا الموضوع (Wallgren and Wallgren 2007) . للحصول على مثال لهذا النهج في مقاطعة واحدة في الولايات المتحدة (مقاطعة أولمستيد ، مينيسوتا ؛ موطن عيادة مايو) ، انظر Sauver et al. (2011) . لمعرفة المزيد عن الأخطاء التي يمكن أن تظهر في السجلات الإدارية ، انظر Groen (2012) .
الطريقة الأخرى التي يمكن للباحثين من خلالها استخدام مصادر البيانات الضخمة في أبحاث المسح هي كإطار أخذ العينات للأشخاص ذوي الخصائص المحددة. لسوء الحظ ، قد يثير هذا النهج أسئلة متعلقة بالخصوصية (Beskow, Sandler, and Weinberger 2006) .
فيما يتعلق بالسؤال المضاعف ، هذا النهج ليس جديدًا كما قد يبدو من وصفه. وله صلات عميقة بثلاث مناطق واسعة في الإحصاء: مرحلة ما بعد التقسيم الطبقي (Little 1993) ، والإسقاط (Rubin 2004) ، وتقدير المساحة الصغيرة (Rao and Molina 2015) . ويرتبط أيضا إلى استخدام المتغيرات البديلة في البحوث الطبية (Pepe 1992) .
تشير تقديرات التكلفة والوقت في Blumenstock, Cadamuro, and On (2015) إلى التكلفة المتغيرة - تكلفة دراسة استقصائية إضافية - ولا تشمل التكاليف الثابتة مثل تكلفة تنظيف بيانات الاتصال ومعالجتها. بشكل عام ، قد يكون تضخيم الطلب على الأرجح تكاليف ثابتة عالية وتكاليف منخفضة متغيرة شبيهة بتكاليف التجارب الرقمية (انظر الفصل 4). لمعرفة المزيد عن الدراسات الاستقصائية المتعلقة بالهواتف المحمولة في البلدان النامية ، انظر Dabalen et al. (2016) .
للحصول على أفكار حول كيفية القيام بتضخيم الطلب بشكل أفضل ، أوصيك بمعرفة المزيد حول الإدعاء المتعدد (Rubin 2004) . أيضا ، إذا قام الباحثون بتضخيم طلب الرعاية حول التعداد الكلي ، بدلا من الصفات على المستوى الفردي ، عندئذ قد تكون المناهج في King and Lu (2008) Hopkins and King (2010) مفيدة. وأخيرًا ، لمزيد من المعلومات حول مناهج التعلم الآلي في Blumenstock, Cadamuro, and On (2015) ، راجع James et al. (2013) (أكثر تمهيدية) أو Hastie, Tibshirani, and Friedman (2009) (أكثر تقدما).
إحدى القضايا الأخلاقية المتعلقة بالسعي المضاعف هي أنه يمكن استخدامها لاستنتاج سمات حساسة قد لا يختارها الناس للكشف عنها في مسح كما هو موضح في Kosinski, Stillwell, and Graepel (2013) .