بسیاری از موضوعات این فصل نیز در آدرس های اخیر ریاست جمهوری در انجمن تحقیقات نظری عمومی آمریکا (AAPOR)، از جمله Dillman (2002) ، Newport (2011) ، Santos (2014) و Link (2015)
برای اطلاعات بیشتر در مورد تفاوت بین تحقیقات تحقیق و مصاحبه عمیق، نگاه کنید به Small (2009) . مربوط به مصاحبه عمیق، یک خانواده از روش هایی است که به نام قوم شناسی است. محققان در مطالعات قوم نگاری عموما وقت بیشتری را با شرکت کنندگان در محیط طبیعی خود صرف می کنند. برای دیدن بیشتر در مورد تفاوت بین قوم نگاری و مصاحبه عمیق، به Jerolmack and Khan (2014) . برای اطلاعات بیشتر در مورد مردمسالاری دیجیتال، به Pink et al. (2015) .
شرح من از تاریخ تحقیقات تحقیقاتی بسیار کوتاه است که شامل بسیاری از پیشرفت های هیجان انگیز شده است. برای پیشینه تاریخی بیشتر، Smith (1976) ، Converse (1987) و Igo (2008) . برای بیشتر در مورد ایده سه گانه تحقیق تحقیق، Groves (2011) و Dillman, Smyth, and Christian (2008) (که سه دوره را کمی متفاوت می بیند) را ببینید.
Groves and Kahn (1979) یک دوره ی تحقیق تحقیقاتی را با در نظر گرفتن یک مقایسه دقیق بین چهره به چهره و نظرسنجی تلفنی در طی گذار از دوره ی اول به دور دوم، انجام می دهند. ( ??? ) نگاهی به توسعه تاریخی روش های نمونه گیری تصادفی با شماره گیری رقمی می اندازد.
برای اطلاعات بیشتر در مورد این که چگونه تحقیقات تحقیقاتی در گذشته در تغییرات در جامعه تغییر کرده است، Tourangeau (2004) ، ( ??? ) و Couper (2011) .
نقاط قوت و ضعف خواسته و رعایت روانشناسان (مانند Baumeister, Vohs, and Funder (2007) ) و جامعه شناسان (به عنوان مثال Jerolmack and Khan (2014) ؛ Maynard (2014) ؛ Cerulo (2014) ؛ Vaisey (2014) ؛ Jerolmack and Khan (2014) ] تفاوت بین درخواست و مشاهده نیز در اقتصاد، که در آن محققان در مورد تنظیمات اعلام کرد و نشان داد صحبت مطرح می شود برای مثال، یک محقق می تواند پاسخ دهندگان که آیا آنها ترجیح می دهند که خوردن بستنی و یا رفتن به سالن ورزش است.. (ترجیحات اظهار شده) و یا می تواند مشاهده کند که اغلب مردم خوردن بستنی و رفتن به ورزشگاه (تنظیمات را نشان می دهد). شکایتی عمیق در مورد انواع خاصی از داده های ترجیحات اظهار شده در اقتصاد به عنوان شرح داده شده در Hausman (2012) .
تم اصلی این بحث ها این است که رفتار گزارش شده همیشه دقیق نیست. اما، همانطور که در فصل 2 توضیح داده شد، منابع داده بزرگ ممکن است دقیق نباشد، آنها ممکن است در مورد نمونه مورد علاقه جمع آوری شوند، و ممکن است برای محققان قابل دسترسی نباشند. بنابراین، من فکر می کنم که در برخی موارد رفتار گزارش شده می تواند مفید باشد. علاوه بر این، موضوع اصلی دوم این بحث ها این است که گزارش های مربوط به احساسات، دانش، انتظارات و نظرات همیشه دقیق نیستند. اما اگر اطلاعات محققان در مورد این حالت های داخلی مورد نیاز باشد، یا برای توضیح بعضی از رفتارها و یا به عنوان چیزی که توضیح داده می شود، ممکن است مناسب باشد. البته، یادگیری در مورد امور داخلی با پرسیدن سوالات می تواند مشکل ساز باشد، زیرا گاهی اوقات پاسخ دهندگان از وضعیت درونی خود آگاه نیستند (Nisbett and Wilson 1977) .
فصل 1 Groves (2004) کار بسیار خوبی را برای تطبیق با اصطلاحات گاهی ناسازگار که توسط محققان بررسی برای توصیف چارچوب خطای کل نظرسنجی انجام می شود، انجام می دهد. برای یک دوره طولانی در مورد چارچوب خطای بررسی کلی، نگاه کنید به Groves et al. (2009) ، و برای یک مرور کلی تاریخی، نگاه کنید به Groves and Lyberg (2010) .
ایده تقسیم خطاها به تعصب و واریانس نیز در یادگیری ماشین ظاهر می شود؛ برای مثال، بخش 7.3 از Hastie, Tibshirani, and Friedman (2009) . این اغلب محققان را مجبور می کند تا درمورد یک «واسطه تبعیض» صحبت کنند.
از دیدگاه بازنمایی، مقدمه ای عالی درباره مسائل مربوط به عدم انطباق غیرمستقیم گزارش شورای ملی تحقیقات عدم پاسخ در نظرسنجی علوم اجتماعی است: یک برنامه تحقیقاتی (2013) . یک مرور کلی مفید توسط Groves (2006) ارائه شده است. همچنین مسائل ویژه مجله آمار رسمی ، فصلنامه عمومی و نشریات آکادمی علوم سیاسی و اجتماعی آمریکا بر روی موضوع عدم پاسخگویی منتشر شده است. در نهایت، در واقع روش های مختلفی برای محاسبه میزان پاسخ وجود دارد؛ این رویکردها در یک گزارش توسط انجمن آمریکایی پژوهشگران نظرخواهی (AAPOR) ( ??? ) به طور دقیق شرح داده شده است.
برای اطلاعات بیشتر در نظرسنجی ادبیات سال 1936، Bryson (1976) ، Squire (1988) ، Cahalan (1989) و Lusinchi (2012) . برای بحث دیگری در مورد این نظرسنجی به عنوان یک هشدار Gayo-Avello (2011) در برابر جمع آوری داده های تصادفی، به Gayo-Avello (2011) . در سال 1936، جورج گالوپ نمونه ای پیچیده تر از نمونه برداری را استفاده کرد و توانست برآوردهای دقیقتری با نمونه بسیار کوچکتر تولید کند. موفقیت گالوپ در مورد ادبیات ادبی یک عنصر در توسعه تحقیقات تحقیقاتی است که در فصل 3 از @ converse_survey_1987 شرح داده شده است؛ فصل 4 Ohmer (2006) ؛ و فصل 3 از @ igo_averaged_2008.
از لحاظ اندازه گیری، یک منبع بزرگ برای طراحی پرسشنامه، Bradburn, Sudman, and Wansink (2004) . برای درمان های پیشرفته تر، نگاه کنید به Schuman and Presser (1996) ، که به طور خاص بر روی سوالات نگرش متمرکز است، و Saris and Gallhofer (2014) ، که بیشتر به طور کلی است. یک رویکرد متفاوتی به اندازه گیری در روان گرفته شده است، همان طور که در ( ??? ) . بیشتر در مورد پیش آزمون در Presser and Blair (1994) ، Presser et al. (2004) و فصل 8 Groves et al. (2009) . برای اطلاعات بیشتر در مورد آزمایشات نظر سنجی، به Mutz (2011) .
از لحاظ هزینه، درمان کلاسیک، کتاب طولانی در میان هزینه های نظرسنجی و خطاهای نظرسنجی، Groves (2004) .
دو روش کلاسی کتاب طولی نمونه گیری نمونه های احتمالی استاندارد و برآورد Lohr (2009) (مقدماتی تر) و Särndal, Swensson, and Wretman (2003) (پیشرفته تر). یک روش طبقه بندی کتاب طولانی پس از طبقه بندی و روش های مرتبط Särndal and Lundström (2005) . محققان در برخی از تنظیمات سنسورهای دیجیتال نسبت به نداشتن اطلاعات بسیار اندکی دارند، که در گذشته غالبا درست نیست. اشکال مختلف عدم تنظیم پاسخگویی ممکن است زمانی که محققان اطلاعاتی در مورد عدم پاسخگویی دارند، همانطور که توسط Kalton and Flores-Cervantes (2003) و Smith (2011) .
مطالعه Xbox توسط W. Wang et al. (2015) از تکنیک به نام رگرسیون چند سطحی و پس از طبقه بندی ("آقای P.") استفاده می کند که به محققین اجازه می دهد برآورد گروه ها را حتی زمانی که گروه های بسیاری و بسیاری وجود دارد، برآورد کنند. اگر چه بحث بر سر کیفیت پیش بینی های این روش وجود دارد، اما به نظر می رسد که یک منطقه امیدوار کننده برای بررسی است. این تکنیک برای اولین بار در Park, Gelman, and Bafumi (2004) استفاده شده است و استفاده و بحث در مورد آن (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . برای اطلاعات بیشتر در مورد ارتباط بین وزن های فردی و وزن گروه، به Gelman (2007) .
برای رویکردهای دیگر برای ارزیابی نظرسنجیهای اینترنتی، Schonlau et al. (2009) ، Bethlehem (2010) ، و Valliant and Dever (2011) . پانل های آنلاین می توانند از نمونه گیری احتمالی یا نمونه گیری غیر احتمالی استفاده کنند. برای اطلاعات بیشتر در پانل های آنلاین، Callegaro et al. (2014) .
گاهی اوقات محققان دریافتند که نمونه های احتمالی و نمونه های غیر احتمالی برآوردهای کیفیت مشابهی را انجام می دهند (Ansolabehere and Schaffner 2014) ، اما مقایسه های دیگر نشان داد که نمونه های غیر احتمالی بدتر می شوند (Malhotra and Krosnick 2007; Yeager et al. 2011) . یک دلیل ممکن برای این تفاوت ها این است که نمونه های غیر احتمالی در طول زمان بهبود یافته اند. برای یک دیدگاه بدبینانه از روش نمونه گیری غیر احتمالی، می توان نیروی کار AAPOR را بر روی نمونه گیری غیر احتمالی (Baker et al. 2013) و همچنین توصیه می کنم که تفسیری را که به شرح خلاصه است، بخوانید.
Conrad and Schober (2008) یک جلد ویرایش شده به نام " پیش بینی مصاحبه Survey of the Future " است و از دیدگاه های مختلف در مورد آینده سوالات شما ارائه می دهد. Couper (2011) به موضوعات مشابه اشاره می کند و Schober et al. (2015) یک مثال خوب از نحوه استفاده از روش های جمع آوری اطلاعات برای تنظیم جدید می تواند داده های با کیفیت بالاتر را به دست آورد. Schober and Conrad (2015) یک بحث کلی تر در مورد ادامه تنظیم روند تحقیقات تحقیقاتی برای مطابقت با تغییرات در جامعه ارائه می دهند.
Tourangeau and Yan (2007) بررسی مسائل مربوط به مطلوبیت اجتماعی در سوالات حساس، و Lind et al. (2013) برخی از دلایل ممکن است که چرا مردم ممکن است اطلاعات حساس تر را در مصاحبه کامپیوتری منتشر کنند. برای کسب اطلاعات بیشتر در مورد نقش مصاحبه کنندگان انسانی در افزایش میزان مشارکت در نظرسنجی ها، می Maynard and Schaeffer (1997) ، می Maynard, Freese, and Schaeffer (2010) ، Conrad et al. (2013) و Schaeffer et al. (2013) . برای اطلاعات بیشتر در مورد نظرسنجی های مخلوط، Dillman, Smyth, and Christian (2014) .
Stone et al. (2007) ارائه یک کتاب طولانی درمان ارزیابی لحظه به لحظه و روش های مرتبط.
برای مشاوره بیشتر در زمینه ایجاد نظرسنجی، یک تجربه لذت بخش و ارزشمند برای شرکت کنندگان، به کار بر روی روش طراحی مناسب (Dillman, Smyth, and Christian 2014) . برای نمونه دیگری جالب از استفاده از برنامه های فیس بوک برای بررسی های علوم اجتماعی، نگاه کنید به Bail (2015) .
Judson (2007) فرایند ترکیب نظرسنجی ها و داده های اداری را به عنوان «ادغام اطلاعات» توصیف می کند و برخی از مزایای این رویکرد را نیز ارائه می دهد و همچنین برخی نمونه هایی را ارائه می دهد.
با توجه به درخواست غنی شده، بسیاری از تلاش های قبلی برای تایید رای گیری انجام شده است. برای یک مرور کلی از آن ادبیات، Belli et al. (1999) ، Ansolabehere and Hersh (2012) ، Hanmer, Banks, and White (2014) ، و Berent, Krosnick, and Lupia (2016) . به نظر Berent, Krosnick, and Lupia (2016) برای مشاهده بیشتر شکاکانه از نتایج ارائه شده در Ansolabehere and Hersh (2012) .
مهم است که توجه داشته باشیم که اگر چه Ansolabehere و Hersh با کیفیت داده های کاتالیست تشویق شده اند، دیگر ارزیابی فروشندگان تجاری کمتر مشتاق بوده است. Pasek et al. (2014) کیفیت نامطلوب را بدست آورد که اطلاعات مربوط به یک نظرسنجی با یک فایل مصرف کننده از گروه بازاریابی سیستم مقایسه شد (که خود داده ها را از سه ارائه دهنده: Acxiom، Experian و InfoUSA ادغام کرد). به این معناست که فایل داده با پاسخ های نظرسنجی که محققان انتظار داشتند درست باشد مطابقت نداشتند، پرونده مصرف کننده اطلاعات زیادی برای تعداد زیادی از سوالات نداشت و الگوی داده های گم شده با مقدار بررسی گزارش شده (به بیان دیگر، از دست رفته داده ها به طور سیستماتیک، تصادفی نیستند).
برای اطلاعات بیشتر در مورد پیوند پیوندی بین نظرسنجی ها و داده های اداری، نگاه کنید به Sakshaug and Kreuter (2012) و Schnell (2013) . برای Fellegi and Sunter (1969) بیشتر در پیوند پیوندی به طور کلی، Dunn (1946) و Fellegi and Sunter (1969) (تاریخی) و Larsen and Winkler (2014) (مدرن) را ببینید. روشهای مشابهی نیز در علوم رایانه تحت نام هایی مانند داده کاوی، شناسایی نمونه، تطبیق نام، تشخیص تکثیر و شناسایی رکورد تکراری (Elmagarmid, Ipeirotis, and Verykios 2007) . همچنین روشهای حفظ حریم خصوصی برای ضبط پیوندهای که نیازی به انتقال اطلاعات شناسایی شخصی ندارند (Schnell 2013) . محققان در فیس بوک یک روش برای ایجاد پرونده های مربوط به سوابق خود را به رفتار رای گیری پیوند دادند (Jones et al. 2013) . این پیوند برای ارزیابی یک آزمایش انجام شده است که در فصل 4 به شما می گویم (Bond et al. 2012) . برای کسب اطلاعات بیشتر در مورد اخذ رضایت برای پیوند ضبط، نگاه کنید به Sakshaug et al. (2012) .
نمونه دیگری از پیوند بررسی گسترده اجتماعی با سوابق اداری دولتی از نظرسنجی بهداشت و بازنشستگی و اداره تامین اجتماعی است. برای اطلاعات بیشتر در مورد این مطالعه، از جمله اطلاعات مربوط به روش رضایت، به اولسون (1996, 1999) .
فرآیند ترکیب بسیاری از منابع سوابق اداری به یک فایل اطلاعات اصلی - فرایندی که کاتالیست ها استخدام می کنند - در ادارات آماری برخی از دولت های ملی رایج است. دو پژوهشگر آمار سوئد یک کتاب مفصل درباره این موضوع نوشته اند (Wallgren and Wallgren 2007) . برای نمونه ای از این رویکرد در یک ناحیه ای در ایالت متحده (Olmstead County، مینه سوتا، خانه درمانگاه Mayo)، Sauver et al. (2011) . برای اطلاعات بیشتر در مورد اشتباهاتی که ممکن است در سوابق اداری ظاهر شوند، به Groen (2012) .
راه دیگری که محققان می توانند از منابع اطلاعاتی بزرگ در تحقیقات تحقیق استفاده کنند، به عنوان یک چارچوب نمونه گیری برای افراد با ویژگی های خاص است. متاسفانه این روش می تواند سوالات مربوط به حریم خصوصی (Beskow, Sandler, and Weinberger 2006) .
با توجه به درخواست های تقویت شده، این رویکرد جدید نیست، زیرا ممکن است از چگونگی آن توضیح داده شود. این ارتباطات عمیق به سه منطقه بزرگ در آمار است: پس از طبقه بندی مبتنی بر مدل (Little 1993) ، محاسبه (Rubin 2004) و برآورد منطقه کوچک (Rao and Molina 2015) . این نیز مربوط به استفاده از متغیرهای جایگزین در تحقیقات پزشکی (Pepe 1992) .
تخمین هزینه و زمان در Blumenstock, Cadamuro, and On (2015) بیشتر به هزینه متغیر - هزینه یک نظرسنجی بیشتر اشاره دارد و شامل هزینه های ثابت مانند هزینه تمیز کردن و پردازش اطلاعات تماس نیست. به طور کلی، تقاضای تقویت احتمالا دارای هزینه های ثابت بالا و هزینه های متغیر کم مشابه شبیه به آزمایشات دیجیتال است (نگاه کنید به فصل 4). برای اطلاعات بیشتر در مورد نظرسنجی مبتنی بر تلفن همراه در کشورهای در حال توسعه، به Dabalen et al. (2016) .
برای ایده هایی که در مورد چگونگی انجام کارهای پیچیده ای بهتر از من می پرسند، من توصیه می کنم بیشتر درباره تقلب چندگانه یاد بگیرم (Rubin 2004) . همچنین اگر محققانی که در حال تکثیر هستند و از صفات فردی مراقبت می کنند، به جای شمارش جمع، مراقب هستند، اما رویکردهای King and Lu (2008) و Hopkins and King (2010) ممکن است مفید باشد. در نهایت، برای اطلاعات بیشتر در مورد روش های یادگیری ماشین در Blumenstock, Cadamuro, and On (2015) ، James et al. (2013) (مقدماتی) یا Hastie, Tibshirani, and Friedman (2009) (پیشرفته تر).
یکی از مسایل اخلاقی در مورد درخواست های تقویت شده این است که می توان آن را به Kosinski, Stillwell, and Graepel (2013) ویژگی های حساس که مردم ممکن است انتخاب کنند در یک نظرسنجی، به عنوان شرح داده شده در Kosinski, Stillwell, and Graepel (2013) .