این بخش طراحی شده است به عنوان یک مرجع استفاده می شود، به جای به عنوان یک روایت خوانده شود.
بسیاری از موضوعات در این فصل نیز در آدرس ریاست جمهوری اخیر در انجمن آمریکایی تحقیقات افکار عمومی (AAPOR)، مانند تکرار شده است Dillman (2002) ، Newport (2011) ، Santos (2014) ، و Link (2015) .
برای پس زمینه تاریخی اطلاعات بیشتر در مورد توسعه پژوهش و تحقیق، و Smith (1976) و Converse (1987) . برای اطلاعات بیشتر در این ایده از سه دوره از تحقیقات پیمایشی، و Groves (2011) و Dillman, Smyth, and Christian (2008) (که می شکند تا سه دوره کمی متفاوت).
اوج داخل گذار از اولین به دوران دوم در تحقیقات پیمایشی است Groves and Kahn (1979) ، که نشانی از یک مقایسه دقیق سر به سر بین یک چهره به چهره و نظرسنجی تلفنی. Brick and Tucker (2007) تماس به نظر می رسد در توسعه تاریخی روش های نمونه گیری رقم تصادفی.
برای نحوه پژوهش و تحقیق در گذشته در پاسخ به تغییرات در جامعه تغییر کرده است، و Tourangeau (2004) ، Mitofsky (1989) ، و Couper (2011) .
یادگیری در مورد حالات درونی با پرسیدن سوال می تواند مشکل ساز به دلیل گاهی اوقات پاسخ دهندگان ها هم از حالات درونی خود آگاه نیست. به عنوان مثال، Nisbett and Wilson (1977) یک مقاله فوق العاده با عنوان خاطره انگیز: "گفتن بیشتر از ما می توانید مطمئن شوید: گزارش کلامی در فرایندهای ذهنی" در مقاله نویسندگان نتیجه گیری: "افراد گاهی اوقات (الف) غافل وجود یک محرک که مهمتر تحت تاثیر یک پاسخ، (ب) از وجود پاسخ، و (ج) غافل که محرک پاسخ را تحت تاثیر قرار بی اطلاع باشند. "
برای استدلال که محققان باید رفتار مشاهده شده به رفتار یا نگرش گزارش ترجیح می دهند، و Baumeister, Vohs, and Funder (2007) (روانشناسی) و Jerolmack and Khan (2014) و پاسخ (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (جامعه شناسی). تفاوت بین درخواست و مشاهده نیز در اقتصاد، که در آن محققان در مورد تنظیمات اعلام کرد و نشان داد صحبت مطرح می شود. برای مثال، یک محقق می تواند پاسخ دهندگان که آیا آنها ترجیح می دهند خوردن بستنی و یا رفتن به باشگاه ورزشی (تنظیمات ذکر شده است) بپرسید و یا پژوهش می تواند مشاهده چگونه اغلب مردم خوردن بستنی و رفتن به سالن ورزش (تنظیمات نشان داد). است شک و تردید عمیق از انواع خاصی از داده ترجیحات اظهار داشت: در اقتصاد وجود دارد (Hausman 2012) .
تم اصلی از این بحث این است که رفتار گزارش شده است همیشه دقیق نیست. اما، رفتار به طور خودکار ثبت ممکن است دقیق، ممکن است در یک نمونه از علاقه جمع آوری نشده است، و ممکن است به محققان در دسترس است. بنابراین، در برخی شرایط، من فکر می کنم که رفتار گزارش شده می تواند مفید باشد. علاوه بر این، موضوع اصلی دوم از این بحث این است که گزارش در مورد احساسات، دانش، انتظارات، و نظرات همیشه دقیق نیست. اما، اگر اطلاعات در مورد این کشورها درونی توسط مورد نیاز محققان، هم برای کمک به توضیح برخی از رفتار و یا به عنوان چیزی که به توضیح-بعد آن را درخواست تواند مناسب باشد.
برای درمان طول کتاب در خطا بررسی کل، و Groves et al. (2009) و یا Weisberg (2005) . برای یک تاریخ توسعه خطا بررسی کل، و Groves and Lyberg (2010) .
پژوهشی برنامه: از لحاظ نمایندگی، عالی برای معرفی مسائل مربوط به عدم پاسخ و تعصب عدم پاسخ گزارش شورای ملی تحقیقات در Nonresponse در نظرسنجی علوم اجتماعی است (2013) . یکی دیگر از کلی مفید است ارائه (Groves 2006) . همچنین، کل مسائل خاص از مجله آمار رسمی، افکار عمومی فصلنامه، و سالانه آکادمی آمریکایی علوم سیاسی و اجتماعی در مورد این موضوع از عدم پاسخ منتشر شده است. در نهایت، در واقع بسیاری از روش های مختلف محاسبه نرخ پاسخ وجود دارد. این روش ها به طور مفصل در گزارش انجمن آمریکایی افکار عمومی محققان (AAPOR) توصیف (Public Opinion Researchers} 2015) .
1936 ادبی خلاصه نظرسنجی شده است در جزئیات مورد مطالعه (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . آن را نیز به عنوان یک مثل را برای هشدار در برابر جمع آوری داده ها اتفاقی استفاده (Gayo-Avello 2011) . در سال 1936، جورج گالوپ از فرم پیچیده تر از نمونه برداری، و قادر به تولید برآوردهای دقیق تر با یک نمونه بسیار کوچکتر بود. موفقیت گالوپ بر خلاصه ادبی یک نقطه عطف توسعه پژوهش بررسی شد (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .
از لحاظ اندازه گیری، یک منبع بزرگ برای اولین بار در پرسشنامه طراحی است Bradburn, Sudman, and Wansink (2004) . برای درمان پیشرفته تر به طور خاص در مورد مسائل نگرش متمرکز، و Schuman and Presser (1996) . بیشتر در سوال قبل از تست در دسترس است Presser and Blair (1994) ، Presser et al. (2004) ، و فصل 8 از Groves et al. (2009) .
درمان کلاسیک، کتاب طول از تجارت بین هزینه های بررسی و خطاهای بررسی است Groves (2004) .
کلاسیک درمان کتاب طول نمونه برداری احتمال استاندارد و برآورد می Lohr (2009) (مقدماتی بیشتر) و Särndal, Swensson, and Wretman (2003) (پیشرفته تر). درمان کتاب طول کلاسیک از روش های پس طبقه بندی و مرتبط است Särndal and Lundström (2005) . در برخی از تنظیمات عصر دیجیتال، محققان می دانند بسیار کمی در مورد غیر از پاسخ دهندگان، که در گذشته درست بود اغلب نیست. اشکال مختلف از اصلاح فاقد پاسخ ممکن است زمانی که محققان اطلاعات در مورد غیر پاسخ دهندگان (Kalton and Flores-Cervantes 2003; Smith 2011) .
مطالعه ایکس باکس از Wang et al. (2015) با استفاده از یک تکنیک به نام رگرسیون چند سطحی و پس از طبقه بندی (MRP، گاهی به نام "آقا P") که اجازه می دهد تا محققان به منظور برآورد سلول بدان معناست که حتی زمانی که بسیاری از سلول های بسیاری وجود دارد. اگرچه بحث در مورد کیفیت برآورد از این روش وجود دارد، آن را مانند یک منطقه امیدوار به کشف به نظر می رسد. این روش برای اولین بار در مورد استفاده قرار گرفت Park, Gelman, and Bafumi (2004) ، و استفاده و بحث های بعدی بوده است (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . برای اطلاعات بیشتر در ارتباط بین وزن فردی و وزن مبتنی بر سلول را ببینید Gelman (2007) .
برای روش های دیگر به نظرسنجی وب وزن، و Schonlau et al. (2009) ، Valliant and Dever (2011) ، و Bethlehem (2010) .
تطبیق نمونه با پیشنهاد شد Rivers (2007) . Bethlehem (2015) استدلال می کند که عملکرد مطابقت نمونه در واقع شبیه به روش های دیگر نمونه (به عنوان مثال، نمونه گیری طبقه ای) و سایر شیوه های تنظیم (به عنوان مثال، پس از راه اندازی) خواهد بود. برای اطلاعات بیشتر در پانل آنلاین، و Callegaro et al. (2014) .
گاهی اوقات محققان دریافته اند که نمونه احتمال و نمونه های غیر احتمال عملکرد برآورد با کیفیت مشابه (Ansolabehere and Schaffner 2014) ، اما مقایسه دیگر پیدا کرده اند که نمونه های غیر احتمال آن بدتر (Malhotra and Krosnick 2007; Yeager et al. 2011) . یکی از دلایل ممکن برای این تفاوت ها این است که نمونه های غیر احتمال در طول زمان بهبود یافته است. برای مشاهده بدبینانه تر از روش های نمونه گیری غیر احتمالی دیدن نیروی کار AAPOR در نمونه گیری غیر احتمالی (Baker et al. 2013) ، و من هم خواندن تفسیر که به شرح زیر خلاصه گزارش توصیه.
برای یک متاآنالیز در اثر وزن برای کاهش تعصب در نمونه های غیر احتمال، جدول 2.4 را در Tourangeau, Conrad, and Couper (2013) ، که منجر نویسندگان به این نتیجه "تنظیمات به نظر می رسد اصلاحات مفید است اما جایزالخطا. . . "
Conrad and Schober (2008) فراهم می کند حجم ویرایش عنوان تجسم مصاحبه بررسی آینده، و آن را به آدرس بسیاری از موضوعات در این بخش. Couper (2011) آدرس تم مشابه، و Schober et al. (2015) ارائه می دهد یک مثال خوب از چگونگی روش های جمع آوری داده هایی را که به یک محیط جدید طراحی می توانید در داده های با کیفیت بالاتر منجر شود.
به عنوان مثال جالب دیگری از استفاده از فیس بوک برنامه برای بررسی های علوم اجتماعی، و Bail (2015) .
برای مشاوره در ساخت نظر سنجی یک تجربه لذت بخش و با ارزش برای شرکت کنندگان، کار بر روی متناسب روش طراحی را ببینید (Dillman, Smyth, and Christian 2014) .
Stone et al. (2007) ارائه می دهد درمان طول کتاب ارزیابی لحظه زیست محیطی و روش های مربوط.
Judson (2007) فرآیند ترکیب نقشه ها و داده های اداری به عنوان "یکپارچه سازی اطلاعات،" مورد بحث برخی از مزایای استفاده از این روش، و برخی از نمونه ارائه می دهد.
راه دیگری که محققان می توانند آثار دیجیتال و داده های اداری استفاده از یک چارچوب نمونه برای افراد با ویژگی های خاص است. با این حال، دسترسی به این پرونده مورد استفاده قرار گیرد یک قاب نمونه همچنین می توانید ایجاد سوالات مربوط به حریم خصوصی (Beskow, Sandler, and Weinberger 2006) .
با توجه به درخواست تقویت شده، این روش این است به عنوان جدید آن را به عنوان ممکن است از چگونه من آن را شرح داده ایم ظاهر می شود. این رویکرد، متصل عمیق به سه حوزه بزرگ در مبتنی بر آمار مدل پس از طبقه بندی (Little 1993) ، نسبت (Rubin 2004) ، و برآورد منطقه کوچک (Rao and Molina 2015) . این نیز به استفاده از متغیرهای جانشین در پژوهش های پزشکی مربوط (Pepe 1992) .
علاوه بر مسائل اخلاقی در مورد دسترسی به اطلاعات ردیابی دیجیتال، درخواست تقویت نیز می تواند مورد استفاده قرار گیرد برای پی بردن صفات حساس که مردم ممکن است به فاش در یک بررسی را انتخاب کنید (Kosinski, Stillwell, and Graepel 2013) .
هزینه و زمان تخمین در Blumenstock, Cadamuro, and On (2015) مانند هزینه برای تمیز کردن و پردازش داده های پاسخ مراجعه کنید بیشتر به متغیر هزینه هزینه یک هزینه بررسی و اضافی را شامل نمی شود ثابت شده است. به طور کلی، درخواست تقویت احتمالا باید هزینه های ثابت بالا و هزینه های متغیر کم به آزمایش های دیجیتال (فصل 4). جزئیات بیشتر در مورد داده های مورد استفاده در Blumenstock, Cadamuro, and On (2015) مقاله در می Blumenstock and Eagle (2010) و Blumenstock and Eagle (2012) . روش از چند imputuation (Rubin 2004) ممکن است عدم قطعیت در برآورد ضبط از درخواست تقویت کمک کند. اگر محققان انجام تقویت درخواست فقط در مورد مراقبت از شمارش دانه ها، به جای صفات در سطح فردی، و سپس این روش در King and Lu (2008) و Hopkins and King (2010) ممکن است مفید باشد. برای اطلاعات بیشتر در مورد روش های یادگیری ماشین در Blumenstock, Cadamuro, and On (2015) ، و James et al. (2013) (مقدماتی بیشتر) و یا Hastie, Tibshirani, and Friedman (2009) (پیشرفته تر). یکی دیگر از محبوب کتاب درسی یادگیری ماشین است Murphy (2012) .
با توجه به درخواست غنی شده، نتایج را در آنسولابهره و هرش (2012) لولا در دو مرحله: 1) توانایی کاتالیست [ii] به ترکیب بسیاری از منابع داده متفاوت برای تولید یک استاد فایل داده های دقیق و 2) توانایی کاتالیست [ii] به لینک داده های نظر سنجی به فایل داده استاد آن است. بنابراین، آنسولابهره و هرش دقت بررسی هر یک از این مراحل است.
برای ایجاد فایل داده کارشناسی ارشد، کاتالیست [ii ترکیب و هماهنگ اطلاعات از منابع مختلف از جمله: سوابق رای گیری های متعدد عکس های فوری از هر ایالت، داده ها را از تغییر ملی اداره پست از آدرس رجیستری، و داده ها از دیگر ارائه دهندگان تجاری نا مشخص. جزئیات اسفبار در مورد چگونه این همه تمیز کردن و ادغام اتفاق می افتد که فراتر از محدوده این کتاب می باشد، اما این فرایند، هر چقدر دقیق، خطاهای در منابع داده های اصلی انتشار و خطاهای معرفی. اگر چه کاتالیست [ii حاضر به بحث در پردازش داده ها و ارائه برخی از داده های خام آن بود، آن را به سادگی غیر ممکن برای محققان به بررسی کل خط لوله داده کاتالیست [ii]. در عوض، محققان در یک وضعیت که در آن فایل داده کاتالیست [ii] برخی از ناشناخته، و شاید ادراک و فهم، مقدار خطا داشتند. این یک نگرانی جدی است، چون یک منتقد ممکن است حدس و گمان که تفاوت های بسیاری بین گزارش بررسی CCES و رفتار در فایل داده های کارشناسی ارشد کاتالیست [ii توسط خطا در فایل داده های کارشناسی ارشد ایجاد می شود، نه با گزارشدهی نادرست توسط پاسخ دهندگان.
آنسولابهره و هرش دو روش متفاوت به پرداختن به نگرانی کیفیت داده در زمان. حزب اول، علاوه بر مقایسه رای خود گزارش به رای دادن در فایل اصلی کاتالیست [ii]، محققان همچنین در مقایسه خود گزارش، نژاد، وضعیت ثبت نام رای دهندگان (به عنوان مثال، ثبت نام یا نه ثبت نام) و روش رای گیری (به عنوان مثال، در فرد، غایب رای، و غیره) به آن ارزش پیدا شده در پایگاه داده های کاتالیست [ii]. برای این چهار متغیرهای جمعیت شناختی، محققان سطوح بسیار بالاتر از توافق بین گزارش بررسی و داده ها در فایل های کارشناسی ارشد کاتالیست [ii] از برای رای دادن پیدا شده است. بنابراین، کاتالیست [ii فایل استاد داده به نظر می رسد اطلاعات با کیفیت بالا برای صفات غیر از رای گیری، نشان می دهد که آن را از کیفیت پایین کلی نیست. دوم، در بخش با استفاده از داده کاتالیست [ii آنسولابهره و هرش توسعه سه اندازه مختلف از کیفیت سوابق رای گیری شهرستان، و آنها نشان داد که میزان تخمینی بیش از گزارش از رای گیری اساسا به هر یک از این اقدامات با کیفیت داده نامربوط بود، یافته ای که نشان می دهد که نرخ بالای بیش از گزارش که توسط شهرستان با کیفیت داده ها غیر منتظره ای کم رانده است.
با توجه به ایجاد این استاد فایل رای گیری، منبع دوم اشتباهات بالقوه است مرتبط کردن سوابق بررسی به آن است. برای مثال، اگر این ارتباط است که به اشتباه انجام آن می تواند به بیش از برآورد تفاوت بین گزارش و تایید رفتار انتخاباتی منجر (Neter, Maynes, and Ramanathan 1965) . اگر هر فرد با ثبات، شناسه منحصر به فرد که در هر دو منابع داده بود، پس از آن ارتباط خواهد بود و بی اهمیت. در کشورهای دیگر ایالات متحده و اغلب، با این حال، هیچ شناسه جهانی وجود دارد. علاوه بر این، حتی اگر وجود دارد یک شناسه مردم احتمالا مردد به ارائه آن به بررسی محققان باشد. بنابراین، کاتالیست [ii به حال به انجام پیوند با استفاده از شناسههای ناقص، در این مورد چهار قطعه از اطلاعات در مورد هر مخاطب: نام، جنس، سال تولد، و آدرس خانه. به عنوان مثال، کاتالیست [ii حال به تصمیم گیری اگر همخونه J سیمپسون در CCES همان شخص به عنوان هومر جی سیمپسون در فایل اصلی داده های خود بود. در عمل، تطبیق یک فرایند دشوار و کثیف است، و، به مسائل برای محققان بدتر، کاتالیست [ii روش تطبیق آن نظر گرفته می شود اختصاصی است.
به منظور اعتبار الگوریتم تطبیق، آنها در دو چالش متکی بود. شرکت MITRE: اول، کاتالیست [ii] در یک رقابت تطبیق است که توسط یک سازمان مستقل، شخص ثالث اجرا شد شرکت کردند. MITRE ارائه همه شرکت کنندگان دو فایل داده پر سر و صدا به همسان باشد، و تیم های مختلف به رقابت برای بازگشت به MITRE بهترین تطبیق است. از آنجا که MITRE خود می دانست که تطبیق درست آنها تونست تیم بودند. از 40 شرکت که به رقابت پرداختند، کاتالیست [ii] در مقام دوم قرار گرفتند. این نوع از مستقل، ارزیابی های شخص ثالث از تکنولوژی انحصاری بسیار نادر و فوق العاده ارزشمند است. باید آن را به ما اطمینان میدهیم که روش تطبیق کاتالیست [ii اساسا در دولت از هنر است. اما دولت از هنر، به اندازه کافی خوب است؟ علاوه بر این رقابت تطبیق، آنسولابهره و هرش چالش تطبیق خود را برای کاتالیست [ii] ایجاد شده است. از پروژه های قبلی، آنسولابهره و هرش سوابق رای دهندگان از فلوریدا جمع آوری کرده بود. به برخی از این پرونده با برخی از زمینه های خود را ویرایش به کاتالیست [ii] و پس از آن در مقایسه گزارش کاتالیست [ii] از این زمینه ها به ارزش های واقعی خود ارائه شده است. خوشبختانه، گزارش کاتالیست [ii] و نزدیک به ارزش نکردن بودند، نشان می دهد که کاتالیست [ii تواند سوابق رای دهندگان جزئی بر روی فایل اصلی داده های خود را مطابقت. این دو چالش، یک به یک شخص ثالث و یک به آنسولابهره و هرش، ما اعتماد به نفس بیشتر در مطابق با الگوریتم های کاتالیست [ii] را، حتی اگر ما می توانیم بررسی نیست اجرای دقیق خود را به خودمان.
بسیاری از تلاش های قبلی به اعتبار رای گیری وجود دارد. برای نمای کلی که ادبیات، و Belli et al. (1999) ، Berent, Krosnick, and Lupia (2011) ، Ansolabehere and Hersh (2012) ، و Hanmer, Banks, and White (2014) .
این مهم است که توجه داشته باشید که اگر چه در این مورد محققان با کیفیت از داده ها را از کاتالیست [ii تشویق شدند، ارزیابی های دیگر از فروشندگان تجاری کمتر مشتاق است. محققان کیفیت پایین پیدا کرده اند که داده ها را از یک بررسی به یک مصرف کننده-فایل را از بازاریابی گروه سیستم (که خود هم داده ها را از سه ارائه دهنده با هم ادغام شدند: Acxiom، اکسپرین، و InfoUSA) (Pasek et al. 2014) . این است که، فایل داده بود بررسی پاسخ که محققان انتظار می رود که درست مطابقت ندارد، فایل داده بود از دست رفته اطلاعات برای تعداد زیادی از سوالات، و الگوی داده از دست رفته به ارزش بررسی گزارش شده و به عبارت دیگر داده های گم شده سیستماتیک بود ارتباط داشت ( ، تصادفی نیست).
برای اطلاعات بیشتر در ارتباط رکورد بین نقشه ها و داده های اداری، و Sakshaug and Kreuter (2012) و Schnell (2013) . برای اطلاعات بیشتر در ارتباط رکورد به طور کلی، و Dunn (1946) و Fellegi and Sunter (1969) (تاریخی) و Larsen and Winkler (2014) (مدرن). روش های مشابه شده در علوم کامپیوتر تحت نام مانند deduplication داده، شناسایی به عنوان مثال، نام تطبیق، تشخیص تکراری توسعه نیز، و تکراری تشخیص رکورد (Elmagarmid, Ipeirotis, and Verykios 2007) . همچنین حریم خصوصی حفظ روش برای ضبط ارتباط که انتقال اطلاعات شناسایی شخصی نیاز نیست وجود دارد (Schnell 2013) . محققان در فیس بوک توسعه یک روش به probabilisticsly سوابق خود را به رای دادن پیوند (Jones et al. 2013) ؛ این ارتباط برای ارزیابی یک آزمایش است که من شما را در مورد در فصل 4 به انجام شد (Bond et al. 2012) .
نمونه دیگری از ارتباط یک بررسی های اجتماعی در مقیاس بزرگ به سوابق اداری دولت از سلامت و بازنشستگی و اداره تامین اجتماعی می آید. برای اطلاعات بیشتر در این مطالعه، از جمله اطلاعات در مورد روش رضایت، و Olson (1996) و Olson (1999) .
فرآیند ترکیب منابع بسیاری از سوابق اداری به یک استاد فایل داده-روند که کاتالیست [ii] در دفاتر آماری برخی از دولت های ملی مشترک کارکنان است. دو محقق از آمار سوئد یک کتاب مفصل در مورد این موضوع نوشته شده است (Wallgren and Wallgren 2007) . برای یک مثال از این روش در شهرستان تنها در ایالات متحده (اولمستد، مینهسوتا، خانه از کلینیک مایو)، و Sauver et al. (2011) . برای اطلاعات بیشتر در خطا است که می تواند در پرونده اداری به نظر می رسد، و Groen (2012) .