نمایندگی است در مورد ساخت استنتاج از پاسخ دهندگان خود را به جامعه هدف خود را.
به منظور درک این نوع از اشتباهات است که می تواند اتفاق می افتد زمانی استنتاج از پاسخ دهندگان به جمعیت بزرگتر، اجازه دهید این نظرسنجی نی ادبی خلاصه که سعی در پیش بینی نتیجه در سال 1936 انتخابات ریاست جمهوری آمریکا در نظر بگیرند. با وجود آن که بیش از 75 سال پیش بود، این افتضاح هنوز درس مهم برای تدریس محققان امروز.
ادبی خلاصه یک مجله مورد علاقه عمومی محبوب بود، و شروع در سال 1920 آنها شروع در حال اجرا نظر سنجی نی برای پیش بینی نتایج انتخابات ریاست جمهوری. به این پیش بینی آنها برگه های رای به تعداد زیادی از مردم ارسال، و سپس به سادگی چوب خط حساب کردن تا برگه های رای که بازگردانده شد. ادبی خلاصه با افتخار گزارش داد که برگه های رای آنها دریافت شد نه "فله ای، تنظیم، و نه تفسیر شده است." این روش به درستی پیش بینی برنده انتخابات در سال 1920، 1924، 1928 و 1932. در سال 1936، در میان رکود بزرگ، ادبی خلاصه برگه های رای به 10 میلیون نفر، که نام عمدتا از دایرکتوری تلفن و سوابق ثبت نام خودرو آمد ارسال می شود. در اینجا چگونه آنها روش خود شرح می دهد:
"حرکت دستگاه صاف در حال اجرا خلاصه با دقت سریع سی سال تجربه به منظور کاهش حدس و گمان به حقایق سخت است. . . .این هفته 500 قلم بیش از یک چهارم از یک میلیون آدرس یک روز خراشیده است. هر روز، در یک اتاق بزرگ بالا-ribboned موتور چهارم خیابان، در نیویورک، 400 کارگر ماهرانه اسلاید از یک میلیون قطعه از ماده به اندازه کافی چاپ شده به هموار چهل شهرستان بلوک-به پوشاند خطاب [کذا]. هر ساعت، در خود دایجست اداره پست پست، سه قروچه ماشین اندازه گیری پستی مهر و موم شده و oblongs سفید مهر؛ کارمندان پستی ماهر آنها را به امده mailsacks بدبختانه؛ کامیون ناوگان هضم سرعت آنها را به اکسپرس-قطار. . . هفته بعد، اولین پاسخ از این ده میلیون جزر و مد های دریافتی از رای مشخص شده آغاز خواهد شد، به سه بررسی می شود، تایید، پنج بار متقابل طبقه بندی شده و بالغ بر. هنگامی که آخرین رقم totted شده و بررسی می شود، اگر تجربه گذشته یک معیار است، این کشور خواهد به در کسری از 1 درصد آرای مردمی واقعی چهل میلیون [رای دهندگان] می دانم. "(آگوست 22، 1936)
fetishization خلاصه از اندازه به هر "داده بزرگ" محقق امروز فورا تشخیص است. از 10 میلیون رای توزیع شده، شگفت انگیز 2.4 میلیون برگه های رای بازگشت که شد تقریبا 1000 برابر بزرگتر از نظر سنجی سیاسی مدرن است. از این 2.4 میلیون پاسخ دهندگان حکم روشن بود: ادبی خلاصه پیش بینی کرد که رقیب آلف لندون بود به شکست وقت فرانکلین روزولت. اما، در واقع، در مقابل دقیق اتفاق افتاده است. روزولت Landon در یک زمین لغزش را شکست داد. چگونه می تواند ادبی خلاصه به اشتباه با داده های بسیار؟ درک مدرن ما از نمونه را می سازد خطاهای ادبی دایجست روشن و کمک می کند تا به ما جلوگیری از ساخت اشتباهات مشابه در آینده است.
فکر به وضوح در مورد نمونه ما را ملزم به در نظر گرفتن چهار گروه مختلف از مردم (شکل 3.1). اولین گروه از افراد جامعه هدف است. این گروه که پژوهش به عنوان جمعیت مورد علاقه تعریف می کند. در مورد آثار ادبی خلاصه جمعیت هدف رای دهندگان در انتخابات ریاست جمهوری 1936 بود. پس از تصمیم گیری در جمعیت هدف، محقق بعدی نیاز به توسعه یک لیست از افرادی است که می تواند برای نمونه برداری استفاده می شود. این لیست به یک قاب نمونه نامیده می شود و جمعیت در چارچوب نمونه است جمعیت قاب نامیده می شود. در مورد آثار ادبی خلاصه جمعیت قاب 10 میلیون نفر که نام آنها عمدتا از دایرکتوری تلفن و سوابق ثبت نام خودرو آمد. در حالت ایده آل، جمعیت هدف و جمعیت قاب خواهد دقیقا همان است، اما در عمل این است که اغلب چنین نیست. تفاوت بین جمعیت هدف و جمعیت قاب خطا پوشش نامیده می شود. خطا پوشش نمی کند، به خودی خود تضمین مشکلات. اما، اگر مردم در جامعه قاب سیستماتیک از مردم در توده قاب وجود خواهد داشت تعصب پوشش. خطا پوشش برای اولین بار از نقص عمده با نظرسنجی ادبی خلاصه بود. آنها می خواستند در مورد رای دهندگان که یادگیری خود هدف جمعیت اما آنها یک چارچوب نمونه عمدتا از دایرکتوری تلفن و ثبت خودرو، منابع ساخته شده است که بیش از حد مطرح ثروتمند آمریکایی که به احتمال زیاد به حمایت آلف لندون (به یاد بیاورید که هر دو از این فن آوری بودند، که امروز رایج است، در زمان و که ایالات متحده در میان رکود بزرگ بود) نسبتا جدید بودند.
پس از تعریف جمعیت قاب، گام بعدی این است برای یک محقق به انتخاب جامعه نمونه؛ این افراد کسانی هستند که پژوهشگر تلاش خواهد کرد به مصاحبه است. اگر نمونه دارای ویژگی های مختلف نسبت به جمعیت قاب، پس ما می توانیم خطای نمونه گیری را معرفی نماید. این نوع از خطا کمی در حاشیه خطا که معمولا همراه برآورد است. در مورد شکست ادبی خلاصه، وجود دارد در واقع هیچ نمونه بود. آنها اقدام به تماس با هر کس که در جمعیت قاب. حتی اگر هیچ خطای نمونه گیری وجود دارد، هنوز هم به وضوح خطا وجود دارد. این توضیح می دهد که حاشیه از اشتباهات که معمولا با برآورد از بررسی های گزارش معمولا گمراه کننده کوچک؛ آنها همه منابع خطا شامل نمی شود.
در نهایت، یک محقق تلاش برای مصاحبه هر کس که در جامعه نمونه. افرادی که در موفقیت مصاحبه می پاسخ دهندگان به نام. در حالت ایده آل، جمعیت نمونه و از پاسخ دهندگان می شود دقیقا همان است، اما در عمل غیر پاسخ وجود دارد. این است که، افرادی که در نمونه انتخاب شده برای شرکت رد. اگر افرادی که پاسخ متفاوت از کسانی که پاسخ نمی دهند، پس از آن وجود دارد می تواند تعصب عدم پاسخ. تعصب عدم پاسخ دومین مشکل اصلی با نظرسنجی ادبی خلاصه بود. فقط 24 درصد از افرادی که رای دریافت پاسخ، و معلوم شد که افرادی که لاندن پشتیبانی احتمال زیاد برای پاسخ بودند.
فراتر از فقط به عنوان یک نمونه به معرفی ایده های نمایندگی، نظرسنجی ادبی خلاصه یک مثل تکراری است، هشدار محققان درباره خطرات نمونه های تصادفی. متاسفانه، من فکر می کنم که درسی است که بسیاری از مردم از این داستان جلب یک اشتباه است. اخلاقی رایج ترین داستان این است که محققان می توانید هر چیزی را از نمونه های غیر احتمال (به عنوان مثال، نمونه بدون قوانین مبتنی بر احتمال سخت برای انتخاب شرکت کنندگان) یاد بگیرند. اما، که من بعدا در این فصل را نشان می دهد، که کاملا درست نیست. در عوض، من فکر می کنم در واقع دو اخلاق به این داستان وجود دارد؛ اخلاق که به عنوان درست است امروز به عنوان آنها در سال 1936. برای اولین بار بود، یک مقدار زیادی از اطلاعات جمع آوری شده را به صورت اتفاقی یک تخمین خوب را تضمین نمی کند. دوم، محققان باید به حساب چگونه اطلاعات خود را هنگامی که آنها در حال ساخت برآورد از آن جمع آوری شد. به عبارت دیگر، به دلیل فرآیند جمع آوری داده در این نظرسنجی ادبی خلاصه سیستماتیک به سمت برخی از پاسخ دهندگان منحرف شده، محققان نیاز به استفاده از فرآیند برآورد پیچیده تر است که وزن برخی از پاسخ دهندگان بیش از دیگران است. بعدا در این فصل، من به شما یک وزن مانند روش-پس از طبقه بندی، که می تواند شما را قادر به ایجاد تخمین بهتر با نمونه های غیر احتمال را نشان می دهد.