Non-ehtimollik namunalari bilan, og'irliklari o'z zimmasiga namuna olish jarayoni oqibatida nomuta- qaytarib olishingiz mumkin.
tadqiqotchilar ehtimollik namunalari javob og'irlik Shu tarzda, ular ham non-ehtimoli namunalari javob og'irlik mumkin. Misol uchun, STM muqobil sifatida, siz ishsizlik tezligi taxmin qilish uchun bir so'rov uchun ishtirokchilarni jalb qilish veb-saytlar minglab banner e'lonlari joylashtirilgan tasavvur. Tabiiyki, siz namunadagi oddiy o'rtacha ishsizlik nisbati yaxshi smeta bo'lishini shubha bo'ladi. Agar ba'zi odamlar boshqalardan ko'ra siz so'rov bajarish ehtimoli ko'proq bo'ladi, deb o'ylayman, chunki sizning Skeptitsizm ehtimol. Misol uchun, Internetdagi ko'p vaqt sarflash yo'q odamlar sizning so'rov bajarish uchun kamroq.
Biz so'nggi bo'limda hududda ko'rib, ammo, biz bilsangiz namuna tanlab-sifatida qanday biz ehtimollik bilan, albatta, namunalar-keyin, biz namuna olish jarayoni oqibatida nomuta- qaytarib olishingiz mumkin. non-ehtimollik namunalari bilan ishlashda Afsuski, biz namuna tanlab qanday bilmayman. Lekin, biz namuna olish jarayoni haqida taxminlarni qilish va keyin bir xil tarzda og'irlik murojaat qilishingiz mumkin. Bu taxminlar to'g'ri bo'lsa, keyin tarozida namuna olish jarayoni oqibatida nomuta- bartaraf qiladi.
Misol uchun, siz kirish Ro'yxatdan reklama javoban, siz 100,000 respondentlarni ishga tasavvur. Biroq, bu 100.000 respondentlar Amerika kattalar oddiy tasodifiy namuna deb ishonmayman. Agar AQSh aholisining uchun respondentlarni solishtirish qachon Aslida, siz ba'zi davlatlar (masalan, Nyu-York) odamlar ba'zi davlatlar (masalan, Alyaska) dan-dan ziyod vakili va qavmdirlar yoshgacha vakili ekanligini topish. Shunday qilib, siz namunadagi ishsizlik darajasi maqsadli aholining ishsizlik nisbati yomon smeta bo'lishi mumkin.
namuna olish jarayonida sodir buzilish bartaraf qilish uchun bir yo'l, har bir kishi uchun og'irliklari tayinlash uchun emas; namunadagi (masalan, Alyaska) da yoshgacha vakili davlatlar odamlarga (masalan, Nyu-York) namuna va oliy og'irliklari ichida-vakili davlatlar odamlarga kam og'irliklari. Batafsil ravishda, har bir javobgarning uchun vazn AQSh aholisining o'z tarqalgani uchun namuna nisbatan o'z tarqalishi bilan bog'liq. Bu tarozida tartibi post-tabaqalanishi deb ataladi, va Rhode ho'l bo'lib ketdi respondentlar Kaliforniya respondentlarning kam og'irlik berildi qaerda tortish g'oyasi bo'lim 3.4.1 masalan yodingizga kerak. Post-tabaqalanishi siz guruhga siz respondentlarni qo'yish va har bir guruhda maqsad aholining ulushini bilish etarli bilaman talab qiladi.
ehtimollik namunadagi va nooziq-ehtimollik namunadagi og'irlik Shu matematik (texnik ilovaga qarang) bo'lsa-da, ular turli vaziyatlarda yaxshi ishlaydi. tadqiqotchi mukammal ehtimoli namunasi (ya'ni, hech qanday xato qamrov va hech bo'lmagan javob) mavjud bo'lsa, u holda tarozida barcha hollarda barcha belgilar bo'yicha xolis smetasini ishlab chiqaradi. ehtimollik namunalarini himoyachilari ularni shunday jozibador topish nima uchun bu kuchli nazariy kafolati hisoblanadi. Boshqa tomondan, og'irlik nodavlat ehtimoli namunalari javob tamoyillarni har bir guruhda har bir kishi uchun bir xil bo'lsa, barcha belgilar bo'yicha xolis smetasini faqat ishlab chiqaradi. Boshqa so'zlar bilan aytganda, Nyu-Yorkda har bir ishtirokchi va Alyaska har bir kishi shu qadar ishtirok va shu ehtimoli bor shu ehtimoli bo'lsa, xolis smetasini ishlab chiqaradi post-tabakalaşmaya foydalanib, bizning masalan qaytib fikr. Bu taxmin bir hil-javob-afzalliklariga-doirasida-guruh gumonga deb ataladi, va post-tabaqalanishi bo'lmagan ehtimollik namunalari bilan ham ishlaydi, agar u bilmagan muhim ahamiyat kasb etadi.
Afsuski, bizning misolda, bir hil-javob-afzalliklariga-doirasida-guruhlar taxmin to'g'ri bo'lishi dargumon. Ya'ni, Alyaska har bir kishi sizning so'rov bo'lgan shu ehtimoli bor, deb dargumon. Lekin, u ko'proq istiqbolli ko'rinadi qilish qaysi barcha post-tabaqalanishi haqida yodda tutish uch muhim nuqtalari bor.
Birinchidan, bir hil-javob-afzalliklariga-doirasida-guruhlar taxmin guruhlari soni oshishi bilan, yana mantiqqa zid bo'ladi. Va, tadqiqotchilar faqat bitta geografik o'lchov asosida guruhlari bilan cheklangan emas. Misol uchun, biz davlat, yoshi, jinsi va ta'lim darajasiga asoslangan guruhlar yaratishingiz mumkin. Bu 18-29 guruh ichida bir hil javob tamoyillarni borligini yana aqlga tuyuladi, Alyaskada yashovchi barcha odamlar guruh ichida ortiq Alyaskada yashovchi ayol, kollej bitiruvchilari. Shunday qilib, post-tabaqalanishi ortadi uchun ishlatiladigan guruhlar soni, varsayımlar, undan oqilona bo'lib qo'llab-quvvatlash uchun zarur. bu e'tiborga olgan holda, u bir tadqiqotchilar post-tabaqalanishi uchun guruhlar katta qator yaratish istayman kabi ko'rinadi. ma'lumotlar sparsity: Lekin, guruhlar soni oshishi bilan, tadqiqotchilar bir xil muammo ichiga ishlatish. Har bir guruh odamlar faqat bir kichik soni mavjud bo'lsa, u holda hisob-kitoblarga ko'ra ko'proq noma'lum bo'lishi va ekstremal holatda hech respondentlarni bo'lgan bir guruh bor qaerda bo'ladi, keyin post-tabaqalanishi to'liq sovishini buzadi. homogeneous- javob-havas-doirasida-guruhlar taxmin sababi va har bir guruhda o'rtacha namuna registri uchun talab o'rtasidagi bu tabiiy keskinlik ikki yo'li bor. Bir yondashuv og'irliklari hisoblash uchun yanada murakkab statistik modeli ko'chib o'tishga va boshqa har bir guruhda o'rtacha namuna registri ta'minlash yordam beradi kattaroq, ko'proq turli namunasi, to'plash uchun. Men quyida batafsil tasvirlab beraman va, ba'zan tadqiqotchilar, ikkala nima.
non-ehtimollik namunalari post-tabaqalanishi bilan ishlash ikkinchi ko'rib chiqish ehtimoli namunalarini tahlil qachon bir hil-javob-havas-doirasida-guruhlar taxmin allaqachon tez-tez amalga oshiriladi, deb. bu taxmin amalda ehtimollik namunalari uchun zarur, deb sababi ehtimoli namunalari non-javob bor, deb, va yuqorida aytilgandek, non-javob sozlash uchun eng keng tarqalgan usul post-qatlamlarga hisoblanadi. Albatta, ko'p tadqiqotchilar, ma'lum bir taxmin siz ham buni kerak, degani emas, chunki qilish faqat. Lekin, bu amalda ehtimollik namunalariga non-ehtimoli namunalari qilayotganini, biz ham smetasini ishlab chiqarish maqsadida taxminlarga va yordamchi axborot bog'liq yodda tutish kerak degani emas. eng aniq sozlash, oddiygina xulosa qilish uchun hech qanday taxmin-bepul yondashuv bor.
Agar bizning misol ishsizlik, xususan-yilda bir matndan g'amxo'rlik Nihoyat, kursi-keyin bir hil-javob-havas-doirasida-guruhlar taxmin zaifroq bir shartni kerak. Xususan, siz faqat har bir guruh ichidagi javob istagi va ishsizlik darajasi o'rtasida hech qanday bog'liqlik yo'q, deb taxmin qilish kerak, hamma ham bir xil javob istagi bor, deb taxmin qilish kerak emas. Albatta, bu ham zaif holati ba'zi vaziyatlarda ushlab bo'lmaydi. Misol uchun, ixtiyoriy ish, albatta, amerikaliklar ulushini baholash tasavvur. Ko'ngilli ishni odamlar bir so'rovda bo'lishi rozi ehtimoli ko'proq bo'lsa, keyin tadqiqotchilar bo'ladi sistematik ustida-tahmin ular tomonidan empirik namoyish qilingan natija post-tabaqalanishi o'zgarishlar nima bo'lsa ham, ko'ngilli miqdorini Abraham, Helms, and Presser (2009) .
Yuqorida aytganimdek, non-ehtimollik namunalari, chunki so'rov tadqiqotlar erta kun eng noqulay muvaffaqiyatsizliklar ba'zi o'z rolini qismida, ijtimoiy olimlar tomonidan katta ishonchsizlik bilan qaralgan. Biz non-ehtimoli namunalari bilan kelgan qancha uzoqqa bir aniq misol, to'g'ri Amerika Xbox foydalanuvchilar bo'lmagan ehtimollik misol yordamida 2012 AQSh saylov natijasini qaytarib Wei dev, David Rotshild, Sharad Goel va Andrew Gelman tadqiqot hisoblanadi amerikaliklar -a qat'iy bo'lmagan tasodifiy tanlanma (Wang et al. 2015) . tadqiqotchilar Xbox o'yin tizimidan respondentlarni ishga, va siz kutish mumkin, Xbox namunasi erkak noto'g'ri va yosh noto'g'ri: 18 - 29 yoshli elektorati 19%, lekin Xbox namunadagi 65% tashkil etadi va erkaklar 47% tashkil etadi elektorat va Xbox namunasi (rasm 3.4) 93% ga. Chunki bu kuchli demografik yanlılıklardan, xom Xbox ma'lumotlar saylov yakunlari kambag'al ko'rsatkich edi. Bu Barak Obama ustidan Mitt Romni uchun kuchli g'alaba bashorat. Shunga qaramay, bu xom, muvofiqlashtirilmagan bo'lmagan ehtimollik namunalarini xavf yana bir misol va adabiy Digest fiyasko eslatadi.
Biroq, dev va do'stlari bu muammolarni xabardor edi va namuna olish jarayoni uchun to'g'rilash uchun respondentlarni og'irlik harakat qildi. Xususan, ular men senga aytgan post-tabaqalanishi yanada murakkab formasini foydalanish. Bu post-tabaqalanishi haqida sezgi hosil qiladi, chunki ularning yondashuv haqida bir oz ko'proq o'rganish arziydi, va alohida versiya Vang va hamkasblari og'irlik nodavlat ehtimoli namunalari uchun eng hayajonli yondashuvlar biri hisoblanadi.
Bo'lim 3.4.1 yilda ishsizlik baholash haqida oddiy misol, biz yashaydigan davlat asoslangan guruhga aholiga bo'lingan. farqli o'laroq, dev va do'stlari tomonidan belgilangan 176.256 guruhga aholiga bo'linadi: jinsi (2 turkum), irqi (4 turkum), yoshi (4 turkum), ta'lim (4 turkum), davlat (51 turkum), partiya ID (3 toifalari), mafkura (3 kategoriyalar) va 2008 ovoz (3 kategoriyalar). ko'proq guruhlar bilan, tadqiqotchilar har bir guruh ichida, javob qiziqish Obama uchun ko'magida uncorrelated ekanligini tobora ehtimol bo'ladi deb umid. Keyingi, balki biz misolida bo'lgani kabi, individual darajadagi og'irliklari qurish ko'ra, dev va do'stlari Obama uchun ovoz bergan har bir guruhda aholisi hissasini baholash uchun murakkab model ishlatiladi. Nihoyat, ular qo'llab-quvvatlash, taxminan umumiy darajasini ishlab chiqarish uchun har bir guruh taniqli hajmi bilan qo'llab-quvvatlash, bu guruh smetasini birlashgan. Boshqa so'zlar bilan aytganda, ular, har xil guruhlarga aholini tashkil tug'ralgan har bir guruhda Obama qo'llab-quvvatlash taxmin, va keyin umumiy matndan ishlab chiqarish uchun guruh smeta og'irligi o'rtacha oldi.
Shunday qilib, o'z yondashuv katta qiyinchilik bu 176.256 guruhlar har bir Obama qo'llab-quvvatlash taxmin qilish hisoblanadi. ularning panel 345.858 noyob ishtirokchilarini, saylov so'rov standartlari tomonidan katta sonini o'z ichiga bo'lsa-da, dev va do'stlari deyarli hech respondentlarni edi, buning uchun juda ko'p guruhlar bor edi. Shuning uchun, tadqiqotchilar mehr ko'p kelgan, janob P. havzasi axborot muayyan guruh ichida Obama qo'llab-quvvatlash, taxmin qilish uchun, Aslida, janob R qo'ng'iroq post-tabaqalanishi bilan ko'p tushish deb nomlangan, ular bir ibora ishlatiladi, har bir guruh, qo'llab-quvvatlash, taxmin qilish uchun yaqindan guruhlari bilan bog'liq. Misol uchun, kim mo''tadil sifatida o'z-o'zini aniqlash demokratlar ro'yxatdan kollej bitiruvchilari, bor, va bu 2008 yilda Obama uchun ovoz kim, 18-29 yoshda o'rtasida, ayol ispan orasida Obama qo'llab-quvvatlash baholash vazifasi ko'rib juda, juda o'ziga xos guruhi bo'lib, bu xususiyatlari bilan namuna hech kim yo'q bo'lishi mumkin. Shuning uchun, bu guruh haqida bashorat qilish, janob P. havzasi bilan birga juda o'xshash guruhlar bilan odamlardan hisob-kitoblariga ko'ra.
Bu tahlil strategiyasi yordamida, dev va do'stlari (rasm 3.5) juda yaqindan Obama 2012 saylovlarida olingan umumiy qo'llab-quvvatlash, taxmin qilish uchun Xbox non-ehtimoli namunasi foydalanish imkoniyatiga ega edi. Aslida, ularning hisob-kitoblarga ko'ra jamoatchilik fikri so'rovlarining bir agregat ko'proq aniq edi. Shunday qilib, bu holatda, og'irlik-, ayniqsa janob non-ehtimollik ma'lumotlar xatolar tuzatish yaxshi bir ish qilish uchun P.-ko'rinadi; Agar muvofiqlashtirilmagan Xbox ma'lumotlari hisob-kitoblarga nazar qachon paydo bo'ladi bichib.
Dev va hamkasblari o'rganish ikki asosiy darslar mavjud. Birinchidan, muvofiqlashtirilmagan non-ehtimoli namunalari yomon hisob-kitoblarga olib kelishi mumkin; Bu ko'p tadqiqotchilar oldin eshitdim, deb bir ibrat bordir. Shu bilan birga, ikkinchi dars to'g'ri talabalari qachon bo'lmagan ehtimollik namunalari, aslida juda yaxshi smetasini ishlab chiqarish mumkin, deb hisoblanadi. Aslida, ularning hisob-kitoblarga ko'ra pollster.com, ko'proq an'anaviy saylov anketalarga bir umumlashtirish dan hisob-kitoblarga ko'ra, ko'proq aniq edi.
Nihoyat, biz bu ma'lum bir ishda o'rganishimiz mumkin, nima uchun muhim cheklovlar mavjud. post-tabaqalanishi, bu vaziyatda yaxshi ishlagan faqat, chunki u boshqa hollarda ham mehnat qiladi, deb kafolat yo'q. anketör topshiriq deyarli 100 yil davomida saylovlar olmoqda, chunki aslida saylov ehtimol eng oson sozlash biri, u erda muntazam fikringiz (biz saylovlarda yutib kim ko'rish mumkin), va partiya aniqlash va demografik xususiyatlari ovoz berish nisbatan bashoratli hisoblanadi. Bu nuqtada, biz qattiq nazariyasi va nooziq-ehtimollik namunalariga ağırlıklandırılması o'zgarishlar etarlicha aniq smetasini ishlab chiqarish qachon bilish empirik tajriba yetishmaydi. Agar bo'lmagan ehtimollik namunalari bilan ishlashga majbur bo'lsangiz aniq bir narsa, ammo, deb, so'ngra belgilangan hisob-kitoblarga ko'ra non-moslashtirilgan hisob-kitoblarga ko'ra yaxshiroq bo'ladi, deb ishonaman uchun kuchli sababi bor.