Raqamli yosh, amaliyotda ehtimollik masalasini qiyinlashtiradi va ehtimolliksiz namuna olish uchun yangi imkoniyatlar yaratadi.
Nasroniylik tarixida ikkita raqobat yondashuvi mavjud: ehtimollik namunalarini tanlash usullari va ehtimolliksiz namuna olish usullari. Garchi ikkala yondashuv namunalar dastlabki kunlarida ishlatilgan bo'lsa-da, ehtimollik masalasi ustunlikka erishdi va ko'plab ijtimoiy tadqiqotchilar katta ehtimollik bilan namuna olishni katta ehtimollik bilan ko'rishga o'rgatilgan. Biroq, quyida tasvirlab beradigan bo'lsak, raqamli yosh tomonidan yaratilgan o'zgarishlar tadqiqotchilarning ehtimollik masalalarini qayta ko'rib chiqish vaqti kelganligini anglatadi. Xususan, ehtimol namuna olish amaliyotda qiyinlashib bormoqda va ehtimolliksiz namunalar tezroq, arzonroq va yaxshi holga keladi. Tezroq va arzonroq tadqiqotlar nafaqat o'z-o'zidan tugaydi, ular tez-tez so'rovlar va kattaroq namunalar kabi yangi imkoniyatlar beradi. Misol uchun, noaniqlik usullarini qo'llash orqali kooperativning Kongress saylovlari bo'yicha tekshiruvi (CCES) ehtimollik namunasini qo'llash orqali dastlabki ishlardan taxminan 10 barobar ko'proq qatnasha oladi. Bu juda katta namuna siyosiy tadqiqotchilarga kichik guruhlar va ijtimoiy kontekstlardagi munosabatlar va xatti-harakatlarning o'zgarishini o'rganishga imkon beradi. Bundan tashqari, ushbu qo'shimchaning hammasi baholashning sifatida (Ansolabehere and Rivers 2013) .
Hozirgi vaqtda ijtimoiy tadqiqotlar uchun namuna olinishning eng yondashuvi - ehtimollik namunasi . Ehtimol, namuna olishda, maqsadli aholi barcha a'zolari taniqli, nodir bo'lmagan probirkaga ega va namuna olingan barcha odamlar so'roqqa javob beradi. Ushbu shartlar bajarilsa, oqilona matematik natijalar tadqiqotchilarning namunani maqsadli populyatsiyaga oid xulosalar chiqarish uchun foydalanishi mumkinligi haqida kafolat beradi.
Biroq, haqiqiy dunyoda bu matematik natijalarning asosiy shartlari kamdan-kam hollarda ro'y beradi. Misol uchun, ko'pincha qamrovli xatolar va javob bermaslik mavjud. Ushbu muammolar sababli tadqiqotchilar o'zlarining namunaviy maqsadlaridan maqsadli populyatsiyaga ega bo'lish uchun ko'pincha statistik tuzatishlarni qo'llashlari kerak. Shunday qilib, kuchli nazariy kafolatlarga ega bo'lgan ehtimollik namunasini nazariyani va amalda amaliyotda ehtimollik namunasini olishni ajratib ko'rsatish muhimdir, bunday kafolatlar taklif etilmaydi va turli statistik tuzatishlarga bog'liq.
Vaqt o'tib, ehtimollik masalasini nazariy va ehtimollik masalalarini amalda qo'llash o'rtasidagi farqlar kuchaymoqda. Masalan, yuqori sifatli, qimmat tadqiqotlarda (3.5-rasm), hatto (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) ham javob bermaslik stavkalari barqaror ravishda ko'paymoqda. Savollarga javob bermaydigan raqamlar tijoriy telefon tadqiqotlarida ancha yuqori - ba'zan 90% ga teng (Kohut et al. 2012) . Bunday javobsiz ko'payish bashorat sifatiga tahdid soladi, chunki bashoratlashlar tadqiqotchilar tadqiqotga javob bermaslik uchun foydalanadigan statistik modellarga bog'liq. Bundan tashqari, sifatlardagi bu pasayishlar tadqiqotchilarning yuqori javob darajasini saqlab qolish uchun borgan sari qimmat ishlarga qaramasdan sodir bo'ldi. Ba'zi odamlar, sifat va ortib borayotgan xarajatlarni kamaytirishning bu ikki tomonlama tendentsiyalari tadqiqot tadqiqotlari (National Research Council 2013) asosini tahdid ostiga olishidan qo'rqishadi.
Ehtimollik namuna olish usullari uchun o'sib borayotgan qiyinchiliklar bor edi, deb bir vaqtning o'zida, shuningdek, nodavlat ehtimoli namuna olish usullari qiziqarli o'zgarishlar sodir bo'ldi. Imkoniyatlar bo'lmagan namuna olish usullarining turli xil uslublari mavjud, biroq ular birgalikda mavjud bo'lgan narsa - ular ehtimollik masalalarini matematik asosda osongina moslasha olmasliklari (Baker et al. 2013) . Boshqacha qilib aytganda, ehtimollik bo'lmagan namuna olish usullarida har bir kishi ma'lum bo'lmagan va nolga teng bo'lmagan qo'shilish ehtimoli mavjud emas. Ehtimollardan namuna olish usullari ijtimoiy tadqiqotchilar orasida dahshatli obro'ga ega va ular tadqiqotchilarning eng dramatik kamchiliklari bilan bog'liq, masalan, " Literary Digest" fiyaskosi (oldinroq muhokama qilingan) va "Dewey Defuming Truman", AQSh haqida noto'g'ri tasavvur 1948 yilgi prezident saylovi (3.6-rasm).
Raqamli yoshga mos keladigan ehtimollik namunasini olishning bir shakli onlayn panellardan foydalanishdir . Interfaol panellardan foydalangan tadqiqotchilar tadqiqotchilarga xizmat qilish uchun rozi bo'lgan katta, turli xil guruhlarni qurish uchun ba'zi panel provayderi, odatda kompaniya, hukumat yoki universitetga bog'liq. Ushbu panel ishtirokchilari tez-tez onlayn reklama bannerlari kabi turli xil maxsus usullarni qo'llash orqali ishga olinadi. Keyinchalik, tadqiqotchi panelni provayderga kerakli xususiyatlarga ega bo'lgan respondentlar namunasiga kirish uchun to'lashi mumkin (masalan, kattalarning milliy vakili). Ushbu onlayn panellar ehtimol bo'lmagan usullardir, chunki har bir kishi ma'lum bo'lmagan, noldan tashqari kiritish ehtimoli bor. Imkoniyatsiz onlayn-panellar allaqachon ijtimoiy tadqiqotchilar tomonidan ishlatilgan bo'lsa-da (masalan, CCES), ulardan keladigan taxminlarning sifati haqida ba'zi bahslar mavjud (Callegaro et al. 2014) .
Ushbu munozaralarga qaramasdan, men ijtimoiy tadqiqotchilarning ehtimollik masalalarini qayta ko'rib chiqish uchun vaqtning to'g'ri ekanligining ikki sababi bor deb o'ylayman. Birinchidan, raqamli davrda ehtimollik bo'lmagan namunalarni to'plash va tahlil qilishda ko'plab o'zgarishlar bo'ldi. Ushbu yangi uslublar o'tmishda muammolarni keltirib chiqaradigan usullardan etarli darajada farq qiladi, chunki ularni "noaniqlik masalasini tanlash 2.0" deb o'ylash mantiqan, deb o'ylayman. Tadqiqotchilarning ehtimollik masalalarini qayta ko'rib chiqishining ikkinchi sababi, amaliyoti tobora qiyinlashib bormoqda. Javob berishning yuqori darajasi mavjud bo'lganda, hozirgi vaqtda tekshiruvlar mavjud bo'lganligi sababli, respondentlarning jalb etilish ehtimoli aniq emas va shuning uchun ko'plab tadqiqotchilar ishonishicha, ehtimol namunalari va ehtimollik namunalari har xil emas.
Yuqorida aytib o'tganimdek, ehtimollik namunalari ko'plab ijtimoiy tadqiqotchilar tomonidan katta shubha bilan qaraldi, qisman tadqiqotlar tadqiqotining dastlabki kunlarida ba'zi bir eng sharmandali muvaffaqiyatsizliklarda ularning roli tufayli. Ehtimollik namunalari bilan qanchalik uzoqqa tushganimizga aniq misol, Wei Vang, David Rothschild, Sharad Goel va Endry Gelman (2015) , 2012-yilgi AQSh saylovlarining natijalarini to'g'ri bo'lmagan tarzda tiklash uchun olib borilgan tadqiqotlar. Amerikalik Xbox foydalanuvchilari - amerikaliklarning noodatiy bo'lmagan namunasi. Tadqiqotchilar XBox o'yin tizimidan respondentlarni ishga yollaganlar va siz kutganingizdek, Xbox namunasi erkaklarni yirtib tashladi va yoshni asabiylashdi: 18 yoshdan 29 yoshgacha bo'lganlar saylovchilarning 19 foizini, ammo Xbox namunasining 65 foizini, erkaklar esa saylovchilarning 47%, Xbox namunasining 93% ni tashkil etadi (3.7-rasm). Bunday kuchli demografik sabablar tufayli Xbox xomashyo ma'lumotlariga ko'ra, saylov natijalari yomon ko'rinib turardi. Mitt Romni Barak Obamaga nisbatan kuchli g'alabani bashorat qilgan. Shunga qaramay, bu xom-xatarli, tuzatilmaydigan ehtimollik namunalarining xavfli ekanligining yana bir misolidir va Literary Digest fiyaskosini eslatadi.
Biroq, Vang va uning hamkasblari bu muammolardan xabardor bo'lishdi va ularning tasodifiy tanlov jarayonida tasodifiy tanlov jarayoniga moslashishga harakat qilishdi. Xususan, ular post-stratifikatsiya usulini qo'lladilar. Bu usul ham keng qamrovli qamrovli xatoliklar va javob bermaydigan ehtimoliy namunalarni sozlash uchun ishlatiladi.
Post-tabakalaşmanın asosiy g'oyasi, namunadan keladigan taxminni yaxshilash uchun maqsadli aholi haqida yordamchi ma'lumotlardan foydalanish. Vatikan va uning hamkasbi o'zlarining noaniqlik namunalarini hisoblash uchun post-stratifikatsiyadan foydalanganda aholi turli guruhlarga bo'linib, har bir guruhda Obamaning yordamini baholadi va keyin umumiy baholash kiritish uchun o'rtacha guruh baholarini oldi. Misol uchun, ular aholi ikki guruhga (erkaklar va ayollar) bo'lingan, Obama va erkaklarni qo'llab-quvvatlagan va keyin Obama uchun umumiy qo'llab-quvvatlashni hisoblab, ayollar og'irligi o'rtacha hisoblab, saylovchilarning 53% va erkaklar 47% ni tashkil qiladi. Keyinchalik post-tabakalaşma, guruhlarning kattaligi haqida qo'shimcha ma'lumot keltirib, muvozanatli namunani to'g'ri tuzishga yordam beradi.
Stratifikatsiyadan keyingi kalit - to'g'ri guruhlarni shakllantirishdir. Agar aholini bir xil guruhlarga ajratib qo'ysangiz, javob guruhidagi har bir guruh uchun bir xil bo'ladi, shundan so'ng tabaqalanish bevosita hisob-kitoblarni keltirib chiqaradi. Boshqacha qilib aytganda, gender bo'yicha post-tabakalaşma, agar barcha erkaklarning javob berish istagi mavjud bo'lsa va barcha ayollar xuddi shunday ta'sirga ega bo'lsalar, xolis baholash mumkin bo'ladi. Bu taxmin bir-biriga o'xshash-javob-propensits-guruh ichidagi taxminlar deb ataladi va men ushbu bobning oxirida matematik qaydlarda biroz ko'proq narsani tasvirlab beraman.
Albatta, barcha erkaklar va barcha ayollar uchun javob tarzining bir xil bo'lishi ehtimoldan yiroq emas. Shu bilan birga, guruhlar sonining ko'payishi tufayli bir xil-javob-propensitsiyalar-guruh ichidagi taxminlar yanada maqbul bo'ladi. Ko'pgina guruhlarni tashkil qilsangiz, aholi bir hil guruhlarga bo'linib ketishi osonlashadi. Misol uchun, barcha ayollar xuddi shunday javob berishga moyilligi kabi ko'rinishi mumkin, ammo 18-29 yoshli, kollejni bitirgan va Kaliforniya shtatida yashaydigan barcha ayollar uchun xuddi shunday javob reaktsiyasining mavjudligi yanada ishonchli tuyulishi mumkin. . Shunday qilib, post-tabakalaşmada ishlatiladigan guruhlar soni ortib borishi tufayli, usulni qo'llab-quvvatlash uchun zarur bo'lgan taxminlar yanada oqilona bo'ladi. Ushbu faktni hisobga olgan holda, tadqiqotchilar ko'pincha post-stratifikatsiya qilish uchun ko'plab guruhlarni tashkil qilishni xohlashadi. Biroq, guruhlarning soni oshgani sayin tadqiqotchilar boshqa muammolarga duch kelmoqdalar: ma'lumotlarning uzilishi. Agar har bir guruhda kam sonli odamlar bo'lsa, unda bashoratlar yanada noaniq bo'ladi va noinsoniy bo'lmagan guruh mavjud bo'lgan haddan tashqari holatda post-tabakalaşma butunlay buziladi.
Bir-biriga mos keladigan javobni-moslashuvchanlik-guruh ichidagi taxminlar va har bir guruhdagi oqilona namunaviy o'lchamlarga bo'lgan talab o'rtasidagi bu o'ziga xos kuchlanishning ikki yo'li mavjud. Birinchidan, tadqiqotchilar har bir guruhda oqilona namunaviy o'lchamlarni ta'minlashga yordam beradigan kattaroq, turli xil namunalarni to'plashlari mumkin. Ikkinchidan, ular guruhlar ichida bashorat qilish uchun yanada murakkab statistik modelni qo'llashlari mumkin. Va, aslida, ba'zida tadqiqotchilar ham, Vang va hamkasblari Xboxdan respondentlar yordamida saylovni o'rganish bilan shug'ullanishgan.
Ular kompyuter yordamida olib borilgan intervyular bilan ehtimolliksiz namuna olish usulini qo'llayotganligi sababli (3.5-bo'limda kompyuterda o'tkaziladigan intervyular haqida ko'proq gapiraman), Vang va uning hamkasblari 345,858 noyob qatnashchining , Saylovoldi tashviqoti standartlari bo'yicha juda ko'p son. Bu katta namunali o'lchamlari ularni ko'p sonli tabaqalash guruhlarini shakllantirishga imkon berdi. Vatan va uning hamkasblari aholini jinsga (2 toifaga), irqiy (4 toifa), yoshga (4 toifaga), ta'limga (4 toifaga), davlatga tegishli bo'lgan 176 256 guruhga bo'linib, (51 toifa), partiya ID (3 toifa), mafkura (3 toif) va 2008 yilgi ovoz berish (3 toifa). Boshqacha qilib aytganda, arzon narxlardagi ma'lumotlar yig'ish orqali o'zlarining yirik namunaviy o'lchamlari ularni baholash jarayonida yanada aniqroq taxmin qilish imkonini berdi.
Hatto 345,858 noyob ishtirokchi bilan ham, ko'plab guruhlar bor edi, ular uchun Vang va hamkasblari deyarli javob bermadilar. Shuning uchun ular har bir guruhdagi yordamni baholash uchun ko'p bosqichli regressiya deb ataladigan bir usulni qo'lladilar. Aslida, Obamaning muayyan guruh ichida qo'llab-quvvatlanishini taxmin qilish uchun, ko'p bosqichli regressiya ko'plab yaqin guruhlardan olingan ma'lumotlarni to'plamoqda. Misol uchun, Obamaning 18 va 29 yoshli ispaniyaliklar orasida, kollej bitiruvchilari bo'lgan, ro'yxatga olingan Demokratlar, moderatorlar sifatida o'zini tanitadigan va Obama uchun 2008 yilda ovoz berganlar orasida qo'llab-quvvatlashni tasavvur qilishni tasavvur qiling. , juda aniq guruh va bu xususiyatlarga ega bo'lgan namunada hech kim yo'q. Shuning uchun, bu guruh haqida taxmin qilish uchun ko'p bosqichli regressiya juda o'xshash guruhlardagi odamlardan taxminlarni birlashtirish uchun statistik modelni qo'llaydi.
Shunday qilib, Vang va uning hamkasblari juda ko'p darajadagi regressiya va post-stratifikatsiyani birlashtirgan yondashuvni qo'lladilar, shuning uchun strategiyani ko'p qatlamli regressiyani post-stratifikatsiya yoki ko'proq mehr bilan ifodalashdi. P. "Vang va uning hamkasblari XBoxning ehtimollik namunasidan taxmin qilish uchun janob Pdan foydalanganlarida, ular Obamaning 2012 yilgi saylovlarda olgan umumiy yordamiga juda yaqin hisob-kitoblarni taqdim etdilar (3.8-rasm). Darhaqiqat, ularning hisob-kitoblari an'anaviy jamoatchilik fikri so'roqlariga qaraganda aniqroq edi. Shunday qilib, bu holda statistika o'zgarishi, xususan, janob P., ehtimollik bo'lmagan ma'lumotlarda noto'g'ri talqin qilinishi yaxshi ishni amalga oshiradi; noto'g'ri Xbox ma'lumotidan hisoblarni ko'rib chiqqanda aniq ko'rinadigan narsalar.
Vang va uning hamkasblarini o'rganishdan ikki asosiy saboq bor. Birinchidan, tuzatilmaydigan ehtimoliy namunalar noto'g'ri taxminlarga olib kelishi mumkin; bu ko'plab tadqiqotchilar ilgari eshitgan saboqdir. Ikkinchi dars esa, ehtimolliksiz namunalar to'g'ri tahlil qilinganida, aslida yaxshi hisob-kitoblarni keltirishi mumkin; ehtimollik bo'lmagan namunalar avtomatik ravishda " Literary Digest" fiyaskosiga o'xshamaydi.
Agar siz ehtimollik namunasi yondashuvi va ehtimolliksiz namuna olish yondashuvidan foydalanishga qaror qilmoqchi bo'lsangiz, siz qiyin tanlovga duch kelishingiz mumkin. Ba'zida tadqiqotchilar tez va qat'iy qoidalarni talab qilishadi (masalan, har doim ehtimoliy namuna olish usullarini qo'llashadi), lekin bunday qoidalarni taklif qilish tobora qiyinlashadi. Tadqiqotchilar, ehtimollik bo'yicha namuna olish usullari bilan amaliyotda qiyin tanlovga ega bo'lib, ular tobora ortib borayotgan qimmat va teoretik natijalarga nisbatan ancha arzon va tezroq, ammo kamroq tanish va ko'proq o'zgaruvchan bo'lgan ulardan foydalanish va non-ehtimollik masalalarini aniqlash usullaridan oqilona emas. Biron narsa aniqki, siz ehtimollik bo'lmagan namunalar bilan yoki vakillik qilmaydigan katta ma'lumot manbalari bilan ishlashga majbur bo'layotgan bo'lsangiz (2-bobga qarang), shundan keyin post-stratifikatsiya va tegishli metodlarni tuzatilmasdan, xom tahminlardan yaxshiroq bo'ladi.